دایرهالمعارف اقتصاد
نظریه بازیها
مترجمان: محمدصادق الحسینی، محسن رنجبر
نظریه بازیها علم استراتژی است. این نظریه تلاش میکند تا اعمالی که «بازیکنها» در گسترهای از «بازیها» باید انجام دهند تا بهترین پیامد به بار آید را به شکل ریاضی و منطقی تعیین کند.
مترجمان: محمدصادق الحسینی، محسن رنجبر
نظریه بازیها علم استراتژی است. این نظریه تلاش میکند تا اعمالی که «بازیکنها» در گسترهای از «بازیها» باید انجام دهند تا بهترین پیامد به بار آید را به شکل ریاضی و منطقی تعیین کند.
بازیهایی که این نظریه مورد مطالعه قرار میدهد از شطرنج تا تربیت کودک و از تنیس تا اشتغال کشورها را در برمیگیرد. تمام این بازیها یک ویژگی مشترک دارند و آن نوعی وابستگی درونی است به این معنا که نتیجه بازی برای هریک از شرکتکنندهها به انتخابها (استراتژیهای) همه افراد بستگی دارد. در بازیهای موسوم به بازی با حاصل جمع صفر، منافع بازیکنها بهطور کامل با یکدیگر تعارض پیدا میکند، بهگونهای که بهرهای که یک فرد کسب میکند، همواره معادل ضرر فرد دیگر است. شایان ذکر است که بازیهایی که در آنها همه بازیکنان ممکن است به منفعت دست یابند (یعنی بازیهای با حاصل جمع مثبت) یا ضرر کنند (یعنی بازیهای با حاصل جمع منفی) معمولترند. در این بازیها درجات مختلفی از تعارض وجود دارد.
جان فون نیومن استاد ریاضیات دانشگاه پرنیستون در نظریه بازیها (game theory) پیشگام بود. تمرکز این نظریه در سالهای اول شکلگیری آن بر بازیهای دارای تعارض خالص (بازیهای با حاصل جمع صفر) بود. سایر بازیها همکارانه در نظر گرفته میشدند، به این معنا که شرکتکنندگان اعمال خود را به اتفاق یکدیگر انتخاب کرده و انجام میدهند. اما در تحقیقات اخیر بر بازیهایی تمرکز گردیده که نه دارای حاصل جمع صفر هستند و نه به طور خالص همکارانه هستند. در این بازیها بازیکنان اقدامات خود را بهصورت جداگانه انتخاب میکنند، اما روابط آنها با یکدیگر حاوی رقابت و همکاری است.
بازیها اساسا با تصمیمات اتخاذ شده در یک محیط خنثی متفاوت هستند. برای آنکه این نکته روشن گردد، تفاوت میان تصمیمات یک چوببر و تصمیمات یک ژنرال را در نظر آورید. زمانی که یک چوب بر تصمیمی را درباره چگونگی برش چوب اتخاذ میکند، از چوب انتظار ندارد که با او مقابله کند، به عبارت دیگر محیطی که وی در آن به فعالیت میپردازد خنثی است. اما زمانی که یک ژنرال نظامی تصمیم میگیرد که ارتش دشمن را از پا در آورد، باید مقاومت دشمن را هم پیشبینی کرده و طوری تصمیم بگیرد که بتواند بر این مقاومتها غلبه کند. کسی که در یک بازی شرکت میکند باید همانند این ژنرال ارتباط متقابل خود و دیگر بازیکنان هوشمند و هدفمند را در نظر بگیرد. بازیکنان باید در تصمیمی که اتخاذ میکنند هم تعارض و هم احتمال همکاری را در نظر داشته باشند. اصل و جوهر هر بازی، وابستگی درونی میان استراتژیهای بازیکنها است. دو نوع مختلف از ارتباط و وابستگی درونی وجود دارد: وابستگی پیاپی (sequential) و وابستگی همزمان (simultaneous). در نوع پیاپی بازیکنها به ترتیب عمل کرده و هریک، از اقدامات قبلی دیگران آگاهند. در نوع همزمان بازیکنان در یک زمان عمل میکنند و هریک از
اقدامات دیگری ناآگاه است. یک اصل عمومی برای بازیکنان شرکتکننده در بازی با حرکتهای پیاپی، نگاه به جلو و استدلال عقبگرد است. هر بازیکن باید در نظر بگیرد که دیگران چگونه به حرکت فعلی او واکنش نشان خواهند داد و در مقابل، خودش دست به چه انتخابی خواهد زد. هر بازیکن پیشبینی میکند که تصمیمات اولیه او نهایتا به کجا خواهند انجامید و از این اطلاعات برای محاسبه بهترین تصمیمی که باید اتخاذ کند استفاده میکند. وی زمانی که راجع به چگونگی واکنش دیگران فکر میکند، باید خود را به جای آنها قرار داده و همانند آنها فکر کند. او نباید استدلال خود را به آنها تحمیل کند.
در اصل هر بازی پیاپی که پس از یک سلسله حرکات متناهی به پایان برسد را میتوان کاملا «حل کرد». در این بازیها بهترین استراتژی هر بازیکن با بررسی تمامی نتایج ممکن تعیین میشود. بازیهای ساده از قبیل دوز را میتوان به این شیوه حل کرد، بنابراین اینگونه بازیها چندان چالشی نیستند. اما انجام این محاسبات برای بسیاری از بازیهای دیگر مثل شطرنج بسیار پیچیده است (حتی با کامپیوتر). از این رو بازیکنان برای چند حرکت محدود برنامهریزی میکنند و سعی میکنند که موقعیتهای حاصل را براساس تجربه ارزیابی کنند.
برخلاف بازیهای پیاپی که در آنها زنجیره استدلال خطی است، بازیهای همراه با حرکات همزمان یک دور منطقی در خود دارند. اگرچه بازیکنها به صورت همزمان و بدون اطلاع از حرکات فعلی یکدیگر عمل میکنند، اما همه آنها باید از این نکته آگاه باشند که بازیکنان دیگر عاقلند. طبق این تفکر هر فرد «فکر میکند که بازیکن دیگر فکر میکند که او فکر میکند...» بنابراین هر بازیکن باید خود را به صورت مجازی به جای تمامی افراد دیگر قرار دهد و سعی کند پیامد هر حرکت را محاسبه نماید. بهترین اقدام برای او با توجه به اینگونه محاسبههای کلی به دست میآید.
این دور منطقی با استفاده از مفهوم تعادل که توسط جان نش، ریاضیدان دانشگاه پرینستون شکل داده شد به نتیجه میرسد (به عبارت دیگر استدلال دوری(circular reasoning) به نتیجه میرسد). ما به دنبال یک مجموعه تصمیم (برای همه بازیکنان) هستیم که در آن، استراتژی فرد برای او بهترین گزینه باشد و بازیکنان دیگر نیز بهترین استراتژی خود را انتخاب کنند. به عبارت دیگر هر بازیکن بهترین واکنش به آنچه دیگران انجام میدهند را انتخاب میکند.برخی اوقات بهترین گزینه برای یک فرد، فارغ از آنکه دیگران چه اقدامی صورت دهند یکسان است. این حالت را «استراتژی غالب» برای آن بازیکن مینامند. در مواقع دیگر بازیکن با گزینهای روبهرو است که همواره نامناسب است، به این معنا که فارغ از آنکه دیگران چه انتخابی کنند، گزینهای وجود دارد که از این گزینه بهتر باشد (به این گزینه «استراتژی مغلوب» گفته میشود). جستوجو برای یافتن تعادل را باید با بررسی استراتژیهای غالب و حذف استراتژیهای مغلوب آغاز کرد. اینکه هر بازیکن بهترین گزینه خود را انتخاب میکند به این معنی نیست که تعادل الزاما جایی برقرار میشود که از لحاظ اجتماعی بهینه است. در واقع نمونههای معروفی
مثل معمای زندانی (که در ادامه به آن میپردازیم) وجود دارند که در آنها هر بازیکن منافع خود را پیگیری میکند، ولی در نهایت نتیجهای که به بار میآید نتیجه خوبی نیست. تعریف نش از تعادل راهحلی ناقص برای مساله استدلال دوری در بازیهای دارای حرکات همزمان است. در برخی از بازیها چند تعادل نش به دست میآید؛ در حالی که در بعضی از بازیها اصلا تعادل نش نداریم. همچنین فرآیند دینامیکی که میتواند به تعادل منجر شود همچنان نامشخص است. اما این مفهوم با وجود این نقایص در تحلیل بسیاری از تعاملات استراتژیک بسیار کارآمد بوده است. غالبا چنین تصور میشود که نظریه بازیها همه بازیکنان را عقلایی در نظر میگیرد. اما این نظریه چنین ادعایی ندارد. ممکن است بازیکنها مغرض یا حسود بوده یا خیرخواه و نیکوکار باشند.
این گفته جورج برناردشاو در اصلاح قانون طلایی را به خاطر داشته باشید: «با دیگران آنگونه که میخواهید با شما رفتار کنند، رفتار نکنید. ممکن است سلایق آنها با شما فرق داشته باشد». بازیکنان دیگر ممکن است علاوهبر داشتن انگیزههای متفاوت، اطلاعات مختلفی داشته باشند. هر فرد باید همواره هنگام محاسبه یک وضعیت تعادلی یا هنگام پیشبینی عکسالعملهای دیگر بازیکنان، آنها را همانگونه که هستند و نه آنگونه که خود هست، در نظر آورد. نمونههای زیر از تعامل استراتژیک، برخی از اصول نظریه بازیها را نشان میدهند:
معمای زندانی: دو مظنون بهطور جداگانه مورد بازجویی قرار میگیرند و هرکدام میتوانند اعتراف کرده یا ساکت بمانند. در صورتی که مظنون A سکوت اختیار کند، به نفع مظنون B است که اعتراف کند، چون مجازاتش کاهش مییابد. اگر مظنون A اعتراف کند، B نیز بهتر است اعتراف کند تا از شدیدترین مجازات در امان بماند. بنابراین اعتراف کردن، استراتژی غالب فرد B است. همین امر راجع به فرد A نیز صادق است. به همین دلیل تعادل جایی به دست میآید که هر دو اعتراف کنند. این در حالی است که اگر هر دو ساکت میماندند، وضعشان بهتر بود. در صورتی این دو بازیکن همکارانه رفتار میکردند (و هر دو سکوت میکردند) بازی تکرار میشد، زیرا در آن صورت ضرر بلندمدت ناشی از تخطی از همکاری میتوانست از منفعت موقت حاصل از تقلب (اعتراف) بیشتر باشد. در چنین شرایطی استراتژیهایی مثل مقابله به مثل نیز وجود دارد.
استراتژیهای مختلط: در برخی شرایط بروز تعارض، رقیب تمامی اقدامات سیستماتیک را کشف کرده و از آنها استفاده خواهد کرد. بنابراین فرد باید با به هم ریختن حرکات خود از اینکه رقیب او بتواند اقداماتش را حدس بزند، ممانعت به عمل آورد. نمونههایی از این گونه در ورزش مشاهده میشود. مثلا اینکه یک بازیکن فوتبال در یک موقعیت خاص پا به توپ شود یا توپ را پاس دهد یا اینکه بازیکن نقش پاسور در والیبال توپ را پاس دهد یا خود آن را روانه زمین حریف کند نمونههایی از گیج کردن حریف به شمار میرود. نظریه بازیها این رفتارها را کمی میکند و نسبتهای صحیح را نشان میدهد.
حرکات استراتژیک: هر بازیکن میتواند برای تغییر انتظارات دیگران نسبت به اقدامات آتی خود از تهدید یا وعده استفاده کند و بنابراین آنها را وادار به انجام کارهایی کند که به نفعش است. البته این تهدیدها و وعدهها برای آنکه به موفقیت برسند باید باورپذیر باشند. این امر مشکلساز است، زیرا وقتی نوبت به اجرای تهدید یا عمل به وعده میرسد عموما هزینههایی به بار میآید. نظریه بازیها، روشهای مختلف برای افزایش باورپذیری را مورد مطالعه قرار میدهد. اصل کلی آن است که اگر یک بازیکن آزادی اش در انتخاب اقدامات آتی اش را محدود کند، ممکن است منافعش بهتر برآورده شوند. با انجام این کار این بازیکن وسوسه این احتمال که وسوسه شود تا زیر قولش بزند یا از تخطیهای دیگران چشم پوشی کند را از بین میبرد.
بهعنوان مثال کورتس (Cortes) هنگام رسیدن به مکزیک همه کشتیهای خود به جز یکی از آنها را غرق کرد. هدف او از این کار آن بود که امکان فرار را از بین ببرد. بدون کشتیای که به کار بازگشت به موطن بیاید، کورتس یا باید در کشورگشایی خود به موفقیت میرسید یا جان خود را از دست میداد. اگرچه شمار سربازهای او بسیار کمتر از حریف بود، اما این تهدید او برای مبارزه تا حد مرگ، روحیه حریفان را تحلیل برد و سربازان دشمن نهایتا تصمیم گرفتند عقبنشینی کنند. شرکت پولاروید نیز زمانی که به نحوی هدفمند عبور از بازار عکس فوری را نپذیرفت، از استراتژی مشابهی استفاده کرد. این شرکت با هر مزاحمی که در این بازار وارد شده بود به یک مبارزه مرگ و زندگی دست زد. زمانی که کداک به بازار عکس فوری وارد شد، پولاروید تمامی منابع خود را به مبارزه با آن وارد کرد. این شرکت چهارده سال بعد در یک دعوی حقوقی تقریبا
یک میلیارد دلاری علیه کداک به پیروزی رسید و دوباره به بازار انحصاری خود دست یافت. (البته بعدا و زمانی که شرکت پولاروید نتوانست خود را به بازار عکس دیجیتال گسترش دهد، تمرکز این شرکت بر محصولات فیلم فوری پرهزینه از آب درآمد). یک راه دیگر برای باورپذیر کردن تهدیدات، به کارگیری استراتژی ماجراجویانه لبه پرتگاه (brinkmanship) است (این استراتژی به این معنی است که یک بازیکن عامدانه ریسکی را به وجود آورد که اگر دیگران برخلاف خواسته او عمل کنند، نتیجه حاصله به ضرر همه تمام شود). سیاست لبه پرتگاه که توسط توماس شلینگ در «استراتژی تعارض» آورده شده است «تاکتیکی است که در آن بهطور عامدانه اجازه داده میشود که شرایط به نوعی از کنترل خارج شود تنها به این دلیل که ممکن است چنین حالتی برای طرف مقابل غیرقابل تحمل بوده و او را به انطباق با آن وادار نماید». زمانی که انبوه اعتراضکنندهها به مخالفت با دولتهای توتالیتر در چین و اروپای شرقی میپرداختند، طرفین از این استراتژی استفاده میکردند. برخی اوقات یک طرف کوتاه آمده و به شکست خود اعتراف میکند و در مواقع دیگر زمانی که هر دو طرف از لبه پرتگاه سقوط میکنند، یک تراژدی به وجود
میآید.
چانه زنی: در این حالت دو بازیکن با هم تصمیم میگیرند که چگونه منافع را با یکدیگر تقسیم کنند. هریک از طرفین به دنبال سهم بیشتری است و هر دو ترجیح میدهند هرچه زودتر به توافق برسند. زمانی که این دو به ارائه پیشنهاد میپردازند، اصل نگاه به جلو و استدلال عقبگرد سهم تعادلی هریک را معین میکند. در این حالت توافق در یک زمان حاصل میشود، اما هزینه تاخیر بر سهم دو طرف تاثیر میگذارد. بازیکنی که خواهان سرعت بیشتری در رسیدن به توافق باشد، سهم کوچکتری را دریافت خواهد کرد.
پنهانسازی و افشای اطلاعات: زمانی که فردی چیزی را میداند که دیگران از آن بیخبرند، برخی اوقات خواهان پنهانسازی این اطلاعات است (مثلا برخی موارد یک طرف میخواهد نحوه تولید یک محصول خاص را پنهان کند). در مواقعی نیز بازیکنان میخواهند این اطلاعات را به طوری که باورپذیر باشد افشا کنند (مثلا زمانی که یک شرکت میخواهد همه بدانند که به کیفیت محصولاتش اهمیت میدهد). در هر دوی این موارد اصل عمومی این است که فایده عمل کردن بیشتر از صحبت کردن است. اگر بخواهیم اطلاعاتی را مخفی کنیم، باید حرکاتمان در هم ریخته باشد. بلوف زدن در بازیها نباید به شکل سیستماتیک صورت بگیرد. گفته وینستون چرچیل درباره مخفی کردن واقعیت میان «محافظانی از جنس دروغ» را به خاطر داشته باشید. برای انتقال اطلاعات باید از اقدامی استفاده کرد که «پیامی» باورپذیر را انتقال دهد طوری که واضح باشد در صورتی که شرایط طوری نبود که بازیکن ادعا میکرد این اقدام به ضررش تمام میشد. بهعنوان مثال ارائه ضمانت طولانیمدت پیام معتبری به مصرفکننده و مبنی بر آن است که تولیدکننده به اینکه محصول با کیفیت بالایی را به تولید میرساند، باور دارد. پیشرفتهای اخیر در
نظریه بازیها توانسته است استراتژیهای مناسب در شرایط مختلف تضاد و همکاری را توضیح داده و تجویز نماید، اما هنوز راه زیادی تا کامل شدن این نظریه باقی است. هنوز هم طراحی یک استراتژی موفقیتآمیز از جهات زیادی یک هنر به شمار میرود.
ارسال نظر