محسن راجی اسدآبادی*
این یادداشت بر پایه متن تفاهمنامه اسلامآباد در رسانهها نگاشته شده و میکوشد منطق حاکم بر این سند را از منظر نظریه بازیها بازخوانی، نقش ذینفعان اصلی را تحلیل و براساس مفاد و ساختار سند، سناریوهای محتمل آتی را ترسیم کند. برابر مفاد این تفاهمنامه، آنچه پیشرو گذاشته شده یک توافق نهایی نیست بلکه مکانیسمی خوداجرا براساس منطق بازیهای تکرارشونده طراحی شده که میکوشد با گامهای کوچک و مشروط، دو بازیگر گرفتار در تعادل بدِ «تشدید تنش» را به سوی تعادلی همکارانه هدایت کند. صورتبندی بازی پیش از تفاهمنامه، یک «معمای زندانی» (Prisoner’s Dilemma) کلاسیک با ساختار پرداخت زیر است.
فرض کنید هر بازیکن دو استراتژی دارد، «همکاری» (C) یا «تشدید» (D). ماتریس این قواعد بازی و نمادهای آن در جدول (۱) خلاصه میشود:
رابطه T > R > P > S ساختار معمای زندانی را تعریف میکند. در بازی یکمرحلهای، استراتژی غالب هر دو بازیکن D است و نتیجه (D, D) یک تعادل نش ناکارا خواهد بود؛ وضعیتی که سالها میان ایران و آمریکا برقرار بود، هر دو از تشدید تنش متضرر میشدند اما هیچیک انگیزه یکجانبه برای تغییر مسیر نداشت.
اما قضیه عامیانه (Folk Theorem) که توسط فریدمن (۱۹۷۱) و دیگران صورتبندی شد، نشان میدهد که اگر بازی بینهایت تکرار شود و ضریب تنزیل δ به اندازه کافی بزرگ باشد (یعنی δ > δ* که δ آستانه بحرانی است)، آنگاه هر جفت استراتژی که میانگین پرداخت آن برای هر بازیکن بهتر از تعادل تنبیهی باشد، میتواند به یک تعادل نش در بازی تکرارشونده تبدیل شود. شرط ریاضی پایداری همکاری در استراتژی «ماشه» (Grim Trigger) چنین است: R/(1-δ) ≥ T + δP/(1-δ)
تفاهمنامه اسلامآباد درصدد تامین این نامساوی از دو مسیر است، افزایش R (پاداش همکاری) از طریق بسته اقتصادی و لغو تحریمها و کاهش آستانه بحرانی δ* از طریق طراحی گامبهگام که ریسک تقلب یکجانبه را کمینه میکند. اما پرسش این است که چرا طرفین به جای استراتژی «ماشه» (که در آن یک تقلب، همکاری را برای همیشه نابود میکند)، ساختاری مبتنی بر «گام در برابر گام» (Tit-for-Tat) برگزیدهاند؟ رابرت اکسلراد در «تکامل همکاری» (۱۹۸۴) با برگزاری مسابقات کامپیوتری نشان داد که TFT در محیطهای متنوع، بالاترین میانگین امتیاز را کسب میکند. علت این موفقیت از نگاه اکسلراد چهار ویژگی است: «آغازگر نبودن» (Never be the first to defect) به این معنا که بازیکن هرگز نخستین گام را در تقلب برنمیدارد، «مقابله متناسب» (Retaliate if provoked) به این معنا که اگر طرف مقابل تقلب کند، بلافاصله پاسخ دریافت میکند، «گذشت پس از تلافی» (Forgive after retaliation) به این معنا که پس از یک دور پاسخ، استراتژی به همکاری بازمیگردد و کینه به دل نمیگیرد و «روشنی» (Be clear and recognizable) به این معنا که رفتار استراتژیک بازیکن برای طرف مقابل شفاف و قابل پیشبینی است. بندهای تفاهمنامه این چهار ویژگی را بازتولید میکنند: بند ۱ (توقف عملیات نظامی) «آغازگر نبودن» را نشان میدهد، بندهای ۴ و ۵ با گرهزدن کاهش محاصره به بازگشایی تنگه، «مقابله متناسب» آنی را ممکن میسازند، افق ۶۰ روزه قابل تمدید، «گذشت پس از تلافی» را فراهم میکند زیرا یک خطای تصادفی لزوما به فروپاشی دائمی نمیانجامد، و مکانیسم نظارت (بند ۱۲) نیز «روشنی» را تامین میکند.
اما در همین نقطه است که مشکل «اطلاعات ناقص» (Incomplete Information) پدیدار میشود، کنت ارو در مقاله کلاسیک خود درباره «عدم تقارن اطلاعات» نشان داد که وقتی یک طرف اطلاعاتی دارد که طرف دیگر ندارد، بازار (و در اینجا مذاکره) به شکست میانجامد. هارسانی (۱۹۶۸-۱۹۶۷) این مساله را با معرفی «بازیهای بیزین» (Bayesian Games) صورتبندی کرد، هر بازیکن یک «نوع» (Type) دارد که بازیکن دیگر از آن بیاطلاع است. در بازی ایران و آمریکا، هر طرف نمیداند که آیا طرف مقابل واقعا «خوشنیت» است یا صرفا «استراتژیک» رفتار میکند تا در فرصت مناسب تقلب کند. بند ۱۲ (مکانیسم نظارت) و ارجاع به آژانس در بند ۸، تلاشی برای تبدیل این بازی با اطلاعات ناقص به یک بازی با اطلاعات کاملتر از طریق تولید «سیگنالهای عمومی» (Public Signals) است.
مفهوم «سیگنالدهی» (Signaling) را اسپنس (۱۹۷۳) در نظریه بازیها وارد کرد، یک سیگنال زمانی «معتبر» (Credible) است که هزینه ارسال آن برای فرستنده غیرصادق چنان بالا باشد که تنها فرستنده صادق حاضر به پرداخت آن شود. از این منظر، پذیرش «رقیقسازی مواد غنیشده در محل تحت نظارت آژانس» (بند ۸) را میتوان یک «سیگنال پرهزینه» (Costly Signal) از سوی ایران تفسیر کرد، این اقدام، بخشی از دارایی هستهای را در معرض دید و راستیآزمایی قرار میدهد و بازگشتپذیری آن را کاهش میدهد. در مقابل، وعده «لغو همه انواع تحریمها» (بند ۷) از سوی آمریکا، یک «پیام بیهزینه» (Cheap Talk) است که تا زمانی که کنگره و نظام حقوقی آمریکا آن را تایید نکنند، فاقد اعتبار سیگنالی است. فارل (۱۹۸۷) نشان داد که Cheap Talk تنها زمانی میتواند بر رفتار طرف مقابل اثر بگذارد که منافع دو طرف به اندازه کافی همسو باشد. حال باید پرسید که چرا تفاهمنامه با وجود این همه ظرافت نظری، همچنان شکننده است؟ پاسخ را باید در مدل «بازی دومرحلهای» (Two-Level Games) رابرت پاتنم (۱۹۸۸) جست. پاتنم استدلال میکند که مذاکرات بینالمللی همزمان در دو سطح انجام میشود: سطح اول (Level I) میان دولتها و سطح دوم (Level II) میان هر دولت و گروههای ذینفوذ داخلیاش. توافق تنها زمانی ممکن است که «مجموعه برد» (Win-Set) در سطح دوم با توافق سطح اول همپوشانی داشته باشد. در مورد ایران، اقتصاد مقاومتی را باید از این منظر تحلیل کرد: این مفهوم نه یک «مانع همکاری»، بلکه یک «استراتژی بهبود BATNA» است. BATNA یا «بهترین گزینه جایگزین توافق» که توسط فیشر و اوری (۱۹۸۱) در ادبیات مذاکره وارد شد، در نظریه بازیها به معنای حداقل پرداختی است که یک بازیکن در صورت عدم توافق دریافت میکند. هرچه BATNA قویتر باشد، بازیکن میتواند سهم بیشتری از مازاد همکاری را مطالبه کند. اقتصاد مقاومتی با افزایش تابآوری اقتصادی، BATNA ایران را تقویت میکند و موقعیت چانهزنی را بهبود میبخشد.
از سوی دیگر مدل پاتنم نشان میدهد که چرا تعهدات آمریکا در این سند شکننده است، «تعهد» (Commitment) در نظریه شلینگ (۱۹۶۰) به معنای توانایی یک بازیکن در مقید ساختن خود به یک اقدام مشخص است بهگونهای که تخطی از آن هزینهای گزاف داشته باشد اما شلینگ خود اذعان میکند که در دموکراسیها، تعهد دولت همواره مشروط به تایید نهادهای داخلی است. وعده لغو تحریمها در بند ۷، یک «تعهد ناقص» (Incomplete Commitment) است که اعتبار آن به توانایی دولت آمریکا در مدیریت کنگره بستگی دارد، این همان مشکلی است که در سناریوی سوم (شکست تعهد) به آن خواهیم پرداخت.
براساس این چارچوب نظری، اکنون میتوان ۷ سناریوی محتمل را استخراج کرد:
· تعادل همکاری پایدار: در این سناریو شرط δ > δ* برقرار است. منافع بلندمدت (بسته اقتصادی، لغو تحریم، بازگشت به بازار انرژی) چنان بزرگ است که انگیزه تقلب در دور جاری را از بین میبرد. استراتژی TFT با موفقیت اجرا میشود و مکانیسم نظارت (بند ۱۲) سیگنالهای شفاف تولید میکند، نتیجه، تحقق قضیه عامیانه و گذار به یک تعادل نش جدید با پرداخت (R, R) است.
· شکست اطلاعاتی: در این سناریو «نویز» (Noise) در سیگنالها موجب تفسیر نادرست میشود. اکسلراد نشان داده که TFT در محیطهای نویزی ضعیف عمل میکند زیرا یک تلافی اشتباهی میتواند زنجیره بیپایان تلافی را فعال کند، تاخیر فنی در لغو تحریمها ممکن است به عنوان «تقلب عمدی» تفسیر شود و بازی به تعادل (D, D) بازگردد.
· شکست تعهد (بازی دومرحلهای): دولتها در سطح اول به توافق میرسند، اما در سطح دوم (کنگره در آمریکا یا گروههای ذینفوذ در ایران) آن را مسدود میکنند. در سطح دوم با توافق سطح اول همپوشانی ندارد، نتیجه، یک «شبح توافق» است که هرگز اجرا نمیشود.
· کارشکنی خارجی (بازی سهنفره با Spoiler): یک بازیگر سوم که در ماتریس پرداخت او، منافعش با (R, R) برای ایران و آمریکا ناسازگار است، وارد عمل میشود، این بازیگر (مثلا اسرائیل) میتواند با یک اقدام نظامی یا عملیات خرابکارانه، سیگنالهای منفی تولید کند و بازی را از تعادل خارج کند.
· فروپاشی تدریجی (کاهش δ): در این سناریو «سایه آینده» به دلیل عدم تحقق منافع ملموس در کوتاهمدت کمرنگ میشود، وعده ۳۰۰ میلیاردی عملیاتی نمیشود و معافیتهای نفتی در بوروکراسی مالی بینالمللی گرفتار میماند، δ به تدریج کاهش مییابد تا از δ* پایینتر رود و همکاری از درون تهی شود.
· بازی هماهنگی منطقهای: اگر بند ۵ (گفتوگو با عمان و کشورهای ساحلی) فعال شود، بازی از یک «معمای زندانی» (PD) به یک «بازی هماهنگی» (Coordination Game) تغییر ماهیت میدهد، در بازی هماهنگی، چند تعادل نش وجود دارد و مشکل اصلی، هماهنگشدن بر سر یک تعادل است. مدل شلینگ درباره «نقاط کانونی» (Focal Points) در اینجا به کار میآید، امنیت تنگه هرمز میتواند به یک نقطه کانونی برای همکاری منطقهای تبدیل شود.
· تغییر بنیادین در بازیکنان: اگر یکی از طرفین دچار بحران داخلی شود (تغییر دولت، فروپاشی، یا جنگ داخلی)، «بازی» با همان بازیکنان قبلی ادامه نمییابد، این سناریو از حیطه نظریه بازیهای با بازیکنان ثابت خارج و وارد قلمرو «بازیهای با ورود و خروج بازیکنان» میشود.
در نهایت تفاهمنامه اسلامآباد یک مکانیسم خوداجرا (Self-Enforcing Mechanism) است که تلاش میکند با طراحی هوشمندانه گامهای متقابل، شرط ریاضی δ > δ* را تامین و از طریق تولید سیگنالهای شفاف، از شکست اطلاعاتی جلوگیری کند، موفقیت آن منوط به سه شرط نظری است؛ پایداری ضریب تنزیل در سطحی بالاتر از آستانه بحرانی، شفافیت سیگنالها برای جلوگیری از تفسیر نادرست و اعتبار تعهد در هر دو سطح. اگر این سه شرط محقق شوند، این تفاهمنامه میتواند از یک معمای زندانی فرسایشی به یک بازی هماهنگی پایدار گذار کند و مصداقی از قضیه عامیانه در عرصه دیپلماسی بینالملل باشد.
* مدرس دانشگاه و پژوهشگر اقتصاد بخش عمومی