משחק המפקח

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש

משחק המפקח הינו מודל מתמטי בתורת המשחקים בו יש "מפקח" ושחקן נוסף אחד או יותר. ה"מפקח" מוודא את ביצועי השחקנים על פי הכללים במודל. לרוב יש לשחקנים אינטרס להפר את כללי המשחק. ניתוח נכון של המודל על פי תאוריות שונות בתורת המשחקים, יעזור לכל צד להגיע לפתרון האופטימלי עבורו.

היסטוריה

מודלים מתמטיים מסוג משחק המפקח פותחו מתוך צורך מעשי בשנות ה-60 במהלך המלחמה הקרה. במסגרת המשא ומתן בין ארצות הברית וברית המועצות בנושא פיקוח על הנשק הגרעיני ופירוקו הוסכמו כללים המגבילים את המעצמות בנושא. הבעיה שנוצרה הייתה פיקוח על עמידת המדינות בכללים שהוסכמו. ארצות הברית חששה שברית המועצות תמשיך ותבצע ניסויים בנשק גרעיני וזאת מצידה רצתה לשלוח משלחות פיקוח לתחומי ברית המועצות בכל פעם שעולה חשד לביצוע ניסוי שכזה. ברית המועצות מצידה לא רצתה לאפשר למשלחות אלו להיכנס לתחומה מתוך חשש שמטרתן תהיה איסוף מודיעין. כתוצאה מכך הוסכמו כללים נוספים בין המעצמות, המאפשרים פיקוח מוגבל של ארצות הברית על יריבתה. לארצות הברית היה אינטרס לגרום לכך שלא יהיו ניסויים גרעיניים מחוץ למסגרת ההסכם ושאם יהיו כאלה, אז שארצות הברית תדע על כך ותוכל להגיב בהתאם. כאמור, אמצעיה לפיקוח היו מוגבלים ולשם פתרון בעיות אלו, חוקרים בתורת המשחקים מידלו את הבעיות ומצאו פתרונות אופטימליים עבורן.

דוגמה

הדוגמה הבאה היא מקרה פרטי פשוט. נניח וברית המועצות יכולה לבצע ניסוי גרעיני באחד משני מועדים בלבד (מועד א' ומועד ב'). ארצות הברית מורשית לשלוח משלחת לבדיקת ביצוע ניסוי שכזה באחד משני המועדים בלבד. לברית המועצות ולארצות הברית אין העדפה (תועלת) מביצוע הניסוי או אי ביצועו במועד ספיציפי. התועלת המכומתת של ארצות הברית ושל ברית המועצות בכל אחת מהאפשרויות הן כדלקמן:

  1. אם בוצע ניסוי ולא נשלחה משלחת: 0 לארצות הברית, 1 לברית המועצות.
  2. אם בוצע ניסוי ונשלחה משלחת: 1 לארצות הברית, 0 לברית המועצות.
  3. אם לא בוצע ניסוי (בין אם נשלחה משלחת ובין אם לא): α לארצות הברית, β לברית המועצות.

בהינתן מצב כזה, אפשר לנתחו בצורה הבאה: לארצות הברית יש אינטרס שלא יבוצעו ניסויים גרעיניים כלל, לכן ניתן להסיק שתועלתה מאי ביצוע ניסוי גרעיני על ידי ברית המועצות תהיה גדולה מביצוע ניסוי שכזה על אף שנתפס. ולכן α>1. כמו כן לברית המועצות יש אינטרס לבצע ניסוי גרעיני, במידה ולא תתפס. כלומר עדיף לה לא להתפס ולא לבצע ניסוי גרעיני מאשר לבצע לבצע ניסוי גרעיני ולהתפס, מצד שני המקרה האולטימטיבי עבורה הינו ביצוע ניסוי גרעיני ולא להתפס. מכאן נסיק כי 0<β וכן β<1. בשלב ראשון של ניתוח המשחק והמהלכים האולטימטיבים לביצוע, ניתן להציג את עץ המשחק בצורה הבאה, אשר מציג את כל אפשרויות המשחק של שני השחקנים.

עץ משחק המפקח

בשלב שני, ניתן לפסול הרבה מאפשרויות המשחק.

  1. אם ברית המועצות עשתה ניסוי במועד א', אזי היא לא תעשה ניסוי במועד ב', כלומר ניתן להתעלם מכל תת-העץ הנ"ל.
  2. אם ארצות הברית לא שלחה משלחת במועד הראשון, אין סיבה שלא תשלח משלחת במועד השני, שכן אין לה הפסד מכך, אזי ניתן להתעלם מכל תת-העץ שמתייחס לכך שארצות הברית לא שולחת משלחת כלל.
  3. כמסקנה מ-ב', אם ארצות הברית לא שלחה משלחת במועד הראשון, ברית המועצות לא תבצע ניסוי במועד השני, שכן ארצות הברית ככל הנראה תשלח משלחת למועד זה.

נשארנו עם תת-המשחק הבא, המוצג באמצעות טבלה ובכל תא כתובה התועלת של כל אחד מהשחקנים (שחקן השורה ושחקן העמודה כפי שמצוין בטבלה).

לשלוח ב' לשלוח א' ארצות הברית\ברית המועצות
1,0 0,1 ניסוי א'
β,α 1,0 ניסוי ב' אם היה ביקור ב-א'
β,α β,α ללא ניסוי כלל

כעת, על מנת למצוא שיווי משקל כלשהו (לאו דווקא יחיד), ניתן להוריד אסטרטגיות נשלטות חלש, כגון זו שבשורה האחרונה בטבלה. במצב זה ניתן להסיק שאין שיווי משקל באסטרטגיות טהורות. נשאר עם משחק מטריצה בגודל 2X2, שיווי המשקל בו יתקבל בחישוב על ידי אסטרטגיות מעורבות (שאינו מיוחד ל"משחק המפקח"). שיווי המשקל יתקבל בקמור התשלומים של שני השחקנים. לאחר חישוב, נמצא שבמשחק זה שיווי המשקל היחיד הינו:

עבור ברית המועצות:

עבור ארצות הברית:

נשים לב ששיווי המשקל נמצא על הישר הימני בשוליי הקמור. כמו כן, זהו שיווי המשקל היחיד הנובע מכך שארצות הברית תהיה מעוניינת להגדיל את תועלתה ותנסה לגרום לברית המועצות לשחק B על ידי כך שתגדיל את הסתברותה לשחק L.

על ידי חישוב נגיע לכך שאסטרטגית המקסמין של ברית המועצות הינה

והתשלום שלה עבור משחק באסטרטגיה זו הוא שזהו אותו התשלום כאשר היא משחקת את המשחק הטוב ביותר שלה בתגובה לאסטרטגיה המעורבת של ארצות הברית. כלומר, ברית המועצות משחקת באסטרטגיה אחת מסוימת ללא תלות באסטרטגיה המעורבת של ארצות הברית. גאומטרית, נובע מכך, שהתשלום של שתי המעצמות נמצא על קו אנכי לציר ה-. מכאן ניתן להסיק (עד כדי ε) שארצות הברית אינה יכולה לצפות לתשלום גבוה יותר מאשר זה שהיא מקבלת כאשר היא משחקת באסטרטגיה שמצאנו לעיל (האסטרטגיה המעורבת). זאת מכיוון שארצות הברית תרצה למקסם את תועלתה והמקסימום יתקבל על שפת הקמור.


משחק המפקח קמור

לקריאה נוספת

  • שמואל זמיר, מיכאל משלר, אילון סולן, תורת המשחקים, הוצאת מאגנס, 2008
  • אביעד חפץ, חשיבה אסטרטגית - תורת המשחקים ושימושיה בכלכלה ובניהול, הוצאת האוניברסיטה הפתוחה, 2008
  • ג'רלד שטיינברג, מושגי יסוד ביחסים בינלאומיים, אסטרטגיה של נשק לא קונוונציונאלי, הוצאת האוניברסיטה הפתוחה, 1997

קישורים חיצוניים