תגובה טובה ביותר
בתורת המשחקים, תגובה טובה ביותר היא אסטרטגיה (תכסיס) אשר מובילה לתועלת הטובה ביותר עבור שחקן, בהינתן האסטרטגיות של השחקנים האחרים. תגובה טובה ביותר היא רעיון מרכזי בתורתו של ג'ון פורבס נאש העוסקת בשיווי משקל נאש.
הגדרה פורמלית
משחק בן n שחקנים יסומן כאשר היא קבוצת האסטרטגיות של השחקן ה-, ו- היא פונקציה שמתאימה לכל בחירת אסטרטגיות של כל השחקנים את התועלת (נקרא גם תשלום, או רווח) שמפיק שחקן ה- ממנה.
נסמן את צירוף האסטרטגיות של כל השחקנים באות (ללא סימון שחקן): . נהוג לכתוב את צירוף האסטרטגיות מנקודת מבטו של שחקן כך: . כלומר, האסטרטגיה של שחקן ה- וכל האסטרטגיות של שאר השחקנים.
אסטרטגיה היא תגובה טובה ביותר ל - אם לכל אסטרטגיה אחרת של שחקן ה- מתקיים: .
דוגמה
נסתכל על משחק בין שני שחקנים (באסטרטגיות טהורות). שחקן 1 יכול לבחור אסטרטגיה אחת מתוך הקבוצה ושחקן 2 יכול לבחור אסטרטגיה אחת מתוך הקבוצה . התועלות מתוארות בעזרת הטבלה הבאה. כל משבצת מגדירה את תוצאת הפונקציה כאשר הוא הצירוף הרלוונטי של השורה והטור ( לדוגמה). התועלת של שחקן 1 מופיע משמאל והתועלת של שחקן 2 מופיע מימין.
שחקן 2 בוחר באסטרטגיה | שחקן 2 בוחר באסטרטגיה | שחקן 2 בוחר באסטרטגיה | |
---|---|---|---|
שחקן 1 בוחר באסטרטגיה | 4, 4 | 3, 12 | 2, 1 |
שחקן 1 בוחר באסטרטגיה | 3, 1 | 1, 3 | 3, 2 |
שחקן 1 בוחר באסטרטגיה | 2, 3 | 4, 3 | 2, 0 |
נסתכל על נקודות מבטו של שחקן 1, בהינתן האסטרטגיה שבחר שחקן 2:
- אם שחקן 2 בחר לשחק את אסטרטגיה , בחירה של שחקן 1 באסטרטגיה תוביל לתועלת 4, בחירה באסטרטגיה תוביל לתועלת 1, ובחירה באסטרטגיה תוביל לתועלת 3. לכן התגובה הטובה ביותר במקרה זה תהיה אסטרטגיה .
- אם שחקן 2 בחר לשחק את אסטרטגיה , בחירת אסטרטגיה על ידי שחקן 1 היא תגובה טובה ביותר שתוביל לתועלת 12.
- אם שחקן 2 בחר לשחק את אסטרטגיה , בחירת אסטרטגיה היא תגובה טובה ביותר שתוביל לתועלת 2.
עתה, נסתכל על נקודת מבטו של שחקן 2, בהינתן האסטרטגיה של שחקן 1:
- אם שחקן 1 בחר לשחק את אסטרטגיה , בחירה של שחקן 2 באסטרטגיה תוביל לתועלת 4, בחירה באסטרטגיה תוביל לתועלת 3, ובחירה באסטרטגיה תוביל לתועלת 2. לכן התגובה הטובה ביותר במקרה זה תהיה אסטרטגיה .
- אם שחקן 1 בחר לשחק את אסטרטגיה , נשים לב שיש כאן שתי אסטרטגיות העונות להגדרה של תגובה טובה ביותר. בחירת אסטרטגיה או על ידי שחקן 2 היא תגובה טובה ביותר שתוביל לתועלת 3.
- אם שחקן 1 בחר לשחק את אסטרטגיה , בחירת אסטרטגיה היא תגובה טובה ביותר שתוביל לתועלת 4.
הערה: מצב בו שני השחקנים בוחרים אסטרטגיות כך שכל אחת היא תגובה טובה ביותר לשנייה נקרא שיווי משקל נאש. בדוגמה שלנו יש שיווי משקל נאש: .
דינמיקה של תגובה טובה ביותר
דינמיקה של תגובה טובה ביותר היא תיאור של משחק סדרתי, בו כל שחקן משחק בתורו את התגובה הטובה ביותר בהתאם למצב המשחק הנוכחי. במשחק כזה כל שחקן עושה את הצעד הטוב ביותר עבורו בסיבוב הנוכחי, ללא התחשבות בעתיד המשחק. לכן, דינמיקה של תגובה טובה ביותר לא תמיד תוביל למצב של שיווי משקל טהור, אפילו אם הוא קיים. במשחקי פוטנציאל דינמיקה של תגובה טובה ביותר אכן תוביל לשיווי משקל נאש טהור.
דוגמה
במשחק הבא קיים שיווי משקל נאש עבור בחירת האסטרטגיות , אך אם נתחיל את דינמיקת התגובה הטובה ביותר מאחד התאים , , , או כל שחקן בתורו ירצה לעבור לאסטרטגיה טובה יותר - כזו בה התועלת שלו היא 1 ולא -1. כך השחקנים "יסתובבו" במעגל, ולא יגיעו אף פעם ל - , שהיא נקודת שיווי משקל, ובעלת תועלות גבוהות יותר לשני השחקנים.
0, 0 | 1, 1- | 1-, 1 | |
0, 0 | 1-, 1 | 1, 1- | |
3, 3 | 0, 0 | 0, 0 |
אסטרטגיות מעורבות
אסטרטגיה מעורבת הינה תגובה טובה ביותר כל אחת מהאסטרטגיות בתומך שלה (כלומר, האסטרטגיות שהסתברותן גדולה מ-0) הינה תגובה טובה ביותר.
זאת משום שאם קיימת בתומך אסטרטגיה טהורה שאיננה תגובה טובה ביותר, נוכל ליצור אסטרטגיה מעורבת חדשה, שבה ההסתברות לקבלת היא 0, ולכל שאר האסטרטגיות בתומך נוסיף את חלקה הפורפורציונלי של . כך נקבל אסטרטגיה מעורבת שתועלתה גדולה יותר מזו המקורית.