שיווי משקל משוכלל

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש

בתורת המשחקים, שיווי משקל משוכלל הוא עידון של המושג שיווי משקל נאש שנהגה על ידי ריינהרד סלטן ב-1975. בשיווי משקל משוכלל מניחים שקיימת הסתברות גדולה מ- (גם אם קטנה) ששחקן יבחר בטעות באסטרטגיה לא מיטבית.

רקע

כאשר מניחים שכל השחקנים רציונליים מתעוררת בעיה להכליל טעויות של שחקנים לתוך מודל המשחק: אם משוחקת אסטרטגיה לא מיטבית (לא רציונלית) על ידי שחקן כלשהו נשאלת השאלה אם שאר השחקנים צריכים להניח שהשחקן הטועה אינו רציונלי. תשובה חיובית או שלילית לשאלה זו משפיעה כמובן על החלטות השחקנים הנותרים.

על מנת לאפשר לתאר משחקים עם טעויות בלי לוותר על הנחת הרציונליות של השחקנים הציג סלטן את עיקרון היד הרועדת: נניח שקיימת הסתברות מסוימת, קטנה ככל שתהיה, ששחקן יבצע בחירה שגויה ויחד עם זאת נמשיך להניח שפעולות השחקנים רציונליות מיסודן. לדוגמה אפשר לדמיין שחקן שנדרש ללחוץ על אחד משני כפתורי הצבעה, מחליט ללחוץ על הראשון ובטעות לוחץ על השני. מתוך הגדרת עקרון היד הרועדת הגיע סלטן להגדרת שיווי המשקל המשוכלל.

הגדרה

משחק עם הפרעות- משחק בצורה אסטרטגית שבו מאפשרים רק לאסטרטגיות מעורבות לחלוטין להתקיים, משמע כל אסטרטגיה טהורה של כל שחקן משוחקת בהסתברות גדולה מ-0. ההפרעה היא וקטור ההסתברויות המזעריות בהן מותר לשחק כל אסטרטגיה.

פורמלית: יהי משחק בצורה אסטרטגית. לכל שחקן נתון וקטור האילוצים כך שמתקיים ש- לכל וגם לכל .

נסמן את וקטור האילוצים של כל השחקנים. המשחק עם v-הפרעות הוא המשחק שבו קבוצת האסטרטגיות של שחקן i היא .

שיווי משקל משוכלל- שיווי משקל נאש המתקבל כגבול של שיוויי משקל במשחקים עם הפרעות כאשר גודל ההפרעה המרבית שואף ל-0.

פורמלית: אסטרטגיה מעורבת במשחק בצורה אסטרטגית נקראת שיווי משקל משוכלל אם קיימת סדרה של וקטורי אילוצים המקיימים ש- ולכל קיימת נקודת שיווי משקל במשחק כך שמתקיים .

דוגמה

במשחק שני השחקנים המוצג בצורה אסטרטגית במטריצה קיימים שני שיוויי משקל נאש באסטרטגיות טהורות- (Up,Left),(Down,Right). נראה שרק (Up,Left) הוא שיווי משקל משוכלל:

משחק בצורה אסטרטגית
Right Left
Up 0, 2 1, 1
Down 2, 2 2, 0

נניח ששחקן 1 משחק באסטרטגיה המעורבת , כאשר .

הרווח של שחקן 2 אם יבחר לשחק Left במקרה זה יהיה :

במקרה ששחקן 2 ישחק Right הרווח הצפוי הוא :

אם ε מספיק קטן שחקן 2 ממקסם את תוחלת התועלת שלו על ידי בחירת האסטרטגיה Right במשקל המרבי האפשרי (במשחק מופרע משקל זה אינו יכול להיות 1). הטיעון הסימטרי לגבי הרווח הצפוי לשחקן 1 מוביל למסקנה ששחקן 1 ישחק Up בהסתברות הגבוהה ביותר האפשרית. אם ניקח סדרת משחקים מופרעים כמתואר לעיל עם ε השואף ל-0 נקבל בהתאם סדרה של שיוויי משקל נאש השואפים ל(U,L). לכן בהתאם להגדרה (U,L) הוא שיווי משקל משוכלל.

לעומת זאת נראה (D,R) אינו שיווי משקל משוכלל: נניח ששחקן 1 משחק באסטרטגיה המעורבת .

הרווח הצפוי לשחקן 2 אם ישחק Left הינו:

הרווח הצפוי ל-2 ממשחק Right הינו:

לכל ערך (בתחום המוגדר) של ε שחקן 2 יעדיף לשחק Left בהסתברות הגבוהה ביותר האפשרית. לכן (D,R) אינו שיווי משקל משוכלל- בהינתן הפרעה במשחק שחקן 2 יעדיף לשנות את האסטרטגיה שלו מRight לLeft. טיעון סימטרי נכון גם לגבי שחקן 1.

תכונות

ראו גם

לקריאה נוספת