בעיית מונטי הול

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש

בעיית מונטי הול או בעיית "עשינו עסק" היא בעיה בתורת ההסתברות שפתרונה אינו אינטואיטיבי. הבעיה מכונה גם "הפרדוקס של מונטי הול".

הבעיה

לאחר שהשחקן בחר דלת, המנחה פותח אחת משתי הדלתות הנותרות ומאחוריה נמצאת עז

הבעיה קרויה על שם שעשועון הטלוויזיה האמריקאי המצליח "Let's Make a Deal (אנ')" בהנחיית מונטי הול. בסוף התוכנית מציגים בפני השחקן שלוש דלתות. מאחורי אחת מהן מצוי פרס יקר ערך - מכונית - ומאחורי שתי הדלתות האחרות - עזים. השחקן מעדיף כמובן את המכונית, אבל הוא אינו יודע איזו דלת מסתירה אותה, ונאלץ לבחור באקראי. אם יבחר בדלת הנכונה, יזכה בפרס; אחרת, לא יקבל דבר.

וזוהי הבעיה:

  • לאחר שהשחקן הצביע על אחת הדלתות, המנחה, היודע מהי הדלת הנכונה, פותח אחת משתי הדלתות האחרות, ומגלה מאחוריה עז. כעת מאפשרים לשחקן להחליט האם לדבוק בבחירה המקורית שלו, או לשנות את ההחלטה ולהעדיף במקומה את הדלת האחרונה שנותרה סגורה.

ניתוח פשטני של הסיטואציה מציג בפנינו את הדילמה הבאה: מצד אחד, הסיכוי שהשחקן בחר בדלת הנכונה היה 1/3, וברגע הבחירה ברור לו שמבין שתי הדלתות האחרות לפחות אחת מסתירה עז. אם כך, המנחה שפתח דלת לא גילה לשחקן שום דבר שלא ידע מראש, ולכן הסיכוי שהדלת שבחר היא הנכונה צריך, לכאורה, להישאר שליש, כשהיה. מצד שני, לאחר שהמנחה פתח את הדלת שלו, נותרו שתי דלתות סגורות, ורק אחת מהן מסתירה את הפרס. לכן (אפילו מנקודת המבט של צופה חיצוני, שאינו יודע באיזו דלת בחר השחקן), הסיכויים שהפרס נמצא מאחורי הדלת הנותרת הם 1/2. גישה שלישית טוענת שעל הדלת שהמנחה לא פתח לא למדנו דבר - כך שהסיכוי שלה להסתיר את הפרס היה ונשאר 1/3, והסיכוי של הדלת עליה הצבענו אמור להיות 2/3.

כפי שיוסבר בהמשך, בניסוח הזה אין שום דרך לחשב את הסיכויים הנכונים, ועל כן נתגלו אי-הסכמות בין מי שניסו לחשב אותם בכל זאת. נתבונן בניסוח מדוקדק יותר של הבעיה[1]:

  • לאחר שהשחקן הצביע על אחת הדלתות, המנחה, היודע מהי הדלת הנכונה, מחויב על-פי כללי המשחק לפתוח אחת משתי הדלתות האחרות ולגלות מאחוריה עז. כמקודם, השחקן צריך להחליט האם להישאר עם אותה דלת, או להחליף אותה באחרת.

בניסוח הקודם של הבעיה המנחה פותח דלת ומגלה מאחוריה עז, ובניסוח השני מתברר שהוא לא פעל סתם כך, אלא היה מחויב לעשות כן לפי כללי המשחק. מתברר שאבחנה עדינה זו מספיקה כדי שאפשר יהיה לחשב באופן מדויק את הסיכויים לכך שהפרס מסתתר מאחורי הדלת שלא נפתחה: 2/3. בתנאים אלה, בוודאי שעדיף לעבור לדלת השנייה. לכאורה נדמה שזו תוצאה אבסורדית, שכן (כאמור לעיל) על עצם הקיום של דלת מסתירת-עז שלא בחרנו בה, ידענו ממילא, ואם כך מה חידש המנחה? ומה היתרון של השחקן על-פני אורח שהזדמן לאולפן אחרי שהדלת נפתחה (ומבחינתו הסיכויים לכל אחת משתי הדלתות הסגורות שווים)? הסיבה לכדאיות ההחלפה תוסבר בהמשך.

מקורה של הבעיה

השם "הבעיה של מונטי הול" ניתן לבעיה זו על ידי סטיב סלווין (אנ'), לאחר שהציג אותה במאמר שפורסם בפברואר 1975 בכתב העת American Statistician (אנ'), אף שבשעשועון המקורי אין בחירה חוזרת - לאחר שהשחקן בחר באחת משלוש הדלתות, מסתיים הסיפור.

הבעיה הוצגה עוד קודם לכן, בשנת 1959, על ידי מרטין גרדנר, בטורו בירחון Scientific American. אצל גארדנר היא קרויה "בעיית שלושת האסירים" וניסוחה:

שלושה אסירים, א, ב, ג נידונו למוות. המושל בחר באופן אקראי אחד מהם והחליט להעניק לו חנינה, ואת בחירתו גילה רק לסוהר. הסוהר מסרב לגלות מה גורלו של א, אך מוכן לגלות שמבין שני האחרים, ב לא זכה בחנינה. הזוכה בחנינה הוא, אם כן, א או ג. מה ההסתברות שהזוכה בחנינה הוא א?

בנוסח זה של הבעיה יש מעט פחות עמימות מאשר בנוסח הראשון שלנו ל"בעיה של מונטי הול", אם כי קל לראות ששתי הבעיות שקולות זו לזו. זו בעיה בפסיכולוגיה של סוהרים ויחסי אנוש, ולא בתורת ההסתברות.

לראשונה הופיעה הבעיה עוד בשנת 1889, בספרו של ז'וזף ברטראן Calcul des probabilités.

ניתוח הגרסה הראשונה

התשובה הנכונה לשאלה בגרסה הראשונה היא שאי אפשר לדעת מה עדיף. כפי שהבעיה מנוסחת שם, המנחה יכול היה שלא לפתוח אף דלת, ואולי אפילו יכול היה לפתוח את הדלת עם הפרס. מכיוון שכך, המנחה יכול להיות משתף פעולה ולהמליץ על החלפה רק אם השחקן טועה (עם מנחה כזה, הסיכויים להצליח בהחלפה הם 100%), או רודף סנסציות שממליץ על החלפה רק אם השחקן צודק (ואז הסיכויים להצליח בהחלפה הם 0).

על ידי מיזוג שתי התכונות האלה, אפשר "לחשב" שהסיכויים להצליח בהחלפת הדלתות הם כל מספר שנרצה. גם כאן, הבעיה הופכת להיות סוגיה בפסיכולוגיה של מנחי טלוויזיה, ולא בהסתברות.

ניתוח הגרסה השנייה

נקודת המפתח בגרסה זו היא מחויבות המנחה לפתיחת דלת שמאחוריה מסתתרת עז, מה שמשאיר במשחק שתי דלתות. אם השחקן צודק בניחוש הראשון ובוחר במכונית (הסיכוי לכך הוא 1/3), החלפת הדלת תגרום לו להפסיד. ואם טעה ובחר בעז, המנחה פותח את הדלת השגויה האחרת, ומשאיר סגורה את הדלת הנכונה; במקרה כזה ההחלפה תבטיח לשחקן את הפרס, וזה קורה בסיכוי של 2/3.

היתרון של השחקן על-פני האורח שנכנס אחרי פתיחת הדלת הוא באינפורמציה שאינה ידועה לו: השחקן בחר את הדלת שלו כשהיא הייתה אחת משלוש, ולכן הסיכוי שלה להסתיר את הפרס הוא 1/3. מבחינת האורח, דלת זו היא אחת משתיים, והסיכוי שלה להסתיר את הפרס הוא 1/2. האבחנה הזו (איזו דלת נכונה בסיכוי 1/3 ואיזו נכונה בסיכוי 2/3) היא הדבר שהשחקן יודע והאורח אינו יודע. הסיכוי תלוי בנקודת המבט. נאמר שהאורח מצביע על אחת הדלתות. מבחינתו, הסיכוי שזוהי הדלת הנכונה הוא חצי. השחקן יודע שהסיכוי הוא שליש או שני שלישים (תלוי כמובן באיזו דלת מדובר). באותה עת, מבחינת המנחה הכל-יודע, הסיכוי הוא אפס או אחת.

ההסבר הוא פשוט: אם בחרת מראש מכונית, שינוי הבחירה תמיד יגרום לך לקבל עז. אם בחרת מראש בעז, הרי שינוי הבחירה שלך יגרום לך תמיד לקבל מכונית. אבל מה ההסתברות שבחרת מראש בעז? מכיוון שיש 2 עיזים ומכונית אחת, הסיכוי שבחרת בהתחלה עז גדול פי שניים מזה שבחרת מכונית (2/3). לכן שינוי הבחירה יזכה אותך במכונית בהסתברות כפולה, קרי 2/3.

במבט ראשון פתרון הבעיה נראה מנוגד לאינטואציה, ניתן גם להציג את הבעיה בצורה מעט אחרת, שהופכת את הפתרון לקל יותר להבנה:

  • אם אחרי בחירת הדלת היה המנחה מציע (תמיד) לנטוש אותה ולבחור במקומה בשתי הדלתות האחרות, כך שאם מסתתרת מכונית מעברו השני של אחת מהן - נזכה בה, היה ברור שכדאי לקבל את ההצעה. אבל בכך שהוא פותח רק אחת משתי הדלתות האחרות, וחושף את העז, המנחה מציע לשחקן בדיוק את ההצעה הזו: לקבל את שתי הדלתות שלא בחרנו, שידוע כי באחת מהן נמצאת עז. כאן קל יותר להשתכנע שהסיכויים לזכות בפרס אחרי החלפה הם 2/3.
  • דרך אחרת להסביר את הפתרון היא בניתוח אסטרטגי. האסטרטגיה "הצמד למה שבחרת בהתחלה" מבטיחה לשחקן הסתברות זכייה של 1/3, משום שזו הייתה ההסתברות מרגע הבחירה הראשון. האסטרטגיה "החלף בכל מקרה" היא האסטרטגיה המשלימה (המנחה השאיר רק שתי דלתות), ולכן ההסתברות להצליח בעזרתה היא 2/3.
  • נניח שמתקיים אותו משחק עם אלף דלתות, כאשר בצידה השני של אחת מהן מסתתר פרס, ומאחורי 999 הדלתות הנוספות נמצאות עזים. בתחילה נבחר דלת, והמנחה יפתח עוד 998 דלתות נוספות, שבצידן השני עזים. האם כדאי יהיה לשחקן להחליף את הבחירה המקורית שלו? כמובן. ההסבר לכך הוא השאלה: מתי ההחלפה תגרום להפסד? זה יקרה אך ורק כאשר הדלת הנכונה היא זו שנבחרה בהתחלה, אירוע שהסיכוי לו הוא 0.1%. בכל בחירה אחרת השחקן ישפר את מצבו ויזכה.

פתרון הסתברותי לגרסה השנייה

  • מאורע X: המכונית מאחורי וילון 1.
  • מאורע Y: המכונית מאחורי וילון 2.
  • מאורע Z: המכונית מאחורי וילון 3.
  • מאורע B: המנחה פותח את וילון 2 שמאחוריו עז.

נבחין כי בתחילת השעשועון כאשר המשתתף יבחר את הווילון באופן שרירותי (נניח כי הבחירה שלו היא X) ההסתברות לבחירה שווה ולכן - P(X)=P(Y)=P(Z)=1/3

כעת נחשב את ההסתברות לזכייה במכונית כאשר המשתתף החליף וילון, וכאשר הוא לא החליף וילון.

מקרה ראשון- המשתתף לא החליף וילון - P(X|B):

נחשב את ההסתברות שהמכונית תהייה מאחורי הוילון הראשון בהינתן שהיא לא מאחורי הוילון השני.

P(X ∩ B) = P(B|X)xP(X)=1/2 x 1/3=1/6

1/2=P(B)=P(B|X)xP(X)+P(B|Y)xP(Y)+P(B|Z)xP(Z)=1/6+0 x 1/3 +1 x 1/3

P(X|B)=P(X ∩ B) / P(B) =(1/6)/(1/2)=1/3

הסיכוי לזכייה במכונית נשמר והוא 1/3.

מקרה שני- המשתתף החליף וילון - P(Z|B):

נחשב את ההסתברות שהמכונית תהייה מאחורי הוילון השלישי בהינתן שהיא לא מאחורי הוילון השני.

P(Z|B)=P(Z ∩ B) / P(B)=(P(B|Z)xP(Z))/P(B)=(1/3)/(1/2)=2/3

הסיכוי לזכייה במכונית הוא 2/3.

נבחין כי הסיכויים לזכות במכונית לאחר החלפת הוילון אכן גודלים יותר מהסיכויים לזכות במכונית ללא החלפת הוילון הנבחר בתחילת השעשועון.

P(Z|B) = 2/3 > 1/3 = P(X|B).

תרשים המתאר את התשובה לבעיית מונטי הול בדומה לתרשים בספר "המקרה המוזר של הכלב בשעת לילה"

בתרבות

  • בספר "המקרה המוזר של הכלב בשעת לילה", מובאת החידה וההד האקדמי שהיא עוררה כהוכחה לכך שמתמטיקה היא דבר שאיננו ברור ואינטואיטיבי. בספר גם מופיע חישוב הסתברותי פשוט (באמצעות הסתברות מותנית) שממחיש את פתרון החידה בצורה מתמטית.
  • בסרט "21", המספר את סיפורו של גאון מתמטי אשר מנצל את כישוריו בתחום המספרים על-מנת לזכות בהימורים בלאס וגאס. מארגן קבוצת המהמרים הוא מרצה באוניברסיטה, והוא מציג לתלמידו את בעיית מונטי הול כמבחן ליכולת החשיבה ההסתברותית שלו. בסרט מוצגת הגרסה הפתירה של הבעיה (המופיעה כאן שנייה). לאחר שהתלמיד מסביר מדוע כדאי להחליף את הבחירה ולהגדיל את הסיכוי ל-2/3, הוא עובר את המבחן בהצלחה ומגויס לצוות ההימורים שהרכיב המרצה.

ראו גם

לקריאה נוספת

קישורים חיצוניים

הערות שוליים

  1. ^ כפי שהוא מופיע למשל ב-Understanding Probability, Henk Tijms, Cambridge University Press, 2004, בעיה 1.11; וראו ניתוח מפורט בסעיף 6.1.
הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

32727372בעיית מונטי הול