תוחלת

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש
Erwartungswert.png

בתורת ההסתברות ובסטטיסטיקה, התוחלתאנגלית: Expected value, ערך נצפה או Mean, מסומנת: E או μ, בהתאמה) של משתנה מקרי היא ממוצע הערכים אותם יכול המשתנה לקבל, משוקלל על-פי ההסתברויות של הערכים השונים. במדעים אמפיריים, התוחלת מייצגת את הערך אליו שואפת התוצאה הממוצעת של ניסוי כשמספר הניסויים שואף לאינסוף פעמים; אכן, לפי החוק החזק של המספרים הגדולים, שני הפירושים מתלכדים. באופן עממי, התוחלת היא ממוצע (משוקלל בהסתברויות) של כל הערכים האפשריים בניסוי. לתוחלת יש שימוש נרחב בפיזיקה סטטיסטית, בפיזיקה קוונטית ובהנדסה.

רקע

בניגוד לממוצע החשבוני הרגיל, המחושב על ידי סיכום סדרת ערכים וחלוקת הסכום למספר הערכים, התוחלת היא ממוצע משוקלל של כל הערכים האפשריים, כשכל ערך משוקלל בהסתברות שלו. בזכות חוק המספרים הגדולים, התוחלת מהווה קירוב לממוצע של סדרת תוצאות ארוכה, ויכולה לסייע בתחזיות של רווח והפסד וכדומה. בהתאם לכך, משחק מזל נחשב להוגן אם תוחלת הזכייה בו, בניכוי דמי ההשתתפות, היא אפס - דבר זה מצביע על כך שבטווח הארוך מחולקים כל דמי ההשתתפות בין השחקנים, ללא רווח או הפסד למארגנים. לדוגמה, בגלגל הרולטה יש 38 תוצאות אפשריות: כשהמהמר על אחד המספרים זוכה, משלמים לו פי 36 מדמי ההשתתפות. לפיכך, תוחלת הרווח של המהמר היא פי מגובה ההימור, היינו, הפסד של כ-53 שקלים בהימור על כל אלף שקלים.

התוחלת מייצגת תוצאה "צפויה" (Expected) של ניסוי זהה החוזר על עצמו פעמים רבות. מכאן מקורו של המונח בלועזית. אך אפשר שהערך של התוחלת עצמו לא יהיה תוצאה "צפויה" במובן המקובל, הוא עשוי להיות נדיר או אפילו בלתי אפשרי (ראו דוגמה להמחשה).

הגדרה

התוחלת מסומלת על ידי ולעיתים .

כאשר X הוא משתנה מקרי בדיד שמקבל את הערכים ...,x1, x2, התוחלת תחושב על ידי הטור (כמו בדוגמת הרולטה לעיל ובדוגמה להלן). במקום לסכום על פי ערכי המשתנה, אפשר לסכום על פי המאורעות במרחב המדגם Ω: . התוחלת קיימת אם ורק אם הטור מתכנס בהחלט (אם הטור סופי הוא מתכנס בהחלט באופן טריביאלי). אם X הוא משתנה מקרי רציף בעל פונקציית צפיפות הסתברות f אזי .

בצורה הכללית, אם X הוא משתנה מקרי המוגדר על מרחב הסתברות , אזי התוחלת של X מוגדרת על ידי כאשר האינטגרל הוא אינטגרל לבג. בדומה למקרה הבדיד, התוחלת קיימת רק כאשר האינטגרל מתכנס בהחלט.

מומנטים: המומנט מסדר n של משתנה מקרי X הוא התוחלת של החזקות ה-n-ית של X, כלומר . המומנט מסדר n סביב התוחלת של X מוגדר כ-, כאשר הוא שווה לשונות.

אמידה: כדי לאמוד את התוחלת של משתנה מקרי באופן אמפירי, מבצעים מדידות חוזרות של המשתנה ומחשבים את הממוצע החשבוני של התוצאות (חוק המספרים הגדולים מבטיח שאומדן זה מתכנס בהסתברות לתוחלת). לאומדן זה יש התכונה שהוא ממזער את סכום ריבועי השגיאות ביחס לתוחלת.

דוגמה 1

הדגמת חישוב התוחלת של משתנה מקרי בדיד.
כאשר מטילים קובייה הוגנת (בעלת שש פאות) ההסתברות לקבלת כל מספר מ-1 עד 6 שווה ל-1/6. המשתנה המקרי הוא תוצאת ההטלה של הקוביה והתוחלת של משתנה מקרי זה תחושב באופן הבא:

דוגמה זו ממחישה שתי תכונות של התוחלת:

  1. תוצאה צפויה: ערך התוחלת (3.5) לא חייב להיות אחד הערכים האפשריים של המשתנה המקרי (המספרים השלמים 1-6).
  2. כאשר ההסתברות בניסוי לקבלת כל תוצאה היא שווה אזי התוחלת היא הממוצע החשבוני.

ניתן לתת לתוחלת את הפירוש הבא: אם משלמים למהמר לפי תוצאות הטלת הקובייה, דהיינו במקרה שייצא 1 - יקבל 1 ש"ח, במקרה שייצא 6 - יקבל 6 ש"ח, הרי שהסכום הממוצע שהמהמר צפוי לקבל לאחר 10 הטלות של הקובייה הוא ש"ח.

דוגמה 2

לצורך הדוגמה נעזר בטבלה הבאה: (בהנחה שאלו פרסים קבועים שאינם משתנים, מספר המשתתפים בהגרלה הוא 16,273,488 והמחיר להשתתפות בהגרלה הוא 2.9 ₪).

רמת הפרס סכום הפרס מספר הזוכים הסתברות הזכייה ≈אחוז תוחלת הזכייה (*אחוז ההחזר) ≈תוחלת הרווח הצפוי ≈תוחלת הזכייה
(=תוחלת הרווח)
תוחלת ההפסד הצפוי תוחלת ההפסד
1 4,000,000 1 1/16,273,488 8.4758% 0.2458 ₪ 2.6542- ₪
2 500,000 6 6/16,273,488 6.3569% 0.1843 ₪ 2.7157- ₪
3 2,500 186 186/16,273,488 0.9853% 0.0286 ₪ 2.8714- ₪
4 350 1,116 1,116/16,273,488 0.8277% 0.0240 ₪ 2.8760- ₪
5 125 6,975 6,975/16,273,488 1.8475%
6 40 41,850 41,850/16,273,488 3.5471%
7 35 89,900 89,900/16,273,488 6.6673%
8 10 539,400 539,400/16,273,488 11.4296%
סה״כ: 1.16 ₪ בממוצע 679,434 679,434/16,273,488 40.1371% 1.1640 1.7360-
שאינם זוכים
בשום פרס
0 15,594,054 15,594,054/16,273,488 0.0000%
סה״כ 1.16 ₪ בממוצע 16,273,488 1/1 40.1371%

ניתן לחשב את תוחלת הרווח הצפוי בצורה הבאה:

1.163977569= 539,400/16,273,488 * 10 + . . . 1,116/16,273,488 * 350 + 186/16,273,488 * 2,500 + 6/16,273,488* 500,000 + 1/16,273,488 * 4,000,000

כלומר, אם לדוגמה עלות השתתפות במשחק זה היא 2.9 ₪ אזי תוחלת אחוז הרווח הצפוי שווה ל-40.1371575% (2.9 / 1.163977569) מההשקעה.

תוחלת ההפסד הצפוי מן ההשתתפות בהגרלה היא 1.736022431 = 2.9 (עלות ההשתתפות=תוחלת עלות ההשתתפות) פחות 1.163977569 (תוחלת הרווח הצפוי).

תוחלת ההפסד הצפוי מהווה 59.8628425% מעלות ההשתתפות בהגרלה (1.736022431 חלקי 2.9, או 100% פחות 40.1371575%).

דרך נוספת לחישוב תוחלת הרווח הצפוי: 1.163977569 ≈ 15,594,054/16,273,488 * (0-2.9) + 539,400/16,273,488 * (10-2.9) + . . . 6/16,273,488 * (500,000-2.9) + 1/16,273,488 * (4,000,000-2.9) + 2.9

דרך נוספת לחישוב אחוז תוחלת הרווח הצפוי (אחוז ההחזר) 40.1371575% ≈ 15,594,054/16,273,488 * 0/2.9 + 539,400/16,273,488 * 10/2.9 + . . . 6/16,273,488 * 500,000/2.9 + 1/16,273,488 * 4,000,000/2.9

יש להבדיל בין תוחלת הזכייה/תוחלת ההפסד (שבה הערך המתקבל מייצג את סכום הרווח/ההפסד) לבין תוחלת הרווח הצפוי/תוחלת ההפסד הצפוי (שבה הערך המתקבל מייצג את הסכום הממוצע שמוחזר בכל הגרלה) הנובעות מההשתתפות בהגרלה, בשני המקרים האחוז זהה אך התוחלת שונה.

  • בהגרלות בהן הפרסים מתחלקים בין הזוכים - תוחלת הצפי אינה בהכרח זהה לאחוז ההחזר המוקצה לפרסים.

תכונות התוחלת

  • לשני משתנים מקריים בעלי אותה התפלגות תהיה אותה תוחלת.

אופרטור התוחלת E הוא לינארי, ולפיכך (כאשר X ,Y משתנים מקריים המוגדרים על אותו מרחב הסתברות, ו- a ,b מספרים ממשיים):

  • אופרטור התוחלת אינו כפלי, כלומר, השוויון אינו מתקיים בדרך כלל. כאשר השוויון מתקיים, אומרים שהמשתנים X ו-Y בלתי מתואמים. כל שני משתנים בלתי תלויים הם גם בלתי מתואמים. ההפרש הוא השונות המשותפת, שממנה אפשר לחשב את מקדם המתאם.
  • אם X,Y משתנים מקריים, מתקיים . תוצאה זו קרויה לפעמים "משפט ההחלקה".

תוחלת של זמן המתנה

אם X הוא משתנה מקרי המקבל רק ערכים טבעיים, אז התוחלת שלו מקיימת (לנוסחה זו יש גם גרסאות כלליות יותר). ביטוי זה לחישוב התוחלת שימושי במקרה שהמשתנה מייצג את זמן ההמתנה עד להתרחשותו של מאורע (כגון הופעתה הראשונה של המלה "אנציקלופדיה" בסדרה של תווים אקראיים).

ראו גם