המבחן המדויק של פישר
המבחן המדוייק של פישר, (או בקיצור "מבחן פישר"), הוא מבחן סטטיסטי לבדיקת השערת אי התלות בין שני משתנים איכותיים. מבחן זה שימושי כאשר גודל המדגם הוא קטן, ולכן הקירובים האסימפטוטיים של מבחנים כגון מבחן חי בריבוע אינם תקפים. עם זאת, המבחן עצמו תקף גם עבור מדגמים גדולים, למרות שבאופן מעשי יש קושי לבצע את החישובים הנדרשים כאשר המדגם גדול.
היסטוריה
רונלד פישר הציג את המבחן ב-[1]1922 . ההקשר המפורסם ביותר של המבחן הוא ניסוי "הליידי טועמת התה" [2], המתואר בספרו של פישר מ-1935 [3]. הליידי, ד"ר מוריאל בריסטול, טענה כי היא מסוגלת לזהות על ידי טעימה אם ספל תה הוכן באופן שבו תחילה נמזגו המים הרותחים ולאחר מכן הוסף להם חלב, או להיפך. כדי לבחון את טענתה, פישר ערך ניסוי בו הוגשו לליידי לטעימה 8 ספלי תה, כאשר בארבעה מהם נמזגו תחילה המים הרותחים ואז נוסף להם החלב, ובארבעה נמזג תחילה החלב ולאחר מכן נוספו המים הרותחים. הניסוי יצר לוח שכיחות של שני משתנים איכותיים, שכל אחד מהם מקבל שני ערכים. משתנה אחד מציין את האופן בו הוכן ספל התה, והשני מציין את קביעתה של הליידי לגבי אופן הכנת התה.
המבחן המקורי שהציג פישר התאים ללוח שכיחות דו מימדי בעל שתי שורות ושתי עמודות, אולם בהמשך הוא הוכלל ללוח שכיחות דו מימדי כלשהו, כלומר כאשר כל משתנה יכול לקבל מספר כלשהו של ערכים [4] . במקרה הכללי, נוסחאות החישוב מסובכות יותר ובדרך כלל לא ניתן לבצע את החישובים באופן ידני.
הגדרה פורמלית ללוח 2x2
נתון לוח השכיחות הבא מסדר 2x2 עבור שני משתנים, ו-:
Total | |||
---|---|---|---|
Total |
כאשר . בלי הגבלת הכלליות נניח כי .
השערת האפס אומרת כי המשתנים ו- הינם בלתי תלויים .
אם נניח כי סכומי השורות והעמודות ידועים וקבועים, אזי ההסתברות כי השכיחות של התצפיות במדגם עבורן ו- היא ניתנת לחישוב על ידי שימוש בהתפלגות ההיפרגיאומטרית:
תחת השערת האפס, הערך הצפוי של הוא . ערכים של הקטנים מהערך הצפוי או גדולים מהערך הצפוי מהווים עדות כנגד השערת אי התלות. לכן לפי הגדרת ערך ה-p, הוא שווה להסתברות כי תתקבל עדות השווה בעצמתה לעדות שהתקבלה במדגם או גדולה ממנה. המשמעות היא לכן כי ערך ה-p שווה לסכום ההסתברויות של כל הלוחות האפשריים שהסתברותם שווה ל- או קטנה ממנו.
בהינתן סכומי השורות והעמודות, השכיחות של התצפיות במדגם עבורן ו- יכולה להיות כל מספר שלם בין 0 לבין . לכן ערך ה-p של מבחן פישר הוא
שימו לב כי זהו מבחן דו-צדדי, במובן שעדות נגד השערת היא התלות יכולה להתקבל גם מערכי הקטנים מ- וגם מערכי הגדולים מ-. ניתן להגדיר גם מבחן חד צדדי, שבו עדות נגד השערת היא התלות יכולה להתקבל רק מערכי הקטנים מ- . במקרה זה
דוגמה
בקורס "מבוא לסטטיסטיקה" לומדים 24 סטודנטים, מחציתם גברים ומחציתם נשים. 10 מהם לומדים לקראת המבחן, ו-14 התייאשו והפסיקו ללמוד. האם יש קשר בין מין הסטודנט לבין גישת הסטודנטים למבחן(לומדים או מיואשים)? נתוני הסטודנטים מוצגים בלוח השכיחות הבא:
סך הכל | גברים | נשים | |
---|---|---|---|
10 | 8 | 2 | לומדים |
14 | 4 | 10 | מיואשים |
24 | 12 | 12 | סך הכל |
ההסתברות כי בהינתן סך השורות וסך העמודות יתקבל לוח השכיחות הזה בו היא: .
מכיוון שכאן , נחשב את ערכי כעבור כל ערכי מ-0 ועד 10. תוצאות החישובים נתונות בטבלה הבאה:
כן | 0.00003 | 0 |
כן | 0.00135 | 1 |
כן | 0.01666 | 2 |
לא | 0.08884 | 3 |
לא | 0.23321 | 4 |
לא | 0.31983 | 5 |
לא | 0.23321 | 6 |
לא | 0.08884 | 7 |
כן | 0.01666 | 8 |
כן | 0.00135 | 9 |
כן | 0.0003 | 10 |
לכן . בהנחה כי החלטנו מראש לבדוק את השערת אי התלות ברמת מובהקות נדחה את השערת האפס של אי התלות בין מין הסטודנט וגישתו למבחן.
בתוכנת R ניתן לחשב את מבחן פישר הדו צדדי לנתונים אלה על ידי הפקודה:
fisher.test(matrix(c(2, 8,10 ,4), nrow=2), alternative="two.sided")
ביקורת
מספר חוקרים טענו כי בפועל רמת המובהקות של מבחן פישר נמוכה מרמת המובהקות המוצהרת[5] [6] [7] . במילים אחרות, אם מבצעים את מבחן פישר ומשתמשים ברמת מובהקות , ההסתברות לטעות מסוג ראשון (דחיה מוטעית של השערת האפס) בדרך כלל קטנה n-. הדבר נובע מחיוב ערך ה-p על סמך התפלגות בדידה. עם זאת יש לציין כי המונח "טעות מסוג ראשון" מוגדר בהקשר של מבחני יחס הנראות על פי הלמה של ניימן ופירסון, ומבחן פישר אינו מבחן יחס נראות.
ביקורת נוספת נוגעת לכך שהמבחן מחושב תחת ההנחה כי ההתפלגויות השוליות של המשתנים נתונות [8] . המבחן הינו מבחן מדוייק רק עבור ההתפלגות המותנית של לוח השכיחות בהינתן ההתפלגויות השוליות, אך אינו מדוייק ביחס ללוח השכיחות המקורי, מכיוון שבמדגם נוסף מאותו גודל עשוי להתקבל לוח שכיחות עם התפלגויות שוליות שונות. ניתן לבנות מבחן מדוייק שאינו מותנה בהתפלגויות השוליות. מבחן ברנרד הוא דוגמה למבחן כזה.
ראו גם
לקריאה נוספת
- Bishop, Y. M. M.; Fienberg, S. E.; Holland, P. W. (1975). Discrete Multivariate Analysis: Theory and Practice. MIT Press. ISBN 978-0-262-02113-5. MR 0381130.
- Agresti, Alan (2007). An introduction to categorical data analysis, 2nd Edition. John Wiley & Sons. ISBN 978-0-471-22618-5.
- Agresti, Alan (2002). Categorical data analysis, 2nd Edition. John Wiley & Sons. ISBN 0-471-36093-7.
- Agresti, A. (1992). A survey of exact inference for contingency tables. Statistical science, 7(1), 131-153.
קישורים חיצוניים
הערות שוליים
- ^ Fisher, R. A., On the interpretation of from contingency tables, and the calculation of P, Journal of the Royal Statistical Society, 1 85, 1922, עמ' 87-94 doi: 10.2307/2340521
- ^ Fisher, R. A. (1956) [The Design of Experiments (1935)]. "Mathematics of a Lady Tasting Tea". In James Roy Newman (ed.). The World of Mathematics, volume 3 (PDF). Courier Dover Publications. ISBN 978-0-486-41151-4.
- ^ Fisher, R. A., The Design of Experiments, 9th edition (1971), Macmillan, 1935, מסת"ב 0-02-844690-9
- ^ Mehta, C. R., & Patel, N. R., A network algorithm for performing Fisher's exact test in r× c contingency tables, Journal of the American Statistical Association, 382 78, 1983, עמ' 427-434 doi: 10.1080/01621459.1983.10477989
- ^ Liddell, D., Practical tests of 2× 2 contingency tables, Journal of the Royal Statistical Society. Series D (The Statistician), 4 25, 1976, עמ' 295-304 doi: 10.2307/2988087
- ^ Berkson, J., In dispraise of the exact test, Journal of Statistical Planning and Inference, 1 2, 1978, עמ' 27-42 doi: 10.1016/0378-3758(78)90019-8
- ^ D'agostino, R. B., Chase, W., & Belanger, A., The appropriateness of some common procedures for testing the equality of two independent binomial populations, The American Statistician, 3 42, 1988, עמ' 198-202
- ^ Barnard, G. A., A new test for 2× 2 tables, Nature, 3954 156, 1945, עמ' 177 doi: 10.1038/156177a0
24855693המבחן המדויק של פישר