מבחן F
בסטטיסטיקה, מבחן F הוא כל מבחן סטטיסטי אשר בו סטטיסטי המבחן הוא בעל התפלגות F תחת השערת האפס. השם של המבחן נקבע על ידי הסטטיסטיקאי George Waddel Snedecor, כמחווה לרונלד פישר.
דוגמאות למבחן F
להלן מספר דוגמאות נפוצות שבהן משתמשים במבחני F.
- בחינת ההיפותזה שהתוחלות של אוכלוסיות המתפלגות נורמלית, בעלות אותה סטיית תקן הן שוות. זהו מבחן ה-F הנפוץ ביותר, והוא מהווה חלק חשוב במבחני אנובה.
- בחינת ההיפותזה שמודל רגרסיה מוצע מתאים באופן טוב לנתונים.
דוגמה להשוואה בין שונויות
יהיו $ X_{1},...,X_{n}\sim N(\mu _{1},\sigma _{1}^{2}) $ ויהיו $ Y_{1},...,Y_{m}\sim N(\mu _{2},\sigma _{2}^{2}) $ שני מדגמים כאשר השונויות והתוחלות אינן ידועות. ונניח שאנו רוצים לבדוק האם השונויות זהות או שונות. נגדיר את ההשערות שלנו: $ {\displaystyle H_{0}:\sigma _{1}^{2}=\sigma _{2}^{2}} $ $ {\displaystyle H_{1}:\sigma _{1}^{2}\neq \sigma _{2}^{2}} $
כדי לבחון את ההשערות ולקבוע מתי לדחות את השערת האפס נבנה מבחן יחס נראות מוכלל. נגדיר את אומדי הנראות המקסימלית: $ {\displaystyle {\hat {\mu }}_{1}={\bar {X}},{\hat {\mu }}_{2}={\bar {Y}},{\hat {\sigma }}_{1}^{2}={\frac {1}{n}}\sum (X_{i}-{\bar {X}})^{2},{\hat {\sigma }}_{2}^{2}={\frac {1}{m}}\sum (Y_{i}-{\bar {Y}})^{2}} $
פונקציית הנראות עבור האומדים הללו מקיימת: $ {\displaystyle L({\hat {\mu }}_{1},{\hat {\mu }}_{2},{\hat {\sigma }}_{1},{\hat {\sigma }}_{2})=\left({\frac {1}{{\sqrt {2\pi }}{\hat {\sigma }}_{1}}}\right)^{n}e^{-{\frac {n}{2}}}\left({\frac {1}{{\sqrt {2\pi }}{\hat {\sigma }}_{2}}}\right)^{m}e^{-{\frac {m}{2}}}} $
תחת השערת האפס, מתקיים שהשונויות שוות, נסמנן $ {\hat {\sigma }}_{0}^{2}={\frac {\sum (X_{i}-{\bar {X}})^{2}+\sum (Y_{i}-{\bar {Y}})^{2}}{n+m}} $. כעת, פונקציית הנראות תחת השערת האפס הינה: $ {\displaystyle L({\hat {\mu }}_{1},{\hat {\mu }}_{2},{\hat {\sigma }}_{0})=\left({\frac {1}{{\sqrt {2\pi }}{\hat {\sigma }}_{0}}}\right)^{n+m}e^{-{\frac {n+m}{2}}}} $
משני חישובים אלה נקבל שפונקציית יחס הנראות היא: $ {\displaystyle \lambda (X,Y)={\frac {L({\hat {\mu }}_{1},{\hat {\mu }}_{2},{\hat {\sigma }}_{1},{\hat {\sigma }}_{2})}{L({\hat {\mu }}_{1},{\hat {\mu }}_{2},{\hat {\sigma }}_{0})}}=\left({\frac {{\hat {\sigma }}_{1}^{2}}{{\hat {\sigma }}_{0}^{2}}}\right)^{\frac {n}{2}}\left({\frac {{\hat {\sigma }}_{2}^{2}}{{\hat {\sigma }}_{0}^{2}}}\right)^{\frac {m}{2}}} $ ואם נציב בביטוי את הנתונים ונפשט נקבל:
$ {\displaystyle \lambda (X,Y)=\left(\left(1+{\frac {\sum (Y_{i}-{\bar {Y}})^{2}}{\sum (X_{i}-{\bar {X}})^{2}}}\right){\frac {n+m}{n}}\right)^{-{\frac {n}{2}}}\left(\left(1+{\frac {\sum (X_{i}-{\bar {X}})^{2}}{\sum (Y_{i}-{\bar {Y}})^{2}}}\right){\frac {n+m}{m}}\right)^{-{\frac {m}{2}}}} $
כעת, נביט בסטטיסטי $ T(X,Y)={\frac {\sum (Y_{i}-{\bar {Y}})^{2}}{\sum (X_{i}-{\bar {X}})^{2}}} $. נשים לב שגם כאשר ביטוי זה שואף ל-0 וגם כאשר הוא שואף לאינסוף, $ \lambda (X,Y) $ שואפת לאינסוף. לכן מבחן יחס נראות מוכלל יהיה מהצורה:
נדחה את השערת האפס אם $ T(X,Y)>C_{1} $ או $ T(X,Y)<C_{2} $ כאשר רמת הביטחון מקיימת $ \alpha =P(T(X,Y)<C_{2}orT(X,Y)>C_{1}) $.
כעת, נשים לב לתכונות הבאות: $ {\frac {\sum (Y_{i}-{\bar {Y}})^{2}/m-1}{\sum (X_{i}-{\bar {X}})^{2}/n-1}}={\frac {S_{Y}^{2}}{S_{X}^{2}}}\sim {\frac {\chi _{m-1}^{2}/m-1}{\chi _{n-1}^{2}/n-1}}=F_{m-1,n-1} $
לכן, נעדיף להשתמש בסטטיסטי $ T'(X,Y)={\frac {\sum (Y_{i}-{\bar {Y}})^{2}/m-1}{\sum (X_{i}-{\bar {X}})^{2}/n-1}} $. כדי לקבל אותו, נכפול ונחלק ב-$ n-1,m-1 $ את המקומות הרלוונטיים בפונקציית יחס הנראות. עדיין יתקיים שכשהסטטיסטי החדש שואף לאינסוף או ל-0, כך גם פונקציית יחס הנראות. לכן נקבל את אותו מבחן יחס נראות מוכלל רק אם ערכי C שונים:
נדחה את השערת האפס אם $ T'(X,Y)>C_{1}^{*} $ או $ T'(X,Y)<C_{2}^{*} $ כאשר רמת הביטחון מקיימת $ \alpha =P(T'(X,Y)<C_{2}^{*}orT'(X,Y)>C_{1}^{*}) $.
ולמעשה נוכל למצוא את ערכי ה-C לפי התפלגות F : $ C_{1}^{*}=F_{m-1,n-1;1-{\frac {\alpha }{2}}},C_{2}^{*}=F_{m-1,n-1;{\frac {\alpha }{2}}} $