אומד עקיב

בסטטיסטיקה, אומד הוא כלל לחישוב אומדנים מתוך תצפיות, עבור הערך של פרמטר $ \theta $ המאפיין את התפלגות התצפיות. אומד עקיב הוא בעל תכונה שכאשר כמות הנתונים המשמשת לחישוב האומד גדלה ושואפת לאינסוף, האומד מייצר סדרת משתנים מקריים המתכנסת בהסתברות לערך של הפרמטר $ \theta $ המאפיין את התפלגות התצפיות. המשמעות היא שהתפלגויות המשתנים המקריים המתקבלים מתרכזות יותר ויותר ליד הערך הרצוי של הפרמטר הנאמד. כלומר, לכל $ \epsilon >0 $ נתון, שההסתברות לכך שהמרחק בין המשתנים המקריים בסדרה לבין הערך הנכון של $ \theta $ יהיה גדול מ-$ \epsilon $, שואפת ל-0.
נניח שנתונה משפחה של התפלגויות עם פרמטר $ \theta $, כך שלכל התפלגות במשפחה מתאים ערך מסוים של $ \theta $. נניח שנתון מדגם מקרי מתוך אחת ההתפלגויות השייכות למשפחה ועבור התפלגות של המדגם מתקיים $ \theta =\theta _{0} $. אומד של $ \theta $ הוא פונקציה של המדגם מקרי, המוגדרת למדגמים בכל גודל n ותפקידו לאמוד את $ \theta _{0} $. עקיבות של אומד היא תכונה שמאפיינת את האומד כאשר גודל המדגם $ n $ שואף לאינסוף. אם ניתן להראות מתמטית שלכל התפלגות מהמשפחה, בהינתן מדגם מקרי מההתפלגות, סדרת המשתנים המקריים שהאומד מגדיר מתכנסת בהסתברות לערך של θ המתאים להתפלגות שממנה לקוח המדגם, אז האומד נקרא אומד עקיב ל-θ; אחרת, אם ניתן להראות שעבור התפלגות מסוימת במשפחה הסדרה איננה מתכנסת כלל או מתכנסת לערך לא נכון, אז האומד אינו אומד עקיב ל-θ.
עקיבות כפי שהוגדרה כאן מכונה לפעמים עקיבות חלשה. כאשר אנו מחליפים התכנסות בהסתברות בהתכנסות כמעט בוודאות, אומרים שלאומד יש עקיבות חזקה.
באופן פורמלי בהינתן משפחת התפלגויות $ {\mathcal {F}}(\theta ) $, אם לכל ערך $ \theta _{0} $ אפשרי של $ \theta $ וסדרה של משתנים מקריים בלתי תלויים ושווי התפלגות $ X_{1},X_{2},...\in {\mathcal {F}}(\theta _{0}) $ , האומד $ T_{n}(X_{1},X_{2},...,X_{n}) $ מתכנס בהסתברות ל- $ \theta _{0} $: כלומר $ ,{\underset {n\to \infty }{\operatorname {plim} }}\;T_{n}=\theta _{0} $ או באופן שקול, אם לכל ε > 0, $ ,\lim _{n\to \infty }\Pr {\big (}|T_{n}-\theta _{0}|>\varepsilon {\big )}=0 $ אז $ T_{n} $ הוא אומד של $ \theta $ בעל עקיבות חלשה.[1]
לאומד $ T_{n} $ של פרמטר $ \theta $ יש עקיבות חזקה, אם לכל ערך $ \theta _{0} $ אפשרי של $ \theta $ וסדרה של משתנים מקריים בלתי תלויים ושווי התפלגות $ X_{1},X_{2},...\in {\mathcal {F}}(\theta _{0}) $ , $ T_{n} $ מתכנס בהסתברות 1 ל-$ \theta _{0} $. כלומר, $ .\Pr \left(\lim _{n\to \infty }T_{n}=\theta _{0}\right)=1 $
דוגמאות
ממוצע מדגם של משתנה מקרי נורמלי
נניח שנתון מדגם מקרי של משתנים מקריים בלתי תלויים ושווי התפלגות מהתפלגות נורמלית $ X_{1},X_{2},...\sim N(\mu ,\sigma ^{2}) $. כדי לאמוד את $ \mu $ על סמך $ n $ המשתנים המקריים הראשונים ניתן להשתמש כאומד בממוצע המדגם: $ T_{n}={\frac {X_{1}+X_{2}+...+X_{n}}{n}} $. אומד זה מגדיר סדרה של משתנים מקריים, משתנה לכל $ n $.
מתכונות ההתפלגות הנורמלית, נובע כי $ T_{n} $ מתפלג התפלגות נורמלית, עם תוחלת $ \mu $ ושונות $ {\frac {\sigma ^{2}}{n}} $. בנוסף לכך, מתכונות ההתפלגות הנורמלית נובע כי ל- $ {\frac {{\sqrt {n}}(T_{n}-\mu )}{\sigma }} $ יש התפלגות נורמלית סטנדרטית. לכן, לכל $ \epsilon >0 $ כאשר $ n $ שואף לאינסוף,
- $ .\Pr \!\left[\,|T_{n}-\mu |\geq \varepsilon \,\right]=\Pr \!\left[{\frac {{\sqrt {n}}\,{\big |}T_{n}-\mu {\big |}}{\sigma }}\geq {\frac {{\sqrt {n}}\varepsilon }{\sigma }}\right]=2\left(1-\Phi \left({\frac {{\sqrt {n}}\,\varepsilon }{\sigma }}\right)\right)\to 0 $
לכן, הסדרה $ T_{n} $ של ממוצעי המדגם מהווה אומד עקיב לתוחלת $ \mu $ ($ \Phi $ היא ההתפלגות המצטברת של ההתפלגות הנורמלית סטנדרטית).
הערות שוליים
אומד עקיב38848368Q1782585
- ↑ Amemiya 1985, Definition 3.4.2.