התפלגות נורמלית

מתוך המכלול, האנציקלופדיה היהודית
(הופנה מהדף עקומת פעמון)
קפיצה לניווט קפיצה לחיפוש
התפלגות נורמלית
פונקציית צפיפות ההסתברות
פונקציית ההסתברות המצטברת
מאפיינים
פרמטרים התוחלת, סטיית התקן.
תומך
פונקציית צפיפות הסתברות
(pdf)
פונקציית ההסתברות המצטברת
(cdf)
תוחלת
סטיית תקן
חציון
ערך שכיח
שונות
אנטרופיה
פונקציה יוצרת מומנטים
(mgf)
פונקציה אופיינית
צידוד
גבנוניות

התפלגות נורמלית היא התפלגות חשובה ביותר בסטטיסטיקה תאורטית וביישומיה בכל תחומי המדע. חשיבותה הרבה נובעת ממשפט הגבול המרכזי, לפיו הממוצע של משתנים בלתי תלויים בעלי אותה התפלגות, לאחר תקנון מתאים, מתכנס בהתפלגות אל ההתפלגות הנורמלית. לכן מופיעה התפלגות זו בכל מקום בו לוקחים ממוצע של משתנים רבים, כגון גובה ממוצע של אנשים באוכלוסייה, ממוצע טעויות מדידה מקריות במדידות חוזרות של אותו גודל, וכדומה. מדדים פסיכומטריים שונים, כגון מבחן מנת משכל, מתוכננים בכוונה תחילה להתפלג באופן נורמלי.

ההתפלגות הנורמלית הסטנדרטית (קרויה גם התפלגות Z) היא השימושית ביותר במשפחת ההתפלגויות הנורמליות. על ידי מתיחה (כלומר, הכפלה בקבוע) והזזה (הוספת קבוע) של משתנה מקרי בעל התפלגות נורמלית סטנדרטית, מתקבלת משפחה כללית יותר של התפלגויות, שכל אחת מהן היא התפלגות נורמלית. זוהי דוגמה למשפחה מעריכית של התפלגויות. בתוך המשפחה, אפשר לזהות התפלגות נורמלית מסוימת על-פי שני פרמטרים: התוחלת והשונות שלה. להתפלגות הנורמלית הסטנדרטית יש תוחלת 0, ושונותה 1.

ההתפלגות הנורמלית נקראת גם גאוסיאן על שמו של קרל פרידריך גאוס, וגם עקומת הפעמון משום שהגרף של פונקציית הצפיפות שלה מזכיר בצורתו פעמון.

היסטוריה

המתמטיקאי אברהם דה מואבר הציג את ההתפלגות הנורמלית לראשונה בשנת 1733 כקירוב להתפלגות הבינומית עבור מספר גדול של דגימות (מאמרו בעניין התגלה רק ב-1924). לפלס השתמש בעקומה הנורמלית לתאר "התפלגות של שגיאות" בשנת 1783. גאוס השתמש בהתפלגות הנורמלית לניתוח מידע אסטרונומי ב-1809[1]. המדען הבלגי אדולף קטלה הראה כי התפלגותם של משתנים רבים (כגון גובהו של אדם) היא נורמלית.

מאפיינים מתמטיים

פונקציית הצפיפות

פונקציית הצפיפות של התפלגות נורמלית בעלת תוחלת ושונות היא :

זוהי פונקציה סימטרית סביב התוחלת, ובעלת שתי נקודות פיתול במרחק סטיית תקן אחת מן הממוצע, כלומר בנקודות . את העובדה שמשתנה מקרי הוא בעל התפלגות כזו, מקובל לציין בסימון .

במקרה המיוחד של ההתפלגות הנורמלית הסטנדרטית , מתקבלת הפונקציה

פונקציית ההתפלגות המצטברת

פונקציית ההתפלגות המצטברת, או הסיכוי שמשתנה מקרי יקבל ערך קטן או שווה ל- נתון, שווה ל-


כדי לחשב את ערכי פונקציית ההתפלגות המצטברת בעלת פרמטרים כלשהם, די בידיעת ערכיה של פונקציית ההתפלגות המצטברת הסטנדרטית, משום שאם ניתן להגדיר משתנה מקרי חדש ולגביו יתקיים . לכן, מתקיים:

- מסמל את פונקציית ההתפלגות המצטברת של משתנה נורמלי סטנדרטי.

בשל תכונות הסימטריה של ההתפלגות הנורמלית, בדרך כלל לא נתונים ערכיה השליליים של ההתפלגות הסטנדרטית בטבלאות המשמשות למציאתה. כדי למצוא אותם משתמשים בזהות: .

הפונקציה איננה פונקציה אלמנטרית (כלומר, היא אינה מתקבלת מהרכבה סופית של פולינומים, פונקציית האקספוננט והפונקציות הטריגונומטריות, והפונקציות ההפוכות להם). משום כך, כמעט כל ספר העוסק במבחנים סטטיסטיים כולל גם טבלה המכילה את הערכים המקורבים להתפלגות הנורמלית הסטנדרטית, שחושבו בשיטות נומריות. הקירוב הבא שימושי למדי כאשר z גדול:

תכונות ההתפלגות

חלוקה של ההתפלגות הנורמלית לפי רבעונים, אחוזונים וסטיות תקן
  • ההתפלגות מתפרשת על פני כל הישר הממשי.
  • ההתפלגות היא סימטרית וחד שיאית (יונימודלית).
  • הממוצע, החציון והשכיח מתלכדים בציר הסימטריה.
  • אם נתון משתנה מקרי ו- מספרים ממשיים, אזי: .
  • אם ו- משתנים מקריים, בלתי תלויים, אז סכומם מתפלג נורמלית עם הפרמטרים או .
  • אם X,Y משתנים נורמליים סטנדרטיים ובלתי תלויים, אז הצירופים הליניאריים בלתי-תלויים אם ורק אם וקטורי המקדמים מאונכים, כלומר .
  • פיזור ערכי ההתפלגות: 68.26% מן הערכים נמצאים במרחק של לא יותר מציון תקן אחד מהממוצע (ציר הסימטריה). במרחק של עד שני ציוני תקן (z=2) נמצאים 95.44% מהערכים ובמרחק עד שלושה ציוני תקן נמצאים 99.74% מהערכים - רק ב-0.26% יהיה ציון התקן גבוה מ-3.
  • גרף ההתפלגות נודע גם בשם "גרף פעמון" או "פעמון גאוס", שכן כאשר הוא משורטט בתור גרף המציין את מספר הערכים בכל תחום, מקבלת העקומה צורה דמוית פעמון - גבוהה במרכזה ונמוכה בשני צדדיה. צורת הפעמון מוכתבת על ידי הממוצע וסטיית התקן של ההתפלגות.
אחוזי ההתפלגות הנורמלית מסביב לממוצע (ציר הסימטריה) לפי סטיות תקן

סימולציה של משתנים המתפלגים נורמלית

הצורך ליצור נתונים שהתפלגותם היא בקירוב התפלגות נורמלית עולה בתחומים רבים. בשפות תכנות רבות קיים מחולל פסבדו אקראי המייצר משתנים המתפלגים, בקירוב, התפלגות אחידה על הקטע , ולכן דרושה שיטה להפוך את המשתנה המקרי האחיד למשתנה המתפלג התפלגות נורמלית סטנדרטית. ישנן מספר דרכים לעשות זאת:

"לאורך כל הדוגמאות המובאות בפסקה זו יסמן משתנה מקרי המתפלג אחיד על קטע היחידה."
  • דרך אינטואיטיבית (אך לא יעילה) ליצור משתנה מקרי המתפלג נורמלית בקירוב היא על ידי שימוש במשפט הגבול המרכזי הקובע כי סכום של מספר גדול של משתנים מקריים אחידים שואף להתפלגות נורמלית. על מנת ליצור התפלגות נורמלית סטנדרטית יש לדאוג שתוחלת הסכום תהיה שווה לאפס וסטיית התקן לאחת. לכן, המשתנה המקרי

מתפלג בקירוב התפלגות נורמלית סטנדרטית, וככל שמספר המחוברים גדל, כך גדל הדיוק.
  • שיטה כללית יותר, ומדויקת מבחינה מתמטית מתקבלת על ידי הפיכת פונקציית ההסתברות המצטברת. באופן כללי, אם היא פונקציית ההסתברות המצטברת של התפלגות נתונה, אז מתפלג בהתפלגות זו. לכן,

מתפלג נורמלית, כאשר היא פונקציית השגיאה. על מנת להשתמש בשיטה זו יש לדעת לחשב את פונקציית השגיאה, שהיא אינה פונקציה אלמנטרית.
  • שיטה יעילה יותר שגם היא מדויקת מבחינה מתמטית נקראת טרנספורמציית בוקס-מולר. טרנספורמציה זו משתמשת בעובדה שהתפלגות כי בריבוע עם שתי דרגות חופש היא התפלגות מעריכית, וקיימת נוסחה מדויקת להפיכת משתנה מקרי אחיד למשתנה המתפלג מעריכית. טרנספורמציית בוקס-מולר לוקחת שני משתנים מקריים אחידים ומחזירה שני משתנים מקריים בלתי תלויים המתפלגים נורמלית על ידי הנוסחה

מבחני נורמליות

מבחני נורמליות מעריכים את הסבירות שאוסף נתונים {x1, …, xn} מגיע מהתפלגות נורמלית. בדרך כלל השערת האפס H0 היא שהתצפיות מתפלגות נורמלית עם ממוצע כלשהו μ ושונות σ2, מול ההשערה החלופית Ha שההתפלגות היא שרירותית. מבחנים רבים (מעל 40) הומצאו לבעיה זו, להלן הבולטים שבהם:

  • בדיקות חזותיות יותר מושכות מבחינה אינטואיטיבית, אבל בו בזמן הן סובייקטיביות מכיוון שנסמכות על שיפוט אנושי בלתי פורמלי על מנת לקבל או לדחות את השערת האפס.
    • תרשים צפיפות אמפירי - בדיקת ההיסטוגרמה או תרשים הצפיפות לראות האם התפלגות נראית נורמלית.
    • תרשים Q-Q של הערכים הממוינים של אוסף הנתונים כנגד הערכים הצפויים של השברונים המתאימים מההתפלגות הנורמלית הסטנדרטית. זהו תרשים של נקודות מהצורה (Φ−1(pk), x(k)) כאשר pk = (k − α)/(n + 1 − 2α) ו-α הוא קבוע ההתאמה, שיכול לקבל כל ערך בין 0 ל-1. אם השערת האפס נכונה, נקודות התרשים אמורות להיות בערך על הקו הישר.
    • תרשים P-P דומה לתרשים ה Q-Q אבל בשימוש נדיר הרבה יותר. בשיטה זו מייצגים בתרשים את הנקודות (Φ(z(k)), pk) כאשר . בשביל הנתונים המתפלגים נורמלית, תרשים זה אמור להיות בערך על הקו הליניארי שבין (0,0) ובין (1,1).
    • מבחן שפירו-ווילק משתמש בעובדה שלקו בתרשים Q-Q יש שיפוע σ. המבחן משווה את הערכת הריבועים הפחותים של השיפוע עם ערך השונות המדגמית, ודוחה את השערת האפס אם שני הערכים האלה שונים משמעותית.
  • מבחני מומנט
    • מבחן K-ריבועי של ד'אגוסטינו
    • מבחן ז'רקה- ברה.
  • מבחני פונקציית התפלגות אמפירית
    • מבחן ליליאפורס (אדפטציה של מבחן קולמוגורוב-סמירנוב).
    • מבחן אנדרסון-דרלינג

התפלגות רב-נורמלית

ערך מורחב – התפלגות רב-נורמלית

ההכללה הנכונה של התפלגות נורמלית לווקטור משתנים מקריים היא זאת: אומרים ש- מתפלג רב-נורמלית (או גאוסיאנית) אם כל צירוף ליניארי שלו מתפלג נורמלית (חד-ממדי), כלומר . זה קורה אם ורק אם הפונקציה האופיינית של המשתנה היא , כאשר היא מטריצת השונויות המשותפות. היות שהמטריצה הזו סימטרית, אפשר ללכסן אותה אורתוגונלית. המטריצה האלכסונית המתקבלת קובעת את סינגולריות המשתנה - אומרים שהוא רגולרי אם ורק אם אין ערכים עצמיים לא אפס, והיותו של המשתנה רגולרי שקולה לכך שיש לו פונקציית צפיפות (ביחס למידת לבג).

למשתנים מקריים רב-נורמליים מספר יישומים בתורת ההסתברות וסטטיסטיקה, כמו בקביעת התפלגות של ממוצע וסטיית תקן של מדגם נרחב של משתנים מקריים נורמליים.

ראו גם

קישורים חיצוניים

הערות שוליים

  1. ^ NORMAL DISTRIBUTION, אוניברסיטת ווסט וירג'יניה


הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

32648929התפלגות נורמלית