משפט הגבול המרכזי

משפט הגבול המרכזי (באנגלית: Central Limit Theorem או בקיצור CLT) הוא משפט יסודי בתורת ההסתברות, העוסק בהתפלגות הגבולית של הממוצע המצטבר של סדרת משתנים מקריים. המשפט קובע שתחת תנאים מסוימים, התפלגות הממוצע של סדרת משתנים מקריים בלתי תלויים מתקרבת להתפלגות נורמלית לאחר תִקנוּן מסוים, גם כאשר המשתנים עצמם אינם מתפלגים נורמלית.
הוא הוכח לראשונה על ידי המתמטיקאי הצרפתי אברהם דה מואבר בשנת 1733. עם זאת, המשפט שוכלל מאוחר יותר על ידי מתמטיקאים אחרים, ביניהם קרל פרידריך גאוס ופייר-סימון לפלס, אשר תרמו תרומה משמעותית לפיתוח המשפט.
בעזרת המשפט, ניתן להסביר את השכיחות הגבוהה של ההתפלגות הנורמלית בתחומים רבים: מאחר שרבים מהערכים הנמדדים בטבע מורכבים למעשה מסכום מספר רב של אירועים אקראיים, וממשפט הגבול המרכזי נובע שהם יתפלגו נורמלית (לפחות בקירוב). כמו כן, המשפט מאפשר שימוש בטכניקות שפותחו תחת הנחת נורמליות על התפלגות של משתנה מקרי, גם כאשר הוא אינו מתפלג נורמלית. את המשפט הכללי הוכיח אלכסנדר ליאפונוב.
תוצאת המשפט יכולה להיות מוסברת דרך העובדה שההתפלגות הנורמלית היא בעלת אנטרופיה מקסימלית מבין כל ההתפלגויות בעלות שונות נתונה[1]. אם כך, כשבמערכת מצטברת אנטרופיה והממוצע מנורמל כך שהשונות נותרת קבועה, סביר לצפות שההתפלגות תשאף דווקא להתפלגות הנורמלית.
עיינו גם בפורטל פורטל המתמטיקה הוא שער לכל הנושאים הקשורים במתמטיקה. ניתן למצוא בו קישורים אל תחומי המשנה של ענף המתמטיקה, מושגי יסוד בתחום, היסטוריה של המתמטיקה, מתמטיקאים חשובים ועוד. |
הגרסה החלשה
תהי סדרה של משתנים מקריים בלתי תלויים בעלי אותה התפלגות, שיש לה תוחלת ושונות . נסמן ב- את הממוצע. לפי החוק החזק של המספרים הגדולים, הגבול של הסדרה הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \frac{\bar{X}_n-\mu}{\sigma}} הוא אפס (בהסתברות 1). משפט הגבול המרכזי מספק מידע מפורט בהרבה: סדרת המשתנים המקריים הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \frac{\bar{X}_n-\mu}{\sigma/\sqrt{n}}} מתכנסת בהתפלגות אל ההתפלגות הנורמלית הסטנדרטית: הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \lim_{n \to \infty} P\left(\frac{\bar{X}_n-\mu}{\sigma/\sqrt{n}} < z\right) = \Phi(z)} , כאשר הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \Phi(z) = \int_{-\infty}^{z}\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dt} .
הגרסה החזקה
תהי הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle X_1,X_2,\dots} סדרה של משתנים מקריים בלתי תלויים, המקיימת:
- הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \ \forall k : \ E(X_k) = 0} (אין כאן פגיעה בכלליות, כי מכל משתנה מקרי ניתן להחסיר את התוחלת שלו).
- הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \ \forall k : \ E(X_k^2) = \sigma_k^2 < \infty} (שונות סופית).
- הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \ \forall k : \ E(|X_k|^3) < \infty}
נסמן הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \ S_n = \sqrt{\sum_{k=1}^{n}{\sigma_k^2}}} . אם הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \ \ \mbox{lim}{ \frac{1}{S_n^3} \sum_{k=1}^{n}{E(|X_k|^3)} } = 0 \ \ } , אז סדרת המשתנים המקריים הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \frac{X_1 + \cdots + X_n}{S_n}} מתכנסת בהתפלגות אל ההתפלגות הנורמלית הסטנדרטית.
משפט גבול מרכזי רב ממדי
תהי הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle X_1,X_2,\dots} סדרה של וקטורים מקריים ב- , בלתי תלויים ושווי התפלגות, עם תוחלת הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \operatorname{E}[X_i]=\mu} ושונות הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \operatorname{Var}(X_i)=\Sigma} . נסמן ב- הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \bar{X}_n=(X_1+\dots+X_n)/n} את הממוצע. סדרת הווקטורים המקריים הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \sqrt{n}\left( \overline{\mathbf{X}}_n - \boldsymbol\mu \right)} מתכנסת בהתפלגות להתפלגות רב נורמלית:
הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \sqrt{n}\left( \overline{\mathbf{X}}_n - \boldsymbol\mu \right) \overset{d}{\rightarrow}\ \mathcal{N}(0,\boldsymbol\Sigma)} .
דוגמה
נראה כיצד ממשפט הגבול המרכזי נובע כי אם הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle X\sim Bin(n,p)} – במילים: המשתנה הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle X} מתפלג בינומית – אז כאשר הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle n} גדול מתקיים הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle X\dot\sim N(np,npq)} , כלומר הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle X} מתפלג בקירוב כמו משתנה נורמלי עם תוחלת הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle np} ושונות הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle npq} , כאשר הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle p + q = 1} ו-.
ניתן לראות משתנה בינומי הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle X} כסכום סדרת משתנים מקריים הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle Y} שכל אחד מהם מקבל 1 בהסתברות הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle p} ואחרת מקבל 0 (ניסויי ברנולי). התוחלת של משתנה כזה היא הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \mu=p} והשונות שלו היא הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle pq} . לכן, כאשר הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle n} גדול, נובע ממשפט הגבול המרכזי:
הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle F_{X}(x)=P\left(X\le x\right)=P\left(\frac{X-n\mu}{\sqrt{n\sigma^2}}\le\frac{x-n\mu}{\sqrt{n\sigma^2}}\right)\approx\Phi\left(\frac{x-np}{\sqrt{npq}}\right)=F_Z\left(\frac{x-np}{\sqrt{npq}}\right)}
כאשר הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle Z\sim N(0,1)} .
יישומים
בתורת ההסתברות
בספרות יש מספר דוגמאות מעניינות ושימושיות ויישומים הקשורים למשפט הגבול המרכזי. מקור אחד מציין את הדוגמאות הבאות:
- התפלגות המרחק הכולל שעוברים בהילוך מקרי (מוטה או חסר הטיה) ייטה להתפלג נורמלי.
- הטלת מטבע מספר רב של פעמים יניב את ההתפלגות הנורמלית עבור המספר הכולל של "עץ" (או "פלי" באופן שקול).
מנקודת מבט אחרת, משפט הגבול המרכזי מסביר את ההופעה התדירה של "עקומת הפעמון" בהערכות צפיפות המופעלות על מידע מהעולם האמיתי. במקרים כמו רעש אלקטרוני, ציוני מבחן וכו', נוכל בדרך כלל להתייחס לתצפית בודדת כממוצע ממושקל של מספר רב של גורמים קטנים. אם נשתמש בהכללות של משפט הגבול המרכזי נוכל לראות שזה לרוב יניב (אך לא תמיד) התפלגות סופית שהיא בערך נורמלית.
באופן כללי, ככל שתצפית היא יותר כמו סכום של משתנים מקריים בלתי תלויים עם השפעה זהה על התוצאה, היא מתאפיינת ביותר "נורמליות". זה מצדיק את השימוש הנפוץ בהתפלגות זו כדי להשלים את ההשפעה של משתנים מקריים שלא נצפו במודלים כמו במודל הליניארי.
בסטטיסטיקה
בטכניקות של בדיקת השערות, מבחן סטטיסטי מנסה להפריד בין שתי התפלגויות: בין ההתפלגות תחת השערת האפס, קרי ההשערה הקודמת למבחן, לבין התפלגות אחרת. לשם כך דוגם החוקר מספר תצפיות מהאוכלוסייה שהוא בוחן, ומחשב את סטטיסטי ערך ה-p (באנגלית: p-value) של התוצאה. אם לא סביר כי הסטטיסטי יצא מההתפלגות של השערת האפס (ברמת המובהקות שנקבעה מראש), החוקר דוחה את השערה זו.
לרוב, התכונה באוכלוסייה אותה מבצע המבחן בוחן אינה מתפלגת נורמלית, אך באמצעות שימוש במשפט הגבול המרכזי הוא יודע שאם הסטטיסטי הוא ממוצע של אותה התכונה, ומתקיימות שאר ההנחות הנדרשות לשם הפעלת המשפט על אותה התכונה, אזי הוא יכול להניח כי עם מספיק תצפיות הסטטיסטי יתפלג נורמלית. בכך הוא יכול להשוות אנליטית את הממוצע אותו דגם להסתברות שאותו ממוצע ייצא תחת התפלגות נורמלית. למבחן סטטיסטי שכזה, שיודע את השונות לאותה תכונה באוכלוסייה קוראים מבחן Z.
מחוץ לתורת ההסתברות
למשפטי גבול בתורת ההסתברות יש יישומים גם מחוץ לתורת ההסתברות.
למשל, בעזרת משפט הגבול המרכזי ניתן לחשב את הגבול הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle L=\lim_{n\to\infty}\int_{-1}^{1}\dots\int_{-1}^{1}\cos\left(\frac{x_{1}+\dots+x_{n}}{\sqrt{n}}\right)dx_{1}\dots dx_{n} } .
כדי לעשות זאת, לוקחים משתנים מקריים בלתי תלויים הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle X_1,\dots, X_n} המתפלגים אחיד בקטע הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle [-1,1]} (עם מידת לבג). כל משתנה כזה הוא בעל תוחלת אפס ושונות הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \sigma^2=\frac{1}{3}} . משתנים אלו "מייצגים" את המשתנים הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle x_1,\dots,x_n} במרחב האוקלידי ולכן הם בלתי תלויים. אם כן האינטגרל שווה לתוחלת של המ"מ .
לפי משפט הגבול המרכזי, מתקיים הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \mathcal{Z} = \frac{X_{1}+\dots+X_{n}}{\sqrt{n}}\longrightarrow Z \sim N\left(0,\sigma^{2}\right) } . כעת, ניתן להסיק מהמשפט גם התכנסות חלשה (ולמעשה התנאי שקול להתכנסות בהתפלגות) - כלומר, לכל פונקציה רציפה וחסומה הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle f} מתקיים הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle E[f(\mathcal{Z})] \to E[f(Z)]} ; במקרה שלנו, הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \cos} היא רציפה וחסומה, ולכן הגבול שווה ל-
הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle L=E\left[\cos\left(Z\right)\right]=E\left[\frac{e^{iZ}+e^{-iZ}}{2}\right]=\frac{1}{2}\left(\varphi_{Z}(1)+\varphi_{Z}(-1)\right)=e^{-\frac{1}{6}} }
(הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \varphi_{Z}(t)} היא הפונקציה האופיינית של הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle Z} ).
ראו גם
קישורים חיצוניים
- יוסי לוי, למי צלצל הפעמון?, באתר "נסיכת המדעים"
- משפט הגבול המרכזי, באתר MathWorld (באנגלית)
- משפט הגבול המרכזי, באתר אנציקלופדיה בריטניקה (באנגלית)
הערות שוליים
- ↑ Raul Rojas, Why the Normal Distribution?
משפט הגבול המרכזי39166017Q190391