התפלגות רב-נורמלית
פונקציית צפיפות ההסתברות
מאפיינים
פרמטרים
μ ∈ R k פרמטר מרכזΣ ∈ R k × k מטריצת שונות משותפת מטריצה חיובית
תומך
x ∈ R k
פונקציית צפיפות הסתברות (pdf)
1
(
2
π
)
n
|
Σ
|
e
−
(
1
2
(
x
−
μ
)
T
Σ
−
1
(
x
−
μ
)
)
{\displaystyle {\frac {1}{\sqrt {(2\pi )^{n}|{\boldsymbol {\Sigma }}|}}}e^{-({\frac {1}{2}}(\mathbf {x} -{\boldsymbol {\mu }})^{\mathrm {T} }{\boldsymbol {\Sigma }}^{-1}(\mathbf {x} -{\boldsymbol {\mu }}))}}
תוחלת
μ
{\displaystyle {\boldsymbol {\mu }}}
ערך שכיח
μ
{\displaystyle {\boldsymbol {\mu }}}
שונות
Σ
{\displaystyle \ \Sigma }
אנטרופיה
k
2
log
(
2
π
e
)
+
1
2
log
|
Σ
|
{\displaystyle {\frac {k}{2}}\log {\mathord {\left(2\pi \mathrm {e} \right)}}+{\frac {1}{2}}\log |{\boldsymbol {\Sigma }}|}
פונקציה יוצרת מומנטים (mgf)
exp
(
μ
T
t
+
1
2
t
T
Σ
t
)
{\displaystyle \exp \!{\Big (}{\boldsymbol {\mu }}^{\mathrm {T} }\mathbf {t} +{\tfrac {1}{2}}\mathbf {t} ^{\mathrm {T} }{\boldsymbol {\Sigma }}\mathbf {t} {\Big )}}
פונקציה אופיינית
exp
(
i
μ
T
t
−
1
2
t
T
Σ
t
)
{\displaystyle \exp \!{\Big (}i{\boldsymbol {\mu }}^{\mathrm {T} }\mathbf {t} -{\tfrac {1}{2}}\mathbf {t} ^{\mathrm {T} }{\boldsymbol {\Sigma }}\mathbf {t} {\Big )}}
בתורת ההסתברות , התפלגות רב-נורמלית , או התפלגות גאוסיאנית רב-ממדית (באנגלית : Multivariate normal distribution ) היא הכללה של התפלגות נורמלית למשתנים מקריים רב-ממדיים. היא מוגדרת בתור וקטור משתנים מקריים , שכל צירוף ליניארי שלו מתפלג נורמלית. ישנה גם הגדרה (כללית יותר) בשפה של פונקציות אופייניות (הקובעת את המשתנה).
להתפלגות רב-נורמלית מספר שימושים, כגון הוכחת טענות על התפלגות הממוצע וסטיית התקן של משתנים מקריים שווי התפלגות נורמלית; טענות אלו שימושיות במיוחד בסטטיסטיקה . ניתן גם לנסח את משפט הגבול המרכזי בגרסה רב-ממדית בעזרת התפלגות רב-נורמלית.
הגדרה
יהי
X
=
(
X
1
,
…
,
X
n
)
{\displaystyle X=(X_{1},\dots ,X_{n})}
וקטור משתנים מקריים ממשיים. נאמר ש-
X
{\displaystyle X}
מתפלג רב-נורמלית (או גאוסיאנית ) אם לכל
a
1
,
…
,
a
n
∈
R
{\displaystyle a_{1},\dots ,a_{n}\in \mathbb {R} }
המשתנה המקרי (החד־ממדי)
⟨
a
¯
,
X
¯
⟩
=
a
1
X
1
+
⋯
+
a
n
X
n
{\displaystyle \langle {\bar {a}},{\bar {X}}\rangle =a_{1}X_{1}+\dots +a_{n}X_{n}}
מתפלג נורמלית , כלומר קיימים
μ
,
σ
{\displaystyle \mu ,\sigma }
(תלויים ב-
a
i
{\displaystyle a_{i}}
) כך ש-
⟨
a
¯
,
X
¯
⟩
∼
N
(
μ
,
σ
2
)
{\displaystyle \langle {\bar {a}},{\bar {X}}\rangle \sim N(\mu ,\sigma ^{2})}
.
אם
X
{\displaystyle X}
משתנה רב-נורמלי, מסמנים
X
∼
N
(
μ
¯
,
Σ
)
{\displaystyle X\sim N({\bar {\mu }},\Sigma )}
.
μ
¯
{\displaystyle {\bar {\mu }}}
הוא וקטור התוחלות , כלומר
μ
=
E
[
X
]
=
(
E
[
X
1
]
,
E
[
X
2
]
,
…
,
E
[
X
k
]
)
T
{\displaystyle {\boldsymbol {\mu }}=\operatorname {E} [\mathbf {X} ]=(\operatorname {E} [X_{1}],\operatorname {E} [X_{2}],\ldots ,\operatorname {E} [X_{k}])^{\mathrm {T} }}
ו-
Σ
{\displaystyle \Sigma }
היא מטריצת השונות משותפת
Σ
i
,
j
=
E
[
(
X
i
−
μ
i
)
(
X
j
−
μ
j
)
]
=
Cov
[
X
i
,
X
j
]
{\displaystyle \Sigma _{i,j}=\operatorname {E} [(X_{i}-\mu _{i})(X_{j}-\mu _{j})]=\operatorname {Cov} [X_{i},X_{j}]}
כאשר
1
≤
i
,
j
≤
k
{\displaystyle 1\leq i,j\leq k}
.
תכונות
הפונקציה האופיינית
ניתן לאפיין את המשתנים המקריים הגאוסיאניים בעזרת הפונקציה האופיינית שלהם: וקטור משתנים מקריים הוא גאוסיאני אם ורק אם הוא בעל פונקציה אופיינית:
φ
X
(
u
)
=
exp
(
i
u
T
μ
−
1
2
u
T
Σ
u
)
.
{\displaystyle \varphi _{\mathbf {X} }(\mathbf {u} )=\exp {\Big (}i\mathbf {u} ^{\mathrm {T} }{\boldsymbol {\mu }}-{\tfrac {1}{2}}\mathbf {u} ^{\mathrm {T} }{\boldsymbol {\Sigma }}\mathbf {u} {\Big )}.}
כאשר מטריצה השונות
Σ
{\displaystyle \Sigma }
היא
חיובית .
בפרט, נובע שהמשתנים המקריים בלתי מתואמים אם ורק אם הם בלתי תלויים (מה שאינו נכון באופן כללי).
לכסון
לכל משתנה מקרי רב-נורמלי
X
{\displaystyle X}
קיימים משתנה מקרי
Y
{\displaystyle Y}
ומטריצה אורתוגונלית
A
{\displaystyle A}
כך ש-
X
=
μ
¯
+
Y
A
{\displaystyle X={\bar {\mu }}+YA}
, כאשר
Y
i
∼
N
(
0
,
λ
i
)
{\displaystyle Y_{i}\sim N(0,\lambda _{i})}
ו-
λ
i
{\displaystyle \lambda _{i}}
הם הערכים עצמיים של
Σ
{\displaystyle \Sigma }
(מטריצת השונויות המשותפות).
בכיוון ההפוך, לכל משתנה מקרי רב-נורמלי
X
{\displaystyle X}
ולכל מטריצה אורתוגונלית
A
{\displaystyle A}
, המשתנה המקרי
A
X
{\displaystyle AX}
גם הוא רב נורמלי:
Y
∼
N
(
A
μ
,
Σ
)
{\displaystyle Y\sim N(A\mu ,\Sigma )}
.
כדי להוכיח משפט זה, יש להפעיל לכסון אורתוגונלי על
Σ
{\displaystyle \Sigma }
(בפרט, המטריצה
A
{\displaystyle A}
נבחרת להיות המטריצה המלכסנת).
פונקציית צפיפות
כאשר מטריצת השונות
Σ
{\displaystyle \Sigma }
איננה מטריצה סינגולרית - כלומר כל ערכיה העצמיים
λ
i
{\displaystyle \lambda _{i}}
שונים מאפס, למשתנה הרב-נורמלי יש פונקציית צפיפות , הנתונה על ידי הנוסחא:
f
X
(
x
¯
)
=
1
(
2
π
)
n
|
Σ
|
e
−
1
2
(
x
¯
−
μ
¯
)
T
Σ
−
1
(
x
¯
−
μ
¯
)
{\displaystyle f_{X}({\bar {x}})={\frac {1}{\sqrt {(2\pi )^{n}|\Sigma |}}}e^{-{\frac {1}{2}}({\bar {x}}-{\bar {\mu }})^{T}{\Sigma }^{-1}({\bar {x}}-{{\bar {\mu }})}}}
כאשר
|
Σ
|
=
det
(
Σ
)
{\displaystyle |\Sigma |=\det(\Sigma )}
מסמן את הדטרמיננטה של
Σ
{\displaystyle \Sigma }
.
התפלגויות שוליות
למציאת ההתפלגות השולית של משתנים מקריים המתפלגים רב-נורמלית, מספיק להשמיט את המשתנים הלא-רלוונטיים (המשתנים שיש לבצע עליהם אינטגרציה) מווקטור התוחלת
μ
{\displaystyle {\boldsymbol {\mu }}}
וממטריצת השונות
Σ
{\displaystyle {\boldsymbol {\Sigma }}}
. ההוכחה לכך נובעת מההגדרה של ההתפלגות הרב-נורמלית ומאלגברה ליניארית.[1]
דוגמה
יהי
X
=
[
X
1
,
X
2
,
X
3
]
{\displaystyle \mathbf {X} =[X_{1},X_{2},X_{3}]}
ווקטור מקרי רב-נורמלי עם ווקטור תוחלת
μ
=
[
μ
1
,
μ
2
,
μ
3
]
{\displaystyle {\boldsymbol {\mu }}=[\mu _{1},\mu _{2},\mu _{3}]}
ומטריצת שונות
Σ
{\displaystyle {\boldsymbol {\Sigma }}}
. ההתפלגות השולית של
X
′
=
[
X
1
,
X
3
]
{\displaystyle \mathbf {X} '=[X_{1},X_{3}]}
היא התפלגות רב-נורמלית עם וקטור תוחלת
μ
′
=
[
μ
1
,
μ
3
]
{\displaystyle {\boldsymbol {\mu }}'=[\mu _{1},\mu _{3}]}
ומטריצת שונות
Σ
′
=
[
Σ
11
Σ
13
Σ
31
Σ
33
]
{\displaystyle {\boldsymbol {\Sigma }}'={\begin{bmatrix}{\boldsymbol {\Sigma }}_{11}&{\boldsymbol {\Sigma }}_{13}\\{\boldsymbol {\Sigma }}_{31}&{\boldsymbol {\Sigma }}_{33}\end{bmatrix}}}
.
התפלגות רב-נורמלית סינגולרית
בדרך כלל מניחים כי מטריצת השונויות
Σ
{\displaystyle \Sigma }
איננה מטריצה סינגולרית . כאמור, במקרה זה למשתנה הרב-נורמלי יש פונקציית צפיפות .
עם זאת, כאשר מורידים את ההנחה האחרונה (כלומר, יש ערכים עצמיים אפס), מתקבל משתנה מקרי רב-נורמלי סינגולרי . ההגדרה בעזרת הפונקציה האופיינית היא כללית יותר (כלומר, תקפה גם במקרה הסינגולרי). במקרה זה אין פונקציית צפיפות (ביחס למידת לבג ) - ערכיה של פונקציית הצפיפות ייקבעו על ידי פחות מ-
n
{\displaystyle n}
משתנים, ואינטגרל של פונקציה כזו הוא אפס ולא 1, כנדרש מפונקציית צפיפות.
בכל זאת, ניתן להגדיר מידות אחרות (על תת-מרחב
rank
(
Σ
)
{\displaystyle \operatorname {rank} (\Sigma )}
-ממדי של
R
n
{\displaystyle \mathbb {R} ^{n}}
) ואז מוגדרת פונקציית צפיפות עבור משתנה מקרי ביחס למידה החדשה.
יישומים
אם
X
1
,
X
2
,
…
{\displaystyle X_{1},X_{2},\dots }
משתנים מקריים בלתי תלויים המתפלגים
N
(
0
,
1
)
{\displaystyle N(0,1)}
, נסמן
X
¯
n
=
X
1
+
⋯
+
X
n
n
{\displaystyle {\bar {X}}_{n}={\frac {X_{1}+\dots +X_{n}}{n}}}
ו-
S
n
=
1
n
−
1
∑
i
=
1
n
(
X
i
−
X
¯
n
)
2
{\displaystyle S_{n}={\frac {1}{n-1}}\sum _{i=1}^{n}{(X_{i}-{\bar {X}}_{n})^{2}}}
. אז מתקיים:
X
¯
n
/
S
n
n
∼
t
n
−
1
{\displaystyle {\bar {X}}_{n}/{\sqrt {\frac {S_{n}}{n}}}\sim t_{n-1}}
, כלומר מתפלג סטודנט עם
n
−
1
{\displaystyle n-1}
דרגות חופש .
קישורים חיצוניים
הערות שוליים
39995592 התפלגות רב-נורמלית