כלל השרשרת (הסתברות)

בתורת ההסתברות, כלל השרשרת^[1] (נקרא גם כלל המכפלה הכללי^[2]^[3]) מתאר כיצד לחשב את ההסתברות של חיתוך מאורעות, לא בהכרח בלתי תלויים, או את ההתפלגות המשותפת של משתנים מקריים בהתאמה, באמצעות הסתברויות מותנות. כלל השרשרת משמש במיוחד בהקשר של תהליכים סטוכסטיים בדידים וביישומים, למשל בחקר של רשתות בייסיאניות, המתארות התפלגות הסתברות במונחים של הסתברויות מותנות.

כלל השרשרת למאורעות

שני מאורעות

לשני מאורעות $A$ ו $B$ , קובע כלל השרשרת

ℙ (A \cap B) = ℙ (B ∣ A) ℙ (A)

,

כאשר $ℙ (B ∣ A)$ מציין את ההסתברות המותנית של $B$ בהינתן $A$ .

דוגמה

בכד א' יש כדור שחור אחד ו-2 כדורים לבנים, ובכד אחר ב' יש כדור שחור אחד ו-3 כדורים לבנים. נניח שבוחרים כד באקראי ואז מוציאים באקראי כדור מאותו הכד. יהי אירוע $A$ הבחירה בכד א', כלומר $ℙ (A) = ℙ (\overline{A}) = 1 / 2$ , כאשר $\overline{A}$ הוא המאורע המשלים ל $A$ (במקרה זה, המאורע של בחירת כד ב'). יהי אירוע $B$ האפשרות שנוציא כדור לבן. ההסתברות להוצאת כדור לבן, בהינתן שכד א' נבחר, היא $ℙ (B | A) = 2 / 3$ . חיתוך המאורעות, $A \cap B$ , מתאר אם כן את בחירת א' והוצאת כדור לבן מתוכו. ניתן לחשב את ההסתברות למאורע זה על ידי כלל השרשרת באופן הבא:

ℙ (A \cap B) = ℙ (B ∣ A) ℙ (A) = \frac{2}{3} \cdot \frac{1}{2} = \frac{1}{3} .

מאורעות רבים

למאורעות $A_{1}, \dots, A_{n}$ , שהסתברות החיתוך שלהם אינו אפס, יהיה כלל השרשרת

\begin{aligned} ℙ (A_{1} \cap A_{2} \cap \dots \cap A_{n}) & = ℙ (A_{n} ∣ A_{1} \cap \dots \cap A_{n - 1}) ℙ (A_{1} \cap \dots \cap A_{n - 1}) \\ = ℙ (A_{n} ∣ A_{1} \cap \dots \cap A_{n - 1}) ℙ (A_{n - 1} ∣ A_{1} \cap \dots \cap A_{n - 2}) ℙ (A_{1} \cap \dots \cap A_{n - 2}) \\ = ℙ (A_{n} ∣ A_{1} \cap \dots \cap A_{n - 1}) ℙ (A_{n - 1} ∣ A_{1} \cap \dots \cap A_{n - 2}) \cdot \dots \cdot ℙ (A_{3} ∣ A_{1} \cap A_{2}) ℙ (A_{2} ∣ A_{1}) ℙ (A_{1}) \\ = ℙ (A_{1}) ℙ (A_{2} ∣ A_{1}) ℙ (A_{3} ∣ A_{1} \cap A_{2}) \cdot \dots \cdot ℙ (A_{n} ∣ A_{1} \cap \dots \cap A_{n - 1}) \\ = \prod_{k = 1}^{n} ℙ (A_{k} ∣ A_{1} \cap \dots \cap A_{k - 1}) \\ = \prod_{k = 1}^{n} ℙ (A_{k} | ⋂_{j = 1}^{k - 1} A_{j}) . \end{aligned}

מקרה פרטי

עבור $n = 4$ , כלומר ארבעה מאורעות, כלל השרשרת יהיה

\begin{aligned} ℙ (A_{1} \cap A_{2} \cap A_{3} \cap A_{4}) & = ℙ (A_{4} ∣ A_{3} \cap A_{2} \cap A_{1}) ℙ (A_{3} \cap A_{2} \cap A_{1}) \\ = ℙ (A_{4} ∣ A_{3} \cap A_{2} \cap A_{1}) ℙ (A_{3} ∣ A_{2} \cap A_{1}) ℙ (A_{2} \cap A_{1}) \\ = ℙ (A_{4} ∣ A_{3} \cap A_{2} \cap A_{1}) ℙ (A_{3} ∣ A_{2} \cap A_{1}) ℙ (A_{2} ∣ A_{1}) ℙ (A_{1}) \end{aligned}

.

דוגמה

שולפים באקראי ארבעה קלפים זה אחר זה ללא החזרה מחפיסה סטנדרטית של 52 קלפים. מה ההסתברות שייבחרו 4 אסים?

ראשית, נסמן ב $A_{n}$ את המאורע "קבלת אס בשליפה ה $n$ ". ההסתברויות למאורעות $A_{1}, A_{2}, A_{3}, A_{4}$ תהינה

ℙ (A_{1}) = \frac{4}{52}, ℙ (A_{2} ∣ A_{1}) = \frac{3}{51}, ℙ (A_{3} ∣ A_{1} \cap A_{2}) = \frac{2}{50}, ℙ (A_{4} ∣ A_{1} \cap A_{2} \cap A_{3}) = \frac{1}{49}

.

וביישום של כלל השרשרת

ℙ (A_{1} \cap A_{2} \cap A_{3} \cap A_{4}) = \frac{4}{52} \cdot \frac{3}{51} \cdot \frac{2}{50} \cdot \frac{1}{49}

.

ניסוח המשפט והוכחתו

יהי $(Ω, 𝒜, ℙ)$ מרחב הסתברות. נזכיר כי ההסתברות המותנית של $A \in 𝒜$ בהינתן $B \in 𝒜$ מוגדר כ

\begin{aligned} ℙ (A ∣ B) : = {\begin{cases} \frac{ℙ (A \cap B)}{ℙ (B)}, & ℙ (B) > 0, \\ 0 & ℙ (B) = 0 . \end{cases} \end{aligned}

יש לנו את המשפט הבא:

משפט: כלל השרשרת

יהי $(Ω, 𝒜, ℙ)$ מרחב הסתברות. ויהיו $A_{1}, . . ., A_{n} \in 𝒜$ אזי

\begin{aligned} ℙ (A_{1} \cap A_{2} \cap \dots \cap A_{n}) & = ℙ (A_{1}) ℙ (A_{2} ∣ A_{1}) ℙ (A_{3} ∣ A_{1} \cap A_{2}) \cdot \dots \cdot ℙ (A_{n} ∣ A_{1} \cap \dots \cap A_{n - 1}) \\ = ℙ (A_{1}) \prod_{j = 2}^{n} ℙ (A_{j} ∣ A_{1} \cap \dots \cap A_{j - 1}) . \end{aligned}

הוכחה:

ההוכחה היא באמצעות שימוש ברקורסיה הבאה

\begin{aligned} (1) & ℙ (A_{1}) ℙ (A_{2} ∣ A_{1}) & = & ℙ (A_{1} \cap A_{2}) \\ (2) & ℙ (A_{1}) ℙ (A_{2} ∣ A_{1}) ℙ (A_{3} ∣ A_{1} \cap A_{2}) & = & ℙ (A_{1} \cap A_{2}) ℙ (A_{3} ∣ A_{1} \cap A_{2}) \\ = & ℙ (A_{1} \cap A_{2} \cap A_{3}), \end{aligned}

כאשר בצעד הראשון השתמשנו בהגדרה של הסתברות מותנית.

כלל שרשרת למשתנים מקריים בדידים

שני משתנים מקריים

עבור שני משתנים מקריים בדידים $X, Y$ , נעזר במאורעות $A : = {X = x}$ ו $B : = {Y = y}$ ובהגדרה לעיל, למציאת ההתפלגות המשותפת

ℙ (X = x, Y = y) = ℙ (X = x ∣ Y = y) ℙ (Y = y),

ℙ_{(X, Y)} (x, y) = ℙ_{X ∣ Y} (x ∣ y) ℙ_{Y} (y),

כאשר $ℙ_{X} (x) : = ℙ (X = x)$ היא התפלגות ההסתברות של $X$ ו $ℙ_{X ∣ Y} (x ∣ y)$ התפלגות ההסתברות המותנית של $X$ בהינתן $Y$ .

משתנים מקריים רבים

יהיו $X_{1}, \dots, X_{n}$ משתנים מקריים ו $x_{1}, \dots, x_{n} \in ℝ$ . לפי הגדרת ההסתברות המותנית,

ℙ (X_{n} = x_{n}, \dots, X_{1} = x_{1}) = ℙ (X_{n} = x_{n} | X_{n - 1} = x_{n - 1}, \dots, X_{1} = x_{1}) ℙ (X_{n - 1} = x_{n - 1}, \dots, X_{1} = x_{1})

ובאמצעות כלל השרשרת, שבו סימנו $A_{k} : = {X_{k} = x_{k}}$ , נוכל למצוא את ההתפלגות המשותפת כ

\begin{aligned} ℙ (X_{1} = x_{1}, \dots X_{n} = x_{n}) & = ℙ (X_{1} = x_{1} ∣ X_{2} = x_{2}, \dots, X_{n} = x_{n}) ℙ (X_{2} = x_{2}, \dots, X_{n} = x_{n}) \\ = ℙ (X_{1} = x_{1}) ℙ (X_{2} = x_{2} ∣ X_{1} = x_{1}) ℙ (X_{3} = x_{3} ∣ X_{1} = x_{1}, X_{2} = x_{2}) \cdot \dots \\ \cdot ℙ (X_{n} = x_{n} ∣ X_{1} = x_{1}, \dots, X_{n - 1} = x_{n - 1}) \end{aligned}

דוגמה

עבור $n = 3$ , כלומר עבור שלושה משתנים אקראיים שנסמן ב $X_{1}, X_{2}, X_{3}$ , יהיה כלל השרשרת

\begin{aligned} ℙ_{(X_{1}, X_{2}, X_{3})} (x_{1}, x_{2}, x_{3}) & = ℙ (X_{1} = x_{1}, X_{2} = x_{2}, X_{3} = x_{3}) \\ = ℙ (X_{3} = x_{3} ∣ X_{2} = x_{2}, X_{1} = x_{1}) ℙ (X_{2} = x_{2}, X_{1} = x_{1}) \\ = ℙ (X_{3} = x_{3} ∣ X_{2} = x_{2}, X_{1} = x_{1}) ℙ (X_{2} = x_{2} ∣ X_{1} = x_{1}) ℙ (X_{1} = x_{1}) \\ = ℙ_{X_{3} ∣ X_{2}, X_{1}} (x_{3} ∣ x_{2}, x_{1}) ℙ_{X_{2} ∣ X_{1}} (x_{2} ∣ x_{1}) ℙ_{X_{1}} (x_{1}) . \end{aligned}

קישורים חיצוניים

René L. Schilling (2021), Measure, Integral, Probability & Processes - Probab(ilistical)ly the Theoretical Minimum (1 ed.), Technische Universität Dresden, Germany, ISBN 979-8-5991-0488-9
William Feller (1968), An Introduction to Probability Theory and Its Applications, vol. I (3 ed.), New York / London / Sydney: Wiley, ISBN 978-0-471-25708-0, p. 496.

הערות שוליים

↑ Schilling, René L. (2021). Measure, Integral, Probability & Processes - Probab(ilistical)ly the Theoretical Minimum. Technische Universität Dresden, Germany. p. 136ff. ISBN 979-8-5991-0488-9.
↑ Schum, David A. (1994). The Evidential Foundations of Probabilistic Reasoning. Northwestern University Press. p. 49. ISBN 978-0-8101-1821-8.
↑ Klugh, Henry E. (2013). Statistics: The Essentials for Research (3rd ed.). Psychology Press. p. 149. ISBN 978-1-134-92862-0.

הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

כלל השרשרת (הסתברות)38823883Q17004731

[1] Schilling, René L. (2021). Measure, Integral, Probability & Processes - Probab(ilistical)ly the Theoretical Minimum. Technische Universität Dresden, Germany. p. 136ff. ISBN 979-8-5991-0488-9.

[2] Schum, David A. (1994). The Evidential Foundations of Probabilistic Reasoning. Northwestern University Press. p. 49. ISBN 978-0-8101-1821-8.

[3] Klugh, Henry E. (2013). Statistics: The Essentials for Research (3rd ed.). Psychology Press. p. 149. ISBN 978-1-134-92862-0.

[1]

[2]

[3]