הסתברות פוסטריורית היא מושג מרכזי בסטטיסטיקה בייסיאנית. המייצגת את ההסתברות, או ההתפלגות, שמתקבלת מעדכונים של ההסתברות הפריורית על סמך מידע המתקבל מתצפיות.[1]
העדכון נעשה על ידי שימוש בכלל בייס.[2] הההסתברות הפוסטריורית עשויה לשמש כהסתברות פריורית במהלך נוסף של עדכון בייסיאני.[3]
בסטטיסטיקה בייסיאנית, הפרמטרים של המודל, שיסומנו ב- , הם בעצמם משתנים מקריים. ההתפלגות הפריורית שלהם, כלומר ההתפלגות שלהם בהיעדר כל מידע מוקדם, תסומן ב .
ההסתברות הפוסטריורית היא ההסתברות של הפרמטרים בהינתן תצפיות , ומסומנת .
לעומת זאת, פונקציית הנראות היא ההסתברות של התצפיות בהינתן הפרמטרים של המודל, כלומר .
בהינתן הסתברות פריורית וכי ההסתברות לתצפיות היא , אז ההסתברות הפוסטריורית מוגדרת באמצעות כלל בייס[4]
.
כלומר, ההסתברות הפוסטריורית פרופורציונית לפונקציית הנראות המוכפלת בהסתברות הפריורית.[5] הוא קבוע הנירמול המחושב על ידי
אם היא פרמטר רציף, או על ידי סיכום של על כל הערכים האפשריים של , אם הוא פרמטר בדיד.[6]
דוגמה 1 - התפלגות פוסטריורית של פרמטר במודל בינומי
נניח שרוצים למצוא מהו הסיכוי שבהטלת מטבע מסוים, לא בהכרח מטבע הוגן, הוא ייפול על עץ. כדי לאמוד את הערך של מבצעים סדרה של הטלות, ונניח ש-m פעמים הוא נפל על עץ, ו-n פעמים על פלי. נסמן ב X את סדרת התוצאות הללו. בהנחה שההטלות בלתי תלויות זו בזה, אז בהינתן מודל שבו ההסתברות לנפילה על עץ בהטלה בודדת היא , ההסתברות לסדרת התוצאות X היא
את האמונה הראשונית שלנו, שמטבעות הם בדרך כלל הוגנים, ניתן לנסח באמצעות פונקציית צפיפות הסתברות פריורית על הפרמטר . למען ההמחשה אפשר לבחור כהתפלגות הפריורית בפונקציה
להתפלגות פריורית זו מקסימום ב והיא סימטרית סביב נקודה זו. כעת ההתפלגות הפוסטריורית של היא
דוגמה 2 - התפלגות פוסטריורית של פרמטר בהתפלגות נורמלית
ניח הם משתנים מקריים בלתי תלויים שווי התפלגות בעלי התפלגות נורמלית , כאשר התוחלת אינה ידועה והשונות נתונה. נניח גם כי צפיפות ההתפלגות הפריורית של היא כאשר ו- נתונים. נסמן ב- את וקטור המשתנים המקריים ונסמן ב- את ערכי התצפית שלהם. אם נתעלם מכל הגורמים שאינם תלויים ב-, ההסתברות הפריורית המוכפלת בנראות היא מהצורה:
באמצעות השלמה לריבוע נקבל:
כאשר וכאשר ו- הם קבועים שאינם תלויים ב- (אך תלויים ב-), ו- ו- הם:
ולסיכום ההתפלגות הפוסטריורית היא התפלגות נורמלית עם תוחלת ועם שונות
ניתן לראות כי בגבול מתקבלות התוצאות המצופות ממדגם גדול, ו .[7]
בסיווג, הסתברות פוסטריורית משקפת את חוסר הוודאות של הערכת תצפית למחלקה מסוימת. בעוד שהפלט של שיטות סיווג סטטיסטיות הוא בהגדרה הסתברות פוסטריורית, שיטות של למידת מכונה לעיתים קרובות אינן מספקת הערכות הסתברותיות אמינות. אחת הדוגמאות הבולטות בהקשר זה הוא מסווג בייסיאני נאיבי, שנוטה להערכות הסתברות פוסטריורית מוטות בשל הנחת האי-תלות בין משתני הקלט.[9]
הערות שוליים
↑Press, S. James (1989). "Approximations, Numerical Methods, and Computer Programs". Bayesian Statistics : Principles, Models, and Applications. New York: John Wiley & Sons. pp. 69–102. ISBN0-471-63729-7.
↑Lambert, Ben (2018). "The posterior – the goal of Bayesian inference". A Student's Guide to Bayesian Statistics. Sage. pp. 121–140. ISBN978-1-4739-1636-4.
↑Andrew Gelman, John B. Carlin, Hal S. Stern, David B. Dunson, Aki Vehtari and Donald B. Rubin (2014). Bayesian Data Analysis. CRC Press. p. 7. ISBN978-1-4398-4095-5.{{cite book}}: תחזוקה - ציטוט: multiple names: authors list (link)
^ 7.07.1G. A. Young , R. L. Smith, Essentials of Statistical Inference, US: Cambridge University Press, 2005