התפלגות זנב עבה
בתורת ההסתברות ובסטטיסטיקה, התפלגות זנב עבה (באנגלית: Heavy-tailed distributions) היא תכונה המיוחסת להתפלגויות שזנבן אינו ניתן לחסימה מעריכית. אינטואיטיבית מדובר בהתפלגויות בהן ישנה אוכלוסייה מעטה עם הסתברות גבוהה ואוכלוסייה רבה עם הסתברות נמוכה, ש"מזדנבת". במקרים רבים, המשקל של ה"זנב" גדול מהמשקל של החלק הראשון. תופעה זו מכונה גם "זנבות כבדים" או "זנב פרטו". על פי רוב העניין מרוכז בזנב הימני, כלומר בערכים החיוביים הקיצוניים, אך באותה מידה התפלגות זנב עבה יכולה להיות בעלת זנב שמאלי ארוך או זנב ימני וגם שמאלי.
ההתפלגויות עבות זנב מתחלקות לשני תתי-סוגים: התפלגויות זנב ארוך והתפלגויות תת-מעריכיות, אך לכל צורך מעשי משתמשים בהתפלגויות תת-מעריכיות.
דוגמאות
- ערך מורחב – הזנב הארוך
יועץ שהתקשה להמחיש ללקוחותיו את העוצמה של הזנב הארוך תיאר אותו כך: תדמיינו ערימה של מאות מטבעות אחד על השני, ולידה ערימה כזו קטנה יותר, לידה ערימה קטנה עוד יותר וכן הלאה. לאחר ערימות שפרוסות לאורך כמטר הן מגיעות לגובה של מטבע אחד או שניים. הערימות הקטנות הללו, שלכאורה חסרות חשיבות ממשיכות לאורך קילומטרים רבים. בסך הכול הערימות הקטנות מכילות יותר מטבעות מהערימות הגדולות.
אוכלוסיות רבות מתנהגות בהתפלגויות בעלות זנב ארוך. לדוגמה:
- שכיחות המילים באנגלית: המילה the היא 7% מהמילים בטקסט טיפוסי, of מהווה 3.5% וכן הלאה. רוב המילים נדירות יחסית, ובכל זאת מרכיבות את חלק הארי של הטקסטים.
- השכיחות שבה אנשים מחפשים מילים במנועי חיפוש.
- מספר הצפיות של מאמרים בוויקיפדיה העברית: מספר מאמרים פופולריים נצפים מאות אלפי פעמים בשנה. רוב המאמרים נצפים הרבה פחות, אולם רוב הצפיות באתר מגיעות מהם.
הגדרות
התפלגות זנב עבה
נאמר שההתפלגות של משתנה מקרי בעל פונקציית הצטברות היא בעלת זנב ימני עבה אם:
אם נגדיר את פונקציית התפלגות הזנב בתור: , אז נקבל כי:
הגדרה שקולה ניתנת באמצעות פונקציה יוצרת מומנטים המתאימה ל-, המסומנת . אם היא אין-סופית לכל , ההתפלגות היא בעלת זנב עבה.
ההגדרות להתפלגויות זנב שמאלי עבה או התפלגויות בעלות שני זנבות עבים מתקבלות על ידי הגדרות דומות.
התפלגות זנב ארוך
נאמר שההתפלגות של משתנה מקרי בעל פונקציית הצטברות היא בעלת זנב ארוך אם לכל :
או באופן שקול:
הסבר אינטואיטיבי להתפלגות זנב ארוך הוא שלא משנה כמה "רחוק" נלך ימינה על הזנב, תמיד ההסתברות שנקבל ערך שגבוה מהערך שבו אנו נמצאים שואף לאחד. או במילים אחרות, אם ככל שהולכים ימינה המצב פחות טוב עבורנו, גם כשאנחנו חושבים שהגענו הכי רחוק שאפשר, כנראה שהמציאות עוד יותר גרועה.
מן ההגדרה נובע שכל ההתפלגויות ארוכות הזנב הן גם עבות זנב, אך לא כל התפלגות זנב עבה היא גם זנב ארוך.
התפלגות תת-אקספוננציאלית
התפלגויות זנב עבה נפוצות
כל התפלגויות הזנב העבה הנפוצות הן התפלגויות תת-אקספוננציאליות. בין התפלגויות הזנב הימני הנפוצות ניתן למנות את התפלגות פארטו, ההתפלגות הלוג-נורמלית, התפלגות לוי והתפלגות וייבול. בין ההתפלגויות הסימטריות (בעלות שני זנבות) שהן גם זנב עבה הנפוצות הן התפלגות t והתפלגות קושי.
ראו גם
התפלגויות | ||
---|---|---|
התפלגויות בדידות כלליות | אחידה בדידה • בינומית • מולטינומית • בינומית שלילית • ברנולי • גאומטרית • היפרגאומטרית • היפרגאומטרית שלילית • מנוונת • פואסון | |
התפלגויות רציפות כלליות | אחידה רציפה • בטא • גמא • לוג-נורמלית • מעריכית (אקספוננציאלית) • נורמלית (גאוסית) • לפלס • משולשת • פארטו • ריילי • קושי • כי בריבוע | |
התפלגויות בפיזיקה סטטיסטית | בולצמן • בוז-איינשטיין • מקסוול-בולצמן • פרמי-דיראק • זטא | |
התפלגויות נוספות | התפלגות t • התפלגות F • ארלנג • וייבול • לוגיסטית | |
סוגי התפלגויות | בדידה • רציפה • מותנית • נורמלית מוכללת • זנב עבה • לא פריקה • משותפת |
32008099התפלגות זנב עבה