הסקה סטטיסטית

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש

הסקה סטטיסטית או סטטיסטיקה היסקית היא תהליך שבו מסיקים מסקנות על התכונות של התפלגות כלשהי, על בסיס ניתוח של מידע אמפירי. הניתוח של המידע מאפשר להסיק מסקנות לגבי התכונות של האוכלוסייה: בפרט ניתן להשתמש בניתוח בשביל לבצע בדיקת השערות ובשביל למצוא אומדנים לפרמטרים של האוכלוסייה[א].

בעוד הסטטיסטיקה התיאורית עוסקת בתכונות של המדגם עצמו, ולכן אינה מניחה שבהכרח האוכלוסייה גדולה מהמדגם, ההנחה במסגרת הניתוח של הסטטיסטיקה ההיסקית היא שהאוכלוסייה גדולה יותר (בדרך כלל הרבה יותר) מכמות הפרטים שלגביהם בפועל נאסף המידע; כלומר ההנחה היא שהמידע שנאסף נדגם מתוך אוכלוסייה גדולה יותר.

הסבר כללי

הסקה סטטיסטית מאפשרת לטעון טענות לגבי האוכלוסייה כולה, על אף שצפינו רק בחלק מתוך אוכלוסייה זו אותו דגמנו (באופן אקראי).

תהליך ההסקה הסטטיסטית מתחיל בבחירת מודל סטטיסטי של התהליך שבאמצעותו נוצר המידע[ב], שנותן לנו להניח מהי צורת ההתפלגות של המידע[ג], ולאחר מכן הסקת מסקנות מהמידע שנאסף תחת ההנחות של המודל.

מספר סטטיסטיקאים ידועים התבטאו בנושא ואמרו שבדרך כלל הבעיה הקשה ביותר בהסקה סטטיסטית היא התרגום של בעיות במציאות למודל סטטיסטי מתאים.

דוגמאות לשימוש בהסקה סטטיסטית

  • אמידה נקודתית - מתן ההערכה/האומדן הטוב ביותר עבור פרמטר מסוים.[א]
  • אמידה של טווח - מציאת טווח מסוים שהסיכוי שהפרמטר האמיתי נמצא בתוכו הוא גבוה. אם הטווח הוא קטע רציף, הוא נקרא רווח בר-סמך, ומידת הוודאות לגבי הימצאותו של הפרמטר בטווח זה נקרא "רמת סמך".[ד]
  • בדיקת השערות - ניסוח השערה ובדיקה אם ניתן לדחות אותה ברמה מסוימת של ודאות.[ה]
  • סיווג של המידע לקבוצות וניתוח אשכולות.

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא הסקה סטטיסטית בוויקישיתוף

ביאורים

  1. ^ 1.0 1.1 למשל, אם האוכלוסייה היא: "עצי האורן בשטח מדינת ישראל", והפרמטר הוא: "גובה", אז ניתן לאמוד את תוחלת הגובה שלהם או את סטיית התקן שלה.
  2. ^ למשל, בהטלת קובייה התהליך בו נוצר המידע הוא הטלת הקוביה כך שיש הסתברות מסוימת לכל פאה, כשסך ההסתברויות של 6 הפאות הוא 100%. אם הקוביה היא הוגנת, ההסתברויות של כל הפאות שוות זו לזו.
  3. ^ למשל: התפלגות נורמלית, התפלגות אחידה, התפלגות פואסונית וכו'.
  4. ^ למשל, אם האוכלוסייה היא: "עצי האורן בשטח מדינת ישראל", והפרמטר הוא: "גובה", אז ניתן לאמוד את תוחלת הגובה בתוך קטע, למשל: בין 12 מטרים ל-16 מטרים, עם רמת סמך של %‏X.
  5. ^ למשל, אם האוכלוסייה היא: "עצי האורן בשטח מדינת ישראל", והפרמטר הוא: "גובה", ניתן לנסח השערה שתוחלת הגובה גבוהה מ-100 מטרים, ולבדוק האם ניתן להסיק מהמדגם של עצים אותם מדדנו שברמת ודאות של 95% ההשערה הזו שגויה.
Allianz AG.png ערך זה הוא קצרמר בנושא סטטיסטיקה. אתם מוזמנים לתרום למכלול ולהרחיב אותו.
Logo hamichlol 3.png
הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0