מדגם
בסטטיסטיקה, מדגם הוא קבוצת פרטים, המהווה מודל לאוכלוסייה (אנ'), שאליה היא שייכת. הפרטים במדגם עשויים להיות בני אדם מאוכלוסייה אנושית כלשהי, בעלי חיים ואפילו עצמים דוממים (למשל, מדגם של גפרורים נבדק כדי לאמוד את אחוז הגפרורים שלא נדלקים, מכלל אוכלוסיית הגפרורים המיוצרת במפעל מסוים).
מחקר הנערך על מדגם מכונה סקר. ככל שבחירת המדגם ("דגימה") נעשית באופן התואם יותר את המלצות הסטטיסטיקאים, כך ניתן להסיק מהסקר מסקנות מדויקות יותר וסבירות יותר על אודות האוכלוסייה הרחבה שאותה מייצג המדגם. אולם, הרבה פעמים יש להתפשר על איכות המדגם.
הסיבות לשימוש במדגם
בסטטיסטיקה נהוג להסיק מסקנות אודות אוכלוסייה מסוימת על סמך מדגם[1]. רק לעיתים רחוקות נערך מחקר בקרב כל האוכלוסייה הנבדקת. למחקר כזה קוראים מפקד אוכלוסין. לדוגמה מפקד האוכלוסין והדיור, שאותו עורכת הלשכה המרכזית לסטטיסטיקה מדי עשר שנים בערך. הסיבות לכך שמפקדים הם מחקרים נדירים הן:
- עלותו של מפקד עשויה להיות גבוהה מאוד.
- חלק מהמחקרים גורמים לנזק בלתי הפיך לפרטים הנבדקים. אין טעם, למשל, לבדוק אם כל הגפרורים שהמפעל מייצר באמת נדלקים.
- יש מחקרים שאוכלוסיית היעד שלהם כוללת גם פרטים שאי אפשר להשיג לצורך מחקר. לדוגמה, אוכלוסיית המכורים לסמים - לא סביר שמאה אחוז מהמכורים לסמים יודו בדבר לצורך המחקר. דוגמה מובהקת אחרת לזה היא במחקרים ברפואה: מחקר רפואי אינו מתעניין רק באוכלוסיית האנשים שכבר נולדו אלא ב-"אוכלוסיית העל" של כל האנשים שעשויים להיוולד.
מדגם מייצג
מדגם מייצג הוא גודל המדגם המינימלי, בדגימה הסתברותית, המאפשר דיוק ניכר בהסקת המידע הסטטיסטי. גודל זה מושפע הן מגודל האוכלוסייה כולה והן מהשונות שיש באוכלוסייה לגבי התכונה הנחקרת. לדוגמה, סקר בחירות במדינה עם אוכלוסייה גדולה, שעל פי רוב נבחרות לפרלמנט שלה מפלגות רבות צריך להכיל מדגם גדול יותר מאשר סקר בחירות במדינה קטנה, שעל פי רוב נבחרות לפרלמנט שלה רק שתי מפלגות.
גודל המדגם
גודל מדגם הוא גורם המשפיע מחד על עלות וזמן עריכת המחקר, אך גם על העוצמה סטטיסטית של המחקר ועל יכולתו של המדגם לייצג את כלל תת-האוכלוסיות שבאוכלוסייה הנחקרת מאידך. גודל המדגם הנדרש מושפע בעיקר מגודל רווח הסמך הנדרש לתוצאות הסקר, מגודל האוכלוסייה כולה ומהשונות שיש באוכלוסייה לגבי התכונה הנחקרת.
כשנחקרת תכונה המתפלגת באוכלוסייה בהתפלגות נורמלית, באוכלוסייה שניתן להחשיב את גודלה לאין סופי, גודל המדגם הדרוש הוא , כאשר סיגמא היא סטיית התקן של התכונה הנחקרת באוכלוסייה, E הוא גודל רווח הסמך הדרוש, ו-Z של חצי אלפא הוא גודל התלוי בהתפלגות הנורמלית הסטנדרטית ובמובהקות הדרושה.
סוגי מדגמים
כמו כל מודל אחר, ככל שקל יותר להשתכנע, שהוא מייצג נאמנה את המערכת שהוא מדמה, כך המסקנות המוסקות בעזרתו, תקפות יותר. לכן "מדגם מייצג" (ראו למעלה) חייב להיות, בין השאר, מדגם הסתברותי. דהיינו, שלכל פרט באוכלוסייה חייב להיות סיכוי להיכלל במדגם ועל הסיכוי הזה להיות ידוע. סיכוי דגימה ידוע מחייב מסגרת דגימה - רשימה הכוללת את כל הפרטים באוכלוסייה.
כוח השכנוע של מחקרים, שנעשים בעזרת מדגמים לא הסתברותיים הוא נמוך יותר, אך לפעמים אין מנוס ממדגמים לא הסתברותיים.
מדגמים הסתברותיים
מדגם הסתברותי הוא כל מדגם שהפרטים בו נבחרו בעזרת הגרלה מתוך כלל הפרטים שבאוכלוסייה. היכולת לדגום מדגם הסתברותי תלויה באפשרות לקיים הגרלה כזו. כדי לקיים הגרלה כזו יש צורך ברשימה של כלל הפרטים שבאוכלוסייה. רשימה כזו קרויה מסגרת דגימה. במקרים רבים, מסגרת הדגימה היא רשימה מקורבת של כלל הפרטים באוכלוסייה. דוגמאות למסגרות דגימה: רשימת כל התלמידים הרשומים לכל בתי הספר בישראל היא מסגרת דגימה המכילה רשימה מקורבת של כלל הילדים בישראל בין הגילים שש לשמונה עשרה, פנקס הבוחרים הוא מסגרת דגימה המכילה רשימה מקורבת של כלל אזרחי ישראל מעל גיל 18.
- דגימה אקראית פשוטה
- המדגם ההסתברותי הפשוט ביותר נקרא מדגם אקראי פשוט. במדגם כזה כל פרט ופרט נבחר למדגם בהליך אקראי מתוך מסגרת הדגימה, כך שלכל פרט במסגרת יש אותו סיכוי להיות במדגם. מדגם כזה נותן ייצוג טוב של האוכלוסייה ויכולת הכללה, אך חסרונו הוא שתת-אוכלוסיות קטנות אינן באות לידי ביטוי בו, שכן אין כל ביטחון שאכן תידגם כמות מספקת מאותה תת-אוכלוסייה. דוגמה: אם מסגרת הדגימה היא רשימת שמות, כל שם ושם נבחר מהרשימה בהגרלת מקומו ברשימה.
- דגימה שיטתית
- בחירת הנדגם הראשון נעשית בהגרלה אקראית ובחירת שאר הנדגמים נעשית לפי יחס מסוים לנדגם הראשון. לדוגמה: אם מסגרת הדגימה היא ספר הטלפונים, שמו של הנדגם הראשון מוגרל במקריות מתוך כלל השמות שבספר הטלפונים, שמו של הנדגם השני מופיע בדיוק עשרה עמודים מאוחר יותר בספר הטלפונים, שמו של השלישי מופיע בדיוק עשרה עמודים אחרי השני וכך הלאה. דגימה שיטתית מונעת בחירת פרטים שמקומם במסגרת המדגם סמוך מסיבות שאינן מקריות. למשל, דגימה שיטתית של עשרה אנשים מספר הטלפונים תמנע מצב שבו לרבים מהנדגמים יש אותו שם משפחה משום שהם מאותה העדה.
- דגימת שכבות
- כדי להבטיח ייצוג של תת-אוכלוסיות קטנות במדגם, אשר לא באות לידי ביטוי בדגימה אקראית פשוטה, ניתן להשתמש בדגימת שכבות. בעת בחירת המדגם, מבטיחים מכסה מסוימת של נדגמים מכל תת-אוכלוסייה. לאחר מכן, בעת הניתוח הסטטיסטי, משוקללות השכבות על מנת שלא ליצור הטיה בשל עודף יצוג של תת-הקבוצות.
- דגימת אשכולות
- שתי השיטות לעיל הן קשות ליישום באוכלוסיות גדולות (ברמת אוכלוסיית מדינה) משתי סיבות עיקריות: ראשית, מסגרת דגימה אינה זמינה תמיד לאוכלוסיות כאלו ושנית - התפרסות של המדגם על כל אזורי הארץ גוררת הוצאות גבוהות. במקרה כזה נעשה שימוש במדגם אשכולות. האוכלוסייה הנדגמת מחולקת לאשכולות (גאוגרפיים בדרך כלל). לאחר מכן נערכת דגימה אקראית של אשכולות, ובשלב הבא - דגימה אקראית של פרטים מתוך כל אשכול שנבחר.
ניתן לשלב דגימת שכבות ודגימת אשכולות - לדוגמה, לבחור לפי שכבות מסוימות בתוך כל אשכול.
מדגמים לא הסתברותיים
עריכת מדגם הסתברותי עשויה להיות הליך ארוך ויקר. כמו כן, היא אינה אפשרית כאשר אין מסגרת דגימה. לכן, חוקרים משתמשים פעמים רבות במדגמים לא הסתברותיים.
שיטות שונות לדגימה לא הסתברותית:
- מדגם נוחות
- שיטה זו מתבססת על בחירת הנחקרים הקלים ביותר להשגה עבור עורך המחקר. יתרונה הגדול של שיטה זו הוא המחיר הזול שלה. חסרונותיה הם שהמדגם יהיה בהכרח מקבוצה חברתית מסוימת ולכן לא יהיה מייצג. שיטה זו מקובלת במחקרים ראשוניים (כמו ניסוי פיילוט).
- מדגם מומחים
- מדגם מומחים הוא סוג של מדגם נוחות. במדגם כזה יש משתתפים בודדים המכירים היטב את אוכלוסיית היעד של המחקר ומנסים להעיד בשמה על צרכיה ודעתה. מדגם כזה מקובל בבדיקת אב טיפוס של ציוד טכנולוגי. שלושה עד חמישה מומחים לנגישות יכולים למצוא במחקר כזה בעיות בעיצוב המוצר שיפריעו לאנשים עם לקויות להשתמש בציוד.
- מדגם מתנדבים
- פרסום קריאה לנחקרים, בחינם או תמורת תשלום, וקבלת כל הפונים שנמצאים מתאימים למחקר. לשיטה זו יש חסרונות סטטיסטיים גדולים מזו של דגימת הנוחות משום שקשה לדעת מה הגורמים המטים את הדגימה - החוקר אינו יודע מה גורם לנבדקים לפנות אליו. במקרה שבו לא ניתן לנהל את הסקר מרחוק (דואר נייר, דואר אלקטרוני, לינק לאתר אינטרנט, ריאיון בטלפון וכיוצא בזה) שיטה זו גם יקרה יותר מדגימת הנוחות משום שהיא כוללת פרסום מודעות בציבור הרחב ועשויה לכלול נסיעות ארוכות לצורך פגישה עם המשתתפים במחקר. מקובל להשתמש בשיטה זו רק כשאין ברירה אחרת.
- מדגם כדור שלג
- לאחר פנייה של החוקר ל'מעגל הראשון' של הנדגמים, הם פונים לחבריהם ומפנים אותם לחוקר וכך הלאה. שיטה זו שימושית במיוחד בחקר תופעות שאינן פומביות, כמו שימוש בסמים. חסרונה העיקרי הוא שהיא דוגמת רשת חברתית אחת.
- מדגם שבו נבחרת, באופן מכוון[2], קבוצה שדומה במדדים רבים ככל האפשר לאוכלוסייה הכללית
- סוג מדגם כזה אינו מקובל במחקר והוא משמש לדברים אחרים, כמו הרכבת חבר מושבעים. בכזה מדגם דואגים שאחוז הנשים, בני המיעוטים, העשירים, העניים, הצעירים, הזקנים, המלומדים וכיוצא בזה יהיה דומה ככל האפשר לזה שבאוכלוסייה הכללית. הרכבת מדגם כזה דורשת מאמץ רב של למידה לעומק של פרטיהם הסוציולוגים של הרבה מאד אנשים ויש בה מעט מאד מקום לאקראיות. מדגם כזה עשוי בהחלט להיבחר באופן שבו תוצאות הסקר נקבעו מראש והן אינן גילוי מחקרי.
זיווגים
דגימת זיווגים יכולה להיות הסתברותית או לא הסתברותית. מחקרים המשתמשים בשיטה זו הם בעלי כוח סטטיסטי רב מאשר מחקרים שאינם משתמשים בה, משום שבשיטה זו כל נבדק מושווה לנבדק נוסף אחד, הדומה לו ככל האפשר בתכונות שאינן נחקרות, בניגוד להשוואה כללית של שתי קבוצות מדגם.
דוגמאות לדגימת זיווגים אקראית:
- דגימות זוגיות בתוך משפחות:
- דגימה אקראית של זוגות תאומים זהים והשוואתם - מחקרי תאומים - למשל, בסקר לשם הערכת הסיכוי של אדם לחלות במחלה מסוימת, אם התאום הזהה שלו כבר חלה בה. סקר מסוג זה יכול להעריך עד כמה מחלה מסוימת תלויה בתורשה.
- מחקרי תאומים זהים ולא זהים - תאומים לא זהים עדיין דומים זה לזה יותר משני אחים, כי הם נולדו באותו יום וגדלו באותם תנאים. אחים אחרים עשויים להיות שונים יותר, משום שהבכור היה בן יחיד למשך כמה שנים וכיוצא בזה.
- בחירה אקראית של אנשים, ועבור כל אחד מהם בוחרים גם קרוב משפחה שלו מדרגה ראשונה (בנו, בתו, אחיו, אחותו, אביו או אמו). לקרובי משפחה כאלה יש רקע תורשתי דומה בהרבה מאשר לזרים מוחלטים או לזוגות נשואים.
- דגימה אקראית של זוגות נשואים והשוואתם. למשל, השוואת משכורות של נשים וגברים, אם היא נעשית בין זוגות נשואים, מבטלת את ההשפעה של הגורמים הגאוגרפיים והסוציאליים שיש במדגמים אחרים. כלומר, אם הגברים במדגם כמעט תמיד מרוויחים יותר מהנשים שבו, במדגם זוגות נשואים, אי אפשר לומר שמקום המגורים או הרקע המשפחתי השפיעו על המסקנות, שהרי כל גבר הושווה לאישה שגרה במקום זהה לשלו והיא בת משפחתו.
- דגימת אותו אדם פעמיים ליצירת זוג נדגם:
- דגימה אקראית של אנשים כלשהם ובדיקת כל אדם פעם אחת לפני טיפול מסוים ופעם שנייה אחרי אותו טיפול. כל אדם מושווה כך לעצמו לפני הטיפול ולאחריו.
- בחירה אקראית של אנשים והשוואת תפקוד יד ימינם לתפקוד יד שמאלם.
- זוגות שרירותיים - דגימה של שתי קבוצות אנשים אקראיות והשוואת כל אדם מאחת הקבוצות לזה שהכי דומה לו, סוציולוגית, בקבוצה השנייה. למשל, במדגם לצורך סקר דעות פוליטיות, המשווה בין שתי ערים, תושווה דעתה של אישה בת עשרים ושש, עם 12 שנות השכלה ממוצא ים-תיכוני בעיר א', לדעתה של אישה שוות גיל, השכלה ומוצא בעיר ב', דעתו של גבר בן שלושים עם תואר ראשון ממוצא סקנדינבי בעיר א' תושווה לדעתו של גבר שווה גיל, השכלה ומוצא בעיר ב' וכיוצא בזה.
דגימת זיווגים שאינה אקראית משמשת נעשית כאשר קשה למצוא מדגם זיווגים אקראי. למשל, במקרה שבו אוכלוסיית היעד קטנה. תפקוד ידיים אצל אנשים עם שיתוק מוחין מקובל לבדוק במדגם מזווג שבו אנשים שרק אחת מידיהם פגועה. אצל כל אחד מהם משווים את פעילות היד הפגועה לפעילות היד שאינה פגועה ומסיקים מסקנות על כלל האנשים שידיהם פגועות לעומת כלל האנשים שידיהם אינן פגועות[3].
ראו גם
קישורים חיצוניים
- יורם שורק, הסטטיסטיקה לא אומרת הכל, במדור "דברים שיורמים יודעים", באתר ארכיון האינטרנט (במקור, מאתר "nana10")
- ניסים כהן ותמר אריאלי (2013). סביבת קונפליקט כשדה מחקר: אתגרים ומדגם כדור השלג. פוליטיקה, 22: 26-2.
הערות שוליים
- ^ שמואל זמיר ורות בייט-מרום (2005). מבוא לסטטיסטיקה לתלמידי מדעי החברה א. רעננה: האוניברסיטה הפתוחה.
- ^ קו עיתונות, מדגם הלמ"ס, 8.5.17
- ^ van Roon, D., Steenbergen, B., & Hulstijn, W. (2003). Reciprocal tapping in spastic hemiparesis. Clinical Rehabilitation, 14(6), 592-600.