ציון תקן
ציון תקן (או, ציון תקן z) הוא משתנה מקרי נורמלי, אשר מבטא את המרחק של תצפית מן התוחלת במונחי יחידות סטיית תקן. ציון התקן יכול לקבל כל ערך, חיובי או שלילי, כאשר ערך חיובי מצביע על תצפית הגבוהה בערכה המספרי מתוחלת האוכלוסייה, וערך שלילי מצביע על תצפית הנמוכה בערכה המספרי מתוחלת האוכלוסייה. תהליך חישוב ציון התקן נקרא גם תקנון או נירמול, וציון התקן יקרא גם ערך Z, ציון Z, או: הציון המתוקנן.
היתרון בחישוב ציון התקן הוא האפשרות לקבל אומדן למיקום של ערך (וכפועל יוצא- גם להסתברות לקבל ערך זה, או ערך קיצוני ממנו), בהתפלגות נתונה- באופן שאינו תלוי בסולמות מדידה. החיסרון בחישוב זה הוא היישום המוגבל בשימוש אמפירי בו, מכיוון שניתן לחשבו רק כאשר מניחים התפלגות נורמלית של האוכלוסייה, ותוחלת ושונות ידועות באוכלוסייה.
חישוב ציון התקן
חישוב ציון תקן של תצפית בודדת
כאשר מעוניינים לחשב את ציון התקן של תצפית בודדת, למעשה מחשבים את מרחקה (ביחידת מרחק של סטיות תקן) ממומנט נתון של אוכלוסייה מסוימת. על כן, בחישוב ציון התקן מניחים כי התצפית שייכת לאוכלוסייה תאורטית על פיה מתקננים. מכיוון שציון תקן יחושב רק תחת ההנחה שהאוכלוסייה מתפלגת נורמלית, ותוחלתה ושונותה ידועות, הסימון המקובל לציון הנחה זו היא: והמינוח השגור הוא: "X מתפלג נורמלי, עם תוחלת ושונות ".
בהינתן ערך נקודתי X עבור תצפית, ציון התקן של זו יהיה:
כאשר:
- הערך הנקודתי של התצפית
- תוחלת האוכלוסייה
- סטיית התקן של האוכלוסייה
- ציון התקן של התצפית, או: ציון התקן של הסטטיסטי הנאמד
חישוב ציון תקן של ממוצע מדגם
כאשר מעוניינים לחשב את ציון התקן של ממוצע המדגם, למעשה מחשבים את מרחק ממוצע זה (ביחידת מרחק של סטיות תקן) מתוחלת התפלגות הדגימה. על כן, מניחים כי הממוצע שייך לאוכלוסיית ממוצעים תאורטית, על פיה מתקננים. באופן דומה להנחות שיש להניח עבור התפלגות האוכלוסייה, כאן נניח כי כל המדגמים האפשריים בגודל של המדגם שלנו מתפלגים נורמלית, עם תוחלת ושונות דגימה ידועות. גם כאן הסימון המקובל הוא: ונהוג לומר כי: " מתפלג נורמלי, עם תוחלת ושונות ".
בהינתן ערך נקודתי עבור ממוצע מדגם בגודל , ציון התקן של זה יהיה:
כאשר:
- ממוצע המדגם
- תוחלת התפלגות הדגימה
- טעות התקן של התפלגות הדגימה
- ציון התקן של ממוצע המדגם, או: ציון התקן של הסטטיסטי הנאמד
נשים לב, כי ציון התקן של תצפית בודדת הוא למעשה המקרה המנוון בו .
משמעות מתמטית
הגדרה כללית עבור כל מומנט של משתנה מקרי X
יהיה משתנה מקרי המתפלג כאשר: ו- . לכל: ציון התקן של ערך זה יהיה:
מכיוון ש הוא משתנה מקרי נורמלי, גם משתנה מקרי נורמלי שהתפלגותו:
עם פונקציית צפיפות: ופונקציית הסתברות מצטברת: , אותה נהוג לסמן בתור:
משמעות ציון התקן תחת הגדרת פונקציית הצפיפות של משתנה מקרי המתפלג נורמלי
תחת הנחת ההתפלגות הנורמלית של משתנה מקרי , נתייחס אל ציון התקן כאל מדד למרחק ערך מתוחלת ביחידות מדידה של סטיות תקן.
מכיוון שפונקציית הצפיפות של משתנה מקרי נורמלי אינה חד-חד ערכית, לכל , קיימים שני מקורות תחת המיפוי ההופכי, כאשר תכונת הזוגיות של הפונקציה מבטיחה כי:
על כן, ניתן להתייחס אל ציון התקן כמדד בעל גודל וכיוון כאשר מלמד על המרחק האבסולוטי של ערך מן התוחלת, ו- על מיקום הערך ביחס לציר סימטריה העובר דרך התוחלת.
משמעות ציון התקן תחת הגדרת פונקציית ההסתברות המצטברת של משתנה מקרי המתפלג נורמלי
לפונקציית ההסתברות המצטברת של ההתפלגות הנורמלית אין פתרון אנליטי, ועל כן נהוג לחשב את ערכי באמצעות קירוב נומרי דרך טבלת ערכים נפוצים של האינטגרל, הקרויה טבלת Z, או טבלת ההסתברות הנורמלית. תחת הנחת ההתפלגות הנורמלית של משתנה מקרי , פעולת התקנון מאפשרת להעריך את ההסתברות למאורעות שונים תחת מרחב ההסתברות של בשימוש בפונקציית ההסתברות המצטברת של המשתנה בלבד, ללא פתרון נומרי של ערכי פונקציית הסתברות המשתנה המקורי, באופן הבא:
משמעות יישומית
ניתן להתייחס לציון התקן כאל המרחק של פרט או ממוצע מדגם מתוחלת האוכלוסייה אליה אנו מניחים כי הוא שייך, במונחי סטיות תקן. דהיינו- ערכו המוחלט של ציון התקן מתייחס למספר סטיות התקן מהתוחלת, וסימנו- לכיוון ממנו מודדים את המרחק. ציון תקן גבוה יצביע על מרחק גדול מן התוחלת, כאשר סימן חיובי ילמד אותנו כי ערך התצפית גבוה מהתוחלת, וסימן שלילי- כי ערך זה נמוך מן התוחלת.
ערכו המספרי של ציון התקן יכול ללמד אותנו על ההסתברות למאורע בו אנו מתעניינים, תחת ההשערה כי המאורע נלקח מאוכלוסייה בעלת תוחלת ושונות נתונות. ככל שערכו המוחלט של ציון התקן גבוה יותר, כך הסתברותו תחת הנחות ההתפלגות הנתונה- נמוכה יותר. מכיוון שבהתפלגות הנורמלית, ההסתברות לכל מאורע נקודתי זניחה, נהוג לרב לחשב את ההסתברות לקבלת המאורע הרצוי, או מאורע קיצוני ממנו. מסיבה זו, ציון התקן גם מלמד אותנו על האחוזון אליו שייכת התצפית, ביחס לאוכלוסייה הכללית. בנוסף, פעולת התקנון מאפשרת לנו להעריך הסתברויות ללא תלות בפרמטרים של האוכלוסייה ממנה נלקחו. כך למשל, השוואה בין שני מאורעות זהים, הלקוחים מאוכלוסיות שונות, תתאפשר תחת פעולת התקנון, אך תהיה חסרת משמעות כאשר ננסה להשוות בין הערכים המקוריים של המאורעות.
שימושים
לציוני תקן שימוש רב במדעי החברה, הטבע והרפואה. הסיבה לפופולריות של מדד זה נובעת מההנחה המקדמית שתופעות רבות מתפלגות בקירוב נורמלית, ועל כן נוח למקם ולאמוד תכונות של אוכלוסיות בעזרת מדד זה. מכיוון שבניסויים אמפיריים רבים אין אפשרות לדגום את כלל האוכלוסייה, נהוג לדגום מספר פרטים, ולבדוק האם מדגם זה אכן שייך לאוכלוסייה הכללית, והאם ניתן להסיק ממנו אליה.
דוגמאות
שימוש בציוני תקן בהערכת הסתברות למאורע
נגדיר את המשתנה המקרי X להיות מנת המשכל (במונחי נקודות IQ) של אדם באוכלוסייה הכללית. על פי אומדנים מקובלים, נהוג להניח כי מנת המשכל של אדם הנבחר באקראי מן האוכלוסייה הכללית תתפלג נורמלי באופן הבא:
דהיינו, באופן נורמלי, עם תוחלת של 100 נקודות IQ ושונות של 225 נקודות IQ בריבוע.
נדגום באופן אקראי אדם ונשאל מהי ההסתברות שאדם זה מחונן. מכיוון שההגדרה הרווחת למחוננות היא ציון IQ של 135 נקודות או יותר, נהיה מעוניינים לחשב את ההסתברות לדגום באקראי אדם עם מנת משכל זו, או גבוהה ממנה.
נתקנן ערך זה ונחשב את ציון התקן המתאים לו:
לאחר פעולת התקנון, ניתן לחשב את ההסתברות באופן הבא:
כלומר, ההסתברות לדגום באקראי אדם מחונן- מתוך אוכלוסיית בני האדם הכללית- היא 0.99%.
שימוש בציוני תקן בהשוואה בין מאורעות מאוכלוסיות שונות
בבחינה של שני מועמדים לעבודה המראיין מעוניין להכריע ביניהם על פי ציוני הגמר של אלו בתואר הראשון. שני המרואיינים סיימו את התואר הראשון בציון גמר של 85, אך באו משתי אוניברסיטאות שונות: A ו-B. המראיין פונה אל שתי האוניברסיטאות ומקבל מהן את המידע הבא:
באוניברסיטה A ציון הגמר הממוצע הוא 80, עם סטיית תקן של 10 נקודות.
באוניברסיטה B ציון הגמר הממוצע הוא 80, עם סטיית תקן של 5 נקודות.
המראיין מתקנן את ציוניהם של שני המועמדים כדי להעריך עד כמה ציונם רחוק מן הציון הממוצע:
עבור המועמד הראשון, ציון התקן של ציונו הוא:
עבור המועמד השני, ציון התקן של ציונו הוא:
על כן, באופן יחסי- המועמד השני הצטיין יותר בלימודיו מהמועמד הראשון, מכיוון שציון הגמר שלו- ביחס לממוצע הציונים באוניברסיטה בה למד- גבוה יותר.
נשים לב, כי גם במקרה בו ציון הגמר של המועמד השני היה 84, המראיין עדיין היה אמור לבחור בו לעבודה, מכיוון שציון גמר זה עודנו נמצא במרחק גבוה ממחצית סטיית תקן ממוצע ציוני מוסד הלימוד: