רגרסיה אורדינלית
רגרסיה אורדינלית היא מודל רגרסיה בסטטיסטיקה בו המשתנה המוסבר נמדד בסולם מדידה סודר. מודלים כאלה שימושיים במיוחד במדעי החברה, שם נעשה שימוש נרחב במשתנים הנמדדים בסולם לייקרט.
סימונים
יהיה משתנה הנמדד בסולם מדידה סודר, שיכול לקבל ערכים שונים. נסמן את הערכים ש- מקבל ב- עד , כאשר . ללא הגבלת הכלליות נניח כי .
כן יהיו משתנים מסבירים, פרמטרים ממשיים, ו- פרמטרים ממשיים המקיימים .
נסמן . כן נסמן ב- את הערך הנצפה של המשתנה .
הערכים מגדירים מעין "מדרגות" שמפרידות בין הערכים השונים של , ויוצרים באופן מסוים הכללה למודל הרגרסיה הלוגיסטית, שם יש מדרגה אחת המפרידה בין שני הערכים האפשריים של המשתנה המוסבר, וגובהה נקבע שרירותית להיות שווה לאפס, וזאת באינטרפרטציה שבה ערכו של נקבע על ידי ערכו של משתנה נסתר .
מודלים ליניאריים
מודל ליניארי עבור הוא , כאשר היא פונקציית קישור. בחירות שונות של מובילות למודלים שונים ממשפחת מודלים זו. במובן מסוים ניתן לראות מודל זה כמודל ליניארי מוכלל. יש להניח את כל ההנחות הסטנדרטיות שמודל רגרסיה אמור לקיים.
יש לשים לב כי בניסוח זה, ערך חיובי של משמעותו אפקט שלילי, במובן שאם גבוה יותר, ההסתברות כי יקבל ערך נמוך תגדל. מסיבה זו, יש הנוהגים להגדיר את המודל כפונקציה של . מבחינה מעשית ההבדל היחיד הוא שאומדני הפרמטרים של המודל יהיו בסימנים הפוכים. לכן, כאשר משתמשים בתוכנה, יש לשים לב איך המודל מוגדר על ידי התוכנה, וזאת כדי לאפשר אינטרפרטציה נכונה של האומדנים.
מודל לוגיסטי מצטבר
אם היא פונקציית הלוגיט: , המודל המתקבל נקרא מודל לוגיסטי מצטבר. כפי שצוין מעלה, ניתן לגזור מודל זה מהנחת קיום משתנה נסתר, בדומה לגזירת מודל הרגרסיה הלוגיסטית.
על פי מודל זה
בדומה למודל רגרסיה הלוגיסטית, גם במודל זה יש לפרמטרים פירוש של לוג יחס סיכויים:
יש לשים כי כאן הלוגריתם של יחס הסיכויים אינו קבוע לכל ערכי אלא פרופורציונלי להפרש בין שני ערכים ספציפיים של .
מודל פרוביט מצטבר
נסמן ב- את פונקציית ההתפלגות המצטברת של משתנה מקרי נורמלי סטנדרטי, ונגדיר את פונקציית הקישור להיות . המודל המתקבל הוא נקרא מודל פרוביט מצטבר. ניתן לגזור מודל זה מהנחת קיום משתנה נסתר שהתפלגותו נורמלית. מודל זה שימושי פחות ממודל הלוגיט, מכיוון שאין לפרמטרים שלו אינטרפרטציה ברורה. כמו כן, בדרך כלל מודל הלוגיט ומודל הפרוביט מניבים תוצאות דומות.
מודל לא סימטרי
פונקציות הקישור לוגיט ופרוביט סימטריות במובן ש- מתקרב ל-0 באותו הקצב שבו הוא מתקרב ל-1. באינטרפרטציה על פיה ערכו של Y נקבע על ידי משתנה נסתר , השימוש בפונקציות קישור אלה ודומותיהן מניח כי הוא בעל התפלגות סימטרית.
עם זאת, לא ניתן לשלול את האפשרות כי התפלגות המשתנה הנסתר אינה סימטרית אלא מצודדת (skewed). בהתפלגות מצודדת ימנית (right skewed), כלומר התפלגות עם "זנב" של ערכים גבוהים, מתקרב ל-1 בקצב יותר מהיר מאשר ל-0, ובאופן דומה, בהתפלגות מצודדת שמאלית (left skewed), כלומר התפלגות עם "זנב" של ערכים נמוכים, מתקרב ל-0 בקצב יותר מהיר מאשר ל-1.
תחת הנחות אלה, מתאים יותר לבחור פונקציית קישור לא סימטרית. למקרה של משתנה נסתר בעל התפלגות מצודדת ימנית מומלץ לבחור כפונקציית הקישור את פונקציית הלוג-לוג המשלימה (complementary log-log): . באופן דומה, כאשר מניחים שלמשתנה הנסתר הוא התפלגות מצודדת שמאלית, מתאימה יותר פונקציית הקישור לוג-לוג: .
מודלים אחרים
קיים מגוון רחב של מודלים אחרים לרגרסיה אורדינלית. שלבי הברמן הציע ליישם את המודל הלוג ליניארי לניתוח משתנה סודר בהינתן משתנים מסבירים.[1] ליאו גודמן הציע מודלים מכפלתיים,[2] וכן משפחת מודלים המהווה הרחבה של המודל הלוג ליניארי שכוללת בתוכה איבר לא ליניארי (אחד המודלים הנפוצים ממשפחת מודלים זו ידוע בשם מודל RC).[3] מודלים לא ליניאריים המתקבלים על ידי השמטת הנחות לגבי השונות של המשתנה הנסתר הוצגו על ידי פיטר מק-קאלאך.[4]
כן יש מגוון רב של מודלים בייסיאניים ומודלים של למידת מכונה.
לקריאה נוספת
- Agresti, Alan (2010). Analysis of ordinal categorical data. Hoboken, N.J: Wiley. ISBN 978-0470082898.
- Agresti, Alan (2002). Categorical data analysis, 2nd Edition. John Wiley & Sons. ISBN 0-471-36093-7.
- Models for Ordinal Response Data - Coure notes by Germán Rodríguez, Princeton University
- Modeling Ordinal Categorical Data - Tutorial by Alan Agresti, University of Florida
הערות שוליים
- ^ Haberman, Shelby J., Log-linear models for frequency tables with ordered classifications, Biometrics, 1974, עמ' 589-600
- ^ Goodman, Leo A., Multiplicative models for square contingency tables with ordered categories, Biometrika, 3 66, 1979, עמ' 413-418
- ^ Goodman, Leo A., Simple models for the analysis of association in cross-classifications having ordered categories, Journal of the American Statistical Association, 367 74, 1979, עמ' 537-552
- ^ McCullagh, Peter., Regression models for ordinal data, Journal of the royal statistical society, Series B (Methodological), 1980, עמ' 109-142
26261214רגרסיה אורדינלית