רגרסיה אורדינלית

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש

רגרסיה אורדינלית היא מודל רגרסיה בסטטיסטיקה בו המשתנה המוסבר נמדד בסולם מדידה סודר. מודלים כאלה שימושיים במיוחד במדעי החברה, שם נעשה שימוש נרחב במשתנים הנמדדים בסולם לייקרט.

סימונים

יהיה הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle Y} משתנה הנמדד בסולם מדידה סודר, שיכול לקבל הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle C} ערכים שונים. נסמן את הערכים ש-הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle Y} מקבל ב-הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle y_1} עד הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle y_C} , כאשר הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle y_1 \le y_2 \le...\le y_C} . ללא הגבלת הכלליות נניח כי הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle y_1=1, y_2=2,...,y_C=C} .

כן יהיו הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle X_1,...X_p} משתנים מסבירים, הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \beta_1,...,\beta_p} פרמטרים ממשיים, ו-הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \alpha_1,...,\alpha_{C-1}} פרמטרים ממשיים המקיימים הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \alpha_1 \le \alpha_2 \le...\le \alpha_{C-1}} .

נסמן הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle X\beta=\beta_1 X_1 + ... + \beta_p X_p} . כן נסמן ב-הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle x} את הערך הנצפה של המשתנה הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle X} .

הערכים הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \alpha_1,...,\alpha_{C-1}} מגדירים מעין "מדרגות" שמפרידות בין הערכים השונים של הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle Y} , ויוצרים באופן מסוים הכללה למודל הרגרסיה הלוגיסטית, שם יש מדרגה אחת המפרידה בין שני הערכים האפשריים של המשתנה המוסבר, וגובהה נקבע שרירותית להיות שווה לאפס, וזאת באינטרפרטציה שבה ערכו של הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle Y} נקבע על ידי ערכו של משתנה נסתר הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle Y^*} .

מודלים ליניאריים

מודל ליניארי עבור הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle Y} הוא הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle P (Y \le j | X_1,...,X_p) = g^{-1} (\alpha_j + X\beta)} , כאשר הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle g} היא פונקציית קישור. בחירות שונות של הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle g} מובילות למודלים שונים ממשפחת מודלים זו. במובן מסוים ניתן לראות מודל זה כמודל ליניארי מוכלל. יש להניח את כל ההנחות הסטנדרטיות שמודל רגרסיה אמור לקיים.

יש לשים לב כי בניסוח זה, ערך חיובי של הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \beta} משמעותו אפקט שלילי, במובן שאם הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \beta} גבוה יותר, ההסתברות כי הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle Y} יקבל ערך נמוך תגדל. מסיבה זו, יש הנוהגים להגדיר את המודל כפונקציה של הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \alpha_j - X\beta} . מבחינה מעשית ההבדל היחיד הוא שאומדני הפרמטרים של המודל יהיו בסימנים הפוכים. לכן, כאשר משתמשים בתוכנה, יש לשים לב איך המודל מוגדר על ידי התוכנה, וזאת כדי לאפשר אינטרפרטציה נכונה של האומדנים.

מודל לוגיסטי מצטבר

אם הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle g} היא פונקציית הלוגיט: הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle g(s)=\log ( \frac {s} {1-s} )} , המודל המתקבל נקרא מודל לוגיסטי מצטבר. כפי שצוין מעלה, ניתן לגזור מודל זה מהנחת קיום משתנה נסתר, בדומה לגזירת מודל הרגרסיה הלוגיסטית.

על פי מודל זה הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle P(Y\le j|x_1,...,x_j)=\frac{ e^{\alpha_j + x\beta} }{1+e^{\alpha_j + x\beta}}}

בדומה למודל רגרסיה הלוגיסטית, גם במודל זה יש לפרמטרים הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \beta} פירוש של לוג יחס סיכויים: הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \log {\frac{P(Y \le j | x_1) / P(Y > j | x_1)} {P(Y \le j | x_2) / P(Y > j | x_2)}} =\beta(x_1-x_2)}

יש לשים כי כאן הלוגריתם של יחס הסיכויים אינו קבוע לכל ערכי הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle X} אלא פרופורציונלי להפרש בין שני ערכים ספציפיים של הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle X} .

מודל פרוביט מצטבר

נסמן ב-הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle \Phi(s)} את פונקציית ההתפלגות המצטברת של משתנה מקרי נורמלי סטנדרטי, ונגדיר את פונקציית הקישור להיות הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle g(s)=\Phi^{-1}(s)} . המודל המתקבל הוא נקרא מודל פרוביט מצטבר. ניתן לגזור מודל זה מהנחת קיום משתנה נסתר שהתפלגותו נורמלית. מודל זה שימושי פחות ממודל הלוגיט, מכיוון שאין לפרמטרים שלו אינטרפרטציה ברורה. כמו כן, בדרך כלל מודל הלוגיט ומודל הפרוביט מניבים תוצאות דומות.

מודל לא סימטרי

פונקציות הקישור לוגיט ופרוביט סימטריות במובן ש-הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle P(Y \le j)} מתקרב ל-0 באותו הקצב שבו הוא מתקרב ל-1. באינטרפרטציה על פיה ערכו של Y נקבע על ידי משתנה נסתר הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle Y^*} , השימוש בפונקציות קישור אלה ודומותיהן מניח כי הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle Y^*} הוא בעל התפלגות סימטרית.

עם זאת, לא ניתן לשלול את האפשרות כי התפלגות המשתנה הנסתר אינה סימטרית אלא מצודדת (skewed). בהתפלגות מצודדת ימנית (right skewed), כלומר התפלגות עם "זנב" של ערכים גבוהים, הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle P(Y \le j)} מתקרב ל-1 בקצב יותר מהיר מאשר ל-0, ובאופן דומה, בהתפלגות מצודדת שמאלית (left skewed), כלומר התפלגות עם "זנב" של ערכים נמוכים, הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle P(Y \le j)} מתקרב ל-0 בקצב יותר מהיר מאשר ל-1.

תחת הנחות אלה, מתאים יותר לבחור פונקציית קישור לא סימטרית. למקרה של משתנה נסתר בעל התפלגות מצודדת ימנית מומלץ לבחור כפונקציית הקישור את פונקציית הלוג-לוג המשלימה (complementary log-log): הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle g^{-1}(s)= \log [- \log (1-s)]} . באופן דומה, כאשר מניחים שלמשתנה הנסתר הוא התפלגות מצודדת שמאלית, מתאימה יותר פונקציית הקישור לוג-לוג: הפענוח נכשל (SVG (אפשר להפעיל MathML בעזרת הרחבת דפדפן): תשובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://wikimedia.org/api/rest_v1/":): {\displaystyle g^{-1}(s)= \log [-\log (s)]} .

מודלים אחרים

קיים מגוון רחב של מודלים אחרים לרגרסיה אורדינלית. שלבי הברמן הציע ליישם את המודל הלוג ליניארי לניתוח משתנה סודר בהינתן משתנים מסבירים.[1] ליאו גודמן הציע מודלים מכפלתיים,[2] וכן משפחת מודלים המהווה הרחבה של המודל הלוג ליניארי שכוללת בתוכה איבר לא ליניארי (אחד המודלים הנפוצים ממשפחת מודלים זו ידוע בשם מודל RC).[3] מודלים לא ליניאריים המתקבלים על ידי השמטת הנחות לגבי השונות של המשתנה הנסתר הוצגו על ידי פיטר מק-קאלאך.[4]

כן יש מגוון רב של מודלים בייסיאניים ומודלים של למידת מכונה.

לקריאה נוספת

  • Agresti, Alan (2010). Analysis of ordinal categorical data. Hoboken, N.J: Wiley. ISBN 978-0470082898.
  • Agresti, Alan (2002). Categorical data analysis, 2nd Edition. John Wiley & Sons. ISBN 0-471-36093-7.
  • Models for Ordinal Response Data - Coure notes by Germán Rodríguez, Princeton University
  • Modeling Ordinal Categorical Data - Tutorial by Alan Agresti, University of Florida

הערות שוליים

  1. Haberman, Shelby J., Log-linear models for frequency tables with ordered classifications, Biometrics, 1974, עמ' 589-600
  2. Goodman, Leo A., Multiplicative models for square contingency tables with ordered categories, Biometrika, 3 66, 1979, עמ' 413-418
  3. Goodman, Leo A., Simple models for the analysis of association in cross-classifications having ordered categories, Journal of the American Statistical Association, 367 74, 1979, עמ' 537-552
  4. McCullagh, Peter., Regression models for ordinal data, Journal of the royal statistical society, Series B (Methodological), 1980, עמ' 109-142
הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0


שגיאות פרמטריות בתבנית:מיון ויקיפדיה

שימוש בפרמטרים מיושנים [ דרגה ]
רגרסיה אורדינלית26261214