משתנה עזר
בסטטיסטיקה ובעיקר באקונומטריקה, המתודה של משתנה עזר נועדה לאפשר מדידת סיבתיות כאשר ניסוי מבוקר אינו אפשרי ויש חשש של אנדוגניות של אחד המשתנים.
דוגמה
נחשוב על מודל לינארי המנסה לאמוד את השפעת העישון על הבריאות, ובפרט על תוחלת החיים:
כך ש-y הוא מספר השנים שחי הפרט, x הוא כמות הסיגריות שהפרט מעשן בחודש ו- הוא השגיאה. מכיוון שלעישון יש קורלציה עם התנהגויות לא בריאות אחרות. נקבל כתוצאה אפקט חזק מהאפקט האמיתי.
לכן עלינו לעשות ניסוי מבוקר בו נורה לאנשים לעשן מספר מסוים של סיגריות וכך נוכל לבודד את האפקט. מחקר כזה אינו אתי ויקר מאד. כך שעלינו למצוא פתרון אחר.
כדי לבודד את האפקט זה עלינו למצוא משתנה שלישי, z, שמתואם עם y רק דרך x. אם גובה המסים על הטבק מתואם שלילית עם כמות העישון ואם החוקר משתכנע שגובה המסים לא משפיע על אורך החיים בדרך אחרת, אז גובה המסים על הטבק הוא משתנה תקף.
שיטת האמידה
ניתן לחשוב על משתנה עזר כרגרסיה דו שלבית. בשלב הראשון נאמוד את המודל:
הביטוי
הוא אותו חלק בx שאינו מתואם עם הטעות, שכן הוא פונקציה לינארית של z שאינו מתואם עם הטעות