הורדת ממד
בסטטיסטיקה, למידת מכונה ותורת האינפורמציה, תהליך הורדת ממד (Dimensionality reduction) הוא תהליך של צמצום מספר משתנים מתוך כלל המידע על מנת לשמר כמה שיותר מהמשמעות של המידע עצמו.
שיטות להורדת ממד
בחירת מאפיינים (Feature selection)- גישה בה ננסה לבחור תת-קבוצה של משתנים מתוך כלל המשתנים, לתת הקבוצה הזאת נקרא מאפיין (Feature). המטרה בגישה זאת היא לבחור את המאפיינים שמייצגים בצורה אופטימלית את המידע.
הטלת מאפיינים (Feature projection) - בגישה זו נמיר את המידע על ידי המרה של מידע המאופיין כמרחב בעל ממדים רבים (high-dimensional space) למידע המיוצג במרחב עם פחות ממדים. ההמרה יכולה להיות המרה ליניארית, כמו בשיטה לניתוח גורמים ראשיים (PCA) והיא יכולה להיות גם המרה לא-ליניארית כמו ב-Autoencoders.
במקרים מסוימים, ניתוחים בסיסיים כמו קלסיפיקציה או רגרסיה יעשו בצורה יותר מדויקת על מידע שעבר הורדת ממדים מאשר על המידע המקורי.[1]
היתרונות של הורדת ממד
- הורדת נפח האחסון הנדרש על מנת לאחסן את המידע.
- הורדה של מידע עודף גורמת לביצועים טובים יותר באלגוריתמים של למידת מכונה.
- קל יותר לייצר ויזואליזציות של מידע כאשר מבטאים אותו במספר מועט של ממדים, כמו בגרף דו-ממדי או תלת-ממדי.
הערות שוליים
- ^ Rico-Sulayes, Antonio (2017). "Reducing Vector Space Dimensionality in Automatic Classification for Authorship Attribution". Revista Ingeniería Electrónica, Automática y Comunicaciones. 38 (3): 26–35.
23761042הורדת ממד