למידה בלתי מונחית

למידה בלתי מונחית (Unsupervised Learning) היא טכניקה בלמידה חישובית שבה מנסים ללמוד את התכונות והמבנה של אוסף דוגמאות נתונים כאשר הנתונים זמינים כפי שהם ללא תוספת תיוגים^[1]. למשל, נתונים הכוללים מידע רפואי על נבדק, כמו: חום, דופק, לחץ דם; ללא תיוג המציין אם הנתונים שייכים לאדם חולה או בריא. התובנות לגבי התכונות של הנתונים הבלתי מתויגים יכולות לשמש למשל כדי לזהות אנומליות או כדי לחלק את הנתונים לקטגוריות. זאת להבדיל מלמידה מונחית שבה הנתונים הזמינים כוללים גם תיוג ומטרת הלימוד היא בדרך כלל לחזות את התיוג של נתונים עתידיים (למשל לחזות אם נתונים רפואיים שלא תויגו עדיין שייכים לאדם חולה).

למידה מונחית לעומת למידה בלתי מונחית

איור 1: נתונים מתויגים לצורך למידה מונחית

איור 2: נתונים לא מתויגים לצורך למידה בלתי מונחית

נניח שזמינים נתונים רפואיים כפי שתוארו בהקדמה כשכל דגימה מתויגת עם אחת משלושה מצבים קליניים. איור 1 מראה הצגה של נתונים מתויגים כאלה במישור כשכל מצב קליני מיוצג על ידי צבע שונה. למידה מונחית תנסה ללמוד את ההתאמה של התיוגים לנתונים כדי לחזות את התיוג של נתונים חדשים ובלתי מתויגים שיגיעו עבור חולה חדש. למשל אם יתקבלו נתונים חדשים ולא מתויגים של חולה שיופיעו באזור הימני העליון של הדיאגרמה, ניתן אולי לשער שמתאים לו התיוג הכחול. שימוש ברשת עצבית מלאכותית היא אחת מהטכניקות הרבות המקובלות לביצוע למידה מונחית שכזאת.

פעמים רבות הנתונים הזמינים ללימוד אינם כוללים תיוגים. בדוגמה הרפואית שלמעלה למשל ייתכן שאי אפשר עדיין לגבש דעה לגבי המצב הקליני, או שאין בנמצא את המומחים הדרושים לשם כך, או שהנתונים רבים מדי, או שפשוט הנתונים הגיעו ממקור שלא כלל את התיוגים. איור 2 מראה הצגה של נתונים לא מתויגים כאלה במישור. למרות שחסרים התיוגים, עדיין ניתן ללמוד די הרבה מנתונים כאלה. למשל, גם ללא התיוגים, ניתן לראות שהנתונים מקובצים בשלושה מקבצים עיקריים. אפשר כך לחלק את הדגימות (או את החולים בדוגמה שלנו) לשלוש קטגוריות (חסרות שם). ניתן כך לשייך גם כל דגימה חדשה לאחת מהקטגוריות הללו. ייתכן שבהמשך נגלה מה הטיפול המתאים לכל קטגוריה ומן סתם ניתן להן שמות. אפשר גם ללמוד תכונות של קטגוריות, למשל מעברים צפויים של אינדיבידואלים בין קטגוריות. חלוקת נתונים כזאת למקבצים דומים היא התחום של ניתוח אשכולות^[2] - שיטה נפוצה בלמידה בלתי מונחית.

לימוד בלתי מונחה יכול גם לזהות אנומליות בנתונים - כלומר דגימות חריגות שאינן תואמות את הדפוס של שאר התצפיות. למשל באיור 2 ניתן לשער שהנקודה השמאלית תחתונה הקיצונית היא חריגה ורחוקה מכל קטגוריה. בעולם הרפואי דגימה שכזאת יכולה להוות אות אזהרה שיוביל לבדיקות מעמיקות יותר של הנבדק. דוגמה נפוצה נוספת לזיהוי אנומליות בנתונים לא מתויגים היא זיהוי של התקפות סייבר. כאן, הדגימות כוללות תכונות שנמדדו עבור תעבורות רשת. דגימות אלה נלקחות בזמן אמת ולא תמיד ניתן להשיג תיוג מיידי לגבי הסכנה שבהם. זיהוי של דגימה חדשה כחריגה הוא אפשרי כאמור אפילו ללא תיוג שכזה ויכול להוביל לשליחת אות אזהרה או אף נקיטת צעדי הגנה באופן אוטומטי. קיימות שיטות רבות לזיהוי אנומליות בנתונים בלתי מתויגים^[3] - כמו למשל זיהוי חריגוּת סטטיסטית, או מרחק קיצוני ממקבץ שזוהה קודם בשיטות של ניתוח אשכולות שהוזכרה מעלה.

טכניקה נוספת המשמשת לימוד בלתי מונחה היא ניתוח גורמים ראשיים^[4]. כאן הנתונים מועברים למערכת קואורדינטות חדשה שבה הקואורדינטות החדשות מסודרות לפי שונות הולכת וקטנה. השימוש הנפוץ בשיטה הוא לצורך מציאת ייצוג יותר קומפקטי ומייצג של הנתונים על ידי שימוש במספר קטן יותר של קואורדינטות שעדיין כוללות את רוב השונות הנמצאת בנתונים.

שיטות נוספות המשמשות בלמידה בלתי מונחית מופיעות להלן.

טכניקות ללמידה בלתי מונחית

קישורים חיצוניים

שי שלו שוורץ ושי בן דוד, Understanding Machine Learning: From Theory to Algorithms, Cambridge University Press, 2014
קורס בלמידת מכונה מאוניברסיטת בן-גוריון שבנגב.
קורס בלמידת מכונה מאוניברסיטת Caltech (אנגלית).

הערות שוליים

↑ Learning From Data Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin, ספר וצילומי הרצאות בלמידה חישובית שניתנו במכון הטכנולוגי של קליפורניה Caltech
↑ אלגוריתם k-מרכזים וניתוח אשכולות היררכי‎ באתר של אנדרו מור הכולל את הרצאותיו בנושאי למידה חישובית באוניברסיטת קרנגי מלון
↑ סקר שיטות לזיהוי אנומליות ויקטוריה הוג' וג'ים אוסטין, אוניברסיטת יורק
↑ ניתוח מרכיבים ראשיים (PCA) – למה, איך ואיך לא - יוסי לוי, נסיכת המדעים

ערך זה הוא קצרמר בנושא מדעי המחשב. אתם מוזמנים לתרום למכלול ולהרחיב אותו.

הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

שגיאות פרמטריות בתבנית:מיון ויקיפדיה
שימוש בפרמטרים מיושנים [ דרגה ] למידה בלתי מונחית23327137

[1] Learning From Data Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin, ספר וצילומי הרצאות בלמידה חישובית שניתנו במכון הטכנולוגי של קליפורניה Caltech

[2] אלגוריתם k-מרכזים וניתוח אשכולות היררכי‎ באתר של אנדרו מור הכולל את הרצאותיו בנושאי למידה חישובית באוניברסיטת קרנגי מלון

[3] סקר שיטות לזיהוי אנומליות ויקטוריה הוג' וג'ים אוסטין, אוניברסיטת יורק

[4] ניתוח מרכיבים ראשיים (PCA) – למה, איך ואיך לא - יוסי לוי, נסיכת המדעים

[1]

[2]

[3]

[4]

תחומים במדעי המחשב
יסודות מתמטים	לוגיקה מתמטית • תורת הקבוצות • תורת המספרים • תורת הגרפים • תורת הטיפוסים • תורת הקטגוריות • אנליזה נומרית • תורת האינפורמציה
תורת החישוביות	תורת האוטומטים • תורת הרקורסיה • תורת הסיבוכיות • מחשוב קוונטי
אלגוריתמים ומבנה נתונים	אנליזה של אלגוריתמים • גאומטריה חישובית
שפות תכנות ומהדרים	מפרש • פרדיגמת תכנות (תכנות פרוצדורלי • תכנות מונחה עצמים • תכנות פונקציונלי • תכנות לוגי)
חישוב מבוזר ועיבוד מקבילי	עיבוד מקבילי • מחשוב סריגי • בקרת מקביליות
הנדסת תוכנה	ניתוח מערכות מידע • עיצוב תוכנה • תכנות מחשבים • שיטות פורמליות • בדיקות תוכנה • מתודולוגיית פיתוח תוכנה
תקשורת	ניתוב • טופולוגיית רשת • קריפטוגרפיה
מסד נתונים	מסד נתונים יחסי • SQL • תנועה • אינדקסים • כריית מידע • CAP theorem
בינה מלאכותית	חשיבה אוטומטית • בלשנות חישובית • ראייה ממוחשבת • עיבוד שפה טבעית • בינה חישובית • מערכת מומחה • למידה חישובית • רובוטיקה
גרפיקה	הדמיה ממוחשבת • הנפשה ממוחשבת • עיבוד תמונה
שפות פורמליות	שפה רגולרית • שפה חסרת הקשר • שפה תלוית הקשר • ההיררכיה של חומסקי
שימושים במדע	ביואינפורמטיקה • מדעים קוגניטיביים • כימיה חישובית • פיזיקה חישובית • אנליזה נומרית