מאבק בדואר זבל אלקטרוני

מתוך המכלול, האנציקלופדיה היהודית
(הופנה מהדף אנטי-ספאם)
קפיצה לניווט קפיצה לחיפוש

משתמשי קצה ומפעילי מערכות של שרתי דואר אלקטרוני משתמשים בשיטות שונות ללחימה בדואר זבל אלקטרוני - דואר אלקטרוני שנשלח על ידי מפרסמים בתפוצה גדולה, ולרוב אין לו ערך עבור הנמען. אף אחת מן השיטות אינה מהווה פתרון כולל וחד-משמעי לבעיית דואר הזבל, ולכל שיטה יתרונות וחסרונות.

בשיטות השונות יש כאלה הדורשות התערבות של משתמש הקצה, וכאלה הפועלות באופן אוטומטי.

הטיפול בהודעות דואר זבל מבזבז זמן עבודה רב בארגונים, וכן אצל משתמשים ביתיים. ככל שהולך וגדל מספר ההודעות מסוג זה, קטנה גם הנכונות לפתוח הודעות דואר אלקטרוני לגיטימיות מאנשים לא מוכרים, מה שמקטין זמינות מידע ופוטנציאל עסקי. מצב זה מחייב סינון אוטומטי של הודעות דואר זבל באמצעות כלי תוכנה, בנוסף לאמצעים אחרים ללחימה בדואר זבל אלקטרוני. השולחים הם בדרך כלל אנשים פרטיים (במקרים רבים, סוכני הפצה של מוצרים) ולא חברות, עובדה זו מפחיתה את היכולת להקטין את כמות דואר הזבל באמצעות תביעות משפטיות.

לחימה בדואר זבל אלקטרוני כוללת שיטות הגנתיות, שבהן המשתמש מנסה לצמצם את הנזק מדואר זבל, ושיטות התקפיות, שמטרתן פגיעה בשולח של דואר זבל.

שיטות הדורשות התערבות של משתמש הקצה

ישנן מספר שיטות שדורשות התערבות מצד משתמש הקצה.

הפעלה ושימוש בשיטות אוטומטיות

לספקי אינטרנט ותוכנות דואר אלקטרוני רבות יש שיטות אוטומטיות למניעת דואר זבל, אך על משתמש הקצה להפעיל אותן ולדעת להשתמש בהן. כיוון שברוב השיטות האוטומטיות יש אחוז מסוים של זיהויים שגויים (דואר אלקטרוני לגיטימי שמזוהה בטעות כדואר זבל) הן לא מופעלות כברירת המחדל במערכת או שהן מופעלות אבל לא בצורה היעילה ביותר שלהן. על משתמש הקצה להפעיל אותן ולדעת להשתמש בהן בצורה שלא תחסום קבלת דואר אלקטרוני לגיטימי.

רוב השיטות האוטומטיות שהמשתמש מפעיל יסמנו דואר זבל בצורה מסוימת, אם באמצעות הוספת המילה spam בתחילת כותרת ההודעה, או באמצעות העברה של הודעות הזבל לתיקיה מיוחדת. כך יכול המשתמש לעבור מפעם לפעם על תיקיית דואר הזבל, לזהות מכתבים שהועברו אליה בטעות, לאשר את כשרות המוען, ולאחר מכן למחוק את תוכן התיקייה.

תוכנות אנטי ספאם

אנטי-ספאם הוא תוכנה שתפקידה זיהוי וסינון דואר זבל.

בדואר אלקטרוני, כמו בשאר האינטרנט, קיימת בעיה של סינון המידע, והאנטי-ספאם נועד למנוע בעיה זו. הגידול בכמויות הדואר האלקטרוני יוצר בעיות שונות, כגון אחסון וניהול המידע, בעיות אבטחת מידע ותופעת דואר הזבל.

רקע

בסיס תאורטי חשוב לסינון הדואר הוא תאוריית גילוי האותות. תאוריה זו התחילה את דרכה בניסיון למענה על שאלות הקשורות במערכות גילוי עצמים באמצעות רדאר, המופעלות על ידי מפעיל אנושי. המפעיל האנושי יושב מול מסך במשך שעות ארוכות. כאשר הוא מזהה מטוס אויב עליו ללחוץ על מתג אזעקה. על המסך עשויים להופיע עצמים אחרים, שאינם מטוסים, עצמים אלה הם רעש (Noise). על המפעיל לסנן ולסווג את האותות לכאלה שהם אובייקט אמיתי (מטוס אויב) וכאלה שהם רעש. היות שקשה לשמור על רמת ריכוז גבוהה לאורך זמן, מתרחשות גם טעויות. טבלה מספר 1 מתארת את המצבים האפשריים מבחינת האירוע האמיתי ותגובת המפעיל.

טבלה 1: מצבים אפשריים בגילוי אותות
המצב / הזיהוי אות רעש
אות פגיעה (Hit) החטאה (Miss)
רעש אזעקת שווא (False Alarm) דחייה מוצדקת (Correct Rejection)

המצבים של פגיעה ודחייה מוצדקת הם מצבים רצויים. המצבים של אזעקת שווא והחטאה הם מצבים בלתי רצויים (אם כי משקלה של טעות החטאה עשוי להיות שונה ממשקל טעות של אזעקת שווא).

מחקרים שונים נערכו במטרה לפתח שיטות להגדלת הסתברותם של המצבים הרצויים והקטנת הסתברותן של טעויות. המודל עצמו הוכלל לנושאים ומצבים אחרים בהם נדרשת קבלת החלטה בתנאי אי-ודאות. המאמר של D. Heeger[1] מהווה דוגמה לשימוש בתיאורית גילוי האותות בתחום רפואי.

מוצר תוכנה ל Anti-Spam צריך לקבל החלטות במודל זהה למתואר בטבלה 1. טבלה 2 מתארת את קבלת ההחלטות על ידי תוכנה כזו:

טבלה 2: מצבים אפשריים בזיהוי הודעות דואר זבל
המצב / הזיהוי זוהה כדואר זבל זוהה כדואר רצוי
התקבל דואר זבל פגיעה (Hit) החטאה (Miss)
התקבל דואר רצוי אזעקת שווא (False Alarm) דחייה מוצדקת (Correct Rejection)

בהקשר של דוא"ל זבל משתמשים לפעמים במונחים שונים באותו מודל. כך למשל במקום המונח: False Alarm משתמשים במונח False Positive. גם במקרה זה אין ודאות מוחלטת ביחס למהות הודעת דואר אלקטרוני ולכן הזיהוי הוא פונקציה סטטיסטית. התוכנות מפעילות שיטות שונות על מנת להגדיל את ההסתברות לזיהוי נכון של הודעת דואר אלקטרוני.

בניגוד למצב המקורי בתיאורית גילוי האותות, בזיהוי דואר כדואר זבל אין קריטריון חד-משמעי החל על כל הנמענים. כך למשל הודעה ביחס לאפשרות לקבל שיעורי ריבית נמוכים למשכנתא בארצות הברית עשויה להיות דואר זבל עבור נמען במדינה אחרת, ועשויה להיות דואר רצוי עבור אזרח אמריקאי, המעוניין להקטין את הריבית על המשכנתא שלו. היעדר קריטריון חד-משמעי כזה מקשה על הסינון.

הבדל משמעותי נוסף בין גילוי האותות הקלאסי לבין זיהוי הודעות דואר זבל הוא בהיבט של סטטי לעומת דינמי. זיהוי אותות רדאר הוא מטלה סטטית במובן זה שהעצמים אותם יש לזהות אינם משתנים. הודעות דואר זבל הן דינמיות: התכנים משתנים, המבנה משתנה, כתובת השולח האמיתית משתנה, כתובת שולח פיקטיבית המופיעה במחשב הנמען משתנה וכדומה. הדינמיות יוצרת מימד נוסף של קושי בזיהוי נכון של הודעות.

מקובל לחשוב כי בהקשר של דוא"ל, הנזק של אזעקת שווא (False Alarm) גדול מהנזק של החטאה (Miss). משמעות החטאה היא שמקבל הדואר צריך לטפל בדואר לא רצוי. לעומת זאת במקרה של אזעקת שווא הודעה בעלת חשיבות עסקית עשויה להישלח לתיקיית דואר זבל ולהביא לנזקים, כגון: אובדן לקוחות, אובדן עסקאות, או מימוש מאוחר של תהליכים עסקיים. ההסתברות שמקבל ההודעה ידלה הודעות כאלה מתוך "ערימת" הזבל הענקית היא קטנה: בדרך כלל ירוקן את תיקיית הזבל בלי לבדוק את תוכן ההודעות, משום שבתהליך הסינון נשלחות הודעות המזוהות כדואר זבל לתיקיות נפרדות על מנת לחסוך מהמשתמש את הטיפול הפרטני בהן.

שיטות לסינון דואר זבל

קיימים הבדלים טכניים בין סינון בארגון, סינון על ידי משתמש ביתי וסינון על ידי ספק שירותי אינטרנט (ISP), אבל בכל המקרים מדובר באותן שיטות עקרוניות.

שיטות שונות נבדלות זו מזו ברמת הדיוק באבחון פגיעות (Hits) ובמניעת אזעקות שווא (False Alarms). קל יחסית להימנע מאזעקת שווא (זיהוי הודעת דואר לגיטימית כ"זבל") מאשר לזהות דואר "זבל" כדואר לא רצוי. מספר שיטות עשויות להשתלב ביחד באותו פתרון ועל ידי כך להגדיל את ההסתברות של אירועים רצויים.

השיטות הראשונות לסינון התבססו על הגדרות ידניות. המשתמש הגדיר מאפיינים של הודעת זבל (למשל: הודעה משולח מסוים). הודעות נכנסות נבחנו מול הגדרות אלה. בגלל הדינמיות וריבוי סוגי הודעות דואר "זבל" התווספו שיטות סינון המבוססות על תפיסה של רשת עצבית מלאכותית. שיטות סינון אלה הן שיטות הלומדות בעצמן ומשכללות בהדרגה את הכללים להגדלת הסתברות פגיעה (Hit) ללא הכרח בהגדרות ידניות.

להלן פירוט של מספר שיטות לסינון:

סינון על פי כתובת השולח

מאפיין בסיסי בזיהוי הודעת דואר זבל הוא כתובת השולח. אחת השיטות היא יצירת רשימה "לבנה" (White List), המכילה כתובות נמענים מהם מעוניינים לקבל דואר ורשימה "שחורה" (Black List) של נמענים, שכל דואר המגיע מהם הוא דואר זבל.

הרשימה ה"לבנה", קלה יחסית לניהול, בדרך כלל מדובר בנמענים מוכרים למקבל הדואר או נמענים העובדים בחברות המוכרות למקבל הדואר. קלט ראשוני לרשימה הוא ספר הכתובות שמחזיק המשתמש. ניתן בקלות לצרף לרשימה נמענים איתם יש קשר רציף באמצעות דואר אלקטרוני.

במשך זמן קצר ובהשקעה קטנה של מאמץ ניתן להגיע לרשימה "לבנה" שתגרום לכך שמרבית ההודעות הרצויות לא יזוהו כדואר "זבל".

רשימה "שחורה" מבוססת על ההנחה שאותו שולח מאותה כתובת דוא"ל ימשיך לשלוח הודעות לא רצויות. התבססות על רשימה "שחורה" עשויה ליצור מספר בעיות:

  • מספר הנכללים בה עשוי להיות גדול מאוד ולגדול כל הזמן. המשמעות היא החטאה (Miss) של מספר גדול של הודעות דואר "זבל" שיאובחנו כהודעות רצויות, משום שהגיעו ממשתמשים שטרם נכללו ברשימה השחורה. משמעות נוספת היא תקורה הפוגעת בביצועים כתוצאה מגודל הרשימה.
  • שולחי הודעות דואר זבל מחליפים את כתובתם ושולחים הודעות מכתובת דוא"ל חדשה. המשמעות היא שגם במקרה שאותר שולח ונכלל ברשימה ה"שחורה" הוא יוכל להמשיך לשלוח דואר זבל. היות שמדובר בעיקר באנשים פרטיים ולא בארגונים, קל להם להחליף כתובת דוא"ל.

לסיכום שיטה לא יעילה ורבת תקורה.

סינון על פי מספר הנמענים

שיטה זו מתבססת על ההנחה הנכונה בפני עצמה, ששולחי דואר "זבל" עשויים במקרים רבים לשלוח את אותה הודעה למספר נמענים רב, מכיוון שהם מעוניינים להפיק מכך תועלת עסקית.

הבעייתיות של שיטה זו היא המספר הגדול יחסית של אזעקות שווא, כלומר: הודעות רצויות הנשלחות למספר גדול של נמענים מאובחנות בטעות כדואר "זבל". כך למשל: מחקרים הנשלחים על ידי חברות אנליסטים לרשימת תפוצה, הודעות ספקים ויצרנים, עיתונים אינטרנטיים, עשויים להיות מסווגים כדואר זבל.

סינון על פי מילות מפתח

בשיטה זו מגדירים הודעה כדואר "זבל" אם מילים מסוימות מופיעות בה. ניתן להגדיר האם אותן מילים חייבות להופיע בנושא ההודעה או בגוף ההודעה. שיטה זו הייתה נפוצה בתוכנות מדור ראשון לסינון דואר זבל. לשיטה זו מספר חסרונות:

  1. שולחי הודעות דואר הזבל מתגוננים באמצעות עיוות מכוון של האותיות או שינוי מילים באמצעות הכנסת תווים אחרים המפרידים בין אותיות מילת המפתח. כך למשל המילה Viagra, עשויה להיכתב כ V $ I $ A $ G $ R $ A. כתוצאה מכך בחלק מהמקרים יש החטאות (Misses).
  2. במקרה של סריקת הנושא בלבד, קל לשולח להחליף את הנושא, כאשר גוף ההודעה מכיל את הנושא האמיתי. התוצאה היא החטאה (Miss) של דואר זבל.
  3. כתוצאה מהדינמיות, מתווספות הודעת דואר "זבל" חדשות עם מילות מפתח חדשות. הודעות אלה מזוהות כדואר לגיטימי.

לסיכום, שיטה המחייבת מאמץ ידני מתמשך להגדרה, עם כמות החטאות (Misses) שעשויה להיות גבוהה.

סינון על פי כללים (Rules)

בשיטה זו נבנים כללים על בסיס ניתוח תכנים בהודעה. למילות המפתח מתוספות התניות ופעילויות. הכללים מרכיבים תסריטים (Scripts) פשוטים המתוכנתים על ידי המשתמש. גם שיטה זו מתקשה להתמודד עם הדינמיות של הודעות ה"זבל" ולאתר אותן. כמו כן היא דורשת תכנות התסריטים, מה שלא כל משתמש ביתי מסוגל לבצע באופן אפקטיבי.

סינון באמצעות שיתוף גולשים

שיטה המבוססת על התראות על מפיצי דואר "זבל" למאגר מרכזי באינטרנט. מוצר תוכנה הניגש למאגר בודק האם השולח נמצא במאגר. שיטה זו היא בעצם שיטה מתוחכמת יותר לבניית רשימה שחורה (Black List), המאפשרת איתור מספר גדול יותר של מפיצי "זבל". כשיטה המבוססת על רשימה שחורה, יש לה את אותו חיסרון של קושי באיתור מפיצי דואר ה"זבל", בגלל יכולתם לשנות בקלות כתובות דואר אלקטרוני. מחירו של התחכום הוא בתקורה: גם במשלוח התראות למאגר המרכזי וגם בגישה אליו בזמן ניתוח ההודעות.

סינון בעזרת השיטה הביסיאנית (Baysian)

שיטה זו מנסה לנתח את תוכן ומבנה ההודעה בהנחה שהודעות אמיתיות והודעות דואר זבל שונות בהיבט זה. השיטה מבוססת על דירוג ההודעה כדואר זבל או דואר לגיטימי על פי מאפיינים. מאפיינים עשויים להיות מילים מסוימות, אך גם דברים אחרים כמו העיצוב הגרפי של ההודעה.

כל הודעה מנותחת לגבי כל אחד מהמאפיינים ומקבלת ציון. הציון מבטא הסתברות להיותה זבל על פי אותו מאפיין. הציונים בכל המאפיינים מסוכמים לציון כולל, המבטא הסתברות לכך שההודעה היא הודעת דואר זבל. במסגרת השיטה הביסיאנית קיימות 2 תפיסות:

  • הגדרה קשיחה של המאפיינים על בסיס מדגם גדול של הודעות זבל והודעות לגיטימיות (Scoring Based Content Filters). בשיטה זו שינוי מאפיינים או משקלם דורש התערבות ידנית.
  • התאמה אוטומטית של המאפיינים במהלך החלטות המשתמש האם הודעה מסוימת היא דואר "זבל" או הודעה לגיטימית. (Bayesian Spam Filters). בשיטה זו המערכת מעדכנת את המסננים על פי ההתנהגות בפועל של המשתמש.

השיטה השנייה היא שיפור של השיטה הראשונה. היא גמישה יותר ומתחשבת בהבדלים בין משתמשים שונים בהקשר של מהו עבורם דואר זבל.

הנחת העבודה בבסיס שיטה זו היא ששולח דואר הזבל לא יתאמץ על מנת להתאים את מאפייני הודעותיו למאפיינים של הודעות לגיטימיות. אם יעשה זאת קל לעקוף את מסנני הדואר.

לגבי הודעות דיוג (המהוות דואר זבל) הנחה זו מוטעית לחלוטין: שולחי הודעות דיוג עושים מאמצים להתאים את עצמם למאפייני ההודעה המקורית של גופים פיננסיים אליהם הם מתחזים. היבט בעייתי נוסף בשיטה זו, כמו בשיטות אחרות המבוססות במידה רבה על ניתוח תוכן, הוא תמיכה בריבוי-לשונות (Multi-Language). הודעות דואר זבל, עשויות להיכתב במגוון רחב של שפות. קיים קושי טכנולוגי בניתוח תוכן ההודעה במספר שפות.

לסיכום שיטה העשויה לתת מענה סביר להיבטים הדינמיים, ולהגיע לאחר פרק זמן לא קצר, להסתברות גבוהה יחסית של פגיעות ודחיות מוצדקות. זאת בתנאי ששולחי דואר הזבל לא ינסו לאמץ דפוסי מבנה ותוכן של הודעות לגיטימיות. במקרים שיעשו זאת, השיטה עלולה להיתקל בקשיים.

סינון בעזרת זיהוי תבניות

בשיטה זו מזהים תבניות (Patterns) של הודעות דואר זבל. הזיהוי אינו מבוסס על תכנים בטקסט ההודעה. זיהוי הדפוסים נעשה באמצעות שרת ייעודי, שבתוכו בסיס נתונים עם דפוסים. לצורך מתן מענה הולם על ההיבט הדינמי, מאגר הדפוסים מתעדכן. במקרה של משלוח מסיבי של דואר זבל חדש, התוכנה מנסה לקבל אותו תוך זמן קצר, ולנתח את תבניותיו. תבניות חדשות עוברות עדכון בבסיס הנתונים. שרתי דואר של ספקי שירותי אינטרנט (ISPs), מקושרים לשרת לצורך שימוש ביכולות הניתוח שלו.

שיטה זו מרחיבה רעיון ששימש בשיטה של שיתוף גולשים למרכיבים נוספים על זהות השולח. גם שיטה זו אינה מתמודדת עם סוגי דואר שהם דואר לגיטימי עבור משתמש אחד, ודואר "זבל" עבור משתמש אחר.

איתור על פי כתובות URL

שיטה זו מבוססת על כך שחלק משולחי דואר זבל מצרפים הצבעה לדף באינטרנט, אליו הם מעוניינים שמקבל ההודעה יכנס. במהלך בחינת ההודעה, מאתרים URLs ומנתחים מי הם. גם בהנחה שניתוח כזה נעשה באופן מושלם, השיטה אינה מונעת פגיעות על ידי דואר זבל שאינו מכיל הצבעות ל-URLs.

התגוננות מפני איסוף כתובות דואר אלקטרוני

רוב האנשים מעוניינים לקבל פניות, ולשם כך מפרסמים את כתובת הדואר האלקטרוני שלהם. שולחי דואר זבל סורקים אתרי אינטרנט, פורומים, ומקומות אחרים שבהם מופיעות כתובות דואר אלקטרוני, לשם איסוף כתובות אלה כיעד למשלוח דואר זבל. הכתובות משמשות לבניית מאגר כתובות ושליחת דואר זבל למאגר הזה. דרך התמודדות אפשרית היא שיקול דעת לגבי היכן מפרסמים את כתובת הדואר האלקטרוני, והאם זה הכרחי.

דרך נוספת לאיסוף כתובות היא באמצעות מתקפת מילון (dictionary attack). במתקפה הזאת הזבלן לוקח דומיינים פופולריים, לדוגמה - hotmail.com, ומנסה לשלוח דואר זבל לשמות אפשריים בדומיין הזה, לדוגמה - [email protected], [email protected] וכו'. לעיתים יש שימוש במאגר מידע אחר (לדוגמה, שמות שמופיעים בפייסבוק) על מנת להפיק את רשימת השמות הראשונית, או למקד את השליחה לקהל יעד אשר מתעניין בנושאים הקרובים לנושא של דואר הזבל. בדרך כלל הדומיינים של ספקי שירותי אינטרנט או של שירותי הדואר החינמי הם יעד למתקפות כאלה.

הסוואת כתובת הדואר האלקטרוני

ניתן למנוע מכתובת הדואר האלקטרוני להגיע לרשימה של זבלן על ידי הסוואה של הכתובת בצורה כזו שלא תתגלה בסריקה אוטומטית פשוטה של אתר האינטרנט שבו היא מופיעה.

שיטה אחת היא לכתוב את הכתובת בצורה שונה מהכתובת האמיתית, כך שאדם יזהה את השינוי וידע להסיק מכך מה הכתובת האמיתית - אבל בוט לא ידע להבחין בכך. לדוגמה, ניתן להסוות את הכתובת [email protected] כ- joe AT example DOT com. שיטה נוספת היא לשים תמונה שמופיעה בה כתובת הדואר האלקטרוני. בכל מקרה יש סיכון מסוים שמשתמש שירצה לשלוח דואר אלקטרוני לגיטימי לכתובת לא יבחין בשינוי, ולא יצליח לשלוח את הדואר האלקטרוני לכתובת הנכונה.

כתובת דואר אלקטרוני לשימוש חד-פעמי

אתרים מסוימים דורשים ממשתמשים לכתוב את כתובת הדואר האלקטרוני שלהם כדי לקבל גישה לאתר. אי אפשר לדעת אם הכתובת תגיע לזבלן דואר או שהאתר עצמו ישלח דואר זבל, לכן ישנם מספר שירותים שנותנים כתובת דואר אלקטרוני לשימוש חד-פעמי. בצורה זו ניתן לקבל את האימייל הראשוני מהאתר, שמכיל בדרך כלל את הסיסמה לשימוש באתר, ואז לא צריך להשתמש בכתובת הדואר האלקטרוני הזו שוב. הבעיה בשיטה הזו שברגע שאתרים יזהו שכתובת מסוימת משמשת לכתובות חד-פעמיות, הם עלולים לא לקבל כתובות חד-פעמיות כאלה.

HTML בהודעות דואר אלקטרוני

רוב תוכנות הדואר האלקטרוני תומכות בקבלת הודעות שמכילות קוד HTML. הודעות כאלה עלולות להכיל תמונות שיכולות לאשר לשולח דואר הזבל שהמשתמש אכן צפה בתמונה וכך לדעת בוודאות שכתובת הדואר האלקטרוני היא אמיתית ופעילה. בתוכנות דואר אלקטרוני רבות קיימת האפשרות לא להראות תמונות באופן אוטומטי, וכך אם המשתמש זיהה שהדואר הוא דואר זבל הוא יכול למחוק אותו לפני שהתמונה הוצגה. לאפשרות הזו יש יתרונות רבים אחרים, בעיקר בכל הקשור למניעת וירוסים ורוגלה.

הימנעות ממענה לדואר זבל

זבלני דואר אלקטרוני עלולים להתייחס לכל תגובה שהיא להודעת דואר אלקטרוני כאישור שאכן הכתובת פעילה, ואז ישלחו יותר דואר זבל לכתובת. זבלני הדואר האלקטרוני לרוב יתעלמו גם מבקשות להסרה מרשימת התפוצה שלהם, ולכן מומלץ לא לענות בשום מקרה לדואר זבל. בהודעות דואר זבל יש לעיתים גם קישור ל"הסרה מרשימת התפוצה". גם לחיצה על קישור זה עלולה לשמש אישור לזבלן שהכתובת היא אמיתית, וכך כמות דואר הזבל עלולה לגדול.

במקרים רבים כתובת השולח בדואר זבל מזויפת. במקרה כזה מענה לדואר הזבל לא יגיע כלל לזבלן במקרה הטוב, ובמקרה הרע יגיע לכתובת דואר אלקטרוני ששייכת למשתמש תמים.

מענה לדואר זבל - תקיפת השולח

יש הטוענים כי לעיתים כדאי לענות לדואר זבל. שיטה זו נקראת "לזבל את הזבלן" (spamming the spammer). להלן מספר שיטות כאלה:

  • מענה ישיר לכתובת הדואר האלקטרוני של הזבלן. ברוב המקרים שיטה זו לא תעבוד מכיוון שכתובת הדואר האלקטרונית האמיתית של הזבלן לא תופיע. עם זאת, במקרים שבהם מופיעה כתובת אמיתית, כגון ב"עוקץ הניגרי", הזבלן כן מצפה לקבל תגובות ממשתמשים תמימים שנופלים בפח העוקץ, ואז ניתן באמת "לזבל את הזבלן".
  • מתקפה ישירה על מחשבים ששולחים דואר זבל. גם אם כתובת הדואר האלקטרוני עשויה להיות מזויפת, ניתן בשיטות מסוימות לגלות את כתובת ה-IP של המחשב ממנו הגיע דואר הזבל, ולכן ניתן לבצע סינון של הודעות שהגיעו מכתובת זו, ולאתר את השולח. למרות זאת, ברוב המקרים המחשבים ששולחים דואר זבל הם מחשבים ש"נחטפו" על ידי הזבלן ולמעשה שייכים למשתמש תמים או לארגון שלא יודע שדואר זבל נשלח ממחשבו.

חקיקה האוסרת דואר זבל

בארצות הברית ומדינות האיחוד האירופי החוק קובע עונשים על משלוח דואר זבל. חקיקה זו מאפשרת פגיעה בשולחי דואר זבל ובמפרסמים המשתמשים בשירותיהם (ראו דוגמה), ותורמת לצמצום דואר הזבל הנשלח.

בישראל קיים סעיף בחוק התקשורת (בזק ושידורים)[2], האוסר משלוח דואר זבל וכן קובע זכות פיצוי למי שקיבל דואר זבל שלא כדין.

דיווח לספק שירותי אינטרנט על שולח של דואר זבל

באמצעות איתור ספק שירותי האינטרנט של הזבלן ודיווח על שליחת דואר זבל אפשר לגרום לכך שהספק ינתק את הזבלן משירותיו. כדי לבצע זאת צריך למצוא את כתובת ה-IP ממנה הגיע דואר הזבל. היא תמיד תופיע בהודעת הדואר האלקטרוני. מכתובת ה-IP ניתן למצוא, באמצעות שירותים מקוונים, את הפרטים של ספק שירותי האינטרנט שכתובת ה-IP היא בשליטתו. ניתן לשלוח הודעה לאותו ספק אינטרנט ולדווח לו על דואר הזבל. ישנן שתי בעיות עיקריות בשיטה זו: ספק האינטרנט יכול להתעלם מתלונות כאלה מכיוון ששולח דואר הזבל מספק לו הכנסה, שאותה אין הוא רוצה לאבד. אם ספק האינטרנט לא מתעלם מהתלונות, ישנה הבעיה שכל התהליך דורש התערבות מצד ספק האינטרנט וכוח אדם לבדיקה של התלונות, כדי לוודא שאכן ההודעה היא דואר זבל. הזבלן יכול לטעון שההודעה היא לגיטימית, ושהמשתמש ביקש לקבל דיוורים ממנו. במקרים כאלה לא תמיד קל לספק האינטרנט לקבוע כי אכן מדובר בדואר זבל. רק אם התקבלה כמות גדולה של תלונות על שולח דואר הזבל, רק אז יכול ספק האינטרנט לחסום את הזבלן מלהשתמש בשירותיו.

שיטות הפועלות באופן אוטומטי

ישנן מספר שיטות שמטרתן למנוע הגעת דואר זבל למשתמש או לסמן אותו ככזה באופן אוטומטי. שיטות אלה ממומשות באמצעות תוכנות אנטי ספאם שמותקנות בשרת הדואר האלקטרוני, כהרחבה לתוכנת הדואר האלקטרוני של המשתמש או כתוכנה נפרדת על מחשב המשתמש. חלק מהשיטות עובדות באמצעות חסימה של הודעות דואר אלקטרוני ממחשבים או אתרים שידוע שהם שולחים דואר זבל. שיטות אחרות עובדות באמצעות סריקה של תוכן הודעה הדואר וזיהוי הודעות שנראות כדואר זבל.

DNSBL

אלו רשימות, בדרך כלל של כתובות IP, שידוע ששולחות דואר זבל או שסביר שיישלח מהם דואר זבל. רשימות אלה מפורסמות בדרך שתוכנות יכולות לקרוא אותן באופן אוטומטי וכך לחסום הודעות דואר אלקטרוני שמגיעות מהכתובות. יש עשרות רשימות כאלה ולכל אחת מאפיינים משלה ושיטה משלה לאסוף את הכתובות. ישנן גם רשימות שמפרסמות כתובות 'לבנות' - כתובת שידוע שדואר אלקטרוני שמגיע מהן הוא אינו דואר זבל.

ישנה בעייתיות בשימוש עם רשימות כאלה, בגלל ריבוי הרשימות, כל רשימה לא לוקחת אחריות על איכות הכתובות המופיעות ברשימה. ייתכן כי תופיע כתובת ברשימה כזו ששימשה בעבר למשלוח דואר זבל וכיום משתמשים בה באופן לגיטימי. כמו כן, היות שאין גוף שאחראי על הכתובות המופיעות ברשימה, יש רשימות שמוסיפות באופן חופשי כתובות לרשימה בלי לבדוק אם אכן מדובר בכתובת ששייכת לזבלן דואר אלקטרוני. כך, אדם שרוצה להתנכל לשולח דואר אלקטרוני לגיטימי יכול להוסיף אותו לרשימה כזו.

בגלל הבעייתיות הנ"ל, האחריות על שימוש ברשימות נופלת על מנהל המערכת, שצריך לבחור את הרשימות האחראיות יותר. בהרבה ארגונים וחברות, מנהלי מערכות חושבים שככל שישתמשו ביותר רשימות כאלה, חסימת דואר הזבל תהיה יותר יעילה, אך הם אינם לוקחים בחשבון את הזיהויים השגויים.

חיוב שימוש טכני נכון בפרוטוקול ה-SMTP

זבלני דואר רבים משתמשים בתוכנות שכתובות בצורה שלא תואמת באופן מלא לפרוטוקול ה-SMTP שמשמש לשליחת דואר אלקטרוני. מצב זה נכון במיוחד אצל זבלני דואר שמשתמשים במחשבים חטופים או שמשתמשים בווירוסים שמותקנים אצל מחשבים של משתמשים תמימים ושולחים את דואר הזבל ממחשבם ללא ידעתם. במצבים כאלה, קשה יותר לכתוב תוכנה שתתאם באופן מלא לפרוטוקול ה-SMTP. שרתי דואר שמקבלים את ההודעה באמצעות SMTP יכולים לקבל גם הודעות שנשלחות בצורה לא תיקנית, אבל, כיום רוב שרתי הדואר כופים שימוש באופן הנכון של השליחה.

שיטות עתידיות לסינון דואר זבל

סעיף זה מתייחס לשיטות סינון העשויות להיות כרוכות בשינוי ארכיטקטורת הטיפול בהודעות דואר אלקטרוני. אין מדובר בשיטות מקובלות הממומשות בפועל אלא ברעיונות אפשריים לשיפורים עתידיים.

מיקום תוכנות הסינון

ברוב המקרים מתבצע היום סינון דואר הזבל בלקוח הדואר (Mail Client) כלומר: אמצעות תוכנת אנטי-ספאם במחשב מקבל ההודעה. המשמעות היא עומס על מקבל הדואר, העמסת שרת סוכן העברת דואר (Mail Transfer Agent) והעמסת רשת התקשורת. בתפיסה אחרת ניתן לבצע את הסינון בשרת דואר (Mail Server) ולחסוך תקורות אלה. סינון בשרתים עלול לא להיות מותאם להעדפות אישיות של מקבל הדואר או לדרוש מנגנון לריכוז העדפות המשתמשים, בשרת, עם התקורה הנגזרת מכך.

זיהוי השולח ( Sender Id)

הרעיון הוא לזהות באופן חד-ערכי את השולח באמצעות מנגנון אימות זהות, ברמת התוכנה השולחת את ההודעה, דהיינו סוכן העברת דואר (Mail Transfer Agent). המטרה העיקרית של מנגנונים אלה היא מניעת התחזות לשולח אחר (Spoofing). זיהוי השולח נעשה על פי קשר בין ה-Domain ב-TCP/IP ממנו נשלחה בפועל ההודעה לבין כתובת הדוא"ל של השולח. הקשיים העיקריים במימוש תפיסה זו:

  1. חוסר הסכמה ביחס לסטנדרט לזיהוי השולח. קיימות שתי גישות עיקריות לזיהוי השולח: Caller ID של חברת מיקרוסופט ו-Sender Policy Framework ‏(SPF) שמקורו בחברת AOL. ניסיון לגבש לגבש סטנדרט משותף בשם Sender Id, שנעשה על ידי ה-Internet Engineering Task Force באמצעות קבוצת עבודה שנקראה MARID נכשל. הסטנדרט חייב הרחבות לפרוטוקול SMTP. הניסיון נכשל בגלל חילוקי דעות בנושאים טכנולוגיים וויכוח על שימוש בפטנטים. קבוצת העבודה הפסיקה את עבודתה.
  2. קושי בשיוך כתובת ל-Domain, כאשר הדוא"ל נשלח מעמדת עבודה ציבורית. למשל משלוח דואר זבל מבית מלון, משדה תעופה או מבית קפה. שיטה זו עשויה לתת מענה לא מלא להתחזות לשולח אחר, אך אינה מונעת פגיעות על ידי שולחי דואר "זבל" שאינם מתחזים לאחרים, ולכן נותנת מענה חלקי בלבד.

מבנה הודעה מחייב

המודל המוצע מחייב אף הוא שינוי תפיסתי. הוא מגדיל את כמות העבודה הנדרשת מספקי שירותי האינטרנט. השיטה מרחיבה מנהג של שולחים שאינם "זבלנים" לאפשר לנמענים להסיר עצמם מרשימת תפוצה, אך הופכת אותו לסטנדרט עבודה מחייב. השיטה מבוססת על האלמנטים הבאים:

  1. כל מפיץ הודעות יצטרך לשמור על מבנה הודעה המאפשר לנמען 3 תשובות להודעה: הסכמה לקבל את ההודעה, סירוב לקבל את הודעות מאותו נמען באותו נושא, סירוב לקבל הודעות כלשהן מאותו נמען.
  2. הודעה שלא תכיל את המרכיב הנ"ל, תיעצר בשרת הדואר ולא תישלח לנמענים, או יתווסף לה באופן אוטומטי מרכיב המאפשר לנמען מענה ביחס לנכונותו לקבל את ההודעה או הודעות אחרות מאותו שולח.
  3. רשימת כתובות אינטרנט של מסרבים לקבל הודעות מאותו נמען באותו נושא או בכלל, תוחזק בספק שירותי הדוא"ל.
  4. הודעת דוא"ל הנשלחת מכתובת אינטרנט למישהו שביקש לחסום הודעה כזו מאותה כתובת, תזוהה על ידי ספק הדוא"ל של השולח ולא תועבר לשרת של המקבל.

מנגנון מסוג זה עשוי לאפשר הקטנה משמעותית של כמות דואר הזבל המגיעה לנמענים. מנגנון מסוג זה אינו מונע לחלוטין פגיעות (Hits). הנמענים יקבלו הודעות משולחי דואר זבל לפחות עד לקבלת תשובתם לדוא"ל. היות שכמות השולחים גדולה, יהיו שולחים נוספים שאינם חסומים. בעיה נוספת היא הקלות בה יכול שולח דואר "זבל" להחליף כתובת דוא"ל ועל ידי כך להימנע מחסימת משלוח הדואר שלו. הבעיה השלישית במודל זה היא הגדלת העומס על ספקי שירותי האינטרנט.

קישורים חיצוניים

הערות שוליים

  1. ^ Professor David Heeger,‏ Signal Detection Theory,‏ Center for Neural Science,‏ באתר אוניברסיטת ניו יורק
  2. ^ תיקון מס' 40 לחוק התקשורת (בזק ושידורים) התשס"ח 2008
Logo hamichlol 3.png
הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0