זיהוי תוכן שנוצר על ידי בינה מלאכותית

זיהוי תוכן שנוצר על ידי בינה מלאכותית היא תוכנה שנועדה לקבוע אם תוכן כלשהו (טקסט, תמונה, וידאו או אודיו) נוצר באמצעות בינה מלאכותית (AI).

האמינות של תוכנות כאלה נתונה לוויכוח,^[1] ויש חששות בנוגע לשימוש אפשרי לרעה בתוכנות זיהוי בינה מלאכותית על ידי מחנכים.

בעיות דיוק

מספר כלי זיהוי בינה מלאכותית הוכחו כבלתי מהימנים בכל הנוגע לזיהוי מדויק ומקיף של טקסט שנוצר על ידי בינה מלאכותית. במחקר שנערך על ידי ובר-וולף ועמיתיה ופורסם בשנת 2023, החוקרים העריכו 14 כלי זיהוי, כולל Turnitin (אנ') ו-GPT Zero (אנ'), וגילו כי "כולם קיבלו ציון נמוך מ-80% דיוק, ורק חמישה עברו את ה-70%.^[2]

זיהוי טקסט

במקרה של טקסט, זיהוי זה מתבצע לרוב כדי למנוע חשד להעתקה וגנבה ספרותית, בדרך כלל על ידי איתור חזרות של מילים כסימנים מובהקים לכך שהטקסט נוצר על ידי בינה מלאכותית (כולל הזיות של הבינה המלאכותית). הכלים אלו משמשים לעיתים קרובות מורים בעת בדיקת עבודות תלמידיהם, בדרך כלל באופן נקודתי. בעקבות השקת ChatGPT ותוכנות דומות ליצירת טקסטים באמצעות בינה מלאכותית, מוסדות חינוך רבים פרסמו מדיניות האוסרת על תלמידים להשתמש בבינה מלאכותית.^[3] תוכנות לזיהוי טקסט שנוצר על ידי בינה מלאכותית משמשות גם להערכת מועמדים לעבודה וכן על ידי מנועי חיפוש מקוונים.^[4]

אמצעי הגילוי הנוכחיים עשויים לעיתים להיות בלתי מהימנים ולסווג בטעות עבודה של בני אדם ככזו שנוצרה על ידי בינה מלאכותית^[5]^[6]^[7] תוך כישלון בזיהוי תוכן שנוצר על ידי בינה מלאכותית במקרים אחרים.^[8] מגזין MIT Technology Review (אנ') ציין כי הטכנולוגיה "התקשתה לזהות טקסט שנוצר על ידי ChatGPT לאחר שעבר סידור קל מחדש על ידי בני אדם והוסתר באמצעות כלי פרפרזה".^[9] כמו כן, נמצא כי תוכנות לזיהוי טקסטי בינה מלאכותית מפלות אנשים שאינם דוברי אנגלית כשפת אם.^[4]

שני סטודנטים מאוניברסיטת קליפורניה בדייוויס, הופנו למשרד להצלחת סטודנטים וענייני משפט (OSSJA) של האוניברסיטה לאחר שמוריהם סרקו את חיבוריהם וקיבלו תוצאות חיוביות באמצעות גלאי בינה מלאכותית; הראשון באמצעות כלי הזיהוי GPTZero, והשני באמצעות כלי זיהוי משולב ב-Turnitin. עם זאת, בעקבות סיקור תקשורתי^[10] ובדיקה מעמיקה, הסטודנטים נוקו מכל חשד לעבירה.^[11]

באפריל 2023 החליטו באוניברסיטת קיימברידג' ואוניברסיטאות נוספות מקבוצת ראסל שלא להשתמש בכלי זיהוי הטקסט של Turnitin, לאחר שהובעו חששות בנוגע לאמינותו.^[12] אוניברסיטת טקסס באוסטין בחרה לוותר על המערכת שישה חודשים לאחר מכן.^[13]

במאי 2023 השתמש פרופסור מאוניברסיטת East Texas A&M (אנ') ב-ChatGPT כדי לבדוק אם עבודות שהגישו תלמידיו נכתבו על ידו, ו-ChatGPT קבע כי כך היה. בעקבות זאת, הפרופסור איים לפסול את עבודותיהם של כל תלמידי הכיתה, למרות ש-ChatGPT אינו מסוגל לזהות כתיבה שנוצרה על ידי בינה מלאכותית.^[14] התלמידים נוקו מהאשמות (למעט אחד שהודה בשימוש בתוכנה).^[15]

מאמר שפורסם באתר Gizmodo (אנ') ביוני 2024, דיווח על אובדן משרות בקרב כותבי מאמרים ועיתונאים עצמאיים, בעקבות סיווג שגוי של עבודותיהם ככאלה שנוצרו על ידי בינה מלאכותית על ידי תוכנות זיהוי טקסטים מבוססות AI.^[16]

כדי לשפר את מהימנות זיהוי הטקסטים שנוצרו על ידי בינה מלאכותית, חוקרים בחנו טכניקות סימון מים דיגיטלי (אנ'). מאמר משנת 2023 שכותרתו "A Watermark for Large Language Models"^[17] מציג שיטה להטמעת סימוני מים בלתי נראים בטקסטים שנוצרו על ידי מודלי שפה גדולים (LLMs). גישה זו מאפשרת לסמן תוכן ככזה שנוצר על ידי בינה מלאכותית ברמת דיוק גבוהה, אפילו כאשר הטקסט עבר פרפרזה או שינויים קלים. הטכניקה תוכננה להיות עדינה וקשה לזיהוי עבור קוראים רגילים, תוך שמירה על קריאות הטקסט, אך בו זמנית היא מספקת אות שניתן לזהות באמצעות כלים מיוחדים. עם זאת, למרות הפוטנציאל שלה, שיטת סימון המים מתמודדת עם אתגרים, כגון שמירה על עמידות בפני שינויים עוינים והבטחת התאמה בין מודלים שונים של בינה מלאכותית.

זיהוי טקסט נגדי

קיימת תוכנה שנועדה לעקוף מערכות לזיהוי טקסט שנוצר על ידי בינה מלאכותית.

מחקר שפורסם באוגוסט 2023 ניתח 20 תקצירים ממאמרים שפורסמו ב-Eye Journal (אנ'), אשר עברו לאחר מכן פרפרזה באמצעות GPT-4. התקצירים שעברו פרפרזה נבדקו לזיהוי גנבה ספרותית באמצעות QueText ולזיהוי תוכן שנוצר על ידי בינה מלאכותית באמצעות Originality.AI. לאחר מכן, הטקסטים עובדו מחדש באמצעות תוכנת למידת מכונה נגדית (אנ') בשם Undetectable.ai (אנ') במטרה להפחית את ציון הזיהוי של בינה מלאכותית. המחקר מצא כי Originality.AI זיהה טקסט שנוצר על ידי GPT-4 ברמת דיוק ממוצעת של 91.3%. עם זאת, לאחר עיבוד מחדש על ידי Undetectable.ai, דיוק הזיהוי של Originality.AI ירד לממוצע של 27.8%.^[18]

חלק מהחוקרים מאמינים גם שטכניקות כמו סימון מים דיגיטלי אינן יעילות, כיוון שניתן להסיר או להוסיף אותן כדי לגרום לזיהוי שגוי של תוכן ככזה שנוצר על ידי בינה מלאכותית.^[17]

זיהוי טקסט בשפות שונות

החיסרון של רוב תוכנות זיהוי התוכן שנוצר על ידי בינה מלאכותית הוא חוסר היכולת שלהן לזהות טקסטים שנוצרו על ידי בינה מלאכותית בשפות שונות. מודלי שפה גדולים (LLMs) כמו ChatGPT, קלוד וג'מיני יכולים לכתוב בשפות שונות, אך כלים מסורתיים לזיהוי טקסט שנוצר על ידי בינה מלאכותית אומנו בעיקר באנגלית ובכמה שפות אחרות המדוברות באופן נרחב, כמו צרפתית וספרדית. פתרונות פחותים לזיהוי בינה מלאכותית יכולים לזהות טקסט שנוצר על ידי בינה מלאכותית בשפות כמו פרסית, ערבית או הינדי.

זיהוי תמונה, וידאו ואודיו

קיימות מספר תוכנות לזיהוי תמונות שנוצרו על ידי בינה מלאכותית, לדוגמה כאלה שנוצרו באמצעות Midjourney או DALL-E. עם זאת, הן אינן מהימנות לחלוטין.^[19]^[20]

ישנם אחרים שטוענים כי הם יכולים לזהות דיפ-פייק בווידאו ואודיו, אך גם טכנולוגיה זו עדיין אינה מהימנה לחלוטין.^[21]

למרות הוויכוח סביב היעילות של סימון מים דיגיטלי, Google DeepMind מפתחת באופן פעיל תוכנה לזיהוי בשם SynthID, שפועלת על ידי הוספת סימן מים דיגיטלי שלא נראה לעין האנושית לתוך פיקסלים בתמונה.^[22]^[23]

ראו גם

הערות שוליים

↑ "'Don't use AI detectors for anything important,' says the author of the definitive 'AI Weirdness' blog. Her own book failed the test". Fortune (באנגלית). נבדק ב-2023-10-21.
↑ Weber-Wulff, Debora; Anohina-Naumeca, Alla; Bjelobaba, Sonja; Foltýnek, Tomáš; Guerrero-Dib, Jean; Popoola, Olumide; Šigut, Petr; Waddington, Lorna (2023-12-25). "Testing of detection tools for AI-generated text". International Journal for Educational Integrity (באנגלית). 19 (1): 26. arXiv:2306.15666. doi:10.1007/s40979-023-00146-z. ISSN 1833-2595.
↑ Hern, Alex (31 בדצמבר 2022). "AI-assisted plagiarism? ChatGPT bot says it has an answer for that". The Guardian. נבדק ב-11 ביולי 2023. {{cite news}}: (עזרה)
^ ^4.0 ^4.1 Sample, Ian (10 ביולי 2023). "Programs to detect AI discriminate against non-native English speakers, shows study". The Guardian. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)
↑ Fowler, Geoffrey A. (2 ביוני 2023). "Detecting AI may be impossible. That's a big problem for teachers". The Washington Post. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)
↑ Tangermann, Victor (9 בינואר 2023). "There's a Problem With That App That Detects GPT-Written Text: It's Not Very Accurate". Futurism. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)
↑ "We tested a new ChatGPT-detector for teachers. It flagged an innocent student". The Washington Post. 1 באפריל 2023. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)
↑ Taylor, Josh (1 בפברואר 2023). "ChatGPT maker OpenAI releases 'not fully reliable' tool to detect AI generated content". The Guardian. נבדק ב-11 ביולי 2023. {{cite news}}: (עזרה)
↑ Williams, Rhiannon (7 ביולי 2023). "AI-text detection tools are really easy to fool". MIT Technology Review. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)
↑ "AI Detection Apps Keep Falsely Accusing Students of Cheating". Futurism. 6 ביוני 2023. נבדק ב-2023-10-21. {{cite web}}: (עזרה)
↑ Jimenez, Kayla. "Professors are using ChatGPT detector tools to accuse students of cheating. But what if the software is wrong?". USA TODAY (באנגלית אמריקאית). נבדק ב-2023-10-21.
↑ Staton, Bethan (3 באפריל 2023). "Universities express doubt over tool to detect AI-powered plagiarism". Financial Times. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)
↑ Carter, Tom. "Some universities are ditching AI detection software amid fears students could be falsely accused of cheating by using ChatGPT". Business Insider (באנגלית אמריקאית). נבדק ב-2023-10-21.
↑ Verma, Prashnu (18 במאי 2023). "A professor accused his class of using ChatGPT, putting diplomas in jeopardy". The Washington Post. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)
↑ "College instructor put on blast for accusing students of using ChatGPT". NBC News. 18 במאי 2023. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)
↑ Germain, Thomas (2024-06-12). "AI Detectors Get It Wrong. Writers Are Being Fired Anyway". Gizmodo (באנגלית). נבדק ב-2024-06-18.
^ ^17.0 ^17.1 Kirchenbauer. "A Watermark for Large Language Model". arXiv:2301.10226.
↑ Taloni, Andrea; Scorcia, Vincenzo; Giannaccare, Giuseppe (2023-08-02). "Modern threats in academia: evaluating plagiarism and artificial intelligence detection scores of ChatGPT". Eye (באנגלית). 38 (2): 397–400. doi:10.1038/s41433-023-02678-7. ISSN 1476-5454. PMC 10810838. PMID 37532832. {{cite journal}}: יש לבדוק את |pmc= (עזרה); יש לבדוק את |pmid= (עזרה)
↑ Thompson, Stuart A.; Hsu, Tiffany (28 ביוני 2023). "How Easy Is It to Fool A.I.-Detection Tools?". The New York Times. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)
↑ Rizwan, Choudhury (15 באוקטובר 2023). "Expert debunks AI tool's claim that Israel's photo is fake". Interesting Engineering. נבדק ב-22 באוקטובר 2023. {{cite news}}: (עזרה)
↑ Hsu, Tiffany; Myers, Steven Lee (18 במאי 2023). "Another Side of the A.I. Boom: Detecting What A.I. Makes". The New York Times. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)
↑ Pierce, David (2023-08-29). "Google made a watermark for AI images that you can't edit out". The Verge. נבדק ב-2023-10-21.
↑ Wiggers, Kyle (2023-08-29). "DeepMind partners with Google Cloud to watermark AI-generated images". TechCrunch. נבדק ב-2023-10-21.

הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

זיהוי תוכן שנוצר על ידי בינה מלאכותית40770539Q120883091

[1] "'Don't use AI detectors for anything important,' says the author of the definitive 'AI Weirdness' blog. Her own book failed the test". Fortune (באנגלית). נבדק ב-2023-10-21.

[2] Weber-Wulff, Debora; Anohina-Naumeca, Alla; Bjelobaba, Sonja; Foltýnek, Tomáš; Guerrero-Dib, Jean; Popoola, Olumide; Šigut, Petr; Waddington, Lorna (2023-12-25). "Testing of detection tools for AI-generated text". International Journal for Educational Integrity (באנגלית). 19 (1): 26. arXiv:2306.15666. doi:10.1007/s40979-023-00146-z. ISSN 1833-2595.

[3] Hern, Alex (31 בדצמבר 2022). "AI-assisted plagiarism? ChatGPT bot says it has an answer for that". The Guardian. נבדק ב-11 ביולי 2023. {{cite news}}: (עזרה)

[Sample-4] 4.0 ^4.1 Sample, Ian (10 ביולי 2023). "Programs to detect AI discriminate against non-native English speakers, shows study". The Guardian. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)

[Fowler-5] Fowler, Geoffrey A. (2 ביוני 2023). "Detecting AI may be impossible. That's a big problem for teachers". The Washington Post. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)

[6] Tangermann, Victor (9 בינואר 2023). "There's a Problem With That App That Detects GPT-Written Text: It's Not Very Accurate". Futurism. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)

[:3-7] "We tested a new ChatGPT-detector for teachers. It flagged an innocent student". The Washington Post. 1 באפריל 2023. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)

[8] Taylor, Josh (1 בפברואר 2023). "ChatGPT maker OpenAI releases 'not fully reliable' tool to detect AI generated content". The Guardian. נבדק ב-11 ביולי 2023. {{cite news}}: (עזרה)

[Williams-9] Williams, Rhiannon (7 ביולי 2023). "AI-text detection tools are really easy to fool". MIT Technology Review. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)

[10] "AI Detection Apps Keep Falsely Accusing Students of Cheating". Futurism. 6 ביוני 2023. נבדק ב-2023-10-21. {{cite web}}: (עזרה)

[11] Jimenez, Kayla. "Professors are using ChatGPT detector tools to accuse students of cheating. But what if the software is wrong?". USA TODAY (באנגלית אמריקאית). נבדק ב-2023-10-21.

[12] Staton, Bethan (3 באפריל 2023). "Universities express doubt over tool to detect AI-powered plagiarism". Financial Times. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)

[13] Carter, Tom. "Some universities are ditching AI detection software amid fears students could be falsely accused of cheating by using ChatGPT". Business Insider (באנגלית אמריקאית). נבדק ב-2023-10-21.

[14] Verma, Prashnu (18 במאי 2023). "A professor accused his class of using ChatGPT, putting diplomas in jeopardy". The Washington Post. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)

[15] "College instructor put on blast for accusing students of using ChatGPT". NBC News. 18 במאי 2023. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)

[16] Germain, Thomas (2024-06-12). "AI Detectors Get It Wrong. Writers Are Being Fired Anyway". Gizmodo (באנגלית). נבדק ב-2024-06-18.

[auto-17] 17.0 ^17.1 Kirchenbauer. "A Watermark for Large Language Model". arXiv:2301.10226.

[:2-18] Taloni, Andrea; Scorcia, Vincenzo; Giannaccare, Giuseppe (2023-08-02). "Modern threats in academia: evaluating plagiarism and artificial intelligence detection scores of ChatGPT". Eye (באנגלית). 38 (2): 397–400. doi:10.1038/s41433-023-02678-7. ISSN 1476-5454. PMC 10810838. PMID 37532832. {{cite journal}}: יש לבדוק את |pmc= (עזרה); יש לבדוק את |pmid= (עזרה)

[ThoHsu-19] Thompson, Stuart A.; Hsu, Tiffany (28 ביוני 2023). "How Easy Is It to Fool A.I.-Detection Tools?". The New York Times. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)

[:1-20] Rizwan, Choudhury (15 באוקטובר 2023). "Expert debunks AI tool's claim that Israel's photo is fake". Interesting Engineering. נבדק ב-22 באוקטובר 2023. {{cite news}}: (עזרה)

[MyeHsu-21] Hsu, Tiffany; Myers, Steven Lee (18 במאי 2023). "Another Side of the A.I. Boom: Detecting What A.I. Makes". The New York Times. נבדק ב-10 ביולי 2023. {{cite news}}: (עזרה)

[22] Pierce, David (2023-08-29). "Google made a watermark for AI images that you can't edit out". The Verge. נבדק ב-2023-10-21.

[23] Wiggers, Kyle (2023-08-29). "DeepMind partners with Google Cloud to watermark AI-generated images". TechCrunch. נבדק ב-2023-10-21.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

בינה מלאכותית
כללי	מבחן טיורינג • היסטוריה של הבינה המלאכותית • ציר הזמן של בינה מלאכותית • התקדמות הבינה המלאכותית • אוריינות AI • סוכן תבוני • AI-שלמות מערכת מומחה • אסדרת בינה מלאכותית (בישראל) • בינה מלאכותית צרה • בינה חישובית • הסברתיות בינה מלאכותית • הפרדוקס של מורבק • סוכן תבוני • אתיקה של בינה מלאכותית • זיהוי תוכן שנוצר על ידי בינה מלאכותית
תחומים	עיבוד שפה טבעית • ראייה ממוחשבת • בינה מלאכותית יוצרת • אומנות בינה מלאכותית • בינה מלאכותית כללית (AGI)
סוגי למידת מכונה	מערכת לומדת • למידה מונחית • למידה בלתי מונחית • למידה עמוקה • למידת חיזוק • סיווג בייסיאני נאיבי • רשת בייסיאנית
אלגוריתמי למידת מכונה קלאסית	פרספטרון • עץ החלטה • מכונת וקטורים תומכים • Bag of words • אלגוריתם k-מרכזים • אלגוריתם מיקסום התוחלת • הורדת ממד • אלגוריתם שכן קרוב • יער אקראי • Q-learning •‏ T-SNE •‏ Tf–idf • חיזוק גרדיאנט
למידה עמוקה	רשת עצבית מלאכותית • רשת זרימה קדימה • רשת עצבית רקורסיבית • פונקציית אקטיבציה • טרנספורמר • Attention •‏ GAN
עיבוד שפה טבעית	מודל שפה • שיכון מילים • בלשנות חישובית • תרגום מכונה • חילוץ מידע (אנ') • ניתוח סנטימנט • זיהוי חלקי דיבר (אנ') • מערכת זיהוי דיבור • זיהוי ישויות • כריית טקסט • תיוג תפקידים סמנטי • Word2vec • מודל שפה גדול • GPT •‏ BERT (אנ') • מודל Bag-of-words (אנ') • יצירת טקסט בשפה טבעית (אנ') • מילת עצירה • ניתוח מחרוזות • Stemming (אנ') • למטיזציה (אנ')
יישומים לבינה מלאכותית (אנ')	צ'אטבוט • זיהוי דובר • זיהוי עצמים • זיהוי תבניות • עוזר וירטואלי • זיהוי תווים אופטי • מחולל תמונות • הזיות
מערכות בינה מלאכותית	אלייזה • ChatGPT •‏ DALL-E •‏ Midjourney •‏ Gemini • קלוד •‏ Perplexity •‏ SearchGPT •‏ GitHub Copilot • דיפ־פייק • סירי • Google Assistant • אמזון אלכסה • מיקרוסופט קופיילוט • Qwen
סוגיות בטיחות בינה מלאכותית (אנ')	סכנה קיומית מבינה מלאכותית כללית • בינה מלאכותית חזקה • יישור בינה מלאכותית (אנ') • בקרת יכולות בינה מלאכותית (אנ') • בינה מלאכותית ידידותית (אנ') • התכנסות אינסטרומנטלית (אנ') • סינגולריות טכנולוגית • השתלטות הבינה המלאכותית • המכתב הפתוח על בינה מלאכותית (2015)
ספריות בשימוש נרחב	TensorFlow •‏ PyTorch •‏ Torch •‏ Hugging Face •‏ Keras •‏ spaCy (אנ') •‏ Caffe
לקטגוריית הבינה המלאכותית