ניו-טק מגזין | מאי 2025 | המהדורה הדיגיטלית
ברעיון אחד ולזלוג הלאה לרעיון אחר. חוקרים לנתח טקסטים לפי PDF מציעים קובץ מסוג אוסף מאפיינים סמנטיים כאלה כבסיס למסווג שיבחין בין טקסטים שייצרה בינה מלאכותית לבין טקסטים שכתבו בני אדם. הבינה תכריע ההתפתחות המהירה של המחוללים וההשקעה הרבה בשיפורם יובילו כנראה לטשטוש המאפיינים המבדילים האלה, במוקדם או במאוחר. אך אם העין ויכולת ההבחנה האנושיות כבר לא יספיקו כדי להבחין במאפיינים האלה, עדיין נוכל לנסות לזהות אותם בעזרת מחשב. כדי להכריע בשאלת המקור של תוכן כתוב או תמונה, נרצה מערכת שאפשר להזין לתוכה את התוכן ולסווג אותו לאחת משתי קבוצות: יצירות מעשה ידי אדם או יצירות של בינה מלאכותית. משימות סיווג כאלה יהיה אפשר לבצע בעזרת בינה מלאכותית שאומנה למטרה הזאת. מערכת מבוססת בינה מלאכותית שמבצעת משימה כלשהי מכונה מודל בינה מלאכותית. מודל שהמשימה שלו היא לסווג תוכן לאחת משתי הקטגוריות יתאמן על מאגר גדול של טקסטים או תמונות שסומנו מראש כתוצרים של בינה מלאכותית ותוצרים של בני אדם וילמד להכיר את ההבדלים בין שתי הקטגוריות. לאחר תהליך אימון, המודל יוכל לקבל קלט חדש ויפסוק לאיזו משתי הקבוצות – תוצרים אנושיים או תוצרי בינה מלאכותית – הוא שייך. הפיצה מטעמה מודל שמטרתו OpenAI חברת לברור בין טקסטים שנכתבו בידי אדם לבין GPT אלה שנכתבו בידי מודל השפה הגדול - . המודל המסווג אומן 2019 , שיצא בשנת 2 ועל מאגר GPT -2 על טקסטים שנכתבו בידי טקסטים מעשה ידי אדם ששימש לאימון המקורי. המסווג הזה זמין ברשת GPT -2 ועומד לרשות הציבור. כשמציגים בפניו טקסט, שמבטא 100 ל- 0 המסווג מספק ציון מספרי בין את הסיכוי שהטקסט מזויף, כלומר נכתב בידי בינה מלאכותית. הסיווג מדויק יותר ככל שהטקסטים ארוכים יותר, ומותאם במיוחד . GPT -2 לזיהוי תוצרים של , 2019 מחוללי הטקסט השתכללו מאז והמשתמשים עברו מזמן למודלים מתקדמים הפיצה לפיכך OpenAI . חברת GPT -2- יותר מ מסוֵוג שנועד לזהות תוכן שייצרו מחוללים חדשים יותר, אך כעבור זמן קצר הסירה את הפרסום עקב ריבוי הטענות על ביצועים לא־
לחברות המפתחות בינה מלאכותית יש כעת גם אינטרס אנוכי להצליח : 5 תמונה « לקטלג מידע שיוצר בידי בינה מלאכותית – אבל זאת משימה מאתגרת. שירות הסיוע Grammarly לכתיבה . באדיבות מכון דוידסון לחינוך מדעי, הזרוע החינוכית dennizn, Shutterstock קרדיט: של מכון ויצמן למדע.
מספקים. החברה דיווחה כי כשהמסווג נבדק על מאגר טקסטים מסוים, הוא זיהה בהצלחה אחוז) מהטקסטים 26 רק קצת יותר מרבע ( שיוצרו בידי בינה מלאכותית, ולעומת זאת סבר בטעות שתשעה אחוזים מהטקסטים שכתבו בני אדם נוצרו למעשה בידי בינה מלאכותית. מוסר כפול מציע לערוך Grammarly שירות הסיוע לכתיבה ולייצר טקסט באמצעות בינה מלאכותית, אך גם מספק כלי שאמור לבחון עד כמה בינה מלאכותית התערבה בכתיבה. אולם כפי שאפשר ללמוד מכישלון המסווג המתקדם , ומהנסיגה שלה מרעיון OpenAI של חברת השימוש בחותמת טקסט, יש עדיין מהמורות רבות בדרך. מעבר לחוסר השקיפות של רבות מהחברות העוסקות בתחום, לצד אינטרסים כלכליים והיעדר פיקוח, יש גם קשיים מעשיים נוספים שקשה מאוד למצוא להם פתרון. אחת הבעיות שמתפתחות מול עינינו בימים אלה ממש נובעת מכך שמחוללים זקוקים למאגרי מידע אמיתי כדי ללמוד מהם. אבל ככל שגובר השימוש בבינה מלאכותית, התוצרים שלה משתלבים בעוד ועוד מאגרים, וכאמור קשה מאוד לזהות אותם אם לא שולבה בהם חתימה. עקב כך, מאגרים כאלה עלולים להזדהם בעצמם במידע שנוצר על ידי בינה מלאכותית. כך שלחברות המפתחות בינה
מלאכותית יש כעת גם אינטרס אנוכי להצליח לקטלג מידע שיוצר בידי בינה מלאכותית – אבל זאת משימה מאתגרת. ההכרעה לגבי אמיתות של תוצר חדלה להיות משימה ישירה או פשוטה. השלב שבו בינה מלאכותית ייצרה תוכן דל ובולט לעין חלף במהירות רבה. כדי לזהות כהלכה טקסטים מעשה ידי מכונה, צריך לבחון מקטעי טקסט כמה שיותר ארוכים. זיוף טקסטים קצרים מציב אתגר משמעותי נוסף ליכולות הזיהוי שלנו. המחקר בנושא עודנו פעיל ומתפתח וכנראה לא יגיע לכדי מיצוי כל עוד תוצרי הבינה המלאכותית ממשיכים להשתנות ולהתפתח. אם הדיון הציבורי ומאמצי הרגולציה ייצרו מספיק לחץ על מפתחי הבינה המלאכותית לחתום את התוצרים שלהם בדרך גלויה או מוסתרת, הפתרון יהיה קל יותר. החברות המובילות בתחום מוכיחות שזה לא בהכרח הלך הרוח שמוביל אותם, אם כי הן משתדלות להציג חזות של שיתוף פעולה. ביקורתיות וספקנות אישית היו ונותרו גם כעת כלי חסר תחליף לצריכת תכנים מכל הסוגים, ובמיוחד אם מקורם אינו אנושי. באדיבות מכון דוידסון לחינוך מדעי, הזרוע החינוכית של מכון ויצמן למדע. קישור לכתבה ■
אתר מכון דוידסון לחינוך מדעי ■ https :// davidson . weizmann . ac . il /
55 l New-Tech Magazine
Made with FlippingBook - professional solution for displaying marketing and sales documents online