הרוצח(ת) של ChatGPT כבר כאן?

בתחום הבינה המלאכותית, ההתקדמות וחידושים משתרכים בתור ארוך, מחקים ללא בושה אולי רק את התור הישראלי לקבלת דרכון, ומבטיחים מהפכות וחוויות חדשות למבקרים, לא פחות. דוגמה מצוינת לכך היא מודל הבינה המלאכותית החדש של מיקרוסופט, תכירו את Orca. אורקה נבנתה כעוזרת וירטואלית בעלת אינטליגנציה יוצאת מגדר הרגיל. למרות שגם הרגיל שהורגלנו אליו, ממש לא רגיל. אורקה מצטיירת כמאתגרת פוטנציאלית של ChatGPT, יקיר ליבנו הבלתי מעורער. בעוד ששני מודלי ה-AI הללו חולקים שושלת משותפת תחת ההורות של מיקרוסופט, הפונקציונליות והיכולות השונות שלהם עוררו שיח מסקרן על סוג חדש של דו-קיום.

אורקה, מודל הבינה המלאכותית החדש, מתהדר ב-13 מיליארד פרמטרים (מודל קטן יחסית לזה של ChatGPT), ומתיימר להיות בעל יכולת להתמודד עם שאילתות מורכבות ותשובות מפורטות. הייחודיות שלו טמונה בכך שהוא לומד על ידי התבוננות וחיקוי של מודלי AI גדולים אחרים כמו GPT-4, ולא פחות חשוב, הוא עוקב אחר ההסברים שמודלים אלה מספקים ב"תהליך החשיבה" שלהם, מה שעוזר לו לחשוב ולהגיב ממש כמוהם. בדרך כלל מודלים קטנים של בינה מלאכותית מתקשים ליישם למידה בדרך זו, מה שנותן ל-Orca יתרון תחרותי וצפוי להפוך אותה לשחקן דומיננטי בתחום הצ'ט בוטים המופעלים על ידי בינה מלאכותית ואולי אף ל"רוצח" של מודלים אחרים...

עם זאת, השאלה האמיתית, היא האם אורקה תעלה על יכולותיו של ה-ChatGPT, אשר זוכה להערכה רחבה בזכות יכולת הבנת ויצירת טקסטים בתחומים וסגנונות שונים. אך למרות (ואולי בזכות) האמא המשותפת, שני המודלים מכוונים למרחבי בעיה שונים. אורקה מותאמת יותר לעיבוד מידע מורכב ויצירת תגובות מפורטות, תוך התאמה למטרות מחקר וניתוח. מצד שני, ChatGPT זורח בהפקת טקסט דמוי אדם, מה שהופך אותו למתאים ליישומים יומי-יומיים מגוונים יותר, אך גם מדויקים פחות.

שני המודלים מציגים את יכולת למידה מהפכנית, כלומר הם יכולים ללמוד מהטעויות שלהם, ולשפר באופן איטרטיבי את הביצועים שלהם לאורך זמן. עם זאת, היכולת הייחודית של Orca הנקראת Zero Shot. המושג זירו שוט מתייחס ליכולת של מודל לבצע משימות או לענות על שאלות ללא כל הכשרה או חשיפה מוקדמת אליהן בתהליך הלמידה. במילים אחרות, מדובר ביכולת להביא לידי ביטוי את הידע שלו וליישם אותו במשימות או שאלות חדשות שלא הוכשר עליהן באופן מפורש. במקום זאת, הוא ממנף את ההבנה הכללית שלו בשפה וידע כדי לספק תשובות הגיוניות ומדויקות.

למידת Zero-shot בעלת ערך ייחודי בעולם מודלי שפה גדולים מכיוון שהיא מפחיתה את הצורך בנתוני אימון נרחבים ומאפשרת למודלים להסתגל למשימות או לתחומים חדשים ביתר קלות, מה שהופך אותו לכלי רב תכליתי עבור יישומים שונים, ואולי צעד נוסף לקראת Artificial General Intelligence.

למרות שהשחרור של Orca עשוי לטרוף את הקלפים, חיוני להבין שמטרת הבינה המלאכותית היא לא להעמיד מערכת אחת מול האחרת, אלא לפתח חבילות של פתרונות הנותנים מענה לצרכים משתנים. ולכן, למרות שהיכולות של Orca מרשימות, זה לא בהכרח הופך אותה ל'רוצחת" שלChatGPT . במקום זאת, ניתן לראות ב-Orca וב-ChatGPT חלקים משלימים במערכת אקולוגית גדולה יותר של בינה מלאכותית, שלכל אחד מהם חוזקות ויישומים משלו.

אנו יכולים לראות את הקשר המשלים הזה באמצעות מספר מקרי בוחן. לדוגמה, אורקה הפגינה יכולות מדויקות ומהירות של פתרון בעיות העוסקות בריביות, חשיבה מרחבית ומענה על  לשאלות שגרתיות, תוך שהיא מציגה את כישרון ההבנה וההיגיון לגבי מושגים מתמטיים, תפיסה מרחבית ומצבים יום-יומיים. מיומנותה במשימות אלו מצביע שימושים פוטנציאליים בתעשיית הפיננסים, בסקטור האדריכלות וההנדסה ובתחומי שירות הלקוחות.

מצד שני, יכולות השפה דמויות האדם של ChatGPT הופכות אותו לבעל ערך רב בתחומים כמו יצירת תוכן, ניהול מדיות חברתיות ואפילו כמענה לצרכים חברתיים. בעוד ששני המודלים יכולים להיות חופפים בתחומים מסוימים, לכל אחד מהם יש חוזקות מובהקות שניתן לנצל בתרחישים שונים.

בהקשר זה, ההשקעה הכפולה של מיקרוסופט ממחישה גישה של לטרוח בערב שבת. במקום להתמקד בתחרות צרה, מיקרוסופט בבירור מחפשת להציע קשת של פתרונות לצרכים שונים. קיומם של Orca ו-ChatGPT זו לצד זה, תחת המטריה של מיקרוסופט מעיד על רצון להגדיר את שדות הפעולה ולהציע מגוון כלים הנותנים מענה למגוון רחב של משימות.

Orca הוא מודל AI רב עוצמה המסוגל להבין שאלות מורכבות, לספק תשובות מפורטות וללמוד בהדרגה מהניסיון שלו עצמו. למרות שהוא עשוי להיחשב כיריב פוטנציאלי ל-ChatGPT, זה חיוני להכיר בייחודיות שכל אחד מהם מביא לשולחן. בעולם המגוון של AI, נרטיב 'הרוצח' פחות רלוונטי ביחס לסינרגיה שמציעים דגמי AI שונים ושבשאיפה יוכלו לעבוד בהרמוניה.

אבל אם כבר ברוצחים עסקינן, מה תהיה תשובתה של גוגל?

 האתר הזה עושה שימוש בעוגיות