כיצד לאמן בינה מלאכותית גנרטיבית באמצעות ידע ארגוני

הבינה המלאכותית הגנרטיבית, מאפשרת יצירת תוכן חדש על ידי הזנת טקסט קצר, הפכה בשנים האחרונות לאחד התחומים החמים והמבטיחים ביותר בעולם הטכנולוגיה. חברות ענק כמו גוגל, מטא, מיקרוסופט, OpenAI ואמזון משקיעות מיליארדי דולרים בפיתוח כלי בינה מלאכותית גנרטיביים מתקדמים. הן מפתחות מודלים מרשימים כמו GPT של OpenAI, או Claude של חברת Anthropic, ו-LaMDA של גוגל, שמסוגלים כבר היום לחקות באופן מדהים יצירת תוכן אנושי.

גם בישראל התחום של בינה מלאכותית גנרטיבית הולך ותופס תאוצה. חברות סטארט-אפ וארגונים גדולים כאחד, מתחילים לחקור וליישם את הטכנולוגיה המרשימה הזו במוצרים ושירותים שלהם. הפוטנציאל שטמון בבינה מלאכותית גנרטיבית עצום - היא יכולה לשדרג תהליכים עבודה רבים, לחסוך זמן יקר לעובדים, ולהוסיף ערך ממשי ללקוחות.

חשוב לציין כי גם ארגונים קטנים יותר וחברות שאינן טכנולוגיות, יכולות ליהנות מהמהפכה הגנרטיבית וליישם בינה מלאכותית בפעילות שלהן. כלים חדשים מאפשרים כעת, גם לארגונים ללא ניסיון טכנולוגי "לאמן" מודלי בינה מלאכותית על בסיס נתוניהם, ובכך לשדרג את השירות, את חווית הלקוח ואת היעילות התפעולית. במקרה זה כן יידרש גוף מלווה ואפילו צוות ייעודי, אך אין עוד צורך בצוותי מחקר ופיתוח גדולים או בתשתיות נתונים ענקיות, משאבים ויכולות שבלאו הכי לא קיימות בארגונים קטנים.

אך עדיין, כדי לממש את הפוטנציאל וליישם בינה מלאכותית גנרטיבית, חברות נדרשות לבצע אימון יסודי של המודלים הגנרטיביים על נתונים איכותיים ורלוונטיים מתחום העיסוק שלהן. המודלים "לומדים" מהנתונים ומשתפרים ככל שהם נחשפים ליותר דוגמאות איכותיות. אחרת נקבל תוצאות כלליות במקרה הטוב, לא מדויקות במקרה הסביר, ושקריות במקרה הרע. אז מה ניתן לעשות?

אימון LLM (Large Language Model) מאפס

גישה זו כרוכה ביצירת מודל ייעודי לתחום מסוים מאפס. אמנם יתרונה בפתרון מותאם אישית, אך היא ניצבת בפני אתגרים בלתי אפשריים:

נפח נתונים: נדרשות כמויות עצומות של נתוני אימון באיכות גבוהה. רוב המוחלט של חברות בישראל, פשוט אינן מחזיקות במאגרי נתונים כה גדולים.
עוצמות חישוב ומומחיות: אימון LLM דורש משאבי חישוב משמעותיים וצוות מדעני נתונים מיומן, ומכאן גם עלויות דרמטיות.

דוגמה בולטת ליישום כזה היא Bloomberg שפיתחו את BloombergGPT לתוכן ספציפי לתחום הפיננסים. בהסתמך על ארבעה עשורים של נתונים פיננסיים, הם השתמשו ב-700 מיליארד טוקנים, שווה ערך לכ-350 מיליארד מילים, והשקיעו 1.3 מיליון שעות יחידות עיבוד גרפי. עם זאת, משאבים אלה מעבר להישג ידן של כל חברה ישראלית.

וכאן מתעוררת בעיה - רוב החברות והארגונים אינם אוגרים אצלם כמויות עצומות של נתוני טקסט, תמונות או קול שניתן להשתמש בהם לאימון מודלים גנרטיביים ואין להן את המשאבים לפיתוחים בסדר גודל כזה. אז מה הפתרון? כאן נכנסות לתמונה טכניקות חדשניות שמאפשרות "לרמות" את המודלים הגנרטיביים ולאמן אותם לביצועים גבוהים גם כשיש רק כמויות קטנות יחסית של נתוני אימון:

אימון מחדש (Fine-Tuning) של LLM קיים

במקום להתחיל מאפס, חברות יכולות להשפיע על מודל שפה קיים כדי להעשיר ולכוון את הידע שלו בתחום. לגישה זו יתרונות משלה:

פחות נתונים וזמן: אימון מחדש דורש פחות מסמכים ופחות זמן חישוב.
בסיס מוכח: חברות יכולות להסתמך על היכולות היסודיות של LLMs מבוססים.

מודל Med-PaLM2 של גוגל מהווה עדות לפוטנציאל של גישה זו. ממאגר הידע הכללי של PaLM2 (מודל השפה של גוגל), גוגל אימנה מחדש את המודל על ידע רפואי ממוקד. עם זאת, הגישה אינה חסרת אתגרים. עדיין קיימות עלויות, הן במונחים של מימון והן של מומחיות, אך במושגים ברי השגה לחברות רבות בישראל. וקיימת גם אפשרות שלישית.

אימון באמצעות פרומפטים (הנחיות) של LLM קיים

טכניקה זו צוברת תאוצה בקרב עסקים המבקשים להתאים אישית את הידע של מודל השפה, במקום לשנות את ליבת המודל, משנים אותו באמצעות פרומפטים המכילים ידע ספציפי לתחום.

יעילות חישובית: שיטה זו דורשת הכי פחות משאבים מבין השלוש.
גמישות: אינה דורשת מאגרי נתונים גדולים לאימון בתחום תוכן חדש.

יישום הטכניקה על ידי מורגן סטנלי בולט במיוחד. הם אימנו את המודל GPT-4 של OpenAI באמצעות אוסף ממוקד של מסמכים הכוללים ידע על השקעות ועסקים. המטרה הייתה לספק ליועצים הפיננסיים שלהם מאגר ידע נגיש. עם זאת, התהליך גם הוא דורש מומחיות, החל מהמרת נתוני טקסט נרחבים לפורמט אחיד, ולעד לצורך ביצירת וקטורים (Vector embeddings) - ייצוג מספרי לטקסט השומר על הקונטקסט בין המילים. מורכב, אך בהחלט אפשרי.

בימים אלה זמינים ברחבי הרשת עשרות "כלי מדף" המתיימרים לעשות את הלמידה הארגונית עבורכם ולספק לכם תוצר מוגמר. חלקם עושים עבודה טובה, רובם פחות, וכמעט בכולם אתגר השפה העברית עומד בעינו. עם זאת האפשרויות קיימות ומגוונות, על ידי אנשי מקצוע מתאימים ואפיון מדויק ניתן לבנות תהליכים הכוללים למידה מידע ארגוני ואוטומטיזציה, שיאפשרו להנות משילוב מנצח של יכולות בינה מלאכותית וידע ארגוני.

מומחים מהתעשייה צופים כי בשנים הקרובות נראה אימוץ נרחב של יישומי בינה מלאכותית גנרטיבית בחברות מכל הסוגים והגדלים. הטכנולוגיה צפויה לחולל מהפכה בתחומים רבים - שיווק, פרסום, שירות לקוחות, גיוס כוח אדם, ניהול ידע ועוד. חברות שיאמצו מוקדם את המהפכה הגנרטיבית יזכו ביתרון תחרותי משמעותי מול מתחריהן.

עם זאת, חשוב שהחברות ינהגו באחריות ושקיפות בפיתוח ואימוץ כלי בינה מלאכותית גנרטיביים. הציפיה כי הפתרון כבר קיים וצריך רק כמה שעות עבודה, אינה פוגשת מציאות. יש להקפיד על פיקוח אנושי, על אבטחת מידע, על מניעת הטיות ועל שימוש אתי בטכנולוגיה המתקדמת, אלה לצד ליווי מקצועי ותהליך עבודה סדור שיתאימו את הפתרון במיוחד עבורכם. רק כך נוכל ליהנות מהיתרונות של המהפכה הגנרטיבית ולצמצם את הנזק הפוטנציאלי שיכול להיגרם משימוש פזיז ולא אחראי.

המאמר מבוסס על מאמרם של טום דבנפורט ומריאם אלווי