מערכות מולטי אייג'נט: למה עתיד הבינה המלאכותית טמון בעבודת צוות
אם תרצו להבין איך נראית הבינה המלאכותית של העתיד, צריך להפסיק לחשוב על מודל אחד שמנסה לעשות הכל לבד. במקום זאת, תארו לעצמכם צוות של סוכנים מתמחים שמחלקים ביניהם משימות, עובדים במקביל, ומשתפים פעולה לביצוע משימות מורכבות. זוהי המציאות של מערכות מולטי אייג'נט.
למה צריך יותר ממודל אחד?
משימות מורכבות כוללות בעיות פתוחות שבהן קשה מאוד לחזות מראש מה יהיו הצעדים הנדרשים. לדוגמה, אי אפשר לתכנת מראש נתיב קבוע לביצוע מחקר, כי מדובר בתהליך דינמי ותלוי בדרך שבה הוא מתפתח. כשאנשים מתמודדים עם בעיות מורכבות - בין אם זה מחקר, פתרון בעיות עסקיות או ארגוניות - הם מעדכנים באופן מתמשך את תכנית הפעולה בהתאם לממצאים של השלבים הקודמים.
דווקא חוסר הוודאות הוא הזדמנות שהופכת את סוכני הבינה המלאכותית למתאימים במיוחד למשימות מורכבות. עבודה כזו דורשת גמישות ויכולת לקבל החלטות בהתאם לתהליך מתפתח. המודל חייב לפעול באופן אוטונומי, עם ריבוי מהלכים, לקבל החלטות על כיווני פעולה על בסיס ממצאים ביניים. תהליך ליניארי המבוסס על תכנית עבודה צעד אחרי צעד, לא יכול להתמודד עם משימות כאלה.
איך זה עובד?
המערכת עובדת לפי תבנית מנצח (Orchestrator) ועובדים מקצועיים. המנצח הוא סוכן מוביל המתאם את התהליך תוך שהוא מאציל משימות לסוכנים מתמחים שפועלים במקביל. כשמשתמש שולח שאילתה, הסוכן המוביל מנתח אותה, מפתח אסטרטגיה, ויוצר סוכנים כדי לטפל בהיבטים שונים של המשימה במקביל. כמו בתזמורת המנצח רואה את התמונה הגדולה, הוא מפעיל ומתזמן את הנגנים, ועיניהם תמיד נשואות אליו.
הסוכנים מתפקדים כאנשי מקצוע על ידי שימוש איטרטיבי בכלים העומדים לרשותם, כדי לדוגמה, לאסוף מידע, ולאחר מכן להחזיר את הממצאים לסוכן המוביל כדי שיוכל לבחון אותם ולקבל החלטה על הפעולה הבאה. זה שונה מגישות מסורתיות של שליפת מידע מתוך מאגר קבוע. במקום זאת, הארכיטקטורה הזאת משתמשת בחיפוש רב-שלבי שמוצא מידע רלוונטי באופן דינמי, מסתגל לממצאים חדשים ומנתח תוצאות כדי לגבש תשובה איכותית יותר.
למה זה עובד כל כך טוב?
מערכות מולטי אייג'נט עובדות בעיקר כי הן מאפשרות להשתמש בכמות מספקת של טוקנים כדי לפתור את הבעיה. מחקרים מראים ששלושה גורמים מסבירים 95% מהשונות בביצועים של מערכות AI: כמות הטוקנים הזמינה (Context window), מספר הקריאות לכלים מתאימים (Tools Usage) ובחירת המודל (LLM). כאשר כמות הטוקנים אחראית לבדה ל-80% מהשונות בביצועים.
הממצא הזה נותן הצדקה לארכיטקטורה שמחלקת עבודה בין סוכנים עם חלונות קונטקסט נפרדים כדי להוסיף יותר קיבולת לתהליך העבודה. תחשבו על עובד שמוגבל בשעות עבודה, ביכולת לזכור דברים, במולטי-טאסקינג. באופן לא מפתיע גם מערכות שפה סובלות ממגבלות, אך אם ניקח את המשתנה המשפיע ביותר ונגייס יותר מעובד אחד נקבל כלי שמוגבל מעט מאוד בכמות הטוקנים לה הוא זקוק להשלמת המשימה. חשוב לומר שנכון לרגע כתיבת שורות אלה ישנם כבר מודלים כמו ChatGPT 4.1 ו-Gemini 2.5 שמחזיקים ב-1 מיליון טוקנים לכל סוכן, זה מספר עצום שמאפשר להתמודד עם משימות מאוד מורכבות ללא חשש לאובדן ההקשר.
יש גם חיסרון: בפועל, הארכיטקטורות הללו שורפות טוקנים במהירות. לפי הנתונים, סוכנים משתמשים עד פי 4 יותר טוקנים מאשר אינטראקציות צ'אט, ומערכות מולטי אייג'נט משתמשות עד פי 15 יותר טוקנים מאשר צ'אטים. עם האוכל בא התאבון.
האתגרים בפיתוח
מערכות מולטי אייג'נט שונות ממערכות סוכן יחיד, כולל גידול מהיר במורכבות התיאום בין הסוכנים. סוכנים ראשונים עשו טעויות כמו יצירת 50 סוכנים לשאילתות פשוטות, סריקת הרשת ללא הגבלה אחר מקורות לא קיימים, והסחות דעת האחד של השני עם עדכונים בלתי פוסקים.
הפתרון מגיע דרך פיתוח הנחיות (Prompts) טובות יותר לסוכנים:
לימוד אופן פעולת הסוכנים: צריך ללמוד ולהבין את ההשפעות של הפרומפטים שאנחנו כותבים למודל. בניית סימולציות עם הפרומפטים והכלים בהם נעשה שימוש, ואז לבצע ניסויים בעבודת הסוכנים צעד אחר צעד.
"הכשרת" המנצח: במערכת, הסוכן המוביל מפרק שאילתות למשימות משנה ומתאר אותן לסוכנים. כל סוכן זקוק לפרומפט משלו - מטרה, פורמט פלט, הנחיה על הכלים והמקורות לשימוש וגבולות משימה ברורים.
התאמת משאבים למורכבות השאילתה: סוכנים מתקשים להחליט אודות המאמץ הנדרש למשימות שונות, ולכן חשוב לכלול "כללי קנה מידה" בפרומפטים הניתנים לסוכנים. גילוי עובדות פשוט דורש רק סוכן אחד עם 3-10 קריאות לכלים, השוואה בין מקורות עשויה לדרוש 2-4 סוכנים עם 10-15 קריאות כל אחד, ומחקר מורכב עשוי להשתמש ביותר מ-10 סוכנים עם עשרות כלים.
עיצוב כלים ובחירתם: ממשקי סוכן-כלי דומים במהותם לממשקי אדם-מחשב. חשוב לעשות שימוש בכלי הנכון בתזמון הנכון. לדוגמה, סוכן שנדרש להביא מקורות מידע, אבל בוחר להתבסס על הדאטה בייס הפנימי של עצמו, נדון לכישלון. כולנו מכירים הפניות למקורות מידע לא קיימים.
הביצועים בפועל
ניסויים מראים שמערכות מולטי אייג'נט מצטיינות במיוחד בשאילתות רחבות - הכוללות פעולות במספר כיוונים עצמאיים בו-זמנית. מערכת מולטי אייג'נט עם סוכן מוביל ומספר סוכני עזר עלתה בביצועיה ב-90.2% על מערכת סוכן יחיד במבחן.
לדוגמה, כשמערכת מחקר התבקשה לזהות את כל חברי הדירקטוריון של חברות הטכנולוגיה ב- S&P-500. מערכת מולטי אייג'נט מצאה את התשובות הנכונות על ידי פירוק המשימה למשימות משנה לסוכנים, בעוד שמערכת הסוכן היחיד פעם אחר פעם נכשלה למצוא את התשובה הנכונה והמלאה.
קריאות לכלים במקביל
משימות מורכבות כוללות באופן טבעי עבודה מול מקורות רבים. כדי להאיץ את ביצוע התהליך המורכב, הכניסו שתי שיטות עבודה במקביל: (1) הסוכן המוביל מאציל משימות ל-3-5 סוכנים במקביל במקום ברצף; (2) הסוכנים משתמשים ב-3 ויותר כלים במקביל. השינויים האלה קיצרו את זמן עיבוד עד 90% לשאילתות מורכבות, ואפשרו למערכת לעבוד בדקות במקום שעות תוך התמודדות עם מאות מקורות מידע.
פיתוח מערכות אמיתיות
בתוכנה מסורתית, באג עלול לשבור את כל התהליך, לפגוע בביצועים, או לגרום לעבודה לא סדירה. אך הבאג הוא קבוע והטיפול הנקודתי פותר את הבעיה (ואז מתגלה הבאג הבא). במערכות סוכנים, שינויים קטנים מתרחבים לשינויים התנהגותיים גדולים, מה שהופך את מלאכת כתיבת הקוד למערכות מרובות סוכנים למשימה מורכבת בהרבה.
הסוכנים רצים הרבה זמן ושומרים מידע לאורך כל התהליך. זה אומר שהקוד צריך להיות יציב ולדעת להתמודד עם בעיות שצצות בדרך. בלי טיפול נכון, תקלה קטנה יכולה להרוס את כל העבודה של הסוכן. בנוסף הסוכנים מקבלים החלטות שונות בכל פעם, גם אם נותנים להם בדיוק את אותן הוראות. זה הופך את מציאת התקלות למורכבת הרבה יותר. הפתרון שמצאו הוא לעקוב אחרי כל מה שהסוכנים עושים, לנסות להבין למה הם נכשלים ולתקן את הבעיות בצורה מסודרת.
והכלי העיקרי שלנו הוא עדיין הפרומפט. מתקנים בעדינות את הטקסט, בודקים ביצועים, מנסים להבין מה השתנה. מורכב. בלתי צפוי. אפשרי.
המאמר מבוסס על המאמר "How we built our multi-agent research system" של חברת Anthropic שהתפרסם ב-13 ביוני 2025.
האתר הזה עושה שימוש בעוגיות