שיתוף פעולה בין סוכנים, השוואה בין סוכנים, ועוד

🗓️ W34-35 x 2025 🗓️ סיכום הדיונים בקבוצות הוואטסאפ שלנו

LangTalks

Sep 15, 2025

ניהול Sub-Agents בקלוד קוד

תכנון ההיררכיה בין הסוכנים:
דובר על ההתלבטות בין יצירת agent ראשי (supervisor/engineering manager) ב-Claude Code שמנהל את הקשר והעברת הפעולות בין sub-agents, לעומת ניהול ישיר של כל קונטקסט על-ידי הסוכן הראשי ללא היררכית ביניים. רוב המשתתפים נטו להעדיף agent ראשי יחיד, וציינו כי רק במקרים בהם דרושות הרשאות רבות או שישנן הגבלות מיוחדות, יש הצדקה להגדרת supervisor ייעודי.
אורקסטרציה באמצעות slash commands:
עלתה המלצה להשתמש ב-slash commands ב-Claude (לדוגמה ‎/testingflow), כדי להריץ פלואו מוגדר מראש, בין אם עבור סוכנים מרובים או עבור שלבים מרובים של סוכן יחיד. כך ניתן לעטוף הליכים חוזרים (כמו בדיקות) ולשתף אותם כ-reusable workflows.
Hooks לניטור IO של sub-agents:
הועלתה האפשרות למעקב אחר קלט/פלט של סוכני משנה באמצעות hooks ייעודיים, המאפשרים חלוקה ברורה באחריות, הבנה טובה יותר של שרשרת הפעולות, וחשיפה של תהליך החשיבה של הסוכן המשנה.
רעיונות לאוטומציה של בדיקות E2E:
נשאלה שאלה אודות פיתוח צוות סוכנים שמבצע בדיקות end-to-end מלאות בעזרת AI. החברים הביעו פליאה שעדיין אין מוצר מספיק מוכר העונה על הצורך הזה, וציינו שיש מקום רב לחדשנות בשוק זה – בהיבטים של ניהול קונטקסט, תהליכים אוטומטיים על גבי ממשקי משתמש מורכבים, ויכולת סקיילינג.
משאבים והעמקה בפרקטיקות בניית Agents:
שותף מאמר שמרכז עקרונות של בניית מערכות agentic עם AI. לקריאה.

🗓️ הדיון המלא התחיל בתאריך: 31.08.25 | 14:48 | LangTalks – Code Generation Agents

השוואת AI Coding Agents

הצגת הבעיה:
משתתף העלה את הקושי בהשוואה אמיתית בין סוכנים שונים – לרוב ההתרשמות מבוססת על תחושה ולא על נתונים. המטרה הייתה למצוא שיטה מסודרת למדוד יכולות, אמינות ומהירות בין agents.
ניסיון השוואה לדוגמה:
במהלך הדיון שותף בלוג שסקר והשווה בין סוכנים מובילים (Devin, Codex, Cursor ואחרים).
הצעות לפתרונות:
- יצירת benchmark tasks אחידים (refactor, unit tests, בניית מודול).
- שימוש במדדים כמו איכות פתרון (עם קריטריונים מוגדרים), זמן תגובה, רמת אוטונומיה.
- המשתתפים הציעו להקים מערך מבחנים אחיד שיאפשר בחינה אובייקטיבית ועקבית.

🗓️ הדיון המלא התחיל בתאריך: 02.09.25 | 20:27 | LangTalks - AI Driven Coding

ניהול פרומפטים בעזרת BAML

הכלי:
אחד המשתתפים שאל מה דעתה של הקהילה לגבי שימוש ב-BAML בתור כלי להנדסת פרומפטים דקלרטיבית, המאפשרת לקבץ לוגיקה וסכמות של פרומפטים, במטרה לייצר תהליכי LLM יותר קלים לתחזוקה והבנה, גם עבור המתכנת וגם עבור המודל.
משוב חיובי:
אנשים שהתנסו בכלי המליצו עליו, במיוחד על הפלאגין ל- VS Code, שתואר על ידי אחד החברים בתור כלי ‘מציל חיים’, במיוחד עבור צוותים המנהלים במשותף תהליכים מורכבים המערבים קריאות מרובות ל-LLM. היו שהצביעו על שיפורים משמעותיים ב-structured output הניתנים להשגה באמצעות הכלי הזה.
אלטרנטיבות:
לצד BAML הוצעו גם כלים דומים כמו DSPY. משתתפים מסוימים אמרו שהם בחרו דווקא לא להשתמש בכלי נפרד שכזה, כדי לא להעמיס עוד ‘שפה’ על המערכת, שעלולה לסבך תהליכי tool calling.

🗓️ הדיון המלא התחיל בתאריך: 05.09.1988 | 13:22 | LangTalks Community

📖 נושאים נוספים שעלו 📖

פתרונות עבור inbound call agents לפרודקשן: הומלצו הכלים vapi.ai, elevenlabs, ובמיוחד pipecat, שמאפשר הרבה גמישות אבל מצריך יותר השקעה.
ירידה בביצועים של קלוד קוד: משתתפים רבים דיווחו על דעיכה מורגשת והמליצו על מעבר למודל Opus כפתרון זמני.
קובץ CLAUDE.md במונורפו - עלתה בקשה לכלי שמייצר את קובץ ההנחיות של קלוד קוד באופן אוטומטי לכל תיקיה\אפליקציה במונורפו, שנענתה בהפניה ל sidekickdev.com.