על מה נלחמות ענקיות הצ'אטבוטים עכשיו?
המרוץ אחר המענה המהיר ביותר נגמר. למשתמשים כבר לא אכפת אם מודל מסוגל לעבור את בחינות הלשכה בעשר שניות או בשתים-עשרה. המיקוד עבר לשאלה איך העוזר הדיגיטלי חי בתוך התוכנות שאתם כבר משתמשים בהן. אנחנו עדים למעבר לאינטגרציה עמוקה, שבה הצ'אטבוט הוא כבר לא יעד, אלא שכבה. השכבה הזו יושבת ביניכם לבין הקבצים, היומן והקול שלכם. השחקניות הגדולות נלחמות על דומיננטיות בכך שהן הופכות את הכלים שלהן לאנושיים ומחוברים יותר. הן רוצות להיות ממשק ברירת המחדל לכל החיים שלכם. השינוי הזה אומר שהמנצחת לא תהיה החברה עם הכי הרבה פרמטרים, אלא זו שתגרום לכם לשכוח שאתם מדברים עם מכונה. אנחנו נכנסים לעידן שבו איכות השיחה חשובה פחות מהיעילות של הפעולה. אם בוט יכול לקבוע פגישה ולזכור את ההעדפות שלכם, הוא בעל ערך רב יותר מבוט שיודע לכתוב סונטה.
מעבר למבחני הביצועים: הקרב החדש על התועלת
במשך זמן רב, עולם הטק היה אובססיבי לגבי benchmarks. הסתכלנו על ציוני MMLU ויכולות תכנות כמדדים היחידים להצלחה. זה השתנה. המיקוד החדש הוא על agency וזיכרון. Agency היא היכולת של ה-AI לבצע משימות בעולם האמיתי, כמו הזמנת טיסה או ארגון גיליון אלקטרוני. זיכרון מאפשר ל-AI לזכור מי אתם ומה חשוב לכם לאורך זמן. זה לא רק עניין של context window ארוך, אלא בסיס נתונים מתמשך של החיים שלכם. כשאתם חוזרים לצ'אטבוט אחרי שבוע, הוא אמור לדעת איפה הפסקתם. התעשייה גם נעה לעבר אינטראקציה מולטי-מודאלית. זה אומר שאתם יכולים לדבר עם ה-AI בקולכם והוא יכול לראות דרך המצלמה שלכם. זהו שינוי מוחלט של ממשק המשתמש. האבולוציה הזו מתועדת על ידי מקורות כמו The Verge, שעוקב אחר השינוי המהיר בעיצוב מוצרים. התכונות המרכזיות שמניעות את השינוי הזה כוללות:
- זיכרון מתמשך של העדפות משתמש ואינטראקציות עבר.
- אינטגרציה טבעית עם דואר אלקטרוני, יומנים ומערכות קבצים.
- מצבי קול עם latency נמוך שמחקים דפוסי דיבור אנושיים.
- יכולות זיהוי חזותי לפתרון בעיות בזמן אמת.
התחרות היא כבר לא על למי יש את ה