ראיונות ה-AI הכי חשובים שכולם פספסו
התובנות הכי משמעותיות על עתיד הבינה המלאכותית כמעט אף פעם לא נמצאות בהודעות לעיתונות מלוטשות או במצגות נוצצות. במקום זה, הן קבורות בשתיקות, בהתחמקויות העצבניות ובהערות הטכניות של ראיונות ארוכים שרוב האנשים פשוט מדלגים עליהם. כשמנכ"ל מדבר במשך שלוש שעות בפודקאסט טכני, המסכה התאגידית בסוף נופלת. הרגעים האלה חושפים מציאות שסותרת את השיווק הציבורי. בזמן שהצהרות רשמיות מתמקדות בבטיחות ודמוקרטיזציה, התגובות הלא מתוסרטות מצביעות על מרוץ מטורף לכוח עיבוד גולמי והודאה שקטה שהדרך קדימה הופכת ליקרה יותר ופחות צפויה. השורה התחתונה מהשנה האחרונה היא שהתעשייה מתרחקת מצ'אטבוטים לכל מטרה ועוברת לסוכנים מיוחדים עם compute גבוה שדורשים שינויי תשתית מסיביים. אם קראתם רק את הכותרות, פספסתם את ההודאה ששיטות ה-scaling הנוכחיות אולי נתקעות בקיר. הסיפור האמיתי נמצא בדרך שבה המנהיגים האלה מתארים את מגבלות ה-hardware שלהם ואת ההגדרות המשתנות של אינטליגנציה.
כדי להבין את השינויים האלה, צריך להסתכל על חילופי דברים ספציפיים של מנהיגים ב-OpenAI, Anthropic ו-Google DeepMind. בדיונים ארוכים מהזמן האחרון, הפוקוס עבר ממה שהמודלים יכולים לעשות לאיך שהם נבנים. למשל, כשדריו אמודיי מ-Anthropic מדבר על scaling laws, הוא לא רק מדבר על להגדיל את המודלים. הוא רומז על עתיד שבו עלות האימון של מודל בודד יכולה להגיע לעשרות מיליארדי דולרים. זה שינוי ענק מהימים הראשונים של התעשייה, כשכמה מיליוני דולרים הספיקו כדי להתחרות. הראיונות האלה חושפים פער הולך וגדל בין החברות שיכולות להרשות לעצמן את "מס ה-compute" הזה לבין אלו שלא. ההתחמקויות אומרות לא פחות מהתשובות. כששואלים מאיפה מגיעים נתוני האימון, המנהלים עוברים לדבר על synthetic data. זה רמז אסטרטגי לכך שהאינטרנט פשוט נסחט עד תום כמשאב. התעשייה מנסה עכשיו להבין איך לגרום למודלים ללמוד מהלוגיקה של עצמם במקום רק לחקות טקסט אנושי. השינוי הזה באסטרטגיה כמעט ולא מפורסם בפוסטים בבלוג, אבל הוא נושא השיחה העיקרי בחוגים טכניים.
להודאות השקטות האלה יש השלכות גלובליות עמוקות. אנחנו רואים את ההתחלה של מה שחלק קוראים לו ריבונות compute. מדינות כבר לא מחפשות software, הן מחפשות את התשתית הפיזית להרצת המודלים האלה. הראיונות מרמזים שהשלב הבא של הפיתוח יוגדר על ידי ייצור אנרגיה ושרשראות אספקה של צ'יפים, ולא רק קוד חכם. זה משפיע על כולם, מרגולטורים ממשלתיים ועד בעלי עסקים קטנים. אם המודלים המובילים דורשים תפוקת אנרגיה של עיר קטנה כדי להתאמן, הכוח יתרכז באופן טבעי בידיים של גופים בודדים. זה סותר את נרטיב הגישה הפתוחה שחברות רבות עדיין מקדמות. הרמזים האסטרטגיים שנזרקו בדיונים טכניים מצביעים על כך שעידן ה-AI ה"פתוח" למעשה נגמר עבור המערכות המתקדמות ביותר. השינוי הזה כבר משפיע על איך הון סיכון מוקצה ואיך מדיניות סחר נכתבת בוושינגטון ובבריסל. העולם מגיב למציאות של הראיונות האלה, גם אם הציבור הרחב עדיין מרוכז בפיצ'רים האחרונים של הצ'אטבוט. לעומק נוסף על השינויים האלה, אתם יכולים לעקוב אחרי ניתוח תעשיית ה-AI האחרון כדי לראות איך האותות התאגידיים האלה מתורגמים לתנועות שוק.
כדי להבין את ההשפעה בעולם האמיתי, תחשבו על יום בחייו של מפתח ראשי בחברת תוכנה בינונית. המפתח הזה כבר לא רק כותב קוד. הוא מבלה שעות בצפייה בראיונות גולמיים של חוקרים כדי להבין אילו APIs יבוטלו ואילו יקבלו יותר compute. הוא רואה חוקר מציין ש-"reasoning tokens" הם העדיפות החדשה. פתאום, המפתח מבין שאסטרטגיית האינטגרציה הנוכחית שלו מיושנת. הוא חייב לעבור מבניית מעטפות פשוטות לעיצוב מערכות שיכולות להתמודד עם שלבי חשיבה ארוכים. זה לא שינוי תיאורטי. זה צורך פרקטי שמונע מהכיוון הטכני שנחשף בשיחה של שעתיים בערוץ יוטיוב נישתי. הבלבול של רוב האנשים בנושא הזה נובע מהמחשבה ש-AI הוא מוצר מוגמר. זה למעשה מטרה נעה. כשמנהל מתחמק משאלה על צריכת האנרגיה של המודל האחרון שלו, הוא אומר לכם שעלות הקריאות ל-API שלכם כנראה תעלה. כשהם מראים דמו של מודל "חושב" לפני שהוא מדבר, הם מכינים אתכם לעתיד שבו latency הוא פיצ'ר ולא באג. האותות האלה הם הדרך היחידה להישאר צעד אחד לפני כולם.
החומר הוויזואלי בראיונות האלה מספק ראיות שהתמלילים לבדם לא יכולים לתפוס. כשמנכ"ל נשאל על הפוטנציאל של מודלים להחליף מגזרי עבודה ספציפיים, שפת הגוף שלו לעיתים קרובות מסגירה רמת ודאות שהמילים שלו מנסות לרכך. צחוק עצבני או מבט חטוף הרחק מהמצלמה יכולים לאותת שהתחזיות הפנימיות הרבה יותר אגרסיביות מההצהרות הפומביות. אנחנו רואים את זה כשמנהיגים דנים בלוח הזמנים ל-Artificial General Intelligence. התשובה המילולית עשויה להיות "תוך עשור", אבל האינטנסיביות של הדיון מרמזת שהם פועלים לפי לוח זמנים צפוף בהרבה. זה יוצר נתק בין מה שהציבור מצפה לו לבין מה שהחברות באמת בונות. הסיכונים הפרקטיים גבוהים. אם עסקים יתכוננו למעבר איטי בזמן שהטכנולוגיה נעה בקצב מואץ, החיכוך הכלכלי שייווצר יהיה חמור. דוגמאות למוצרים חדשים כמו סדרת ה-o1 של OpenAI מראות שהטיעון למודלים "חושבים" הוא אמיתי. זה כבר לא רק תיאוריה על autocomplete טוב יותר. זה שינוי יסודי בדרך שבה מכונות מעבדות לוגיקה.
יישום ספקנות סוקרטית על הראיונות האלה חושף כמה עלויות נסתרות ומתחים לא פתורים. אם המודלים האלה הופכים ליעילים יותר, למה הביקוש לחשמל עולה בקצב אקספוננציאלי? מנהיגי התעשייה מדברים לעיתים קרובות על שיפורי יעילות בזמן שהם מבקשים מאות מיליארדי דולרים עבור data centers חדשים. זו סתירה שנותרה ברובה ללא מענה. מי בסופו של דבר ישלם על התשתית הזו? העלות הנסתרת עשויה להיות לא רק פיננסית אלא גם סביבתית וחברתית. יש גם את שאלת הפרטיות בעידן של AI "סוכני" (agentic). אם AI אמור לפעול בשמכם, הוא צריך גישה לנתונים הכי רגישים שלכם. הראיונות רק לעיתים נדירות מספקים תשובה ברורה על איך הנתונים האלה יוגנו בצורה שתספק גם תועלת וגם אבטחה. אנחנו חייבים לשאול גם על העבודה שמושקעת במודלים האלה. ה"אדם בלופ" הוא לעיתים קרובות עובד בשכר נמוך במדינה מתפתחת שמתייג נתונים בתנאים מפרכים. החלק הזה של הסיפור כמעט תמיד מושמט מהשיחות החזוניות ברמה הגבוהה.
BotNews.today משתמש בכלי AI כדי לחקור, לכתוב, לערוך ולתרגם תוכן. הצוות שלנו בודק ומפקח על התהליך כדי לשמור על המידע שימושי, ברור ואמין.
עבור ה-power users והמפתחים, החלק ה"גיקי" בראיונות האלה הוא המקום שבו נמצא הערך האמיתי. הדיון עובר לעיתים קרובות למגבלות הספציפיות של ארכיטקטורות נוכחיות. אנחנו שומעים יותר על ה-"memory wall" שבו מהירות העברת הנתונים בין המעבד לזיכרון הופכת לצוואר הבקבוק העיקרי. זו הסיבה שאחסון מקומי ו-edge computing הופכים לנושאי שיחה מרכזיים. אם ה-cloud איטי מדי או יקר מדי לאפליקציות בזמן אמת, התעשייה חייבת לעבור למודלים קטנים ויעילים יותר שיכולים לרוץ על hardware של צרכנים. הראיונות מרמזים שנראה שוק מפוצל. יהיו מודלים מסיביים של טריליוני פרמטרים ב-cloud למשימות מורכבות, ומודלים מזוקקים ואופטימליים לשימוש יומיומי. מפתחים צריכים לשים לב לאזכורים של "quantization" ו-"speculative decoding". אלו הטכניקות שיקבעו אם אפליקציה ישימה לקהל הרחב. מגבלות ה-API הן פקטור קריטי נוסף. בזמן שהשיווק מציע פוטנציאל בלתי מוגבל, המציאות הטכנית היא מאבק מתמיד נגד rate limits ועלויות טוקנים. הבנת האינטגרציות של זרימת העבודה שחוקרים מזכירים היא המפתח לבניית מוצרים ברי קיימא. הם נעים לעבר עולם שבו המודל הוא רק חלק אחד מ"מערכת AI מורכבת" (compound AI system) שכוללת מסדי נתונים, כלי חיפוש ומריצי קוד חיצוניים.
- המעבר מלוגיקה של מודל יחיד למערכות מורכבות שמשתמשות במספר כלים כדי לאמת תשובות.
- החשיבות הגוברת של inference-time compute שבו המודל משקיע יותר זמן בעיבוד שאילתה בודדת.
השורה התחתונה היא שהמידע הכי חשוב בעולם ה-AI חבוי ממש מתחת לאף שלנו. על ידי התעלמות מהראיונות הארוכים והתמקדות רק בנקודות השיא, רוב האנשים מפספסים את השינוי האסטרטגי שמתרחש כרגע. התעשייה עוברת משלב של גילוי לשלב של תיעוש מסיבי. זה דורש סט כישורים שונה ודרך חשיבה שונה על טכנולוגיה. ההתחמקויות והסתירות של המנהיגים בתחום הן לא רק יחסי ציבור תאגידיים. הן המפה של האתגרים שיגדירו את חמש השנים הבאות. אנחנו נעים לעבר עתיד שבו "אינטליגנציה" היא סחורה שנכרית, מזוקקת ונמכרת כמו חשמל. האם זה יוביל לחברה יצרנית יותר או לחברה ריכוזית יותר? זה תלוי באיך נפרש את האותות המוקדמים האלה ואילו שאלות נבחר לשאול עכשיו. האותות נמצאים שם לכל מי שמוכן להקשיב מעבר להייפ.
הערת העורך: יצרנו אתר זה כמרכז חדשות ומדריכים רב-לשוני בנושא בינה מלאכותית עבור אנשים שאינם "גיקים" של מחשבים, אך עדיין רוצים להבין בינה מלאכותית, להשתמש בה בביטחון רב יותר, ולעקוב אחר העתיד שכבר מגיע.
מצאת שגיאה או משהו שצריך לתקן? ספר לנו.