מייסדים, מבקרים וחוקרים: השיחות שבאמת כדאי לקרוא
רוב האנשים יודעים מי הוא המנכ"ל של OpenAI, אבל מעטים מכירים את שמות החוקרים שכתבו את המאמרים שהגדירו את עידן המודלים השפתיים הגדולים (LLMs). הפער הזה יוצר תמונה מעוותת של האופן שבו הטכנולוגיה באמת מתקדמת. אנחנו מתייחסים לבינה מלאכותית כאילו מדובר בסדרת השקות של מוצרים, בעוד שבפועל מדובר בצבירה איטית של פריצות דרך מתמטיות. המייסדים מנהלים את ההון ואת הנרטיב הציבורי, בעוד החוקרים מנהלים את המשקולות והלוגיקה. הבנת ההבדל הזה היא הדרך היחידה לראות מבעד לערפילי השיווק. אם אתם עוקבים רק אחרי המייסדים, אתם צופים בסרט; אם אתם עוקבים אחרי החוקרים, אתם קוראים את התסריט. המאמר הזה בוחן מדוע ההבחנה הזו חשובה ואיך לזהות את האותות שבאמת מכתיבים את עתיד התעשייה. הגיע הזמן להפסיק להקשיב לנאומים הכריזמטיים ולהתמקד במציאות הקרה של המעבדה – באנשים שכותבים את הקוד, ולא רק באלו שחותמים על הודעות לעיתונות.
האדריכלים הבלתי נראים של עידן המכונות
המייסדים הם הפנים הציבוריות. הם נואמים בפורום הכלכלי העולמי ומעידים בפני הקונגרס. התפקיד שלהם הוא להבטיח מיליארדים במימון ולבנות מותג שנראה בלתי נמנע. הם משתמשים במילים שמרמזות על קסם. החוקרים הם אחרים. הם עובדים ב-Python וב-LaTeX. אכפת להם מפונקציות הפסד (loss functions) ויעילות טוקנים. מייסד עשוי לומר שהמודל שלו "חושב", בעוד חוקר יסביר לכם שהוא פשוט חוזה את המילה הבאה הסבירה ביותר על בסיס התפלגות הסתברותית ספציפית. הבלבול נוצר כי התקשורת מתייחסת לשתי הקבוצות כאל גוף אחד. כשמנכ"ל אומר שמודל יפתור את משבר האקלים, זהו תרגיל מכירות. כשחוקר מפרסם מאמר על sparse autoencoders, זו טענה טכנית. האחד הוא תקווה, השני הוא עובדה.
הציבור לרוב מבלבל בין תקווה לעובדה, מה שמוביל למחזור של הבטחות יתר ואכזבות. כדי להבין את התחום הזה, חייבים להפריד בין האדם שמוכר את המכונית לבין האדם שתכנן את המנוע. מתכנן המנוע יודע בדיוק איפה הברגים רופפים, אבל איש המכירות לעולם לא יספר לכם על כך כי התפקיד שלו הוא לשמור על מחיר המניה גבוה. אנחנו רואים את זה קורה בכל פעם שיוצא מודל חדש: המייסד מפרסם ציוץ מסתורי כדי לייצר הייפ, והחוקר מפרסם קישור לדוח טכני ב-arXiv. הציוץ מקבל מיליון צפיות, בעוד הדוח הטכני נקרא על ידי כמה אלפים בודדים שבאמת בונים דברים. זה יוצר לולאת משוב שבה הקולות הרועשים ביותר מגדירים את המציאות עבור כולם.
מעבר לפנים הציבוריות של החדשנות
לפער הזה יש השלכות אדירות על מדיניות גלובלית. ממשלות כותבות כיום חוקים המבוססים על אזהרות של מייסדים – אזהרות על סיכונים קיומיים שנשמעים כמו מדע בדיוני. זה משאיר את המיקוד על עתיד היפותטי במקום על נזקים נוכחיים. בינתיים, חוקרים מצביעים על בעיות מיידיות כמו הטיות בנתונים וצריכת אנרגיה. על ידי הקשבה בעיקר לשמות המפורסמים, אנחנו מסתכנים ברגולציה על הדברים הלא נכונים. אנחנו עלולים לאסור על בינה מלאכותית עתידית תוך התעלמות מכך שהמודלים הנוכחיים מרוקנים את מאגרי המים של עיירות קטנות כדי לקרר את מרכזי הנתונים שלהם. זו לא בעיה אמריקאית בלבד; אותה דינמיקה קיימת באירופה ובאסיה.
הקולות שמקבלים הכי הרבה זמן אוויר הם אלו עם תקציבי השיווק הגדולים ביותר. זה יוצר סביבת "המנצח לוקח הכל" שבה כמה חברות קובעות את סדר היום לכל כדור הארץ. אם לא נרחיב את הפרספקטיבה שלנו, נאפשר לקומץ אנשים בעמק הסיליקון להגדיר מה בטוח ומה אפשרי. ריכוז כוח כזה הוא סיכון בפני עצמו; הוא מגביל את גיוון המחשבה בתחום שזקוק לו נואשות. אנחנו צריכים לשמוע את האנשים באוניברסיטת טורונטו או במעבדות בטוקיו בדיוק כפי שאנחנו שומעים את האנשים בסן פרנסיסקו. קידמה מדעית היא מאמץ גלובלי, אך הנרטיב כרגע הוא מונופול מקומי. כדאי להסתכל בכתבי עת כמו Nature כדי לראות את ההתקדמות האמיתית שנעשית מחוץ לחדרי הישיבות של התאגידים.
למה העולם מקשיב לאנשים הלא נכונים
תחשבו על יום בחייו של חוקר מוביל במעבדה גדולה. הם מתעוררים ובודקים תוצאות של ריצת אימון שעלתה שלושה מיליון דולר. הם רואים שהמודל הוזה יותר מהצפוי. הם מבלים עשר שעות בבחינת אשכולות נתונים כדי למצוא את הרעש. הם לא חושבים על הבחירות של 2024 או על גורל האנושות; הם חושבים על הסיבה שהמודל לא מצליח להבין שלילה במשפטים מורכבים. הם מסתכלים על מפות חום של הפעלת נוירונים. ההצלחה שלהם נמדדת בביטים לתו או בדיוק במבחן השוואה ספציפי. עכשיו תחשבו על היום של מייסד: הם במטוס פרטי בדרך לפגישה עם ראש מדינה, מדברים על ההזדמנות של טריליון דולר בכלכלה החדשה.
החוקר מתעסק ב"איך", המייסד מתעסק ב"למה זה שווה כסף". עבור מפתח שבונה אפליקציה, החוקר הוא הדמות החשובה יותר. החוקר קובע את ה-API latency ואת ה-context window, בעוד המייסד קובע את המחיר. אם אתם מנסים לבנות עסק, אתם צריכים לדעת אם הטכנולוגיה באמת יכולה לעשות את מה שהמייסד טוען שהיא יכולה. לעיתים קרובות, היא לא. ראינו את זה בימים הראשונים של הנהיגה האוטונומית: המייסדים אמרו שיהיו לנו מיליוני רובוטקסי עד 2026, בעוד החוקרים ידעו שמקרי קצה בגשם כבד הם עדיין בעיה לא פתורה. הציבור האמין למייסדים, אבל החוקרים צדקו.
אותו דפוס חוזר על עצמו בתחום ה-Generative AI. אומרים לנו שהמודלים יחליפו בקרוב עורכי דין ורופאים. אם תקראו את המאמרים הטכניים, תראו שהמודלים עדיין נאבקים בעקביות לוגית בסיסית. הפער בין הדמו למציאות הוא המקום שבו חברות מפסידות כסף. אתם יכולים למצוא סקירה מעמיקה על מגמות בבינה מלאכותית כדי לראות איך המגבלות הטכניות האלו נבחנות היום. ההבחנה הזו היא ההבדל בין השקעה נבונה לבועה ספקולטיבית. כשאתם שומעים טענה חדשה, שאלו את עצמכם אם היא הגיעה ממאמר או מהודעה לעיתונות. התשובה תגיד לכם כמה משקל לתת לה. עיתונאים ב-MIT Technology Review מדגישים לעיתים קרובות את הפער הזה בין המעבדה ללובי. עלינו לזכור שלמייסדים יש תמריץ להסתיר פגמים, בעוד לחוקרים יש תמריץ למצוא אותם. הראשונים בונים את ההייפ, האחרונים בונים את האמת. בטווח הארוך, האמת היא הדבר היחיד ששורד. ראינו את זה ב-2026 כשהגל הראשון של ההייפ החל להתקרר תחת כובד המציאות הטכנית.
יום שלישי במעבדה מול חדר הישיבות
אנחנו חייבים לשאול שאלות קשות על המסלול הנוכחי של הפיתוח. מי משלם על המחקר שהמייסדים טוענים שיועיל לכולם? רוב החוקרים המובילים עזבו את האקדמיה לטובת מעבדות פרטיות. זה אומר שהידע שהם מייצרים כבר אינו מוצר ציבורי, אלא סוד מסחרי. מה קורה לשיטה המדעית כשהנתונים המשמשים להוכחת טענה חבויים מאחורי חומת תשלום? אנחנו רואים מעבר ממדע פתוח למודל של יתרון תחרותי סגור. האם הפרסום של כמה אנשים עוזר לתחום, או שהוא יוצר פולחן אישיות שמרתיע מהתנגדות? אם חוקר מוצא פגם משמעותי במודל דגל, האם הוא מרגיש בטוח לדווח על כך אם זה עלול לפגוע בשווי החברה?
BotNews.today משתמש בכלי AI כדי לחקור, לכתוב, לערוך ולתרגם תוכן. הצוות שלנו בודק ומפקח על התהליך כדי לשמור על המידע שימושי, ברור ואמין.
הלחץ הפיננסי על החברות האלו הוא עצום. אנחנו גם צריכים לשקול את העלות הסביבתית. האם המרדף אחרי שיפורים קלים במדדים שווה את טביעת הרגל הפחמנית המסיבית של אימון המודלים האלו? אנחנו מדברים לעיתים קרובות על היתרונות של AI לסביבה, אבל לעיתים רחוקות רואים מאזן שמשקלל את השניים. לבסוף, מי מחזיק בתרבות שעליה המודלים האלו מאומנים? החוקרים משתמשים בתפוקה הקולקטיבית של האינטרנט כדי לבנות את המערכות שלהם, ואז המייסדים גובים מהציבור תשלום כדי לגשת לגרסה מזוקקת של אותה תפוקה. זו העברת עושר שכמעט ולא נידונה בכותרות. אלו לא רק בעיות טכניות; אלו דילמות חברתיות ואתיות שדורשות יותר מסתם אלגוריתם טוב יותר כדי להיפתר.
מגבלות טכניות ויישום מקומי
עבור אלו שבונים על הפלטפורמות האלו, הפרטים הטכניים חשובים יותר מהפילוסופיה. מגבלות ה-API הנוכחיות הן צוואר בקבוק משמעותי לאימוץ ארגוני. לרוב הספקים יש מגבלות קצב (rate limits) קשיחות שמונעות עיבוד בזמן אמת בנפח גבוה. זו הסיבה שחברות רבות בוחנות אחסון מקומי והרצה מקומית. שימוש במודלים כמו Llama 3 על חומרה מקומית מאפשר פרטיות נתונים טובה יותר ועלויות נמוכות יותר בטווח הארוך. עם זאת, דרישות החומרה גבוהות. כדי להריץ מודל של 70 מיליארד פרמטרים במהירות סבירה, צריך GPUs מתקדמים עם VRAM משמעותי. כאן הגיקים פוגשים את הפיננסים: העלות של אשכול H100 היא חסם כניסה שמשאיר את הכוח בידי העשירים.
אנחנו רואים גם מעבר לכיוון של fine-tuning ממוקד. במקום להשתמש במודל כללי לכל דבר, מפתחים משתמשים במודלים קטנים יותר שאומנו על מערכי נתונים ספציפיים. זה משפר את הדיוק ומפחית את כמות הטוקנים. האתגר הטכני כאן הוא אוצרות נתונים (data curation). אם נתוני הקלט גרועים, המודל שעבר fine-tuning יהיה גרוע יותר מהמודל הכללי. אנחנו רואים גם שימוש גובר ב-Retrieval Augmented Generation (RAG) כדי לעגן מודלים בנתונים עובדתיים. זה עוקף את הצורך ב-context windows מסיביים ומפחית הזיות. אבל ל-RAG יש מגבלות משלו, במיוחד באופן שבו הוא מטפל בדירוג המסמכים שנשלפו. אם שלב החיפוש נכשל, פלט המודל חסר תועלת. רוב המשתמשים לא מבינים שהביצועים של AI תלויים בבסיס הנתונים שהוא שואל לא פחות מאשר במודל עצמו.
המסננת הסופית למידע
העתיד של ה-AI הוא לא סיפור אחד שמסופר על ידי אדם אחד. זהו ויכוח מבולגן ומתמשך בין אלו שמוכרים חזון לבין אלו שבונים את המציאות. כדי להיות צרכן חכם של חדשות טכנולוגיה, אתם חייבים ללמוד להסתכל מעבר למייסד הכריזמטי. חפשו את השמות על המאמרים. חפשו את החוקרים שמוכנים לדבר על מה שהמודלים שלהם לא יכולים לעשות. הסתירות בתעשייה הן לא באגים; הן החלק הכי כן בסיפור. התחום ימשיך להתפתח כי הבעיות הטכניות רחוקות מלהיפתר. השאלה הפתוחה נותרת: האם נוכל לבנות מערכת אינטליגנטית באמת ללא צריכת המשאבים המסיבית שמגדירה את העידן הנוכחי? עד שנענה על כך, ההייפ ימשיך להקדים את המדע. עלינו להישאר סקפטיים כלפי כל נרטיב שמבטיח פתרון מושלם מבלי להזכיר את הפשרות הכרוכות בכך.
הערת העורך: יצרנו אתר זה כמרכז חדשות ומדריכים רב-לשוני בנושא בינה מלאכותית עבור אנשים שאינם "גיקים" של מחשבים, אך עדיין רוצים להבין בינה מלאכותית, להשתמש בה בביטחון רב יותר, ולעקוב אחר העתיד שכבר מגיע.
מצאת שגיאה או משהו שצריך לתקן? ספר לנו.