המעבדות שקובעות את הקצב לגל ה-AI הבא
המצב הנוכחי של בינה מלאכותית כבר לא מוגדר על ידי מאמרי מחקר תיאורטיים או הבטחות רחוקות. נכנסנו לעידן של תפוקה תעשייתית שבו המטרה העיקרית היא המרה של כוח מחשוב עצום לתועלת אמינה. המעבדות שמובילות את המהלך הזה לא כולן דומות. חלקן מתעדפות הרחבה גולמית של לוגיקה, בעוד אחרות מתמקדות באופן שבו הלוגיקה הזו משתלבת בגיליון אלקטרוני או בחבילת יצירה. השינוי הזה מעביר את השיחה ממה שעלול לקרות יום אחד למה שבאמת עובד על שרתים ברגע זה. אנחנו רואים סטייה באסטרטגיה שתגדיר את המנצחות הכלכליות של העשור הבא. מהירות הפיתוח הזו מותחת את היכולת של תאגידים לעמוד בקצב. זה כבר לא רק עניין של להחזיק את ה-model הכי טוב. זה עניין של מי יכול להפוך את ה-model הזה לזול מספיק ומהיר מספיק כדי לשמש מיליוני אנשים בו-זמנית מבלי להפיל את המערכת או להזות שגיאות קריטיות. זהו ה-baseline החדש של התעשייה.
שלושת עמודי התווך של ה-Machine Intelligence המודרנית
כדי להבין את המסלול הנוכחי, עלינו להבחין בין שלושת הסוגים העיקריים של ארגונים שבונים את המערכות הללו. ראשית, יש לנו את מעבדות החזית כמו OpenAI ו-Anthropic. הישויות הללו ממוקדות בדחיפת הגבולות המוחלטים של מה ש-neural network יכול לעבד. המטרה שלהן היא יכולת כללית. הן רוצות לבנות מערכות שיכולות להסיק מסקנות בכל תחום, מכתיבת קוד ועד כתיבה יצירתית. המעבדות הללו פועלות עם תקציבי עתק וצורכות את רוב ה-hardware היוקרתי בעולם. הן חדר המכונות של כל התנועה, ומספקות את ה-base models שכולם בסופו של דבר בונים עליהם.
שנית, יש לנו את המעבדות האקדמיות, כמו Stanford HAI ו-MIT CSAIL. התפקיד שלהן שונה. הן הספקניות והתיאורטיקניות. בעוד שמעבדת חזית עשויה להתמקד בהגדלת ה-model, מעבדה אקדמית שואלת מדוע ה-model עובד מלכתחילה. הן חוקרות את ההשפעה החברתית, ההטיות המובנות והשלכות הבטיחות לטווח ארוך. הן מספקות את הנתונים שעברו peer-reviewed ששומרים על המגזר המסחרי מקורקע. בלעדיהן, התעשייה הייתה קופסה שחורה של סודות קנייניים ללא פיקוח ציבורי או הבנה של המכניקה שמאחורי הקלעים.
לבסוף, יש לנו את מעבדות המוצר בתוך חברות כמו Microsoft, Adobe ו-Google. הצוותים הללו לוקחים את הכוח הגולמי מהחזית והופכים אותו למשהו שאדם באמת יכול להשתמש בו. הם מתמודדים עם המציאות המבולגנת של ממשקי משתמש, latency ופרטיות נתונים. למעבדת מוצר לא אכפת אם ה-model יכול לכתוב שירה אם הוא לא יכול גם לסכם במדויק מסמך משפטי של אלף עמודים בשלוש שניות. הם הגשר בין המעבדה לסלון. הם מתמקדים בסדרי העדיפויות הבאים:
- הפחתת העלות לכל query כדי להפוך את הטכנולוגיה לבת-קיימא עבור שווקים המוניים.
- בניית guardrails כדי להבטיח שהפלט עומד בתקני בטיחות המותג הארגוני.
- שילוב ה-intelligence בתוך תהליכי עבודה של תוכנה קיימת כמו דואר אלקטרוני וכלי עיצוב.
ההימורים הגלובליים של תפוקת המעבדות
העבודה שמתרחשת במעבדות הללו היא לא רק עניין של רווח תאגידי. היא הפכה למרכיב ליבה בביטחון הלאומי ובמעמד הכלכלי הגלובלי. מדינות שמארחות את המעבדות הללו זוכות ליתרון משמעותי ב-computational efficiency ובריבונות נתונים. כאשר מעבדה בסן פרנסיסקו או בלונדון מבצעת פריצת דרך בהסקה, זה משפיע על האופן שבו עסקים בטוקיו או בברלין פועלים. אנחנו רואים ריכוז כוח שמתחרה בימים הראשונים של תעשיית הנפט. היכולת לייצר intelligence באיכות גבוהה בקנה מידה רחב היא ה-commodity החדש. זה הוביל למרוץ שבו ההימור הוא על היסודות של האופן שבו עבודה מוערכת.
ממשלות מסתכלות כעת על המעבדות הללו כנכסים אסטרטגיים. יש מתח גובר בין האופי הפתוח של מחקר אקדמי לבין האופי הסגור והקנייני של מעבדות חזית. אם ה-models הטובים ביותר נשמרים מאחורי paywall, הפער הגלובלי בין מדינות עשירות בטכנולוגיה לעניות בטכנולוגיה יתרחב. זו הסיבה שמעבדות רבות נמצאות כעת תחת לחץ כבד להסביר את מקורות הנתונים שלהן ואת צריכת האנרגיה שלהן. העלות הסביבתית של אימון המערכות העצומות הללו היא דאגה גלובלית שאף מעבדה בודדת עדיין לא פתרה במלואה. האנרגיה הנדרשת להפעלת מרכזי הנתונים הללו מאלצת חשיבה מחודשת על רשתות חשמל מווירג'יניה ועד סינגפור.
גישור על הפער לתועלת יומיומית
יש מרחק משמעותי בין מאמר מחקר שטוען ש-model עבר את בחינת הלשכה לבין מוצר שעורך דין יכול לסמוך עליו בתיק של לקוח. רוב מה שאנחנו רואים בחדשות הוא האות של המחקר, אבל הרעש של השוק לעיתים קרובות מעלים את ההתקדמות בפועל. פריצת דרך במעבדה עשויה לקחת שנתיים להגיע למכשיר צרכני. העיכוב הזה נגרם מהצורך באופטימיזציה. model שדורש עשרת אלפים GPUs כדי לרוץ הוא חסר תועלת לעסק קטן. העבודה האמיתית של השנה הבאה היא להפוך את ה-models הללו לקטנים מספיק כדי לרוץ על מחשב נייד תוך שמירה על ה-intelligence שלהם.
קחו לדוגמה יום בחייו של מפתח תוכנה בעתיד הקרוב. הוא לא מתחיל עם מסך ריק. במקום זאת, הוא מתאר פיצ'ר ל-model מקומי שעבר fine-tuned על ה-codebase הספציפי שלו. ה-model מייצר את ה-boilerplate, בודק פגיעויות אבטחה ומציע אופטימיזציות. המפתח פועל כאדריכל ועורך ולא כפועל ידני. השינוי הזה אפשרי רק בגלל שמעבדות מוצר הבינו איך לגרום ל-model להבין את ההקשר של הנתונים של חברה ספציפית מבלי להדליף את הנתונים הללו לאינטרנט הציבורי.
BotNews.today משתמש בכלי AI כדי לחקור, לכתוב, לערוך ולתרגם תוכן. הצוות שלנו בודק ומפקח על התהליך כדי לשמור על המידע שימושי, ברור ואמין.
עבור יוצר, ההשפעה מיידית עוד יותר. עורך וידאו יכול כעת להשתמש בכלים ממעבדות כמו Google DeepMind כדי להפוך לאוטומטיים את החלקים המייגעים ביותר בעבודה, כמו rotoscoping או color grading. זה לא מחליף את העורך, אבל זה משנה את עלות ההפקה. מה שהיה לוקח שבוע לוקח עכשיו שעה. זה הופך סיפור סיפורים באיכות גבוהה לנגיש ליותר אנשים, אבל זה גם מציף את השוק בתוכן. האתגר עבור המעבדות כעת הוא ליצור כלים שעוזרים למשתמשים להבחין בין עבודה שנעשתה על ידי אדם לעבודה שנוצרה על ידי מכונה. ה-reliability הזו היא המכשול הגדול הבא של התעשייה.
שאלות קשות לאדריכלים
ככל שאנו מסתמכים יותר על המעבדות הללו, עלינו להחיל רמה של ספקנות סוקרטית על הטענות שלהן. מהי העלות הנסתרת של הנוחות הזו? אם אנחנו מוציאים את הסקת המסקנות שלנו ל-model, האם אנחנו מאבדים את היכולת לחשוב בצורה ביקורתית בעצמנו? יש גם את שאלת הבעלות על הנתונים. רוב ה-models הללו אומנו על התפוקה הקולקטיבית של האינטרנט ללא הסכמה מפורשת מהיוצרים. האם זה אתי שמעבדה תרוויח מהעבודה של מיליוני אמנים וכותבים ללא פיצוי? אלו לא רק שאלות משפטיות; הן מהותיות לעתיד הכלכלה היצירתית.
פרטיות נותרה הדאגה המשמעותית ביותר. כשאתם מקיימים אינטראקציה עם model, אתם לעיתים קרובות מזינים לו מידע אישי או קנייני. איך אנחנו יכולים להיות בטוחים שהנתונים הללו לא משמשים לאימון הגרסה הבאה של ה-model? חלק מהמעבדות טוענות שיש להן מדיניות