למה AI הוא סיפור על חומרה לא פחות מעל תוכנה
התפיסה הרווחת לגבי בינה מלאכותית מתמקדת כמעט אך ורק בקוד. אנשים מדברים על מודלי שפה גדולים כאילו הם קיימים בבועה של לוגיקה טהורה. הם דנים בגאונות של אלגוריתם או בניואנסים של תשובות הצ'אטבוט. הפרספקטיבה הזו מפספסת את הגורם הקריטי ביותר בעידן הטכנולוגי הנוכחי. AI הוא לא רק סיפור של תוכנה. זה סיפור על תעשייה כבדה. זה עניין של צריכת חשמל מסיבית והמגבלות הפיזיות של הסיליקון. בכל פעם שמשתמש שואל שאלה את הצ'אטבוט, שרשרת של אירועים פיזיים מתרחשת במרכז נתונים במרחק קילומטרים משם. התהליך הזה מערב שבבים מיוחדים שהם כרגע הסחורות היקרות ביותר עלי אדמות. אם אתם רוצים להבין למה חברות מסוימות מנצחות ואחרות נכשלות, אתם חייבים להסתכל על החומרה. התוכנה היא ההגה, אבל החומרה היא המנוע והדלק. בלי התשתית הפיזית, המודל המתקדם ביותר בעולם הוא רק אוסף של מתמטיקה חסרת תועלת.
תקרת הסיליקון
במשך עשורים, פיתוח תוכנה עקב אחרי מסלול צפוי. כתבת קוד, והוא רץ על יחידות עיבוד מרכזיות סטנדרטיות או CPUs. השבבים האלה היו כלליים. הם יכלו לטפל במגוון משימות בזו אחר זו. עם זאת, ה-AI שינה את הדרישות. מודלים מודרניים לא צריכים ג'נרליסט. הם צריכים מומחה שיכול לבצע מיליארדי פעולות מתמטיות פשוטות בו-זמנית. זה נקרא עיבוד מקבילי. התעשייה העבירה את המיקוד שלה ליחידות עיבוד גרפיות או GPUs. השבבים האלה תוכננו במקור לרינדור משחקי וידאו, אבל חוקרים גילו שהם מושלמים לכפל מטריצות שמניע רשתות נוירונים. השינוי הזה יצר צוואר בקבוק מסיבי. אי אפשר פשוט להוריד עוד אינטליגנציה. צריך לבנות אותה עם רכיבים פיזיים שקשה מאוד לייצר. העולם מתמודד כרגע עם מציאות שבה מהירות ההתקדמות של ה-AI מוכתבת על ידי המהירות שבה חברות כמו TSMC יכולות לחרוט מעגלים על פרוסות סיליקון.
המגבלה הפיזית הזו יצרה סוג חדש של מערכת מעמדות בעולם הטק. יש את ה