המהפכה הבאה בשבבי AI: מהירות, גודל או יעילות?
המרוץ ל-AI מהיר יותר עבר ממהירויות שעון פשוטות לקרב מורכב על ארכיטקטורת מערכות. כבר לא מספיק רק לדחוס עוד טרנזיסטורים על פיסת סיליקון. התעשייה הגיעה לקיר שבו מהירות העברת הנתונים בין המעבד לזיכרון חשובה יותר מהמעבד עצמו. השינוי הזה מגדיר את עידן החומרה הנוכחי. חברות שהתמקדו פעם רק בעיצוב שבבים, מוצאות את עצמן כעת מנהלות שרשראות אספקה גלובליות וטכניקות אריזה מתקדמות כדי להישאר רלוונטיות. השינוי האחרון הוא מעבר למערכות הוליסטיות שבהן רישות וזיכרון חשובים בדיוק כמו שערי הלוגיקה. האבולוציה הזו משנה את הדרך שבה כותבים תוכנה ואת הדרך שבה ממשלות תופסות ביטחון לאומי. אם אתם רוצים להבין לאן הטכנולוגיה הולכת, תסתכלו על החיבורים בין השבבים ולא על השבבים עצמם. העוצמה של פלטפורמה תלויה כיום ביכולת שלה לשלב את החלקים השונים הללו ליחידה אחת מגובשת. מי שיתעלם מהמגבלות הפיזיות של החומרה, יגלה שחלומות התוכנה שלו נתקעים בגלל Latency וחום.
ערימת סיליקון כדי לשבור את מחסום הזיכרון
כדי להבין את השינוי הנוכחי, צריך להסתכל על האופן שבו שבבים מורכבים פיזית. במשך עשורים, התעשייה הלכה על עיצוב שטוח. היה לכם מעבד והיה לכם זיכרון, והם ישבו בנפרד על לוח מעגלים. כיום, המרחק הזה הוא האויב העיקרי של הביצועים. כדי לפתור זאת, יצרנים פונים לאריזה מתקדמת (Advanced Packaging). זה כולל ערימת רכיבים זה על גבי זה או זה לצד זה על בסיס מיוחד שנקרא Interposer. הטכניקה הזו, שלעיתים מכונה Chip on Wafer on Substrate, מאפשרת לכמויות עצומות של נתונים לנוע במהירויות שהיו בלתי אפשריות בעבר. זה לא רק שיפור קטן, אלא שינוי מהותי באופן שבו אנחנו בונים מחשבים. כשאתם עורמים **High Bandwidth Memory** ישירות ליד ליבות העיבוד, אתם מחסלים את פקקי התנועה שמאטים מודלי שפה גדולים. זו הסיבה שחברות כמו NVIDIA כל כך דומיננטיות. הן לא רק מוכרות שבב, הן מוכרות חבילה משולבת היטב שכוללת זיכרון ו-Interconnects מהירים.
גם הזיכרון עצמו השתנה. RAM סטנדרטי לא יכול לעמוד בדרישות של ה-AI המודרני. התעשייה עברה לזיכרון מיוחד שמציע תפוקה גבוהה בהרבה. הזיכרון הזה יקר וקשה לייצור, מה שיוצר צוואר בקבוק באספקה. אם חברה לא יכולה להבטיח מספיק מהזיכרון המיוחד הזה, המעבדים המתקדמים שלה הם למעשה חסרי תועלת. התלות הזו מראה שסיפור החומרה הוא כעת סיפור של מערכת. אי אפשר לדבר על המוח בלי לדבר על הוורידים שמובילים את הדם. המעבר ממבנים דו-ממדיים לתלת-ממדיים הוא האות הטכני המשמעותי ביותר בשוק כיום. הוא מפריד בין השחקנים הרציניים לבין אלו שרק עושים איטרציות על עיצובים ישנים. המעבר הזה דורש השקעה מאסיבית במתקני ייצור שיכולים להתמודד עם דיוק כזה. רק מעט חברות בעולם, כמו TSMC, מסוגלות לעשות זאת בהיקף כזה.
המציאות הגיאופוליטית של ה-AI קשורה למקום שבו השבבים האלה מיוצרים. רוב הייצור המתקדם מרוכז בכמה קילומטרים רבועים בטייוואן. הריכוז הזה יוצר נקודת כשל יחידה עבור הכלכלה העולמית. אם הייצור שם ייעצר, כל מגזר הטכנולוגיה ייעצר. ממשלות מוציאות כעת מיליארדי דולרים כדי לבנות מפעלים מקומיים, אבל פרויקטים כאלה לוקחים שנים להשלמה. גם בקרות ייצוא הפכו לגורם מרכזי. ממשלת ארה