מלחמת השבבים שמאחורי ה-AI Boom
צוואר הבקבוק של הסיליקון שמעצב את הכוח המודרני
האובססיה העולמית למודלים גנרטיביים מתעלמת לעיתים קרובות מהמציאות הפיזית שמאפשרת אותם. בינה מלאכותית היא לא ענן ערטילאי של לוגיקה, אלא צרכנית אדירה של משאבים פיזיים. ה-boom הנוכחי מסתמך על שרשרת אספקה שבירה וריכוזית מאוד של מוליכים למחצה מתקדמים. ללא השבבים האלו, האלגוריתמים המתוחכמים ביותר הם חסרי תועלת. אנחנו עדים לשינוי שבו יכולת ה-compute הופכת למדד העיקרי להצלחה תאגידית ולאומית. זה יצר סביבה של הימורים גבוהים שבה הגישה ל-hardware קובעת מי יכול לבנות ומי חייב להמתין. צוואר הבקבוק הוא לא רק מספר השבבים המיוצרים, אלא היכולת הספציפית לייצר רכיבים שיכולים לטפל במיליארדי פרמטרים בו-זמנית. ככל שאנחנו מתקדמים ב-, המאבק להבטחת ה-hardware הזה עבר מחדרי האחוריים של מחלקות ה-IT לרמות הגבוהות ביותר של מדיניות הממשלה. ההימור כולל יותר מסתם צ'אטבוטים מהירים. הוא כולל את השליטה הבסיסית בעידן הבא של פריון תעשייתי. אם אין לך את הסיליקון, אין לך את עתיד התעשייה.
יותר מסתם מעבד
כשמדברים על מלחמת השבבים, לעיתים קרובות מתמקדים בעיצוב של ה-Graphics Processing Unit. בעוד שהעיצוב קריטי, הוא רק חלק אחד ממכלול מורכב. שבב AI מודרני הוא פלא של אינטגרציה שכולל זיכרון ברוחב פס גבוה וטכניקות אריזה מתקדמות. זיכרון ברוחב פס גבוה מאפשר לנתונים לנוע בין המעבד לאחסון במהירויות שלא היו נתפסות לפני עשור. ללא סוג זיכרון ספציפי זה, המעבד היה נשאר בטלה בזמן שהוא ממתין להגעת מידע. זה יוצר שוק משני שבו חברות כמו SK Hynix ו-Samsung חיוניות בדיוק כמו מעצבי השבבים עצמם. גורם קריטי נוסף הוא תהליך האריזה הידוע כ-Chip on Wafer on Substrate. שיטה זו מאפשרת לסוגים שונים של שבבים להיערם ולהתחבר ליחידה אחת. זהו תהליך מיוחד מאוד שמעט מאוד חברות יכולות לבצע בקנה מידה רחב. ריכוז זה של יכולת ייצור אומר שכישלון במפעל בודד או הגבלת סחר יכולים לעצור את ההתקדמות העולמית. התעשייה נאבקת כרגע להרחיב את יכולת האריזה הזו, שנשארת צוואר בקבוק הדוק יותר מהדפסה בפועל של פרוסות הסיליקון. הבנת זה עוזרת להסביר מדוע פשוט בניית עוד מפעלים אינה פתרון מהיר למחסור. התהליך כרוך בריקוד עולמי של חומרים ומומחיות שלא ניתן לשכפל בקלות במיקום חדש.
BotNews.today משתמש בכלי AI כדי לחקור, לכתוב, לערוך ולתרגם תוכן. הצוות שלנו בודק ומפקח על התהליך כדי לשמור על המידע שימושי, ברור ואמין.
ה-hardware stack עבור AI כולל מספר שכבות מובחנות שחייבות לעבוד בהרמוניה מושלמת:
- שכבות לוגיות שמבצעות את החישובים המתמטיים בפועל עבור רשתות נוירונים.
- שכבות זיכרון שמספקות את ה-throughput העצום הנדרש לאימון מודלים.
- חיבורים (Interconnects) שמאפשרים לאלפי שבבים לדבר זה עם זה ב-data center.
- מערכות קירור ורכיבי אספקת חשמל שמונעים מה-hardware להימס.
המטבע הגיאופוליטי החדש
הריכוזיות של ייצור השבבים הפכה את ה-hardware לכלי של מדיניות חוץ. רוב השבבים הלוגיים המתקדמים ביותר בעולם מיוצרים על ידי חברה אחת בטייוואן. זה יוצר פגיעות אסטרטגית שממשלות ממהרות כעת לטפל בה באמצעות סובסידיות ענקיות ובקרות יצוא. ארצות הברית ובעלות בריתה הטמיעו חוקים נוקשים כדי למנוע יצוא של שבבי AI מתקדמים והמכונות הדרושות לייצורם לאזורים מסוימים. בקרות אלו נועדו לשמור על יתרון טכנולוגי על ידי הגבלת ה-compute power הזמין למתחרים. עם זאת, הגבלות אלו גם משבשות את האופי הגלובלי של תעשיית הטק. חברות שהיו רגילות להסתמך על שרשרת אספקה עולמית חלקה צריכות כעת לנהל מערכת מפוצלת של רישיונות ואזורים מוגבלים. פיצול זה מעלה עלויות ומאט את הפריסה של טכנולוגיות חדשות. זה גם מאלץ מדינות תחת הגבלה להשקיע רבות ביכולות מקומיות משלהן, מה שעלול ליצור אקו-סיסטם טכנולוגי מקביל שלא מסתמך על סטנדרטים מערביים. ההשפעה מורגשת על ידי כל חברה שמשתמשת ב-cloud services, שכן עלות ה-hardware מגולגלת למשתמש הקצה. אנחנו כבר לא בעידן של חילופי טכנולוגיה פתוחים. במקום זאת, אנחנו רואים את עליית הלאומנות של הסיליקון שבה המטרה היא להבטיח אספקה מקומית של הצמתים המתקדמים ביותר. שינוי זה משנה את האופן שבו חברות מתכננות את התשתית לטווח ארוך ואת המקום שבו הן בוחרות למקם את ה-data centers שלהן. המתח הגיאופוליטי מבטיח ששוק השבבים יישאר תנודתי בעתיד הנראה לעין.
מחדרי ישיבות ל-Data Centers
עבור CTO בחברה בגודל בינוני, מלחמת השבבים היא לא סוגיה פוליטית מופשטת. זהו מאבק לוגיסטי יומיומי. דמיינו תרחיש שבו חברה מחליטה לבנות מודל קנייני כדי לטפל בנתונים הפנימיים שלה. הצוות מבלה חודשים בעיצוב הארכיטקטורה וניקוי ה-datasets. כשהם מוכנים להתחיל באימון, הם מבינים שזמן האספקה עבור ה-hardware הדרוש הוא מעל חמישים שבועות. הם לא יכולים פשוט להשתמש ב-cloud instances סטנדרטיים כי הביקוש דחף את המחירים לנקודה ששוחקת את כל התקציב שלהם. הם נאלצים להתפשר על גודל המודל או להמתין שנה כדי להתחיל. עיכוב זה מאפשר למתחרים גדולים יותר עם חוזי hardware ישירים לפעול קודם. גם כשהשבבים מגיעים, האתגרים נמשכים. ארונות השרתים מזמזמים כשהמערכות קירור נכנסות להילוך גבוה, וצורכות יותר חשמל משאר המשרד יחד. קצין הרכש מבלה את ימיו במעקב אחר מכולות משלוח וניהול משא ומתן עם ספקים על כבלי רשת מיוחדים שגם הם במחסור. אנשים נוטים להפריז בחשיבות של קוד התוכנה תוך זלזול בקושי של הפריסה הפיזית. מתג רשת אחד חסר יכול להפוך אשכול של GPUs בשווי עשרה מיליון דולר לחסר תועלת. זו המציאות של עידן ה-hardware-first. זהו עולם של אילוצים פיזיים שבו הצלחה נמדדת במגה-וואט וביחידות ארון. הפעילות היומיומית של חברת AI היא כעת הנדסה תעשייתית בדיוק כפי שהיא מדעי המחשב. יוצרים שחשבו שהם יכולים לבנות את הדבר הגדול הבא ממחשב נייד מגלים שהם קשורים לזמינות של תשתית מסיבית וזללנית אנרגיה שהם לא שולטים בה.
ההסתמכות על hardware ספציפי יוצרת גם אפקט של נעילה לתוכנה (software lock-in). רוב מפתחי ה-AI משתמשים בכלים שעברו אופטימיזציה למותג ספציפי של hardware. מעבר לספק שבבים אחר ידרוש שכתוב של אלפי שורות קוד ואימון מחדש של הצוות. זה הופך את בחירת ה-hardware למחויבות של עשור. חברות מגלה שהחלטות ה-hardware-first שלהן היום יכתיבו את יכולות התוכנה שלהן לשנים הבאות. זה יוצר תחושת דחיפות שלעיתים קרובות מובילה לרכישת יתר ואגירת שבבים, מה שמעיק עוד יותר על האספקה העולמית. התוצאה היא שוק שבו השחקנים העשירים ביותר יכולים להציע מחיר גבוה יותר מכולם, מה שיוצר פער עצום בתעשיית הטק. סטארט-אפים קטנים מתקשים יותר ויותר להתחרות ללא הון סיכון משמעותי שמיועד ספציפית לעלויות ה-hardware. סביבה זו מעדיפה ענקיות מבוססות שיש להן את ההון לבנות את ה-data centers שלהן ואת המשקל הפוליטי כדי להבטיח את שרשראות האספקה שלהן.
השאלות הלא נוחות של צמיחה
ככל שאנו דוחפים ל-hardware חזק יותר, עלינו לשאול מהן העלויות הנסתרות באמת. צריכת האנרגיה של אשכולות השבבים המסיביים האלו מגיעה לנקודה שבה היא מאתגרת את היציבות של רשתות החשמל המקומיות. האם זה בר-קיימא לבנות כלכלה על טכנולוגיה שדורשת עלייה אקספוננציאלית בחשמל ובמים לקירור? עלינו גם לשקול את השלכות הפרטיות של ריכוזיות ה-hardware. כאשר קומץ חברות שולט בסיליקון שעליו רץ כל ה-AI, יש להן נראות חסרת תקדים לזרימת המידע העולמית. מה קורה אם חברות אלו יופעלו עליהן לחצים על ידי ממשלות לבנות דלתות אחוריות לתוך ה-hardware עצמו? השכבה הפיזית הרבה יותר קשה לביקורת מאשר קוד תוכנה. יתרה מכך, עלינו להסתכל על ההשפעה הסביבתית של תהליכי הכרייה והייצור הנדרשים לשבבים אלו. הפקת מינרלים נדירים והמים בטוהר גבוה הדרושים למפעלי ייצור הם בעלי טביעת רגל אקולוגית משמעותית. האם אנחנו מחליפים בריאות סביבתית לטווח ארוך ברווחים לטווח קצר במהירות עיבוד? יש גם את השאלה של ה-edge מול ה-cloud. ככל שה-hardware הופך לחזק יותר, האם נראה מעבר חזרה לעיבוד מקומי כדי להימנע מהעלויות וסיכוני הפרטיות של ה-cloud? או שהקנה מידה העצום הנדרש למודלים מודרניים יבטיח ש-compute יישאר שירות ריכוזי? אלו השאלות שהתעשייה מתעלמת מהן לעיתים קרובות בחיפזון לשחרר את המודל הבא. ההתמקדות בביצועים לעיתים קרובות מעוורת אותנו לסיכונים המערכתיים של עתיד תלוי-hardware.
הארכיטקטורה של ביצועים
עבור משתמשי הכוח והמהנדסים, מלחמת השבבים מוכרעת בפרטי הארכיטקטורה. זה כבר לא רק על טרה-פלופים גולמיים. זה על מהירות החיבור ורוחב הפס של הזיכרון. כשאתה מריץ עבודת אימון מבוזרת על פני אלפי יחידות, צוואר הבקבוק הוא לעיתים קרובות ה-hardware של הרשת שמקשר ביניהם. טכנולוגיות כמו InfiniBand ופרוטוקולי Ethernet מיוחדים הפכו לחשובים כמו השבבים עצמם. אם החיבור איטי, המעבדים מבלים את רוב זמנם בהמתנה לנתונים מהשכנים שלהם. זו הסיבה שחברות מעצבות כעת סיליקון רשת מותאם אישית משלהן כדי לעקוף מגבלות סטנדרטיות. תחום קריטי נוסף הוא שכבת הפשטת התוכנה. רוב המפתחים מתקשרים עם ה-hardware דרך API ספציפי שמבצע אופטימיזציה לאופן שבו הקוד רץ על הסיליקון. ספריות אלו מורכבות להפליא ומייצגות חפיר (moat) מסיבי עבור מובילי השוק. גם אם מתחרה בונה שבב מהיר יותר, הוא חייב גם לספק אקו-סיסטם תוכנתי שקל באותה מידה לשימוש. אנחנו גם רואים עלייה בדרישות האחסון המקומי. מודלים גדולים דורשים כמויות עצומות של אחסון מהיר כדי להזין את המעבדים במהלך אימון והסקה (inference). זה הוביל לזינוק בביקוש לכונני NVMe ובקרי אחסון מיוחדים. מדור הגיקים של השוק מתמקד כרגע בשלושת התחומים האלו:
יש לכם סיפור, כלי, טרנד או שאלה הקשורים ל-AI שלדעתכם כדאי לנו לסקר? שלחו לנו את רעיון המאמר שלכם — נשמח לשמוע.- אופטימיזציה של היחס בין זיכרון ל-compute כדי להפחית בזבוז אנרגיה.
- פיתוח טכניקות דחיסה חדשות כדי להתאים מודלים גדולים יותר על hardware ברמת צרכן.
- בניית חלופות קוד פתוח ל-APIs של hardware קנייני כדי לשבור את נעילת הספק.
אחסון מקומי ו-inference מקומי הופכים לפופולריים יותר ככל שמגבלות ה-API והעלויות עבור שירותי ה-cloud עולות. משתמש כוח מחפש כעת hardware שיכול להריץ גרסה מקוונטטת של מודל באופן מקומי, תוך הימנעות מבעיות ה-latency והפרטיות של ה-cloud. זה הוביל לעניין חדש בתחנות עבודה עם מספר GPUs ברמת צרכן גבוהה וכמויות עצומות של RAM מערכת. המטרה היא ליצור זרימת עבודה שאינה תלויה בספקי ה-cloud הגדולים. עם זאת, יצרני ה-hardware מגבילים לעיתים קרובות את התכונות של שבבי צרכן כדי למנוע מהם לשמש ב-data centers. זה יוצר משחק מתמיד של חתול ועכבר בין חובבים ליצרנים. היכולת להריץ מודלים אלו באופן מקומי היא הצורה האולטימטיבית של ריבונות דיגיטלית בעולם שבו ה-compute עובר ריכוזיות.
ההשפעה המתמשכת
מלחמת השבבים היא לא שלב זמני ב-AI boom. זהו הבסיס החדש של הכלכלה העולמית. המעבר מעולם ממוקד תוכנה לעולם המוגדר על ידי אילוצי hardware הוא קבוע. חברות ומדינות שלא יצליחו להבטיח את מקומן בשרשרת האספקה של הסיליקון ימצאו את עצמן בחיסרון קבוע. בעוד שאנו עשויים לראות שיפורים ביכולת הייצור, הביקוש ל-compute כנראה ימשיך לעלות על ההיצע במשך שנים. השאלה הפתוחה נותרת האם נוכל למצוא דרך להפוך טכנולוגיה זו ליעילה יותר או אם נגזר עלינו עתיד של צריכת משאבים גוברת והולכת. ככל שהעולמות הפיזיים והדיגיטליים הופכים למשולבים יותר, השליטה בשכבת ה-hardware תהיה המקור האולטימטיבי לכוח. הקרב על הסיליקון רק מתחיל, והתוצאה שלו תגדיר את המאה הבאה של הקידמה האנושית.
הערת העורך: יצרנו אתר זה כמרכז חדשות ומדריכים רב-לשוני בנושא בינה מלאכותית עבור אנשים שאינם "גיקים" של מחשבים, אך עדיין רוצים להבין בינה מלאכותית, להשתמש בה בביטחון רב יותר, ולעקוב אחר העתיד שכבר מגיע.
מצאת שגיאה או משהו שצריך לתקן? ספר לנו.