מרכזי הכוח החדשים של ה-AI: מודלים, צ'יפים, ענן ודאטה
סוף עידן הווירטואלי
עידן ה-artificial intelligence כתופעה של תוכנה בלבד הגיע לסיומו. במשך שנים, עולם ה-tech התמקד באלגנטיות של אלגוריתמים ובחידושים של ממשקי צ'אט. המיקוד הזה עבר למציאות האכזרית של משאבים פיזיים. אנחנו עדים כעת להעברת השפעה מאסיבית מאלו שכותבים קוד לאלו ששולטים בחשמל, במים ובקרקע. היכולת לבנות מודל חכם יותר כבר לא תלויה רק בכישרון של חוקרים, אלא ביכולת להבטיח אלפי דונמים של קרקע וחיבור ישיר לרשת חשמל במתח גבוה. זוהי חזרה לעידן התעשייתי, שבו השחקנים הגדולים ביותר הם אלו עם התשתית הכבדה ביותר. צוואר הבקבוק הוא כבר לא היצירתיות האנושית, אלא הקיבולת של שנאי בתחנת משנה או קצב הזרימה של מערכת קירור. אם אי אפשר להשיג חשמל, אי אפשר להריץ את ה-compute. ואם אי אפשר להריץ את ה-compute, התוכנה שלכם פשוט לא קיימת. המציאות הפיזית הזו מסדרת מחדש את ההיררכיה הגלובלית של חברות טכנולוגיה ומדינות כאחד. המנצחים הם אלו שיכולים להפוך חומר פיזי ל-digital intelligence בקנה מידה עצום.
ה-Stack הפיזי של הבינה
התשתית הנדרשת עבור AI מודרני מורכבת הרבה יותר מאוסף פשוט של שרתים. היא מתחילה ברשת החשמל. מרכזי דאטה דורשים כיום מאות מגה-וואט של חשמל כדי לפעול. הביקוש הזה מאלץ חברות טכנולוגיה לנהל משא ומתן ישיר עם ספקי אנרגיה ואפילו להשקיע בייצור אנרגיה משל עצמן. קרקע פיזית עם ייעוד מתאים וקרבה לקווי סיבים אופטיים הפכה לבעלת ערך רב יותר מהתוכנה עצמה. מים הם המשאב הקריטי הבא. אשכולות ענק של צ'יפים מייצרים חום עצום. קירור אוויר מסורתי לרוב אינו מספיק עבור ה-hardware החדש ביותר. חברות עוברות למערכות קירור נוזלי שדורשות מיליוני גלונים של מים מדי יום כדי למנוע מהמעבדים להינמס. מעבר למתקן, שרשרת האספקה של ה-hardware מרוכזת להפליא. זה לא רק עניין של עיצוב הצ'יפים, אלא של טכניקות אריזה מתקדמות כמו CoWoS שמאפשרות לחבר מספר צ'יפים יחד, ושל High Bandwidth Memory שמספק את מהירויות הנתונים הדרושות לאימון. הייצור של הרכיבים הללו מתרחש במספר מצומצם של מתקנים בעולם. הריכוזיות הזו יוצרת מערכת שבירה שבה שיבוש אחד יכול לעצור את ההתקדמות של התעשייה כולה. המגבלות אינן מופשטות; הן גבולות מוחשיים לכמות הבינה שאנחנו יכולים לייצר ב-.
- קיבולת חיבור לרשת החשמל והזמן הנדרש לשדרוגי תשתיות.
- תהליכי רישוי לקירור תעשייתי רחב היקף ושימוש במים.
- התנגדות מקומית של קהילות המודאגות מרעש וממחירי אנרגיה.
- זמינות של רכיבים חשמליים מיוחדים כמו שנאי מתח גבוה.
- בקרות ייצוא על ציוד ליתוגרפיה ואריזה מתקדם.
גיאופוליטיקה של רשת החשמל
חלוקת הכוח של ה-AI הופכת לעניין של ביטחון לאומי. ממשלות מבינות שהיכולת לעבד מידע חיונית בדיוק כמו היכולת לייצר נפט או פלדה. זה הוביל לזינוק בבקרות ייצוא שנועדו למנוע מיריבים להשיג את הצ'יפים המתקדמים ביותר ואת המכונות הדרושות לייצורם. עם זאת, המיקוד עובר מהצ'יפים לחשמל. מדינות שיש להן אנרגיה יציבה, זולה ושופעת הופכות למוקדים החדשים של ה-compute. זו הסיבה שאנחנו רואים השקעות מאסיביות באזורים עם רשתות חשמל לא מנוצלות או פוטנציאל גדול לאנרגיה מתחדשת. הריכוזיות של הייצור במזרח אסיה נותרה נקודת מתח משמעותית. חברה אחת כמו TSMC מטפלת ברוב המוחלט של ייצור הצ'יפים המתקדמים. אם הייצור הזה ייקטע, האספקה הגלובלית של קיבולת AI תיעלם בן לילה. זה הוביל למאמץ קדחתני מצד ארה"ב ואירופה לסבסד ייצור מקומי. אבל בניית מפעל היא החלק הקל. אבטחת כוח אדם מומחה וכמויות החשמל העצומות הדרושות להפעלת המפעלים הללו היא אתגר של עשורים. מאזן הכוחות העולמי קשור כעת ליציבות רשת החשמל ולאבטחת נתיבי השיט שמובילים מודולי זיכרון ו-hardware של רשתות. זהו משחק עם סיכונים גבוהים שבו מחיר הכניסה נמדד בעשרות מיליארדי דולרים. ניתן למצוא נתונים מפורטים יותר על מגמות חשמל גלובליות בדוחות האחרונים של סוכנות האנרגיה הבינלאומית.
כששרתים פוגשים את השכונה
ההשפעה של תנופת התשתיות הזו מורגשת בצורה החריפה ביותר ברמה המקומית. דמיינו פקיד עירייה בעיר בינונית. חברת טכנולוגיה גדולה מגיעה עם הצעה למרכז דאטה. על הנייר, זה נראה כמו ניצחון לבסיס המס. במציאות, מדובר במשא ומתן מורכב על עתיד העיר. הפקיד חייב להבין אם הרשת המקומית יכולה להתמודד עם עומס פתאומי של 200 מגה-וואט בלי לגרום להפסקות חשמל לתושבים. הם חייבים לשקול את היתרונות של הכנסות ממסים מול הרעש של אלפי מאווררי קירור שפועלים 24 שעות ביממה. עבור תושב שחי ליד אחד האתרים הללו, החוויה היומיומית משתנה. השוליים השקטים של העיר הופכים לאזור תעשייה. מפלס מי התהום המקומי עלול לרדת כשהמתקן שואב מיליוני גלונים עבור מגדלי הקירור שלו. כאן הרעיון המופשט של AI פוגש את המציאות של התנגדות מקומית. במקומות כמו צפון וירג'יניה או חלקים מאירלנד, קהילות מתנגדות. הן שואלות מדוע מחירי החשמל שלהן עולים כדי לסבסד את הפעילות של ענקית טכנולוגיה גלובלית. הן מטילות ספק בהשפעה הסביבתית של גושי הבטון העצומים הללו. עבור סטארט-אפ שמנסה לבנות אפליקציה חדשה, האתגר שונה. אין להם את ההון לבנות תחנות כוח משלהם. הם נתונים לחסדי ספקיות הענן הגדולות ששולטות בגישה ל-compute. אם ספקית הענן נתקעת ללא קיבולת או מעלה מחירים בגלל עלויות אנרגיה, הסטארט-אפ בחוץ. זה יוצר מערכת מדורגת שבה רק החברות העשירות ביותר יכולות להרשות לעצמן לחדש. הנראות של מוצר בשוק אינה זהה למינוף בר-קיימא. מינוף אמיתי מגיע מבעלות על הנכסים הפיזיים שהתוכנה מסתמכת עליהם. המעבר לאנרגיה גרעינית מצד חברות טכנולוגיה הוא סימן ברור לכמה הן נואשות לאנרגיה יציבה.
BotNews.today משתמש בכלי AI כדי לחקור, לכתוב, לערוך ולתרגם תוכן. הצוות שלנו בודק ומפקח על התהליך כדי לשמור על המידע שימושי, ברור ואמין.
העלויות הנסתרות של קנה המידה
אנחנו חייבים לשאול שאלות קשות על הקיימות ארוכת הטווח של הצמיחה הזו. מי באמת משלם על העלויות הנסתרות של תשתית ה-AI? כשמרכז דאטה צורך חלק משמעותי מאספקת המים של עיר בזמן בצורת, העלות היא לא רק פיננסית. זו עלות חברתית שנופלת על הקהילה. האם תמריצי המס שניתנים לחברות הללו שווים את העומס על המשאבים הציבוריים? אנחנו צריכים גם לשקול את ריכוזיות הכוח בידי כמה חברות ששולטות בקשר עם המשתמש וב-compute. אם שלוש או ארבע חברות מחזיקות ברוב קיבולת ה-AI של העולם, מה זה אומר על התחרות? האם זה אפשרי ששחקן חדש יופיע כשהדרישות להון כל כך גבוהות? אנחנו בונים מערכת שהיא יעילה להפליא אבל גם שבירה להפליא. כשל בודד במפעל שנאים מיוחד או בצורת במוקד קירור מרכזי עלולים לעורר שרשרת של כשלים בכל האקו-סיסטם. מה קורה ליוצרים ולחברות שבנו את כל זרימות העבודה שלהם על גבי המודלים הללו אם התשתית הפיזית קורסת? אנחנו חייבים גם להסתכל על ההשפעה הסביבתית. בעוד שחברות טוענות שהן ניטרליות פחמנית, נפח האנרגיה העצום הנדרש מאלץ רבות להשאיר תחנות כוח ישנות ומלוכלכות פועלות זמן רב מהמתוכנן. האם התועלת של צ'אטבוט מעט טוב יותר שווה את העיכוב במעבר שלנו לאנרגיה נקייה? אלו לא רק שאלות טכניות. אלו שאלות אתיות ופוליטיות שיגדירו את העשור הבא של הפיתוח הטכנולוגי. הניתוח תשתיות ה-AI הנוכחי שלנו מראה שהפער בין בעלי האמצעים לאלו שאין להם מתרחב על בסיס גישה פיזית.
יש לכם סיפור, כלי, טרנד או שאלה הקשורים ל-AI שלדעתכם כדאי לנו לסקר? שלחו לנו את רעיון המאמר שלכם — נשמח לשמוע.
מתחת למכסה המנוע של ביצועים גבוהים
עבור אלו שצריכים להבין את המגבלות הטכניות של העידן החדש, המיקוד חייב לעבור מעבר לפרמטרים של המודל. צווארי הבקבוק האמיתיים נמצאים כעת ב-networking ובזיכרון. אימון מודל רחב היקף דורש אלפי GPUs שיעבדו בסנכרון מושלם. זה אפשרי רק באמצעות טכנולוגיות networking במהירות גבוהה כמו InfiniBand או קונפיגורציות Ethernet מיוחדות. השיהוי (latency) בין הצ'יפים הללו יכול להיות ההבדל בין מודל שמתאמן בשבועות לבין כזה שלוקח חודשים. ואז יש את סוגיית הזיכרון. High Bandwidth Memory (HBM) נמצא במחסור כי תהליך הייצור שלו קשה משמעותית מ-DRAM סטנדרטי. זה מגביל את מספר הצ'יפים ברמה גבוהה שניתן לייצר גם אם פרוסות הלוגיקה זמינות. בצד התוכנה, מפתחים מגיעים לגבולות של מה ש-APIs יכולים לספק. מגבלות קצב (rate limits) הן כבר לא רק מניעת שימוש לרעה. הן השתקפות של הקיבולת הפיזית של ה-hardware הבסיסי. עבור משתמשים כבדים, המעבר לאחסון מקומי והרצה מקומית הוא תגובה למגבלות הללו. אם אתם יכולים להריץ מודל קטן ואופטימלי על ה-hardware שלכם, אתם עוקפים את התור במרכז הדאטה. עם זאת, ל-hardware מקומי יש מגבלות משלו במונחים של ניהול תרמי וצריכת חשמל. האינטגרציה של המודלים הללו לתוך זרימות עבודה קיימות נפגעת גם מהיעדר ממשקים סטנדרטיים. לכל ספק יש stack קנייני משלו, מה שמקשה על מעבר אם ספק אחד נתקל בהשבתה פיזית. הריכוזיות של הייצור נראית גם בשוק האריזה המתקדמת. ההתקדמות של TSMC באריזת צ'יפים היא הסיבה היחידה שאנחנו יכולים להמשיך להגדיל ביצועים כשאנחנו מגיעים לגבולות של הסיליקון המסורתי. זו המציאות הגיקית של התעשייה.
- מגבלות תפוקה של InfiniBand ו-NVLink לאשכולות אימון מרובי צמתים.
- מגבלות אספקה של HBM3e והשפעתן על נפחי ייצור ה-GPU הכוללים.
- קפיצות ב-API latency הנגרמות מתנודות ברשת החשמל האזורית.
- מהירויות אחסון NVMe מקומי כצוואר בקבוק להזנת נתונים ב-fine tuning.
- מגבלות Thermal throttling לקונפיגורציות ארונות בצפיפות גבוהה במתקנים ישנים.
המציאות החדשה עבור מפתחים
המעבר מעולם של תוכנה תחילה לעולם של hardware תחילה הושלם. החברות שיובילו את השלב הבא של הפיתוח הן אלו שהבטיחו את שרשראות האספקה שלהן ואת מקורות האנרגיה שלהן. עבור שאר התעשייה, האתגר הוא לחדש בתוך המגבלות שקבע העולם הפיזי. זה אומר לכתוב קוד יעיל יותר שדורש פחות compute. זה אומר למצוא דרכים להשתמש במודלים קטנים יותר שיכולים לרוץ על hardware פחות מיוחד. הימים של scaling אינסופי וזול מאחורינו. אנחנו נכנסים לתקופה שבה הזמינות של חיבור לרשת החשמל היא מדד חשוב יותר ממספר שורות הקוד שנכתבו. הבנת מרכזי הכוח הפיזיים הללו היא הדרך היחידה להבין לאן הטכנולוגיה הולכת ב-. העתיד הוא לא רק בענן. הוא באדמה, בחוטים ובמים שהופכים את הענן לאפשרי.
הערת העורך: יצרנו אתר זה כמרכז חדשות ומדריכים רב-לשוני בנושא בינה מלאכותית עבור אנשים שאינם "גיקים" של מחשבים, אך עדיין רוצים להבין בינה מלאכותית, להשתמש בה בביטחון רב יותר, ולעקוב אחר העתיד שכבר מגיע.
מצאת שגיאה או משהו שצריך לתקן? ספר לנו.