מה יקרה אם המלחמה הקרה של ה-AI תתחמם?
התחרות העולמית על עליונות בבינה מלאכותית עוברת מקרב של אלגוריתמים למלחמת התשה על משאבים פיזיים. משקיפים רבים מניחים שהמנצחת במירוץ הזה תהיה המדינה עם מהנדסי התוכנה המוכשרים ביותר או הקוד החכם ביותר. זוהי אי-הבנה בסיסית של המצב הנוכחי. המנצח האמיתי יהיה הגוף שיצליח להבטיח לעצמו את מרבית ה-semiconductors המתקדמים ואת כמויות החשמל העצומות הנדרשות להפעלתם. אנחנו מתרחקים מעולם של שיתוף פעולה אקדמי פתוח ונכנסים לתקופה של פרוטקציוניזם טכנולוגי עמוק. השינוי הזה קרה כי ממשלות הבינו ש-large language models הם הבסיס החדש ל**הגנה לאומית ופריון כלכלי**. אם המתיחות בין ארצות הברית לסין תמשיך להסלים, תעשיית הטק העולמית תתפצל לשתי אקו-סיסטמות נפרדות ולא תואמות. זו לא אפשרות רחוקה, אלא תהליך שכבר בעיצומו. חברות נאלצות לבחור צד כשהן מחליטות היכן לאחסן את ה-data שלהן ואילו חומרה לרכוש. עידן האינטרנט המאוחד והגלובלי מגיע לסיומו.
מעבר להייפ של הצ'אטבוטים
שאלה נפוצה בקרב מי שחדש בנושא היא האם צד אחד מנצח כרגע. קשה לענות על כך כי שני השחקנים העיקריים משחקים משחקים שונים. ארצות הברית מובילה כרגע במחקר בסיסי ובביצועי מודלים גולמיים. רוב המודלים הגדולים והיכולתיים ביותר מיוצרים על ידי חברות אמריקאיות. עם זאת, סין מובילה בפריסה מהירה של הטכנולוגיות הללו ובשילובן בייצור תעשייתי. תפיסה מוטעית מרכזית היא שהאיסורים האמריקאיים על ייצוא שבבים מתקדמים עצרו לחלוטין את ההתקדמות הסינית. זה לא נכון. במקום זאת, המגבלות הללו אילצו חברות סיניות להפוך לאמניות באופטימיזציה. הן מוצאות דרכים חדשניות לאמן מודלים ענקיים על חומרה פחות חזקה ובונות שרשראות אספקה מקומיות ל-semiconductors. זה יצר שוק מפוצל שבו חברות מערביות מתמקדות בקנה מידה, בעוד חברות מזרחיות מתמקדות ביעילות.
המיקוד בתחרות עבר לאחרונה מאימון מודלים להרצתם בקנה מידה רחב. כאן צוואר הבקבוק של החומרה הופך למשבר עבור כל המעורבים. אם חברה לא יכולה לגשת לשבבי Nvidia H100 או B200 העדכניים, היא חייבת להשתמש בהרבה יותר חשמל כדי להשיג את אותן תוצאות. זה יוצר חיסרון כלכלי עצום בעולם שבו מחירי האנרגיה תנודתיים. התחרות כעת היא על מי יכול לבנות את ה-data centers היעילים ביותר ולהבטיח את רשתות החשמל האמינות ביותר. זה כבר לא רק על מי שיש לו את הנוסחאות המתמטיות הטובות ביותר. התשתית הפיזית של ה-AI הופכת חשובה לא פחות מהקוד עצמו. השינוי הזה הואץ על ידי ההבנה ש-compute power הוא משאב סופי. אי אפשר לשתף או לשכפל אותו בקלות ללא השקעת הון מאסיבית.
הניתוק הגדול
ההשפעה העולמית של החיכוך הזה היא ארגון מחדש מוחלט של שרשרת האספקה הטכנולוגית. אנחנו רואים את עליית ה-sovereign AI. זה אומר שמדינות כבר לא מוכנות להסתמך על ספקי cloud זרים עבור המידע הקריטי שלהן. הן רוצות מודלים משלהן, מאומנים על ה-data שלהן ורצים על שרתים שנמצאים בתוך הגבולות שלהן. הן לא רוצות להסתכן בניתוק משירותים חיוניים במהלך סכסוך סחר או משבר דיפלומטי. זה מוביל לעולם מפוצל שבו תקנים טכניים משתנים לפי אזור. מדינות קטנות נאלצות לבחור צד כדי לקבל גישה לכלים המתקדמים ביותר. זו לא רק בעיית תוכנה. זה קרב על שליטה בכבלים הפיזיים ובמפעלים שמייצרים את רכיבי העולם המודרני.
רבים חושבים שזו רק מלחמת סחר על מוצרי צריכה כמו סמארטפונים. בפועל, זה קרב על עתיד מגמות ה-AI העולמיות ועל האופן שבו הן מנוהלות. אם העולם יתפצל, נאבד את היכולת לשתף מחקרי בטיחות קריטיים. זה הופך את הטכנולוגיה למסוכנת יותר עבור כולם. כשחוקרים לא יכולים לדבר זה עם זה מעבר לגבולות, הם לא יכולים להסכים על תקני בטיחות בסיסיים או הנחיות אתיות. זה יוצר מרוץ לתחתית שבו המהירות מקבלת עדיפות על פני האבטחה. השינוי האחרון במדיניות ארה"ב להגביל אפילו גישת cloud לאזורים מסוימים מראה עד כמה המצב הפך רציני. זה כבר לא רק על משלוח חומרה. זה על שליטה בעצם היכולת לבצע חישובים. רמת שליטה כזו היא חסרת תקדים בהיסטוריה של הטכנולוגיה.
חיים באזור החיכוך
חשבו על המציאות היומיומית של מפתח ב-startup בדרום-מזרח אסיה. בעשור הקודם, הוא היה משתמש ב-API אמריקאי עבור הלוגיקה המרכזית שלו ובספק סיני עבור לוגיסטיקת הייצור. היום, הוא ניצב מול קיר של ציות. שימוש ב-API אמריקאי עלול להפוך אותו ללא זכאי למענקים ממשלתיים מקומיים או לשותפויות אזוריות. שימוש בחומרה סינית עלול להוביל לחסימת המוצר שלו מהשוק האמריקאי. זו המציאות היומיומית של הפיצול הטכנולוגי החדש. המפתחים הללו מבלים יותר זמן על ציות משפטי מאשר על כתיבת קוד בפועל. הם חייבים לתחזק שתי גרסאות שונות של המוצר שלהם. גרסה אחת רצה על שבבים מערביים מתקדמים עבור לקוחות בינלאומיים. הגרסה השנייה מותאמת לחלופות מקומיות לשימוש פנימי. זה מוסיף תקורה עצומה ומאט את קצב החדשנות.
יום טיפוסי עבור מפתח כזה כולל בדיקת רשימות בקרת ייצוא מעודכנות לפני דחיפת קוד ל-repository. הם חייבים לוודא שה-data של האימון שלהם לא חוצה גבולות גיאוגרפיים מסוימים. החיכוך הזה הוא נזק אגבי של המלחמה הקרה של ה-AI. זה לא רק על תאגידי ענק כמו Nvidia או Huawei. זה על אלפי חברות קטנות שתקועות באמצע. אנחנו רואים את זה בדרך שבה חברות מעבירות כעת את המטה שלהן לאזורים ניטרליים כמו סינגפור או דובאי. הן מנסות למצוא דרך אמצע שאולי לא תתקיים לאורך זמן. הלחץ לבחור צד הוא קבוע וגובר. הסביבה הזו מעדיפה שחקנים גדולים שיכולים להרשות לעצמם צוותים משפטיים כדי לנהל את המורכבויות הללו. זה מקשה הרבה יותר על צוות קטן לבנות משהו שמגיע לקהל עולמי.
BotNews.today משתמש בכלי AI כדי לחקור, לכתוב, לערוך ולתרגם תוכן. הצוות שלנו בודק ומפקח על התהליך כדי לשמור על המידע שימושי, ברור ואמין.
ההשפעה מתרחבת גם לרמת הצרכן. משתמשים באזורים שונים מתחילים לראות גרסאות שונות של אותם כלים. מודל שזמין במדינה אחת עשוי לכלול מגבלות מחמירות או נתוני אימון שונים מאותו מודל במדינה אחרת. זה יוצר "ספלינטרנט" של בינה. החוויה החלקה של האינטרנט המוקדם מוחלפת בטלאים של רגולציות אזוריות ומחסומים טכניים. זה לא רק על צנזורה. זה על הארכיטקטורה הבסיסית של הכלים שבהם אנחנו משתמשים כדי לחשוב ולעבוד. המוצרים שהופכים את הטיעון הזה למוחשי הם ה-LLMs המקומיים שמפותחים באזורים כמו המזרח התיכון ואירופה. המודלים הללו מתוכננים לשקף ערכים ושפות מקומיות תוך שמירה על עצמאות משני גושי הכוח העיקריים.
המחיר של הניצחון
אנחנו חייבים לשאול שאלות קשות על העלויות הנסתרות של התחרות הזו. אם אנחנו נותנים עדיפות לביטחון לאומי מעל הכל, האם אנחנו מקריבים את החדשנות שאנחנו מנסים להגן עליה? דרישות האנרגיה עבור אשכולות ה-GPU הענקיים הללו הן מדהימות. הערכות מסוימות מציעות שריצת אימון גדולה אחת צורכת כוח כמו עיר קטנה. מי משלם על זה? האם זה משלם המסים דרך סובסידיות ממשלתיות? או שזה הצרכן דרך מחירים גבוהים יותר? שאלה נוספת נוגעת לטרייד-אוף בין פרטיות להתקדמות. במרוץ לבניית המודלים החזקים ביותר, האם ממשלות יתעלמו מחוקי הגנת ה-data כדי להאכיל את המכונות? קיים סיכון שהצורך בעוד נתונים יוביל למעקב בחסות המדינה בקנה מידה שמעולם לא ראינו קודם לכן.
המגבלות של החומרה הנוכחית הן גם גורם מרכזי. אנחנו מגיעים לגבולות הפיזיים של כמה קטנים אנחנו יכולים להפוך טרנזיסטורים על פרוסת סיליקון. אם לא נוכל לחדש את דרכנו החוצה מזה, מרוץ ה-AI יהפוך למלחמה על מי יכול לבנות את ערימת הסיליקון הגדולה ביותר. זה לא בר-קיימא עבור כדור הארץ. אנחנו כבר רואים דיווחים מ-Reuters על צריכת המים המסיבית הנדרשת לקירור ה-data centers. אנחנו גם רואים את The New York Times מדווח על המתיחויות הגיאופוליטיות סביב ייצור שבבים בטייוואן. אלו לא רק סיפורי טק. אלו משברים סביבתיים ופוליטיים. אנחנו חייבים לשאול אם היתרונות של AI מהיר במעט שווים את ההרס הפוטנציאלי של המשאבים המשותפים שלנו. העוגן הספקני כאן הוא האם המרדף אחר בינה מלאכותית אכן הופך את העולם הפיזי שלנו לשברירי יותר.
יש לכם סיפור, כלי, טרנד או שאלה הקשורים ל-AI שלדעתכם כדאי לנו לסקר? שלחו לנו את רעיון המאמר שלכם — נשמח לשמוע.
מתחת למכסה המנוע של ה-Local Compute
עבור ה-power users והמפתחים, הסיפור האמיתי נמצא ב-workflow. אנחנו רואים מעבר מאסיבי מ-APIs מרכזיים לעבר local inference. זה מונע גם על ידי עלות וגם על ידי הפחד מניתוק משירותים חיצוניים. משתמשים מתקדמים בוחנים טכניקות quantization כדי להריץ מודלים גדולים על חומרה ברמת צרכן. הם משתמשים בכלים כדי לסחוט ביצועים מ-VRAM מוגבל. מגבלות ה-API המוטלות על ידי ספקים גדולים הופכות לצוואר בקבוק משמעותי עבור workflows אוטומטיים. מפתח עשוי להיתקל במגבלה של 100 בקשות לדקה במודל ברמה גבוהה. זה פשוט לא מספיק עבור סביבת ייצור. כדי לפתור זאת, הם בונים מערכות היברידיות שמשתמשות במודל cloud ענק עבור הסקה מורכבת ובמודל מקומי קטן עבור משימות שגרתיות.
- Quantization מאפשר לגרסאות 4-bit או 8-bit של מודלים לרוץ על GPUs סטנדרטיים.
- אחסון מקומי של נתוני אימון הופך לחובה כדי להימנע מעמלות egress גבוהות מספקי cloud.
- Edge AI מעביר את העיבוד למכשיר כדי להפחית latency ולשפר את פרטיות ה-data.
זה דורש הבנה עמוקה של ארכיטקטורת חומרה. אתה כבר לא יכול פשוט לקרוא ל-API ולצפות שזה יעבוד בקנה מידה רחב. אתה חייב להבין את ה-memory bandwidth של המכונות המקומיות שלך ואת ה-latency של הרשת שלך. משתמשים פונים יותר ויותר למודלים open source שניתן לארח על שרתים פרטיים. זה מספק רמת שליטה ש-APIs קנייניים לא יכולים להשתוות אליה. על פי מחקר של MIT Technology Review, המעבר לעבר local compute הוא אחד הטרנדים המשמעותיים ביותר בתעשייה. זה מאפשר יותר התאמה אישית ואבטחה טובה יותר. עם זאת, זה גם דורש יותר מומחיות טכנית. הפער בין משתמש מזדמן ל-power user מתרחב. ה-power user הופך למעשה לארכיטקט מערכות שמנהל רשת מורכבת של משאבים מקומיים ומשאבי cloud.
השאלה הפתוחה
בשורה התחתונה, המלחמה הקרה של ה-AI היא כבר לא ויכוח תיאורטי. זו מציאות פיזית שמעצבת מחדש את הכלכלה העולמית. המעבר משיתוף פעולה פתוח לסודות שמורים כמעט הושלם. נותרנו עם עולם שבו טכנולוגיה היא נשק עיקרי של מדינאות. השאלה החשובה ביותר נותרת ללא מענה. האם נוכל לפתח AI בטוח ומועיל בעולם שמפוצל מיסודו? אם שני הצדדים לא יכולים להסכים על חוקים בסיסיים, אנו עלולים למצוא את עצמנו במרוץ שאף אחד לא יכול לנצח בו. הסתירות ברורות. אנחנו רוצים את היתרונות של אקו-סיסטם טכנולוגי גלובלי, אבל אנחנו לא מוכנים לקבל את הסיכונים של תלות הדדית. המתיחות הזו תגדיר את העשור הבא. בין אם נסתכל אחורה על 2026 כעל נקודת המפנה, התוצאה היא עולם שבו הקוד שאנחנו כותבים אינו נפרד מהגבולות שאנחנו משרטטים.
הערת העורך: יצרנו אתר זה כמרכז חדשות ומדריכים רב-לשוני בנושא בינה מלאכותית עבור אנשים שאינם "גיקים" של מחשבים, אך עדיין רוצים להבין בינה מלאכותית, להשתמש בה בביטחון רב יותר, ולעקוב אחר העתיד שכבר מגיע.
מצאת שגיאה או משהו שצריך לתקן? ספר לנו.