Co się stanie, gdy zimna wojna AI stanie się gorętsza?
Globalna rywalizacja o dominację w dziedzinie sztucznej inteligencji zmienia się z bitwy na algorytmy w wojnę na wyczerpanie o zasoby fizyczne. Wielu obserwatorów zakłada, że wyścig ten wygra naród z najbardziej utalentowanymi inżynierami oprogramowania lub najsprytniejszym kodem. To fundamentalne niezrozumienie obecnej sytuacji. Prawdziwym zwycięzcą będzie podmiot, który zdoła zabezpieczyć najwięcej wysokiej klasy półprzewodników oraz ogromne ilości energii elektrycznej potrzebnej do ich zasilania. Odchodzimy od świata otwartej współpracy akademickiej w stronę okresu głębokiego protekcjonizmu technologicznego. Ta zmiana nastąpiła, ponieważ rządy zdały sobie sprawę, że duże modele językowe są nowym fundamentem obronności narodowej i produktywności gospodarczej. Jeśli napięcie między Stanami Zjednoczonymi a Chinami będzie nadal eskalować, globalna branża technologiczna podzieli się na dwa odrębne i niekompatybilne ekosystemy. To nie jest odległa możliwość. To proces, który już trwa. Firmy są zmuszane do opowiedzenia się po jednej ze stron, decydując, gdzie przechowywać dane i jaki sprzęt kupować. Era zunifikowanego, globalnego internetu dobiega końca.
Poza szumem wokół chatbotów
Częstym pytaniem osób nowych w tym temacie jest to, czy któraś ze stron obecnie wygrywa. Trudno na to odpowiedzieć, ponieważ dwaj główni gracze prowadzą różne gry. Stany Zjednoczone obecnie przodują w badaniach podstawowych i surowej wydajności modeli. Większość największych i najbardziej zdolnych modeli jest produkowana przez amerykańskie firmy. Jednak Chiny przodują w szybkim wdrażaniu tych technologii i ich integracji z produkcją przemysłową. Powszechnym błędnym przekonaniem jest to, że amerykańskie zakazy eksportu wysokiej klasy chipów całkowicie zatrzymały chiński postęp. To nieprawda. Zamiast tego ograniczenia te zmusiły chińskie firmy do zostania mistrzami optymalizacji. Znajdują one innowacyjne sposoby trenowania ogromnych modeli na mniej wydajnym sprzęcie i budują własne krajowe łańcuchy dostaw półprzewodników. Stworzyło to dwudzielny rynek, na którym firmy zachodnie skupiają się na skali, a wschodnie na wydajności.
Koncentracja rywalizacji zmieniła się niedawno z trenowania modeli na ich uruchamianie na dużą skalę. To tutaj wąskie gardło sprzętowe staje się kryzysem dla wszystkich zaangażowanych. Jeśli firma nie ma dostępu do najnowszych chipów Nvidia H100 lub B200, musi zużyć znacznie więcej energii elektrycznej, aby osiągnąć te same wyniki. Tworzy to ogromną niekorzyść ekonomiczną w świecie, w którym ceny energii są zmienne. Rywalizacja dotyczy teraz tego, kto potrafi zbudować najbardziej wydajne data centers i zabezpieczyć najbardziej niezawodne sieci energetyczne. Nie chodzi już tylko o to, kto ma najlepsze wzory matematyczne. Fizyczna infrastruktura AI staje się równie ważna, co sam kod. Ta zmiana została przyspieszona przez uświadomienie sobie, że moc obliczeniowa jest zasobem skończonym. Nie można jej łatwo udostępnić ani powielić bez ogromnych nakładów kapitałowych.
Wielkie rozdzielenie
Globalnym skutkiem tego tarcia jest całkowita reorganizacja łańcucha dostaw technologii. Obserwujemy wzrost suwerennej AI. Oznacza to, że narody nie chcą już polegać na zagranicznych dostawcach cloud dla swoich krytycznych informacji. Chcą własnych modeli trenowanych na własnych danych i działających na serwerach zlokalizowanych wewnątrz własnych granic. Nie chcą ryzykować odcięcia od niezbędnych usług podczas sporu handlowego lub kryzysu dyplomatycznego. Prowadzi to do rozdrobnionego świata, w którym standardy techniczne różnią się w zależności od regionu. Małe narody są zmuszane do wyboru strony, aby uzyskać dostęp do najbardziej zaawansowanych narzędzi. To nie jest tylko kwestia oprogramowania. To bitwa o kontrolę nad fizycznymi kablami i fabrykami, które produkują komponenty współczesnego świata.
Wiele osób uważa, że to tylko wojna handlowa o dobra konsumpcyjne, takie jak smartfony. W rzeczywistości jest to bitwa o przyszłość globalnych trendów sztucznej inteligencji i sposób ich zarządzania. Jeśli świat się podzieli, stracimy zdolność do dzielenia się krytycznymi badaniami nad bezpieczeństwem. To czyni technologię bardziej niebezpieczną dla wszystkich. Kiedy naukowcy nie mogą rozmawiać ze sobą ponad granicami, nie mogą uzgodnić podstawowych standardów bezpieczeństwa ani wytycznych etycznych. Tworzy to wyścig na dno, w którym szybkość jest priorytetem przed bezpieczeństwem. Niedawna zmiana w polityce USA, ograniczająca nawet dostęp do cloud dla niektórych regionów, pokazuje, jak poważna stała się sytuacja. Nie chodzi już tylko o wysyłkę sprzętu. Chodzi o kontrolowanie samej zdolności do obliczeń. Ten poziom kontroli jest bezprecedensowy w historii technologii.
Życie w strefie tarcia
Rozważmy codzienną rzeczywistość programisty w startupie w Azji Południowo-Wschodniej. W poprzedniej dekadzie korzystałby z API opartego na rozwiązaniach z USA dla swojej logiki rdzeniowej i chińskiego dostawcy dla logistyki produkcyjnej. Dziś stoi przed ścianą zgodności. Korzystanie z amerykańskiego API może sprawić, że nie będzie kwalifikował się do niektórych lokalnych dotacji rządowych lub partnerstw regionalnych. Korzystanie z chińskiego sprzętu może spowodować zakaz sprzedaży jego produktu na rynku amerykańskim. To codzienna rzeczywistość nowego podziału technologicznego. Ci programiści spędzają więcej czasu na zgodności prawnej niż na faktycznym kodowaniu. Muszą utrzymywać dwie różne wersje swojego produktu. Jedna wersja działa na wysokiej klasy zachodnich chipach dla klientów międzynarodowych. Druga wersja jest zoptymalizowana pod kątem krajowych alternatyw do użytku lokalnego. To dodaje ogromne koszty ogólne i spowalnia tempo innowacji.
Typowy dzień tego programisty obejmuje sprawdzanie zaktualizowanych list kontroli eksportu przed wypchnięciem kodu do repozytorium. Muszą upewnić się, że ich dane treningowe nie przekraczają pewnych granic geograficznych. To tarcie jest szkodą uboczną zimnej wojny AI. Nie chodzi tylko o gigantyczne korporacje, takie jak Nvidia czy Huawei. Chodzi o tysiące małych firm uwięzionych w środku. Widzimy to w sposobie, w jaki firmy przenoszą teraz swoje siedziby do neutralnych stref, takich jak Singapur czy Dubaj. Próbują znaleźć złoty środek, który może nie istnieć zbyt długo. Presja na wybór strony jest stała i rośnie. To środowisko sprzyja dużym podmiotom, które stać na zespoły prawne do zarządzania tymi złożonościami. Utrudnia to małemu zespołowi zbudowanie czegoś, co dotrze do globalnej publiczności.
BotNews.today wykorzystuje narzędzia AI do badania, pisania, edytowania i tłumaczenia treści. Nasz zespół przegląda i nadzoruje ten proces, aby informacje były użyteczne, jasne i wiarygodne.
Wpływ rozciąga się również na poziom konsumencki. Użytkownicy w różnych regionach zaczynają widzieć różne wersje tych samych narzędzi. Model dostępny w jednym kraju może mieć surowe ograniczenia lub inne dane treningowe niż ten sam model w innym kraju. Tworzy to splinternet inteligencji. Bezproblemowe doświadczenie wczesnego internetu jest zastępowane przez patchwork regionalnych regulacji i barier technicznych. Nie chodzi tu tylko o cenzurę. Chodzi o fundamentalną architekturę narzędzi, których używamy do myślenia i pracy. Produkty, które sprawiają, że ten argument wydaje się prawdziwy, to zlokalizowane LLMs rozwijane w regionach takich jak Bliski Wschód i Europa. Modele te zostały zaprojektowane tak, aby odzwierciedlać lokalne wartości i języki, pozostając jednocześnie niezależnymi od dwóch głównych bloków siłowych.
Koszt wygranej
Musimy zadać trudne pytania o ukryte koszty tej rywalizacji. Jeśli stawiamy bezpieczeństwo narodowe ponad wszystko inne, czy poświęcamy samą innowację, którą próbujemy chronić? Wymagania energetyczne dla tych ogromnych klastrów GPU są oszałamiające. Niektóre szacunki sugerują, że pojedynczy duży trening modelu zużywa tyle energii, co małe miasto. Kto za to płaci? Czy podatnik poprzez dotacje rządowe? A może konsument poprzez wyższe ceny? Inne pytanie dotyczy kompromisu między prywatnością a postępem. W wyścigu o zbudowanie najpotężniejszych modeli, czy rządy zignorują przepisy o ochronie danych, aby nakarmić maszyny? Istnieje ryzyko, że potrzeba większej ilości danych doprowadzi do sponsorowanej przez państwo inwigilacji na skalę, jakiej nigdy wcześniej nie widzieliśmy.
Ograniczenia obecnego sprzętu są również głównym czynnikiem. Osiągamy fizyczne granice tego, jak małe możemy uczynić tranzystory na płytce krzemowej. Jeśli nie zdołamy wyjść z tego poprzez innowacje, wyścig AI stanie się wojną o to, kto zbuduje największy stos krzemu. To nie jest zrównoważone dla planety. Widzimy już raporty z Reuters o ogromnym zużyciu wody potrzebnej do chłodzenia data centers. Widzimy również raport The New York Times na temat napięć geopolitycznych wokół produkcji chipów na Tajwanie. To nie są tylko historie technologiczne. To kryzysy środowiskowe i polityczne. Musimy zapytać, czy korzyści z nieco szybszej AI są warte potencjalnego zniszczenia naszych wspólnych zasobów. Sceptycznym punktem jest tutaj to, czy dążenie do sztucznej inteligencji faktycznie czyni nasz fizyczny świat bardziej kruchym.
Masz historię, narzędzie, trend lub pytanie dotyczące sztucznej inteligencji, które Twoim zdaniem powinniśmy omówić? Prześlij nam swój pomysł na artykuł — chętnie go poznamy.
Pod maską lokalnych obliczeń
Dla power users i programistów prawdziwa historia kryje się w workflow. Obserwujemy ogromne przejście od scentralizowanych API w stronę lokalnej inferencji. Jest to napędzane zarówno kosztami, jak i strachem przed odcięciem od usług zewnętrznych. Użytkownicy wysokiej klasy przyglądają się technikom kwantyzacji, aby uruchamiać duże modele na sprzęcie klasy konsumenckiej. Używają narzędzi, aby wycisnąć wydajność z ograniczonej VRAM. Limity API narzucone przez głównych dostawców stają się głównym wąskim gardłem dla zautomatyzowanych workflow. Programista może mieć limit 100 zapytań na minutę w modelu najwyższej klasy. To po prostu za mało dla środowiska produkcyjnego. Aby to rozwiązać, budują systemy hybrydowe, które wykorzystują ogromny model cloud do złożonego rozumowania i mały, lokalny model do rutynowych zadań.
- Kwantyzacja pozwala na uruchamianie 4-bitowych lub 8-bitowych wersji modeli na standardowych GPU.
- Lokalne przechowywanie danych treningowych staje się obowiązkowe, aby uniknąć wysokich opłat za transfer danych od dostawców cloud.
- Edge AI przenosi przetwarzanie na urządzenie, aby zmniejszyć opóźnienia i poprawić prywatność danych.
Wymaga to głębokiego zrozumienia architektury sprzętowej. Nie można już po prostu wywołać API i oczekiwać, że będzie działać na dużą skalę. Trzeba rozumieć przepustowość pamięci lokalnych maszyn i opóźnienia sieci. Użytkownicy coraz częściej zwracają się ku modelom open source, które można hostować na prywatnych serwerach. Zapewnia to poziom kontroli, któremu własnościowe API nie mogą dorównać. Według badań MIT Technology Review, przejście w stronę lokalnych obliczeń jest jednym z najważniejszych trendów w branży. Pozwala na większą personalizację i lepsze bezpieczeństwo. Wymaga to jednak większej wiedzy technicznej. Przepaść między zwykłym użytkownikiem a power userem się powiększa. Power user w zasadzie staje się architektem systemów, który zarządza złożoną siecią lokalnych i cloud zasobów.
Otwarte pytanie
Wniosek jest taki, że zimna wojna AI nie jest już teoretyczną debatą. To fizyczna rzeczywistość, która zmienia globalną gospodarkę. Przejście od otwartej współpracy do strzeżonych tajemnic jest prawie zakończone. Pozostajemy w świecie, w którym technologia jest główną bronią polityki państwowej. Najważniejsze pytanie pozostaje bez odpowiedzi. Czy możemy rozwijać bezpieczną i korzystną AI w świecie, który jest fundamentalnie podzielony? Jeśli dwie strony nie potrafią uzgodnić podstawowych zasad, możemy znaleźć się w wyścigu, którego nikt nie wygra. Sprzeczności są jasne. Chcemy korzyści z globalnego ekosystemu technologicznego, ale nie chcemy zaakceptować ryzyka współzależności. To napięcie zdefiniuje następną dekadę. Niezależnie od tego, czy będziemy patrzeć wstecz na ten moment jako punkt zwrotny, wynikiem jest świat, w którym kod, który piszemy, jest nierozerwalnie związany z granicami, które wyznaczamy.
Uwaga redakcji: Stworzyliśmy tę stronę jako wielojęzyczne centrum wiadomości i przewodników na temat sztucznej inteligencji dla osób, które nie są komputerowymi maniakami, ale nadal chcą zrozumieć sztuczną inteligencję, używać jej z większą pewnością i śledzić przyszłość, która już nadchodzi.
Znalazłeś błąd lub coś, co wymaga poprawy? Daj nam znać.