Nvidia, AMD ja uusi laskentatehokilpailu
Globaali teknologiateollisuus elää parhaillaan murrosta siinä, miten teho määritellään ja jaetaan. Vuosikymmenten ajan keskusprosessori (CPU) oli jokaisen koneen sydän, mutta se aikakausi on ohi. Nykyään huomio on siirtynyt erikoistuneisiin piireihin, jotka on suunniteltu käsittelemään modernin tekoälyn vaatimia valtavia matemaattisia työkuormia. Kyse ei ole vain kilpailusta siitä, kuka valmistaa nopeimman komponentin. Kyse on laskentatehon hallinnasta. Nvidia ja AMD ovat tämän tarinan päätoimijoita, mutta kyse on paljon muustakin kuin vain raudasta. Se koskee infrastruktuurin hallintaa, joka määrittää ohjelmistokehityksen seuraavan vuosikymmenen. Panokset ovat korkeat, sillä voittaja ei myy vain tuotetta, vaan luo alustan, jota muiden on käytettävä pysyäkseen relevantteina. Tämä siirtymä yleislaskennasta kiihdytettyyn laskentaan edustaa perustavanlaatuista muutosta teknologian maailman hierarkiassa.
Näkymätön koodi, joka kahlitsee pilven
Ymmärtääkseen, miksi yksi yritys hallitsee tätä alaa, on katsottava fyysistä sirua pidemmälle. Useimmat tarkkailijat keskittyvät transistorien määrään tai grafiikkaprosessorin (GPU) kellotaajuuteen. Todellinen voima piilee kuitenkin ohjelmistokerroksessa, joka sijaitsee raudan ja kehittäjän välissä. Nvidia käytti lähes kaksi vuosikymmentä rakentaakseen CUDA-nimisen suljetun ympäristön. Tämä ympäristö mahdollistaa GPU:n rinnakkaislaskentatehon hyödyntämisen tehtävissä, joilla ei ole mitään tekemistä grafiikan kanssa. Koska niin suuri osa olemassa olevasta koodista on kirjoitettu juuri tälle ympäristölle, kilpailijalle vaihtaminen ei ole niin yksinkertaista kuin kortin vaihtaminen. Se vaatii tuhansien monimutkaisten koodirivien uudelleenkirjoittamista. Tämä on se ohjelmistomuuri, joka estää jopa parhaiten rahoitettuja kilpailijoita saavuttamasta nopeaa jalansijaa. Se luo tilanteen, jossa rauta on käytännössä pääsylippu tiettyyn ohjelmistoekosysteemiin.
AMD yrittää vastata tähän avoimen lähdekoodin lähestymistavalla nimeltä ROCm. Heidän strategiansa on tarjota varteenotettava vaihtoehto, joka ei lukitse kehittäjiä yhteen toimittajaan. Vaikka heidän uusin rautansa, kuten MI300-sarja, osoittaa merkittävää potentiaalia raa’assa suorituskyvyssä, ohjelmistokuilu on edelleen merkittävä este. Monet kehittäjät huomaavat, että uusimmat työkalut ja kirjastot on optimoitu ensisijaisesti Nvidialle, jolloin muut alustat jäävät jälkeen. Tämä dynamiikka vahvistaa markkinajohtajan asemaa. Jos olet insinööri, joka yrittää saada mallin toimimaan tänään, menet sinne, missä dokumentaatio on kattavinta ja bugit jo löydetty. Voit löytää lisätietoja uusimmista GPU-arkkitehtuurin edistysaskelista virallisen teknisen dokumentaation kautta. Tekoälyn infrastruktuurin ymmärtäminen on välttämätöntä jokaiselle, joka yrittää ennustaa, mistä seuraava innovaatioaalto syntyy. Kilpailu koskee nykyään yhtä lailla kehittäjäkokemusta kuin itse piitä.
Geopoliittinen monopoli älykkyydestä
Tämän laskentatehokilpailun seuraukset ulottuvat kauas Piilaakson taseiden ulkopuolelle. Näemme vallan keskittymistä, joka vetää vertoja 1900-luvun öljymonopoleille. Kourallinen suuria pilvipalveluntarjoajia, kuten Microsoft, Amazon ja Google, ovat näiden huipputason sirujen ensisijaisia ostajia. Tämä luo palautekierteen, jossa suurimmat yritykset saavat parhaan raudan ensin, mikä mahdollistaa tehokkaampien mallien rakentamisen, mikä puolestaan tuottaa enemmän tuloja entistä suurempien laitehankintojen tekemiseen. Tämä resurssien keskittyminen tarkoittaa, että pienemmät toimijat ja jopa kokonaiset kansakunnat huomaavat jäävänsä kasvavan kuilun väärälle puolelle. Ne, joilla on pääsy massiivisiin laskentaklustereihin, voivat innovoida vauhdilla, joka on mahdotonta muille. Tämä on johtanut kaksitasoiseen järjestelmään teknologiateollisuudessa: laskentatehon suhteen rikkaisiin ja köyhiin.
Hallitukset ovat huomanneet tämän epätasapainon. Piitä pidetään nyt strategisena, kansallisesti tärkeänä resurssina. Vientirajoituksia on otettu käyttöön estämään kehittyneiden sirujen päätyminen tietyille alueille, mikä käyttää rautaa ulkopolitiikan välineenä. Nämä rajoitukset eivät koske vain sotilaallisen käytön estämistä. Kyse on siitä, että varmistetaan seuraavan sukupolven ohjelmistojen taloudellisten hyötyjen pysyminen tietyillä rajojen sisäpuolella. Näiden sirujen toimitusketju on myös uskomattoman hauras. Suurin osa kehittyneestä valmistuksesta tapahtuu yhdessä paikassa Taiwanissa, mikä luo koko maailmantaloudelle yhden kriittisen haavoittuvuuspisteen. Näimme, kuinka toimitusrajoitteet voivat pysäyttää tuotannon useilla toimialoilla. Jos huipputason GPU-sirujen virta pysähtyisi, modernien ohjelmistojen kehitys käytännössä jäätyisi. Tämä riippuvuus muutamasta yrityksestä ja yhdestä valmistuskumppanista on riski, jota monet analyytikot pitävät markkinoilla vielä alihinnoiteltuna. Reutersin raporttien mukaan nämä toimitusketjun haavoittuvuudet ovat globaalien kauppasääntelijöiden ensisijainen huolenaihe.
Laskentatehon nälän korkea hinta
Pohdi startup-yrittäjän päivittäistä todellisuutta nykyisessä ympäristössä. Heidän ensisijainen huolensa ei ole enää vain parhaiden osaajien palkkaaminen tai tuotteen markkinoiden löytäminen. Sen sijaan he käyttävät merkittävän osan ajastaan palvelinajan neuvottelemiseen. Tyypillisenä päivänä yrittäjä saattaa aloittaa tarkistamalla polttotahtinsa (burn rate), vain huomatakseen, että suurin osa pääomasta menee suoraan pilvipalveluntarjoajalle H100-klustereiden vuokraamiseen. He eivät voi ostaa siruja suoraan, koska toimitusajat ovat kuukausien mittaisia, ja heiltä puuttuu jäähdytysinfrastruktuuri niiden paikalliseen käyttöön. Heidän on pakko odottaa digitaalisessa jonossa toivoen, ettei suurempi asiakas tarjoa heitä korkeampaa hintaa etuoikeutetusta pääsystä. Tämä on kaukana internetin alkuajoista, jolloin muutama halpa palvelin riitti tukemaan globaalia alustaa. Vakavan kehitystyön aloituskustannukset ovat nousseet tuhansista dollareista miljooniin.
Päivä jatkuu kamppailulla teknistä velkaa vastaan. Koska he käyttävät vuokrattua rautaa, heidän on optimoitava jokainen sekunti koulutusaikaa. Jos työ epäonnistuu pienen koodivirheen vuoksi, se voi maksaa tuhansia dollareita hukkaan heitettyä laskenta-aikaa. Tämä paine tukahduttaa kokeilunhalun. Kehittäjät kokeilevat harvemmin radikaaleja uusia ideoita, kun epäonnistumisen hinta on näin korkea.
BotNews.today käyttää tekoälytyökaluja sisällön tutkimiseen, kirjoittamiseen, muokkaamiseen ja kääntämiseen. Tiimimme tarkistaa ja valvoo prosessia pitääkseen tiedon hyödyllisenä, selkeänä ja luotettavana.
Suljetun piin piilotettu vero
Kun siirrymme syvemmälle tähän kiihdytetyn laskennan aikakauteen, meidän on kysyttävä vaikeita kysymyksiä pitkän aikavälin seurauksista. Onko terveellistä, että modernin teknologian perustaa hallitsee näin pieni määrä toimijoita? Kun yksi yritys tarjoaa raudan, ohjelmistoympäristön ja verkkoyhteydet, he käytännössä omistavat koko pinon. Tämä luo innovaatioille piilotetun veron. Jokainen kehittäjä, joka kirjoittaa koodia suljetulle järjestelmälle, edistää monopolia, jota on päivä päivältä vaikeampi murtaa. Mitä tapahtuu datan yksityisyydelle, kun sen on kuljettava näiden erikoistuneiden sirujen läpi jaetussa pilviympäristössä? Vaikka palveluntarjoajat väittävät datan olevan eristettyä, jaetun piin fyysinen todellisuus viittaa siihen, että uudenlaiset sivukanavahyökkäykset voisivat olla mahdollisia. Vaihdamme läpinäkyvyyden suorituskykyyn, eikä tuon kaupan koko hintaa vielä tunneta.
Kysymys on myös ympäristön kestävyydestä. Näiden uusien datakeskusten tehontarve on huimaava. Rakennamme massiivisia tiloja, jotka vaativat yhtä paljon sähköä kuin pienet kaupungit vain matriisikertolaskujen suorittamiseen. Onko tämä kestävä polku planeetalle? Jos näiden mallien kysyntä jatkaa kasvuaan nykyisellä tahdilla, saavutamme lopulta fyysisen rajan sille, kuinka paljon energiaa voimme tuottaa. Lisäksi, mitä tapahtuu, jos nykyinen innostus näitä teknologioita kohtaan tasaantuu? Olemme parhaillaan massiivisessa rakennusvaiheessa, mutta jos näitä siruja ostavat yritykset eivät saa taloudellista tuottoa, voimme nähdä äkillisen ja rajun korjausliikkeen. Tämän infrastruktuurin rakentamiseen otettu velka on silti maksettava takaisin, riippumatta siitä, onko sen ajama ohjelmisto kannattavaa. Meidän on pohdittava, rakennammeko hiekalle perustaa vai pysyvää muutosta maailman toimintatapoihin.
Tekoälymoottorin konepellin alla
Niille, joiden on ymmärrettävä tekniset rajoitteet, tarina koskee muutakin kuin GPU:ta. Modernin laskennan pullonkaula on siirtynyt prosessorista muistiin ja liitäntöihin. High Bandwidth Memory, erityisesti HBM3e, on tällä hetkellä maailman halutuin komponentti. Se sallii prosessorin käyttää dataa nopeuksilla, jotka olivat aiemmin mahdottomia. Ilman tätä muistia nopeinkin GPU istuisi toimettomana odottaen datan saapumista. Siksi toimitusrajoitteet ovat niin sitkeitä. Kyse ei ole vain useampien sirujen valmistamisesta: kyse on useiden monimutkaisten komponenttien tuotannon koordinoinnista eri toimittajilta. Tämän muistin saatavuus sanelee todennäköisesti koko alan kokonaistuotannon. Tämä on fyysinen raja, jota ohjelmisto ei voi helposti ylittää.
Verkottuminen on palapelin toinen kriittinen osa. Kun koulutat mallia tuhansien GPU-yksiköiden yli, nopeus, jolla sirut voivat kommunikoida keskenään, muodostuu suorituskyvyn määrittäväksi tekijäksi. Nvidia käyttää suljettua liitäntää nimeltä NVLink, joka tarjoaa paljon suuremman läpimenon kuin tavallinen Ethernet. Tämä on muurin toinen kerros. Vaikka kilpailija tekisi sirun, joka on yksittäisenä nopeampi, he eivät voi vastata klusterin suorituskykyyn, jos heidän verkottumisensa on hitaampaa. Tehokäyttäjien on myös kohdattava tiukat API-rajoitukset ja paikallisen tallennustilan pullonkaulat. Nopeimmallakin laskentateholla teratavujen datan siirtäminen klusteriin pysyy hitaana ja kalliina prosessina. Seuraavat tekijät ovat tällä hetkellä huippukäyttäjien ensisijaisia teknisiä rajoitteita:
- Muistin kaistanleveyden saturaatio laajamittaisissa päättelytehtävissä.
- Lämpöön liittyvä suorituskyvyn rajoittaminen (thermal throttling) tiheissä räkkikonfiguraatioissa.
- Liitäntöjen latenssi skaalattaessa yhden podin yli.
- Pysyvän tallennustilan korkeat kustannukset laskentayksiköiden lähellä.
Useimmat organisaatiot huomaavat, etteivät ne voi ajaa näitä työkuormia paikallisesti. Erikoistuneet virta- ja jäähdytysvaatimukset ylittävät tavallisen datakeskuksen kyvyt. Tämä pakottaa turvautumaan muutamaan tiettyyn palveluntarjoajaan, joilla on pääomaa rakentaa näitä räätälöityjä ympäristöjä. Markkinoiden nörttiosio ei enää liity oman koneen rakentamiseen: se liittyy etäpalvelun virtuaalikoneen konfigurointivaihtoehtojen ymmärtämiseen. Siirtymä paikallisesta raudasta abstraktiin pilvilaskentaan on lähes valmis huipputason työkuormien osalta.
Tuomio piisodasta
Nvidian ja AMD:n välinen kilpailu ei ole yksinkertainen nopeuskilpailu. Se on taistelu laskenta-alustan tulevaisuudesta. Nvidialla on valtava etumatka, ei vain rautansa vuoksi, vaan siksi, että he ovat onnistuneet lukitsemaan kehittäjäyhteisön ohjelmistoekosysteemiinsä. AMD käy ylämäkeen suuntautuvaa taistelua edistämällä avoimia standardeja, mutta he kohtaavat merkittävän haasteen olemassa olevien koodikantojen inertian ylittämisessä. Todellisia voittajia tähän asti ovat olleet suuret pilvipalveluntarjoajat, joilla on pääomaa ostaa tätä piitä tukkuna, mikä keskittää valtaa entisestään teknologiateollisuudessa. Tavalliselle käyttäjälle tai kehittäjälle panokset ovat käytännöllisiä. Näemme innovaatioiden kustannusten nousun ja uudenlaisen portinvartijan syntymisen. Piisota kirjoittaa uusiksi globaalin talouden sääntöjä, ja olemme vasta alkuvaiheessa näkemässä sen todelliset vaikutukset. Huomion on pysyttävä siinä, palveleeko tämä vallan keskittyminen yhteiskunnan laajempia etuja vai vain niiden etuja, jotka omistavat sirut.
Toimittajan huomautus: Loimme tämän sivuston monikieliseksi tekoälyuutisten ja -oppaiden keskukseksi ihmisille, jotka eivät ole tietokonenörttejä, mutta haluavat silti ymmärtää tekoälyä, käyttää sitä luottavaisemmin ja seurata jo saapuvaa tulevaisuutta.
Löysitkö virheen tai jotain korjattavaa? Kerro meille.