Alapítók, kritikusok és kutatók: beszélgetések, amiket érdemes olvasni
A legtöbben meg tudják nevezni az OpenAI vezérigazgatóját. Kevesebben ismerik azoknak a tanulmányoknak a szerzőit, amelyek meghatározták a nagy nyelvi modellek jelenlegi korszakát. Ez a tudásbeli szakadék eltorzítja azt, ahogyan a technológiai fejlődést látjuk. Az mesterséges intelligenciát termékbevezetések sorozataként kezeljük, pedig valójában matematikai áttörések lassú felhalmozódásáról van szó. Az alapítók kezelik a tőkét és a nyilvános narratívát. A kutatók kezelik a súlyokat és a logikát. A különbség megértése az egyetlen módja annak, hogy átlássunk a marketingfelhőkön. Ha csak az alapítókat követed, egy filmet nézel. Ha a kutatókat követed, a forgatókönyvet olvasod. Ez a cikk azt vizsgálja, miért számít ez a megkülönböztetés, és hogyan azonosíthatjuk azokat a jeleket, amelyek valóban meghatározzák az iparág jövőjét. Túllépünk a karizmatikus beszédeken, hogy a laboratóriumok rideg valóságát vizsgáljuk. Ideje azokra figyelni, akik a kódot írják, nem csak azokra, akik aláírják a sajtóközleményeket.
A gépkorszak láthatatlan építészei
Az alapítók a nyilvános arcok. Felszólalnak a Világgazdasági Fórumon és tanúskodnak a Kongresszus előtt. A munkájuk az, hogy dollármilliárdokat szerezzenek és olyan márkát építsenek, amely elkerülhetetlennek tűnik. Olyan szavakat használnak, amelyek varázslatot sugallnak. A kutatók mások. Pythonban és LaTeX-ben dolgoznak. A veszteségfüggvények és a token-hatékonyság érdekli őket. Egy alapító azt mondhatja, hogy a modellje gondolkodik. Egy kutató elmondja, hogy a modell a következő legvalószínűbb szót jósolja meg egy adott valószínűség-eloszlás alapján. A zavar abból adódik, hogy a média ezt a két csoportot egyként kezeli. Amikor egy vezérigazgató azt mondja, hogy egy modell megoldja a klímaváltozást, az egy értékesítési szöveg. Amikor egy kutató tanulmányt tesz közzé a ritka autoenkóderekről, az egy technikai állítás. Az egyik remény, a másik tény.
A közvélemény gyakran összekeveri a reményt a ténnyel. Ez a túlzott ígéretek és a teljesítés elmaradásának ciklusához vezet. Ahhoz, hogy megértsd ezt a területet, el kell különítened az autót eladó személyt attól, aki a motort tervezte. A motortervező pontosan tudja, hol lazák a csavarok. Az értékesítő sosem fog beszélni a laza csavarokról, mert az ő dolga a részvényárfolyam magasan tartása. Ezt minden alkalommal látjuk, amikor egy új modell megjelenik. Az alapító rejtélyes tweetet tesz közzé a hype építése érdekében. A kutató linket tesz közzé egy technikai jelentéshez az arXiv oldalon. A tweet egymillió megtekintést kap. A technikai jelentést néhány ezer ember olvassa el, akik ténylegesen építenek is valamit. Ez egy olyan visszacsatolási hurkot hoz létre, ahol a leghangosabb hangok határozzák meg a valóságot mindenki más számára.
Az innováció nyilvános arcán túl
Ez a megosztottság hatalmas hatással van a globális politikára. A kormányok jelenleg az alapítók figyelmeztetései alapján írnak törvényeket. Ezek az alapítók gyakran olyan egzisztenciális kockázatokról beszélnek, amelyek sci-fi filmbe illenek. Ez a hipotetikus jövőre helyezi a fókuszt a jelenlegi károk helyett. Eközben a kutatók olyan azonnali problémákra mutatnak rá, mint az adatelfogultság és az energiafogyasztás. Ha elsősorban a híres nevekre hallgatunk, fennáll a veszélye, hogy rossz dolgokat szabályozunk. Lehet, hogy betiltunk egy jövőbeli szuperintelligenciát, miközben figyelmen kívül hagyjuk, hogy a jelenlegi modellek kisvárosok vízkészletét csapolják le az adatközpontjaik hűtésére. Ez nem csak amerikai probléma. Európában és Ázsiában ugyanaz a dinamika létezik.
Azok a hangok kapják a legtöbb figyelmet, akiknek a legnagyobb a marketingköltségvetésük. Ez egy „a győztes mindent visz” környezetet teremt, ahol néhány vállalat határozza meg a menetrendet az egész bolygó számára. Ha nem szélesítjük a látókörünket, megengedjük, hogy a Szilícium-völgyben maroknyi ember határozza meg, mi a biztonságos és mi a lehetséges. Ez a hatalomkoncentráció önmagában is kockázat. Korlátozza a gondolkodás sokszínűségét egy olyan területen, ahol erre szükség lenne. Hallanunk kell a Torontói Egyetem vagy a tokiói laboratóriumok embereit is, ugyanúgy, ahogy San Franciscóban halljuk az embereket. A tudományos haladás globális erőfeszítés, de a narratíva jelenleg helyi monopólium. Olyan folyóiratokat kell néznünk, mint a Nature, hogy lássuk a valódi haladást a vállalati tárgyalótermeken kívül.
Miért hallgat a világ a rossz emberekre?
Gondolj egy vezető kutató napjára egy nagy laboratóriumban. Felébred, és ellenőrzi egy hárommillió dollárba kerülő tréning futtatásának eredményeit. Látja, hogy a modell a vártnál többet hallucinál. Tíz órát tölt az adatklaszterek vizsgálatával, hogy megtalálja a zajt. Nem a 2024-es választásokon vagy az emberiség sorsán gondolkodik. Azon gondolkodik, miért nem érti a modell a tagadást összetett mondatokban. A neuronaktivitás hőtérképeit nézi. Sikerét bitek per karakterben vagy egy adott benchmarkon elért pontosságban mérik. Most gondolj egy alapító napjára. Magánrepülőn ül, hogy találkozzon egy államfővel. Az új gazdaság billió dolláros lehetőségéről beszél.
A kutató a „hogyan”-nal foglalkozik. Az alapító azzal, hogy „miért ér pénzt”. Egy appot építő fejlesztő számára a kutató a fontosabb figura. A kutató határozza meg az API válaszidejét és a kontextusablakot. Az alapító határozza meg az árat. Ha üzletet próbálsz építeni, tudnod kell, hogy a technológia valóban képes-e arra, amit az alapító állít. Gyakran nem. Ezt láttuk az autonóm vezetés korai napjaiban. Az alapítók azt mondták, hogy 2026-ra millió robotaxi lesz az utakon. A kutatók tudták, hogy a heves esőzésben előforduló edge case-ek még megoldatlan problémák. A közvélemény hitt az alapítóknak. A kutatóknak volt igazuk.
Ugyanez a minta ismétlődik a generatív AI területén. Azt mondják nekünk, hogy a modellek hamarosan felváltják az ügyvédeket és az orvosokat. Ha elolvasod a technikai tanulmányokat, látod, hogy a modellek még mindig küzdenek az alapvető logikai konzisztenciával. A demó és a valóság közötti szakadék az, ahol a vállalatok pénzt veszítenek. Találhatsz egy mélyreható elemzést a mesterséges intelligencia trendjeiről, hogy lásd, hogyan tesztelik ezeket a technikai korlátokat ma. Ez a különbség a megalapozott befektetés és a spekulatív buborék között. Amikor egy új állítást hallasz, kérdezd meg magadtól, hogy tanulmányból vagy sajtóközleményből származik-e. A válasz megmutatja, mekkora súlyt érdemes adni neki. Az MIT Technology Review újságírói gyakran kiemelik ezt a szakadékot a labor és a lobbi között. Emlékeznünk kell arra, hogy az alapítók érdekeltek a hibák elrejtésében, míg a kutatók érdekeltek azok megtalálásában. Az előbbi hype-ot épít, az utóbbi igazságot. Hosszú távon az igazság az egyetlen, ami skálázódik. Ezt láttuk 2026-ban, amikor az első hype-hullám hűlni kezdett a technikai valóság súlya alatt.
Egy kedd a laborban kontra a tárgyalóteremben
Nehéz kérdéseket kell feltennünk a fejlesztés jelenlegi irányáról. Ki fizeti azt a kutatást, amelyről az alapítók azt állítják, hogy mindenki javát szolgálja? A legjobb kutatók többsége elhagyta az akadémiát a magánlaborokért. Ez azt jelenti, hogy az általuk előállított tudás már nem közjó. Ez vállalati titok. Mi történik a tudományos módszerrel, amikor az állítás bizonyítására használt adatok fizetőfal mögött rejtőznek? A nyílt tudománytól a zárt versenyelőny modellje felé való elmozdulást látjuk. Néhány egyén hírneve segíti a területet, vagy olyan személyi kultuszt teremt, amely elriasztja az ellenvéleményt? Ha egy kutató jelentős hibát talál egy zászlóshajó modellben, biztonságban érzi magát, ha jelenti, ha az esetleg tönkreteheti a vállalat értékét?
A BotNews.today mesterséges intelligencia eszközöket használ a tartalom kutatására, írására, szerkesztésére és fordítására. Csapatunk felülvizsgálja és felügyeli a folyamatot, hogy az információ hasznos, világos és megbízható maradjon.
A pénzügyi nyomás ezeken a cégeken óriási. Figyelembe kell vennünk a környezeti költségeket is. Megéri-e a kissé jobb benchmarkok elérése a modellek betanításának hatalmas szénlábnyomát? Gyakran beszélünk az AI környezeti előnyeiről, de ritkán látunk olyan mérleget, amely egyensúlyba hozza a kettőt. Végül, kié az a kultúra, amelyen ezeket a modelleket tanítják? A kutatók az internet kollektív kimenetét használják rendszereik felépítéséhez. Az alapítók ezután pénzt kérnek a nyilvánosságtól ugyanannak a kimenetnek a desztillált változatáért. Ez egy olyan vagyoni átcsoportosítás, amelyről ritkán esik szó a főcímekben. Ezek nem csak technikai problémák. Ezek társadalmi és etikai dilemmák, amelyek megoldásához több kell, mint egy jobb algoritmus.
Technikai korlátok és helyi implementáció
Azok számára, akik ezekre a platformokra építenek, a technikai részletek fontosabbak, mint a filozófia. A jelenlegi API-korlátok jelentős szűk keresztmetszetet jelentenek a vállalati adaptációban. A legtöbb szolgáltatónak szigorú korlátai vannak, amelyek megakadályozzák a nagy volumenű, valós idejű feldolgozást. Ezért sok cég vizsgálja a helyi tárolást és a helyi végrehajtást. Az olyan modellek használata, mint a Llama 3 helyi hardveren, jobb adatvédelmet és alacsonyabb hosszú távú költségeket tesz lehetővé. A hardverigények azonban magasak. Egy 70 milliárd paraméteres modell tisztességes sebességgel történő futtatásához csúcskategóriás GPU-kra van szükség, jelentős VRAM-mal. Itt találkozik a geek szekció a pénzügyi szekcióval. A H100-as klaszter költsége olyan belépési korlát, amely a hatalmat a gazdagok kezében tartja.
Azt is látjuk, hogy eltolódás tapasztalható a speciális finomhangolás felé. Ahelyett, hogy egy általános modellt használnának mindenre, a fejlesztők kisebb, konkrét adatkészleteken betanított modelleket használnak. Ez javítja a pontosságot és csökkenti a tokenek számát. A technikai kihívás itt az adatkurálás. Ha a bemeneti adatok rosszak, a finomhangolt modell rosszabb lesz, mint az általános. Azt is látjuk, hogy egyre több a Retrieval Augmented Generation (RAG) használata a modellek tényszerű adatokkal való megalapozásához. Ez kiküszöböli a hatalmas kontextusablakok szükségességét és csökkenti a hallucinációkat. De a RAG-nak is megvannak a maga korlátai, különösen abban, hogyan kezeli a lekért dokumentumok rangsorolását. Ha a keresési lépés sikertelen, a modell kimenete használhatatlan. A legtöbb felhasználó nem veszi észre, hogy az AI teljesítménye ugyanannyira függ az adatbázistól, mint magától a modelltől.
Az információ végső szűrője
Az AI jövője nem egyetlen történet, amelyet egyetlen ember mesél el. Ez egy zavaros, folyamatos vita azok között, akik eladnak egy víziót, és azok között, akik felépítik a valóságot. Ahhoz, hogy a technológiai hírek okos fogyasztója legyél, meg kell tanulnod átlátni a karizmatikus alapítón. Keresd a neveket a tanulmányokon. Keresd azokat a kutatókat, akik hajlandóak beszélni arról, mire nem képesek a modelljeik. Az iparág ellentmondásai nem hibák. Ezek a történet legőszintébb részei. A terület folyamatosan fejlődni fog, mert a technikai problémák messze nem megoldottak. Az élő kérdés továbbra is az: tudunk-e igazán intelligens rendszert építeni anélkül az óriási erőforrás-felhasználás nélkül, amely a jelenlegi korszakot jellemzi? Amíg erre nem válaszolunk, a hype továbbra is megelőzi a tudományt. Szkeptikusnak kell maradnunk minden olyan narratívával szemben, amely tökéletes megoldást ígér anélkül, hogy megemlítené az ezzel járó kompromisszumokat.
A szerkesztő megjegyzése: Ezt az oldalt többnyelvű AI hírek és útmutatók központjaként hoztuk létre olyan emberek számára, akik nem számítógépes zsenik, de mégis szeretnék megérteni a mesterséges intelligenciát, magabiztosabban használni, és követni a már megérkező jövőt.
Hibát talált, vagy valami javításra szorul? Tudassa velünk.