Valóban kihívhatják a nyílt modellek a legnagyobb laborokat?
Az intelligencia nagy decentralizációja
A zárt, saját tulajdonú rendszerek és a nyilvános modellek közötti szakadék gyorsabban szűkül, mint ahogy azt a legtöbb elemző jósolta. Még csak egy éve volt az az általános vélekedés, hogy a milliárdos finanszírozással rendelkező óriáslaborok tartósan megőrzik vezető szerepüket. Ma már ez az előny nem években, hanem hónapokban mérhető. A nyílt súlyozású (open weights) modellek már olyan szinten teljesítenek, ami felveszi a versenyt a legfejlettebb zárt rendszerekkel a kódolás, a következtetés és a kreatív írás terén. Ez a váltás nem csupán technikai érdekesség, hanem alapvető változást jelent abban, hogy ki irányítja a számítástechnika jövőjét. Amikor egy fejlesztő saját hardverén futtathat egy nagy teljesítményű modellt, az erőviszonyok eltolódnak a központosított szolgáltatóktól. Ez a tendencia azt sugallja, hogy a fekete doboz modellek korszaka első igazi kihívásával néz szembe egy elosztott globális közösség részéről.
Ezeknek a hozzáférhető rendszereknek a felemelkedése arra kényszerít minket, hogy újraértékeljük, mit is jelent vezetőnek lenni ezen a területen. Már nem elég a legnagyobb chip-fürtökkel rendelkezni, ha az eredményül kapott modell egy drága és korlátozó interfész mögé van zárva. A fejlesztők az idejükkel és a számítási kapacitásukkal szavaznak. Olyan modelleket választanak, amelyeket engedélykérés nélkül vizsgálhatnak, módosíthatnak és telepíthetnek. Ez a mozgalom azért nyer teret, mert választ ad az adatvédelem és a testreszabhatóság alapvető igényeire, amelyeket a zárt modellek gyakran figyelmen kívül hagynak. Az eredmény egy versenyképesebb környezet, ahol a hangsúly a puszta méretről a hatékonyságra és a hozzáférhetőségre tevődött át. Ez egy új korszak kezdete, ahol a legképesebb eszközök egyben a legelérhetőbbek is.
A fejlesztés három törzse
Ahhoz, hogy megértsük, merre tart ez a technológia, meg kell vizsgálnunk a három különböző típusú szervezetet, amely építi. Először is ott vannak a határvonalat feszegető laborok (frontier labs). Ezek olyan óriások, mint az OpenAI és a Google. Céljuk az általános intelligencia lehető legmagasabb szintjének elérése. Mindenekelőtt a méretet és a nyers erőt helyezik előtérbe. Számukra a nyitottság gyakran a biztonság kockázatát vagy a versenyelőny elvesztését jelenti. Hatalmas, zárt ökoszisztémákat építenek, amelyek nagy teljesítményt kínálnak, de cserébe teljes mértékben a felhő-infrastruktúrájukra való támaszkodást követelik meg. Modelljeik a teljesítmény arany standardjai, de használatukhoz kötöttségek társulnak a felhasználási irányelvek és az ismétlődő költségek formájában.
Másodszor, ott vannak az akadémiai laborok. Az olyan intézmények, mint a Stanford Institute for Human-Centered AI, az átláthatóságra és az újratervezhetőségre összpontosítanak. Céljuk nem egy termék eladása, hanem annak megértése, hogyan működnek ezek a rendszerek. Közzéteszik eredményeiket, adatkészleteiket és képzési módszertanaikat. Bár modelljeik nem mindig érik el a határvonalat feszegető laborok nyers erejét, ők adják az iparág többi részének alapját. Olyan kérdéseket tesznek fel, amelyeket a kereskedelmi laborok esetleg elkerülnek, például azt, hogyan alakul ki az elfogultság, vagy hogyan tehető a képzés energiahatékonyabbá. Munkájuk biztosítja, hogy a terület tudománya közjó maradjon, ne pedig vállalati titok.
Végül ott vannak a termékfejlesztő laborok és a vállalati nyílt súlyozású támogatók. A Meta és a Mistral ebbe a kategóriába tartozik. Modelljeiket azért adják ki a nyilvánosságnak, hogy ökoszisztémát építsenek. A súlyok elérhetővé tételével arra ösztönzik a fejlesztők ezreit, hogy optimalizálják kódjaikat és kompatibilis eszközöket építsenek. Ez egy stratégiai lépés a zárt platformok dominanciájának ellensúlyozására. Ha mindenki a te architektúrádon épít, te leszel az iparági standard. Ez a megközelítés áthidalja a szakadékot a tiszta kutatás és a kereskedelmi termékek között. Olyan szintű telepítést tesz lehetővé, amelyet az akadémiai laborok nem érhetnek el, miközben fenntartja a szabadság egy olyan szintjét, amelyet a határvonalat feszegető laborok nem tesznek lehetővé.
A nyitottság illúziója a modern szoftverekben
A nyílt forráskód (open source) kifejezést gyakran lazán használják ebben az iparágban, ami jelentős zavart okoz. Az igazi nyílt forráskódú szoftver, ahogy azt az Open Source Initiative meghatározza, megköveteli, hogy a forráskód, az építési utasítások és az adatok szabadon elérhetőek legyenek. A legtöbb modern modell nem felel meg ezeknek a kritériumoknak. Ehelyett a nyílt súlyozású modellek felemelkedését látjuk. Ebben a felállásban a vállalat biztosítja a képzési folyamat végeredményét, de titokban tartja a képzési adatokat és a receptet. Ez egy döntő különbség. Futtathatod a modellt és láthatod, hogyan viselkedik, de nem tudod könnyen újraalkotni az alapoktól, és nem tudhatod pontosan, milyen információkkal táplálták a létrehozása során.
A marketingnyelv gyakran még bonyolultabbá teszi ezt azzal, hogy olyan kifejezéseket használ, mint a megengedő vagy közösségi licencek. Ezek a licencek gyakran tartalmaznak olyan záradékokat, amelyek korlátozzák, hogyan használhatják a modellt nagyon nagy vállalatok vagy konkrét feladatokra. Bár ezek a modellek sokkal hozzáférhetőbbek, mint egy zárt API, nem mindig ingyenesek a hagyományos értelemben. Ez a nyitottság spektrumát hozza létre. Az egyik végén ott vannak a teljesen zárt modellek, mint a GPT-4. Középen vannak a nyílt súlyozású modellek, mint a Llama 3. A távoli végén pedig azok a projektek, amelyek mindent kiadnak, beleértve az adatokat is. Annak megértése, hogy egy modell hol helyezkedik el ezen a spektrumon, létfontosságú minden vállalat vagy fejlesztő számára, aki hosszú távra tervez.
Ennek a félig nyitott megközelítésnek az előnyei továbbra is hatalmasak. Lehetővé teszi a helyi hosztolást, ami követelmény sok, szigorú adatszuverenitási szabályokkal rendelkező iparágban. Lehetővé teszi a finomhangolást (fine tuning) is, ahol a modellt kis mennyiségű specifikus adaton képzik ki, hogy szakértővé váljon egy adott területen. Ez az irányítási szint lehetetlen egy zárt API-val. Azonban pontosnak kell lennünk abban, mi az, ami valóban nyitott. Ha egy vállalat visszavonhatja az engedélyedet, vagy ha a képzési adatok rejtélyesek, akkor továbbra is egy mások által tervezett rendszeren belül működsz. A jelenlegi tendencia az átláthatóság felé mutat, de még nem tartunk ott, hogy a legerősebb modellek valóban nyílt forráskódúak legyenek.
Helyi irányítás a felhő-óriások korában
Egy magas biztonságú környezetben dolgozó fejlesztő számára a nyílt súlyozás felé való elmozdulás gyakorlati szükséglet. Képzelj el egy vezető mérnököt egy közepes méretű pénzügyi cégnél. Régebben érzékeny ügyféladatokat kellett volna küldenie egy harmadik fél szerverére, hogy kihasználhassa egy nagy nyelvi modell előnyeit. Ez hatalmas adatvédelmi kockázatot és egy külső szolgáltató rendelkezésre állásától való függőséget teremtett. Ma ez a mérnök letölthet egy nagy teljesítményű modellt, és futtathatja egy belső szerveren. Teljes ellenőrzése van az adatfolyam felett. Módosíthatja a modellt, hogy megértse a cég sajátos zsargonját és megfelelőségi szabályait. Ez nem csupán kényelem. Ez egy alapvető változás abban, hogyan kezeli a vállalat legértékesebb eszközét, az adatait.
Ennek a mérnöknek a mindennapjai jelentősen megváltoztak. Ahelyett, hogy API-kulcsokat kezelne és az aránykorlátok miatt aggódna, az idejét a helyi következtetés (inference) optimalizálásával tölti. Használhat egy olyan eszközt, mint a Hugging Face, hogy megtalálja a modell egy olyan verzióját, amelyet tömörítettek, hogy elférjen a rendelkezésre álló hardverén. Hajnali 3-kor is futtathat teszteket anélkül, hogy aggódnia kellene az egyes generált tokenek költsége miatt. Ha a modell hibázik, megnézheti a súlyokat, és megpróbálhatja megérteni az okát, vagy finomhangolást használhat a javításához. Ez az autonómia szintje elképzelhetetlen volt a legtöbb vállalkozás számára mindössze két éve. Gyorsabb iterációs ciklust és robusztusabb végterméket tesz lehetővé.
Ez a szabadság az egyéni felhasználóra is kiterjed. Egy író vagy kutató futtathat egy modellt a laptopján, amelyen nincs a Szilícium-völgyi bizottság által tervezett szűrő. Felfedezhet ötleteket és generálhat tartalmat anélkül, hogy egy közvetítő döntené el, mi a megfelelő. Ez a különbség az eszköz bérlése és a tulajdonlása között. Míg a felhő-óriások csiszolt, könnyen használható élményt kínálnak, a nyílt ökoszisztéma valami értékesebbet kínál: cselekvőképességet. Ahogy a hardver egyre erősebbé és a modellek egyre hatékonyabbá válnak, a rendszereket helyben futtató emberek száma csak nőni fog. Ez a decentralizált megközelítés biztosítja, hogy a technológia előnyei ne csak azok számára legyenek elérhetőek, akik megengedhetik maguknak a drága havi előfizetéseket.
A BotNews.today mesterséges intelligencia eszközöket használ a tartalom kutatására, írására, szerkesztésére és fordítására. Csapatunk felülvizsgálja és felügyeli a folyamatot, hogy az információ hasznos, világos és megbízható maradjon.
A vállalatok azt is tapasztalják, hogy a nyílt modellek védelmet nyújtanak a platformkockázattal szemben. Ha egy zárt szolgáltató megváltoztatja az árazását vagy a szolgáltatási feltételeit, az azon az API-n épült vállalat bajba kerül. A nyílt súlyok használatával egy vállalat hardverszolgáltatót válthat, vagy áthelyezheti a teljes stackjét egy másik felhőbe anélkül, hogy elveszítené alapvető intelligenciáját. Ez a rugalmasság hajtja a ma látható örökbefogadások nagy részét. Már nem arról van szó, melyik modell teljesít valamivel jobban egy benchmarkon. Arról van szó, melyik modell adja a vállalkozásnak a legtöbb hosszú távú stabilitást. A nyílt forráskódú AI-ökoszisztéma legutóbbi fejlesztései ezt életképes stratégiává tették minden méretű vállalat számára.
Az ingyenes modellek magas ára
Az izgalom ellenére nehéz kérdéseket kell feltennünk a nyitottság rejtett költségeiről. Egy nagy modell helyi futtatása nem ingyenes. Jelentős hardverberuházást igényel, különösen nagy teljesítményű, sok memóriával rendelkező GPU-kat. Sok kisvállalkozás számára ennek a hardvernek a megvásárlása és karbantartása több évre meghaladhatja az API-előfizetés költségét. Ott van még az áramköltség és a telepítés kezeléséhez szükséges speciális tehetségek iránti igény is. Egyszerűen csak szoftver-előfizetést cserélünk hardver- és energiaszámlára? A helyi AI gazdasági valósága bonyolultabb, mint ahogy a szalagcímek sugallják.
Van egy AI-történet, eszköz, trend vagy kérdés, amiről úgy gondolja, hogy foglalkoznunk kellene vele? Küldje el nekünk cikkötletét — szívesen meghallgatnánk.Az adatvédelem egy másik terület, ahol szkepticizmusra van szükség. Bár a modell helyi futtatása jobb az adatbiztonság szempontjából, magukat a modelleket gyakran az internetről, beleegyezés nélkül lekapart adatokon képzik ki. Vajon egy nyílt modell használata bűnrészessé tesz ebben a gyakorlatban? Továbbá, ha egy modell nyitott, akkor a rosszindulatú szereplők számára is nyitott. Ugyanazokat az eszközöket, amelyek lehetővé teszik egy orvos számára az orvosi feljegyzések összefoglalását, egy hacker is használhatja adathalász támadások automatizálására. Hogyan egyensúlyozzuk ki a demokratizáció előnyeit a visszaélés kockázataival? A súlyaikat kiadó laborok gyakran azt állítják, hogy a közösség biztosítja a szükséges biztonsági ellenőrzéseket, de ezt az állítást nehéz ellenőrizni. Meg kell fontolnunk, hogy a központi felügyelet hiánya funkció vagy hiba-e.
Végül meg kell vizsgálnunk a nyílt modell fenntarthatóságát. Ezeknek a rendszereknek a képzése dollármilliókba kerül. Ha az olyan vállalatok, mint a Meta vagy a Mistral úgy döntenek, hogy már nem érdekük a súlyok kiadása, a nyílt közösség fejlődése megakadhat. Jelenleg egy olyan vállalati stratégiából profitálunk, amely a piaci részesedés megszerzése érdekében a nyitottságot részesíti előnyben. Ha ez a stratégia megváltozik, a közösség újra évekkel a határvonalat feszegető laborok mögött találhatja magát. Lehetséges-e egy valóban független, nagy teljesítményű modellt építeni egy több milliárd dolláros vállalat támogatása nélkül? A vállalati nagylelkűségre való jelenlegi támaszkodás a teljes mozgalom egy lehetséges központi meghibásodási pontja.
A helyi következtetés motorházteteje alatt
A haladó felhasználó számára az igazi munka ezeknek a modelleknek a meglévő munkafolyamatokba való integrálásában történik. Az egyik legnagyobb kihívás a hardverigény. Egy 70 milliárd paraméterrel rendelkező modell futtatásához általában legalább két csúcskategóriás fogyasztói GPU-ra vagy egy 48 GB VRAM-mal rendelkező professzionális kártyára van szükség. Ez vezetett a kvantálási technikák felemelkedéséhez. A modell súlyainak pontosságát 16-bitről 4-bitre vagy akár 2-bitre csökkentve a fejlesztők sokkal nagyobb modelleket tudnak olcsóbb hardverre illeszteni. Ez a folyamat a pontosság enyhe csökkenésével jár, de a legtöbb feladatnál a különbség elhanyagolható. Az olyan eszközök, mint a Llama.cpp, lehetővé tették ezeknek a modelleknek a futtatását szabványos CPU-kon és Mac hardveren, jelentősen csökkentve a belépési küszöböt.
Egy másik kritikus tényező az API-korlát. Zárt szolgáltató használatakor gyakran korlátozva vagy, hogy hány kérést indíthatsz percenként. Egy helyi modellnél az egyetlen korlát a hardvered sebessége. Ez olyan összetett munkafolyamatokat tesz lehetővé, ahol a modellt több százszor hívják meg egyetlen folyamatban. Például egy fejlesztő használhat egy modellt több ezer sornyi kód elemzésére vagy egy teljes szintetikus adatkészlet generálására teszteléshez. Ezek a feladatok tiltóan drágák és lassúak lennének egy felhő API-n. A helyi tárolás lehetővé teszi a hatalmas kontextusablakok használatát is. Dokumentumok egész könyvtárát táplálhatod be egy modellbe anélkül, hogy aggódnod kellene a bemeneti tokenek költsége miatt.
A munkafolyamat-integráció is egyre kifinomultabbá válik. A fejlesztők olyan keretrendszereket használnak, amelyek lehetővé teszik a modellek cseréjét egyetlen kódsorral. Ez azt jelenti, hogy egy rendszer használhat egy kicsi, gyors modellt egyszerű feladatokhoz, és egy nagy, lassú modellt összetett következtetésekhez. Ez a hibrid megközelítés optimalizálja a költségeket és a teljesítményt is. Azonban még mindig vannak akadályok. A helyi modellekből gyakran hiányoznak a zárt társaik csiszolt biztonsági szűrői és kiterjedt dokumentációja. Egy robusztus helyi környezet beállítása mély ismereteket igényel a Linuxról, a Pythonról és a GPU-illesztőprogramokról. Azok számára, akik képesek kezelni, a jutalom a teljesítmény és az adatvédelem olyan szintje, amelyet egyetlen felhőszolgáltató sem tud megközelíteni.
A nyilvános technológia új standardja
A nyílt és zárt modellek közötti verseny a legfontosabb történet a mai technológiában. Ez egy csata az internet alapvető architektúrájáért. Ha a zárt modellek nyernek, az AI jövője a jelenlegi mobilalkalmazás-áruházakhoz fog hasonlítani, ahol két vagy három óriás irányítja, mi lehetséges. Ha a nyílt modellek folytatják jelenlegi pályájukat, a jövő inkább magához az internethez fog hasonlítani, egy decentralizált hálózathoz, ahol bárki építhet és újíthat. A kiváló minőségű nyílt súlyok felé való közelmúltbeli elmozdulás erős jele annak, hogy az utóbbi valószínűbbé válik. Ez egy lenyűgöző vízió egy olyan világról, ahol az intelligencia közmű, nem pedig luxus.
Ahogy belépünk az évbe, a hangsúly valószínűleg a nyers modellteljesítményről az ezeket a modelleket körülvevő ökoszisztémára helyeződik át. A győztes nem az a vállalat lesz, amelyik a legmagasabb benchmark pontszámot éri el, hanem az, amelyik a legkönnyebbé teszi mások számára az építkezést. A távolság egy kutatási cikk és egy hasznos termék között még mindig nagy, de a nyílt közösség építi azokat a hidakat, amelyekre szükség van az átkeléshez. Ez a gyors változások ideje, és a fejlesztők és vállalatok által ma meghozott döntések fogják meghatározni a technológiai környezetet a következő évtizedben. A zárt doboz korszaka véget ér, és a nyílt súly korszaka éppen most kezdődik.
A szerkesztő megjegyzése: Ezt az oldalt többnyelvű AI hírek és útmutatók központjaként hoztuk létre olyan emberek számára, akik nem számítógépes zsenik, de mégis szeretnék megérteni a mesterséges intelligenciát, magabiztosabban használni, és követni a már megérkező jövőt.
Hibát talált, vagy valami javításra szorul? Tudassa velünk.