Az AI-pillanatok, amelyek mindent megváltoztattak
Az átállás az utasításokat követő szoftverekről a példákból tanuló szoftverekre a számítástechnika történetének legjelentősebb fordulópontja. Évtizedeken át a mérnökök merev kódsorokat írtak, hogy meghatározzanak minden lehetséges kimenetelt. Ez a megközelítés működött a táblázatoknál, de kudarcot vallott az emberi beszéd és a vizuális felismerés terén. A változás komolyan 2012-ben, az ImageNet versenyen kezdődött, amikor egy speciális matematikai módszer felülmúlt minden hagyományos eljárást. Ez nem csupán egy jobb eszköz volt, hanem a korábbi ötven év logikájának teljes elhagyása. Ma már minden szövegmezőben és képgenerátorban látjuk az eredményeket. A technológia laboratóriumi érdekességből a globális infrastruktúra alapvető elemévé vált. Ennek a váltásnak a megértéséhez túl kell látnunk a marketinges felhajtáson, és meg kell értenünk, hogyan váltotta fel a logika régi mechanikáját a predikció, azaz az előrejelzés új mechanikája. Ez a cikk megvizsgálja azokat a technikai fordulatokat, amelyek ide vezettek, és azokat a megoldatlan kérdéseket, amelyek meghatározzák a következő évtized fejlődését. Már nem azt tanítjuk a gépeknek, hogyan gondolkodjanak, hanem azt, hogyan jósolják meg a következő legvalószínűbb információt.
A logikától a predikció felé
A hagyományos számítástechnika a szimbolikus logikára épült. Ha a felhasználó rákattint egy gombra, a program megnyit egy fájlt. Ez kiszámítható és átlátható. A világ azonban bonyolult. Egy macskáról készült kép minden fényviszonyban és szögből másképp néz ki. Lehetetlen annyi „ha-akkor” feltételt írni, amely minden lehetséges macskát lefed. Az áttörés akkor következett be, amikor a kutatók felhagytak azzal, hogy megpróbálják leírni a macskát a számítógépnek, és hagyták, hogy a gép maga találja meg a mintákat. A neurális hálózatok használatával, amelyek biológiai neuronok által inspirált matematikai függvények rétegei, a számítógépek emberi útmutatás nélkül kezdtek el jellemzőket azonosítani. Ez a változás a szoftverfejlesztést az utasítások írásáról a kurátori munkává alakította át. A kódolás helyett a mérnökök most hatalmas adathalmazokat gyűjtenek, és olyan architektúrát terveznek, amelyet a gép tanulmányozhat. Ez a módszer, amelyet deep learning néven ismerünk, működteti a modern világot.
A legfontosabb technikai fordulat 2017-ben történt, a Transformer architektúra bevezetésével. Előtte a gépek lineáris sorrendben dolgozták fel az információt. Ha egy modell elolvasott egy mondatot, megnézte az első szót, majd a másodikat, és így tovább. A Transformer bevezette az „attention” mechanizmust, amely lehetővé teszi a modell számára, hogy egy mondat minden szavát egyszerre vizsgálja a kontextus megértéséhez. Ezért érződnek a modern eszközök sokkal természetesebbnek, mint a tíz évvel ezelőtti chatbotok. Nem csak kulcsszavakat keresnek, hanem kiszámítják a kapcsolatot a bemenet minden része között. Ez a sorrendtől a kontextus felé történő elmozdulás tette lehetővé a mai hatalmas léptéket. Lehetővé tette, hogy a modelleket a teljes nyilvános interneten képezzék ki, ami elvezetett a generatív eszközök jelenlegi korszakához, amelyek képesek kódot írni, esszéket fogalmazni és művészetet alkotni egyszerű promptok alapján.
A számítási kapacitás globális újraelosztása
Ennek a technikai váltásnak mélyreható globális következményei vannak. Régebben a szoftverek szinte bármilyen fogyasztói hardveren futottak. A deep learning ezt megváltoztatta. Ezen modellek betanítása több ezer speciális chipet és hatalmas mennyiségű elektromos energiát igényel. Ez egy újfajta geopolitikai szakadékot hozott létre. Azok a nemzetek és vállalatok, amelyek a legtöbb „compute” kapacitással rendelkeznek, ma már egyértelmű előnyben vannak a gazdasági termelékenység terén. A hatalom központosulását látjuk néhány földrajzi központban, ahol megvan az infrastruktúra ezen masszív adatközpontok támogatására. Ez már nem csak arról szól, kinek vannak a legjobb mérnökei, hanem arról, kinek van a legstabilabb elektromos hálózata és a legfejlettebb félvezető-ellátási lánca. Egy csúcskategóriás modell megépítésének belépési költsége milliárd dollárokra rúg, ami korlátozza a legmagasabb szinten versenyezni képes szereplők számát.
Ugyanakkor ezen modellek kimenetei demokratizálódnak. Egy kisvárosi fejlesztő ma már ugyanahhoz a kódolási asszisztenshez fér hozzá, mint egy nagy technológiai cég vezető mérnöke. Ez valós időben változtatja meg a munkaerőpiacot. Azok a feladatok, amelyek korábban órákig tartó szakértői munkát igényeltek, mint például összetett dokumentumok fordítása vagy régi kódok hibakeresése, most másodpercek alatt elvégezhetők. Ez egy furcsa paradoxont teremt. Míg a technológia létrehozása egyre központosítottabbá válik, a technológia használata gyorsabban terjed, mint bármely korábbi innováció. Ez a gyors elterjedés arra kényszeríti a kormányokat, hogy a szerzői jogi törvényektől az oktatásig mindent újragondoljanak. A kérdés már nem az, hogy egy ország használni fog-e ilyen eszközöket, hanem az, hogyan kezeli azokat a gazdasági változásokat, amelyek akkor következnek be, amikor a kognitív munka költsége a nullához közelít. A globális hatás egy olyan világ felé mutat, ahol a gép irányításának képessége értékesebb, mint maga a feladat elvégzésének képessége.
Mindennapi élet a predikció korszakában
Vegyünk egy Sarah nevű szoftverfejlesztőt. Öt évvel ezelőtt a reggele azzal telt, hogy dokumentációt keresett a specifikus szintaxishoz, és manuálisan írta a sablonkódot. Ma azzal kezdi a napot, hogy leír egy funkciót egy integrált asszisztensnek. Az asszisztens elkészíti a vázlatot, ő pedig a karakterek gépelése helyett a logika ellenőrzésével tölti az idejét. Ez a folyamat minden iparágban megismétlődik. Egy ügyvéd egy modell segítségével foglal össze több ezer oldalnyi bizonyítékot. Egy orvos algoritmust használ az orvosi képalkotásban olyan anomáliák jelzésére, amelyeket az emberi szem esetleg elkerülne. Ezek nem jövőbeli forgatókönyvek, hanem a jelen. A technológia beépült a szakmai élet hátterébe, gyakran anélkül, hogy az emberek észrevennék, mennyire megváltozott az alapul szolgáló munkafolyamat. Ez egy váltás az alkotói szerepből a szerkesztői szerepbe.
Egy átlagos napon az ember tucatnyi különböző modellel léphet kapcsolatba. Amikor fotót készít egy okostelefonnal, egy modell állítja be a megvilágítást és a fókuszt. Amikor e-mailt kap, egy modell javasol választ. Amikor információt keres, egy modell közvetlen választ szintetizál a linkek listája helyett. Ez megváltoztatta az információhoz való viszonyunkat. A „keresés és találás” modelljéből a „kérés és kapás” modellje felé mozdulunk el. Ez a kényelem azonban az igazságérzetünk megváltozásával jár. Mivel ezek a modellek prediktívek, magabiztosan tévedhetnek. A legvalószínűbb következő szót részesítik előnyben a legpontosabb ténnyel szemben. Ez vezet a hallucinációk jelenségéhez, ahol a modell egy hihető, de hamis valóságot talál ki. A felhasználók megtanulják az újfajta szkepticizmussal kezelni a gép kimenetét, egyensúlyozva az eszköz sebessége és az emberi ellenőrzés szükségessége között.
A BotNews.today mesterséges intelligencia eszközöket használ a tartalom kutatására, írására, szerkesztésére és fordítására. Csapatunk felülvizsgálja és felügyeli a folyamatot, hogy az információ hasznos, világos és megbízható maradjon.
A váltás nemrégiben az egyszerű szöveggenerálásról a multimodális képességek felé mozdult el. Ez azt jelenti, hogy ugyanaz a modell képes egyszerre megérteni képeket, hangot és szöveget. Ez a vitát az „intelligenciáról” szóló elméleti eszmecseréről a hasznosságról szóló gyakorlati beszélgetéssé változtatta. Az emberek korábban túlbecsülték, milyen hamar fog egy gép emberként „gondolkodni”, de alábecsülték, mennyire hasznos lehet egy „nem gondolkodó” mintafelismerő. Most látjuk ezen eszközök integrációját a fizikai robotikába és az automatizált rendszerekbe. A vita lezárt része az, hogy ezek a modellek hihetetlenül hatékonyak szűk feladatokban. A megoldatlan rész az, hogyan kezelik majd az összetett, többlépcsős érvelést, amely az ok-okozati összefüggések valódi megértését igényli. A közeljövő mindennapi élete valószínűleg ezen speciális ágensek flottájának kezelésével telik majd, ahol mindegyik a digitális létezésünk egy-egy részéért felel.
A fekete doboz rejtett költségei
Ahogy egyre inkább ezekre a rendszerekre támaszkodunk, nehéz kérdéseket kell feltennünk a rejtett költségekről. Az első a környezeti hatás. Egyetlen nagy modell betanítása annyi elektromos energiát fogyaszthat, mint amennyit több száz háztartás használ egy év alatt. Ahogy a modellek nagyobbak lesznek, a karbonlábnyom is nő. Hajlandóak vagyunk-e feláldozni a környezeti stabilitást a gyorsabb e-mail-összefoglalókért? Ott van az adat tulajdonjogának kérdése is. Ezeket a modelleket az emberi kultúra kollektív termésén képezték ki. Írók, művészek és kódolók biztosították az alapanyagot, gyakran beleegyezés vagy kompenzáció nélkül. Ez alapvető kérdést vet fel a kreativitás jövőjével kapcsolatban. Ha egy modell képes utánozni egy élő művész stílusát, mi történik azzal a művésszel? Jelenleg egy olyan jogi szürkezónában vagyunk, ahol a „fair use” definícióját a töréspontig feszítik.
A magánélet egy másik fő aggály. A felhőalapú modellel való minden interakció egy adatpont, amely felhasználható további képzésre. Ez gondolataink, kérdéseink és szakmai titkaink állandó nyilvántartását hozza létre. Sok vállalat betiltotta a nyilvános modellek használatát belső munkára, mert félnek, hogy szellemi tulajdonuk kiszivárog a nyilvános képzési készletbe. Továbbá foglalkoznunk kell a „fekete doboz” problémával. Még a modellek alkotói sem értik teljesen, miért hoznak bizonyos döntéseket. Ez az értelmezhetőség hiánya veszélyes az olyan nagy téttel bíró területeken, mint az igazságszolgáltatás vagy az egészségügy. Ha egy modell elutasít egy hitelt vagy kezelést javasol, tudnunk kell, miért. Ezen rendszerek *stochastic parrots* (sztochasztikus papagájok) néven való címkézése rávilágít a kockázatra. Lehet, hogy csak mintákat ismételnek anélkül, hogy megértenék a mögöttes valóságot, ami elfogult vagy káros eredményekhez vezet, amelyeket nehéz nyomon követni vagy kijavítani.
Van egy AI-történet, eszköz, trend vagy kérdés, amiről úgy gondolja, hogy foglalkoznunk kellene vele? Küldje el nekünk cikkötletét — szívesen meghallgatnánk.Geek szekció: Hardver és integráció
Azok számára, akik ezekre a rendszerekre építenek, a fókusz a modell méretéről a hatékonyságra és az integrációra tolódott. Míg a címlapok a trilliónyi paraméterrel rendelkező hatalmas modellekre fókuszálnak, a valódi munka a kvantálásban és a helyi futtatásban zajlik. A kvantálás az a folyamat, amely csökkenti a modell súlyainak pontosságát, gyakran 16-bitről 4-bitre vagy 8-bitre. Ez lehetővé teszi, hogy nagy modellek fussanak fogyasztói kategóriájú GPU-kon vagy akár csúcskategóriás laptopokon is, a teljesítmény jelentős csökkenése nélkül. Ez kulcsfontosságú a magánélet és a költségkezelés szempontjából. A modellek helyi tárolása biztosítja, hogy az érzékeny adatok soha ne hagyják el a felhasználó gépét. Olyan eszközök térnyerését látjuk, mint a Llama.cpp és az Ollama, amelyek megkönnyítik a kifinomult modellek helyi futtatását, megkerülve a drága API-hívások szükségességét.
Az API-korlátok és a kontextusablakok továbbra is a fejlesztők elsődleges korlátai. A kontextusablak az az információmennyiség, amelyet egy modell egyetlen beszélgetés során „megjegyez”. -ben láthattuk, hogy a kontextusablakok néhány ezer tokenről több mint egymillióra bővültek. Ez lehetővé teszi teljes kódbázisok vagy hosszú jogi dokumentumok elemzését egy menetben. Azonban ahogy a kontextusablak nő, a költség és a késleltetés is növekszik. A fejlesztőknek kezelniük kell a „tű a szénakazalban” problémákat, ahol a modell kihagyhat egy konkrét részletet, amely egy hatalmas bemenetbe van temetve. Ezen kompromisszumok kezelése kifinomult munkafolyamat-integrációkat igényel. A fejlesztők egyre gyakrabban használják a RAG-ot (Retrieval-Augmented Generation), hogy a modellek hozzáférjenek külső adatbázisokhoz. Ez csökkenti a hallucinációkat azáltal, hogy a modellt konkrét források idézésére kényszeríti, ahelyett, hogy kizárólag a képzési adataira támaszkodna. A következő határvonal az „agentic” munkafolyamatok felé való elmozdulás, ahol a modellek eszközöket kapnak kód végrehajtására, webböngészésre és más szoftverekkel való autonóm interakcióra.
Az út előre
A gépi intelligencia gyors fejlődése elérte azt a pontot, ahol a technológia már nem a „tech” külön kategóriája. Ez válik azzá a szubsztráttá, amelyre minden más szoftver épül. Túl vagyunk a generatív eszközök kezdeti sokkján, és most az integráció és a szabályozás nehéz szakaszában vagyunk. A legfontosabb dolog, amit észben kell tartani, hogy ezek az eszközök a predikció eszközei, nem a bölcsességé. Kiválóan találják meg a legkisebb ellenállás útját egy adathalmazban, ami hihetetlenül hatékonnyá teszi őket, de hajlamosak a múlt elfogultságainak ismétlésére is. Ahogy belépünk -be, a fókusz valószínűleg a modellek nagyobbra növeléséről a megbízhatóbbá és specializáltabbá tételükre tolódik.
Az élő kérdés, amely megmaradt, az, hogy képesek leszünk-e valaha túllépni a „következő token előrejelzése” modellen valami olyasmi felé, ami valóban megérti a fizikai világot. Egyes kutatók azzal érvelnek, hogy teljesen új architektúrára van szükség az igazi érvelés eléréséhez. Mások úgy vélik, hogy elegendő adattal és számítási kapacitással a jelenlegi módszerek végül áthidalják a szakadékot. Az eredménytől függetlenül az, ahogyan dolgozunk, alkotunk és kommunikálunk, véglegesen megváltozott. A következő generáció számára a kihívás az emberi cselekvőképesség fenntartása lesz egy olyan világban, ahol a „leglogikusabb” utat mindig egy gép javasolja. El kell döntenünk, az emberi tapasztalat mely részei érdemesek arra a hatékonytalanságra, hogy magunk végezzük el őket.
A szerkesztő megjegyzése: Ezt az oldalt többnyelvű AI hírek és útmutatók központjaként hoztuk létre olyan emberek számára, akik nem számítógépes zsenik, de mégis szeretnék megérteni a mesterséges intelligenciát, magabiztosabban használni, és követni a már megérkező jövőt.
Hibát talált, vagy valami javításra szorul? Tudassa velünk.