Osnivači, kritičari i istraživači: Razgovori koje vredi pratiti
Većina ljudi zna ko je CEO kompanije OpenAI. Manje njih zna ko su autori rada koji je definisao trenutnu eru velikih jezičkih modela. Ovaj jaz u znanju stvara iskrivljenu sliku o tome kako tehnologija zapravo napreduje. Veštačku inteligenciju tretiramo kao niz lansiranja proizvoda, dok je ona zapravo sporo gomilanje matematičkih otkrića. Osnivači upravljaju kapitalom i javnim narativom. Istraživači upravljaju težinama i logikom. Razumevanje ove razlike je jedini način da se progleda kroz marketinšku maglu. Ako pratite samo osnivače, gledate film. Ako pratite istraživače, čitate scenario. Ovaj članak istražuje zašto je ta razlika važna i kako identifikovati signale koji zapravo diktiraju budućnost industrije. Preći ćemo preko harizmatičnih govora kako bismo sagledali hladnu realnost laboratorije. Vreme je da se fokusiramo na ljude koji pišu kod, a ne samo na one koji potpisuju saopštenja za javnost.
Nevidljive arhitekte mašinskog doba
Osnivači su javno lice. Oni govore na Svetskom ekonomskom forumu i svedoče pred Kongresom. Njihov posao je da osiguraju milijarde u finansiranju i izgrade brend koji deluje neizbežno. Oni koriste reči koje sugerišu magiju. Istraživači su drugačiji. Oni rade u Python-u i LaTeX-u. Brinu o funkcijama gubitka i efikasnosti tokena. Osnivač bi mogao reći da njihov model razmišlja. Istraživač će vam reći da on predviđa sledeću najverovatniju reč na osnovu specifične raspodele verovatnoće. Zbunjenost nastaje jer mediji tretiraju ove dve grupe kao jednu. Kada CEO kaže da će model rešiti klimatske promene, to je prodajni govor. Kada istraživač objavi rad o sparse autoencoders, to je tehnička tvrdnja. Jedno je nada. Drugo je činjenica.
Javnost često meša nadu sa činjenicom. To vodi ka ciklusu prevelikih obećanja i premalih rezultata. Da biste razumeli ovu oblast, morate odvojiti osobu koja prodaje automobil od osobe koja je dizajnirala motor. Dizajner motora tačno zna gde su šrafovi labavi. Prodavac vam nikada neće reći za labave šrafove jer je njegov posao da održi visoku cenu akcija. Ovo viđamo svaki put kada izađe novi model. Osnivač objavi kriptičan tvit da bi podigao hajp. Istraživač objavi link ka tehničkom izveštaju na arXiv. Tvit dobije milion pregleda. Tehnički izveštaj pročita nekoliko hiljada ljudi koji zaista nešto grade. Ovo stvara povratnu spregu gde najglasniji glasovi definišu realnost za sve ostale.
Iza javnog lica inovacija
Ova podela ima ogromne implikacije na globalnu politiku. Vlade trenutno pišu zakone na osnovu upozorenja osnivača. Ovi osnivači često upozoravaju na egzistencijalne rizike koji deluju kao naučna fantastika. To drži fokus na hipotetičkim budućnostima, a ne na trenutnim štetama. U međuvremenu, istraživači ukazuju na trenutne probleme kao što su pristrasnost podataka i potrošnja energije. Slušajući prvenstveno poznata imena, rizikujemo da regulišemo pogrešne stvari. Možda ćemo zabraniti buduću superinteligenciju, dok ignorišemo činjenicu da trenutni modeli isušuju vodene resurse malih gradova da bi ohladili svoje data centre. Ovo nije samo američki problem. U Evropi i Aziji postoji ista dinamika.
Glasovi koji dobijaju najviše prostora su oni sa najvećim marketinškim budžetima. Ovo stvara okruženje u kojem pobednik uzima sve, gde nekoliko kompanija postavlja agendu za celu planetu. Ako ne proširimo perspektivu, dozvoljavamo šačici ljudi u Silicijumskoj dolini da definiše šta je bezbedno i šta je moguće. Ova koncentracija moći je rizik sama po sebi. Ona ograničava raznolikost misli u polju koje to zahteva. Moramo čuti ljude sa Univerziteta u Torontu ili laboratorija u Tokiju jednako kao i ljude iz San Franciska. Naučni napredak je globalni napor, ali narativ je trenutno lokalni monopol. Moramo gledati časopise kao što je Nature da bismo videli stvarni napredak koji se postiže izvan korporativnih sala za sastanke.
Zašto svet sluša pogrešne ljude
Razmotrite dan u životu vodećeg istraživača u velikoj laboratoriji. Bude se i proveravaju rezultate treninga koji je koštao tri miliona dolara. Vide da model halucinira više nego što se očekivalo. Provode deset sati gledajući klastere podataka kako bi pronašli šum. Oni ne razmišljaju o izborima 2024. ili sudbini čovečanstva. Oni razmišljaju o tome zašto model ne uspeva da razume negaciju u složenim rečenicama. Gledaju toplotne mape aktivacije neurona. Njihov uspeh se meri u bitovima po karakteru ili preciznosti na određenom benchmarku. Sada razmotrite dan osnivača. Oni su u privatnom avionu na putu ka sastanku sa šefom države. Govore o trilionskoj prilici nove ekonomije.
Istraživač se bavi pitanjem „kako“. Osnivač se bavi pitanjem „zašto to vredi novac“. Za developera koji gradi app, istraživač je važnija figura. Istraživač određuje API latency i context window. Osnivač određuje cenu. Ako pokušavate da izgradite biznis, morate znati da li tehnologija zaista može da uradi ono što osnivač kaže da može. Često, ne može. To smo videli u ranim danima autonomne vožnje. Osnivači su rekli da ćemo imati milione robotaksija do 2026. Istraživači su znali da su edge cases po jakoj kiši i dalje nerešen problem. Javnost je verovala osnivačima. Istraživači su bili u pravu.
Isti obrazac se ponavlja u prostoru generativne AI. Rečeno nam je da će modeli uskoro zameniti advokate i lekare. Ako čitate tehničke radove, vidite da se modeli i dalje bore sa osnovnom logičkom konzistentnošću. Jaz između demo verzije i realnosti je mesto gde kompanije gube novac. Možete pronaći detaljan pregled trendova u veštačkoj inteligenciji da vidite kako se ove tehničke granice danas testiraju. Ova razlika je granica između zdrave investicije i spekulativnog balona. Kada čujete novu tvrdnju, zapitajte se da li potiče iz rada ili saopštenja za javnost. Odgovor će vam reći koliku težinu da joj pridate. Novinari na MIT Technology Review često ističu ovaj jaz između laboratorije i lobija. Moramo zapamtiti da su osnivači motivisani da sakriju mane, dok su istraživači motivisani da ih pronađu. Prvi gradi hajp, a drugi gradi istinu. Dugoročno gledano, istina je jedina stvar koja se skalira. To smo videli u 2026 kada je prvi talas hajpa počeo da se hladi pod težinom tehničke realnosti.
Utorak u laboratoriji naspram sale za sastanke
Moramo postaviti teška pitanja o trenutnom putu razvoja. Ko plaća istraživanja za koja osnivači tvrde da će koristiti svima? Većina vrhunskih istraživača napustila je akademiju zbog privatnih laboratorija. To znači da znanje koje proizvode više nije javno dobro. To je korporativna tajna. Šta se dešava sa naučnim metodom kada su podaci korišćeni za dokazivanje poente sakriveni iza paywall-a? Vidimo pomak od otvorene nauke ka modelu zatvorene konkurentske prednosti. Da li slava nekoliko pojedinaca pomaže polju ili stvara kult ličnosti koji obeshrabruje neslaganje? Ako istraživač pronađe veliku manu u vodećem modelu, da li se oseća bezbedno da to prijavi ako bi to moglo da sruši vrednost kompanije?
BotNews.today користи АИ алате за истраживање, писање, уређивање и превођење садржаја. Наш тим прегледа и надгледа процес како би информације биле корисне, јасне и поуздане.
Finansijski pritisak na ove firme je ogroman. Takođe moramo uzeti u obzir ekološku cenu. Da li je potraga za malo boljim benchmark rezultatima vredna ogromnog ugljeničnog otiska treniranja ovih modela? Često govorimo o prednostima AI za životnu sredinu, ali retko vidimo bilans koji balansira to dvoje. Konačno, ko poseduje kulturu na kojoj su ovi modeli trenirani? Istraživači koriste kolektivni output interneta da izgrade svoje sisteme. Osnivači zatim naplaćuju javnosti pristup destilovanoj verziji tog istog output-a. Ovo je transfer bogatstva o kojem se retko raspravlja u naslovima. Ovo nisu samo tehnički problemi. To su društvene i etičke dileme koje zahtevaju više od samo boljeg algoritma da bi se rešile.
Tehnička ograničenja i lokalna implementacija
Za one koji grade na ovim platformama, tehnički detalji su važniji od filozofije. Trenutna API ograničenja su glavno usko grlo za usvajanje u preduzećima. Većina provajdera ima stroga ograničenja brzine koja sprečavaju obradu visokog obima u realnom vremenu. Zato mnoge firme gledaju ka lokalnom skladištenju i lokalnom izvršavanju. Korišćenje modela kao što je Llama 3 na lokalnom hardveru omogućava bolju privatnost podataka i niže dugoročne troškove. Međutim, hardverski zahtevi su visoki. Da biste pokrenuli model sa 70 milijardi parametara pristojnom brzinom, potrebni su vam vrhunski GPU-ovi sa značajnim VRAM-om. Ovde se geek sekcija susreće sa finansijskom sekcijom. Cena H100 klastera je barijera za ulazak koja drži moć u rukama bogatih.
Takođe vidimo pomak ka specijalizovanom fine-tuning-u. Umesto korišćenja opšteg modela za sve, developeri koriste manje modele trenirane na specifičnim skupovima podataka. Ovo poboljšava preciznost i smanjuje broj tokena. Tehnički izazov ovde je kuracija podataka. Ako su ulazni podaci loši, fine-tuned model će biti gori od opšteg. Takođe vidimo veću upotrebu Retrieval Augmented Generation (RAG) za utemeljivanje modela u činjeničnim podacima. Ovo zaobilazi potrebu za ogromnim context window-ima i smanjuje halucinacije. Ali RAG ima svoja ograničenja, posebno u tome kako rukuje rangiranjem preuzetih dokumenata. Ako korak pretrage ne uspe, output modela je beskoristan. Većina korisnika ne shvata da performanse AI zavise jednako od baze podataka koju pretražuje, kao i od samog modela.
Konačni filter za informacije
Budućnost AI nije jedna priča koju priča jedna osoba. To je neuredna, tekuća debata između onih koji prodaju viziju i onih koji grade realnost. Da biste bili pametan potrošač tehnoloških vesti, morate naučiti da gledate dalje od harizmatičnog osnivača. Tražite imena na radovima. Tražite istraživače koji su voljni da govore o tome šta njihovi modeli ne mogu da urade. Kontradikcije u industriji nisu bagovi. One su najiskreniji deo priče. Polje će nastaviti da se razvija jer su tehnički problemi daleko od rešenih. Glavno pitanje ostaje: možemo li izgraditi zaista inteligentan sistem bez ogromne potrošnje resursa koja definiše trenutnu eru? Dok ne odgovorimo na to, hajp će nastaviti da nadmašuje nauku. Moramo ostati skeptični prema svakom narativu koji obećava savršeno rešenje bez pominjanja kompromisa koji su uključeni.
Napomena urednika: Kreirali smo ovaj sajt kao višejezični centar za vesti i vodiče o veštačkoj inteligenciji za ljude koji nisu kompjuterski genijalci, ali ipak žele da razumeju veštačku inteligenciju, koriste je sa više samopouzdanja i prate budućnost koja već stiže.
Пронашли сте грешку или нешто што треба исправити? Јавите нам.