AI intervjui koje ste propustili (a niste smeli)
Najbitniji uvidi u budućnost veštačke inteligencije retko se nalaze u onim „ispeglanim“ saopštenjima za medije ili blještavim prezentacijama. Umesto toga, oni su zakopani u pauzama, nervoznim izbegavanjima odgovora i tehničkim digresijama u dugim intervjuima koje većina ljudi preskoči. Kada jedan CEO priča tri sata na nekom tehničkom podkastu, korporativna maska kad-tad padne. Ovi momenti otkrivaju realnost koja je u potpunoj suprotnosti sa onim što nam marketing servira. Dok se zvanične izjave fokusiraju na bezbednost i demokratizaciju, ovi neplanirani komentari ukazuju na mahnitu trku za sirovom snagom i tiho priznanje da put pred nama postaje sve skuplji i manje predvidiv. Glavna stvar koju smo naučili iz prošlogodišnjih razgovora na visokom nivou jeste da se industrija udaljava od običnih chatbot-ova i ide ka specijalizovanim agentima koji zahtevaju ogromne promene u infrastrukturi. Ako čitate samo naslove, propustili ste priznanje da trenutne metode skaliranja možda udaraju u zid. Prava priča se krije u tome kako ovi lideri opisuju svoja hardverska ograničenja i kako menjaju samu definiciju inteligencije.
Da bismo razumeli ove promene, moramo pogledati konkretne razgovore lidera iz OpenAI, Anthropic-a i Google DeepMind-a. U poslednjim dugim diskusijama, fokus se pomerio sa onoga što modeli mogu da urade na to kako se oni zapravo prave. Na primer, kada Dario Amodei iz Anthropic-a priča o „zakonima skaliranja“ (scaling laws), on ne misli samo na to da modeli postanu veći. On nagoveštava budućnost u kojoj bi troškovi treniranja jednog modela mogli dostići desetine milijardi dolara. To je ogroman skok u odnosu na rane dane industrije kada je par miliona dolara bilo dovoljno za igru. Ovi intervjui otkrivaju sve veći jaz između kompanija koje mogu da priušte ovaj „porez na compute“ i onih koje ne mogu. Izbegavanje odgovora je podjednako rečito. Kada ih pitaju odakle dolaze podaci za trening, direktori često skreću temu na synthetic data. To je strateški mig da je internet praktično „iscrpljen“ kao resurs. Industrija sada pokušava da provali kako da natera modele da uče iz sopstvene logike, a ne samo da imitiraju ljudski tekst. Ova promena strategije se retko najavljuje na blogovima, ali je glavna tema u tehničkim krugovima.
Globalne posledice ovih tihih priznanja su ogromne. Vidimo početak nečega što neki zovu „suverenitet procesorske snage“ (compute sovereignty). Države više ne traže samo softver. One traže fizičku infrastrukturu na kojoj će ti modeli raditi. Intervjui sugerišu da će sledeću fazu razvoja definisati proizvodnja energije i lanci snabdevanja čipovima, a ne samo pametno kodiranje. Ovo utiče na sve – od državnih regulatora do vlasnika malih biznisa. Ako vodeći modeli zahtevaju energiju manjeg grada da bi se istrenirali, moć će se prirodno koncentrisati u rukama nekoliko moćnika. To je u suprotnosti sa pričom o otvorenom pristupu koju mnoge kompanije i dalje promovišu. Strateški tragovi u tehničkim diskusijama ukazuju na to da je „otvorena“ era AI-ja praktično gotova za najnaprednije sisteme. Ova promena već utiče na to kako se deli venture capital i kako se pišu trgovinske politike u Vašingtonu i Briselu. Svet reaguje na realnost iz ovih intervjua, čak i ako je šira javnost i dalje fokusirana na najnovije funkcije chatbot-a. Za više detalja o ovim promenama, možete pratiti najnoviju analizu AI industrije da vidite kako se ovi korporativni signali pretvaraju u tržišna kretanja.
Da biste razumeli uticaj u stvarnom svetu, zamislite dan jednog glavnog developera u srednjoj softverskoj firmi. Danas taj developer više ne piše samo kod. On provodi sate gledajući sirove snimke intervjua istraživača kako bi razumeo koji će API-jevi biti ugašeni, a koji će dobiti više resursa. Čuje istraživača kako pominje da su „reasoning tokens“ (tokeni za rezonovanje) novi prioritet. Odjednom, developer shvata da je njegova trenutna strategija integracije zastarela. Mora da pređe sa pravljenja jednostavnih omotača (wrappers) na dizajniranje sistema koji mogu da podnesu duge korake logičkog zaključivanja. Ovo nije teoretska promena. To je praktična potreba vođena tehničkim pravcem otkrivenim u dvočasovnom razgovoru na nekom nišnom YouTube kanalu. Zabuna koju većina ljudi ima jeste ideja da je AI gotov proizvod. To je zapravo pokretna meta. Kada direktor izbegne pitanje o potrošnji energije svog najnovijeg modela, on vam zapravo kaže da će cena vaših API poziva verovatno skočiti. Kada pokažu demo modela koji „razmišlja“ pre nego što progovori, pripremaju vas za budućnost gde je kašnjenje (latency) zapravo funkcija, a ne bag. Ovi informacioni signali su jedini način da ostanete ispred svih.
Vizuelni materijal u ovim intervjuima pruža dokaze koje sami transkripti ne mogu da uhvate. Kada pitaju nekog CEO-a o potencijalu modela da zamene određene poslove, govor tela često odaje nivo sigurnosti koji njihove reči pokušavaju da ublaže. Nervozan smeh ili brz pogled skrenut sa kamere mogu signalizirati da su interne projekcije mnogo agresivnije od javnih izjava. To vidimo kada lideri diskutuju o vremenskom okviru za AGI (opšta veštačka inteligencija). Usmeni odgovor može biti „u toku decenije“, ali intenzitet diskusije sugeriše da rade po mnogo bržem rasporedu. To stvara raskorak između onoga što javnost očekuje i onoga što kompanije zapravo grade. Praktični ulozi su veliki. Ako se biznisi spremaju za sporu tranziciju dok se tehnologija kreće ubrzano, ekonomsko trenje će biti žestoko. Primeri novih proizvoda poput OpenAI o1 serije pokazuju da je priča o modelima koji „razmišljaju“ stvarna. To više nije samo teorija o boljem autocomplete-u. To je fundamentalna promena u tome kako mašine obrađuju logiku.
Primena sokratovskog skepticizma na ove intervjue otkriva nekoliko skrivenih troškova i nerešenih tenzija. Ako ovi modeli postaju efikasniji, zašto potražnja za strujom raste eksponencijalno? Lideri industrije često pričaju o dobicima u efikasnosti dok istovremeno traže stotine milijardi dolara za nove data centre. To je kontradikcija koja ostaje uglavnom neobjašnjena. Ko će na kraju platiti za svu tu infrastrukturu? Skriveni trošak možda nije samo finansijski, već i ekološki i društveni. Tu je i pitanje privatnosti u eri „agentic“ AI-ja. Ako AI treba da deluje u vaše ime, potreban mu je pristup vašim najosetljivijim podacima. Intervjui retko daju jasan odgovor na to kako će ti podaci biti zaštićeni na način koji zadovoljava i korisnost i bezbednost. Moramo se zapitati i o radu koji stoji iza ovih modela. „Čovek u petlji“ (human in the loop) je često slabo plaćen radnik u zemlji u razvoju koji označava podatke u užasnim uslovima. Ovaj deo priče se skoro uvek izostavlja iz vizionarskih govora.
BotNews.today користи АИ алате за истраживање, писање, уређивање и превођење садржаја. Наш тим прегледа и надгледа процес како би информације биле корисне, јасне и поуздане.
Za napredne korisnike i developere, „geek“ deo ovih intervjua je tamo gde leži prava vrednost. Diskusija se često okreće ka specifičnim ograničenjima trenutnih arhitektura. Sve više slušamo o „zidu memorije“ (memory wall) gde brzina prenosa podataka između procesora i memorije postaje glavno usko grlo. Zato lokalno skladištenje i edge computing postaju glavne teme. Ako je cloud prespor ili preskup za aplikacije u realnom vremenu, industrija mora da se okrene manjim, efikasnijim modelima koji mogu da rade na običnom hardveru. Intervjui sugerišu da ćemo videti podeljeno tržište. Postojaće masivni modeli sa trilionima parametara u cloud-u za kompleksne zadatke i visoko optimizovani, „destilovani“ modeli za svakodnevnu upotrebu. Developeri treba da obrate pažnju na pominjanje termina kao što su quantization i speculative decoding. To su tehnike koje će odrediti da li je neka aplikacija održiva za masovnu publiku. API ograničenja su još jedan kritičan faktor. Dok marketing obećava neograničen potencijal, tehnička realnost je stalna borba sa rate limit-ima i cenom tokena. Razumevanje integracija radnih procesa koje istraživači pominju je ključ za pravljenje održivih proizvoda. Idemo ka svetu gde je model samo jedan deo većeg „compound AI sistema“ koji uključuje baze podataka, alate za pretragu i eksterne izvršioce koda.
- Prelazak sa logike jednog modela na složene sisteme koji koriste više alata za proveru odgovora.
- Sve veći značaj „inference-time compute-a“ gde model troši više vremena na obradu jednog upita.
Suština je da su najvažnije informacije u AI svetu skrivene svima pred očima. Ignorisanjem dugih intervjua i fokusiranjem samo na najzanimljivije delove, većina ljudi propušta strateški zaokret koji se upravo dešava. Industrija prelazi iz faze otkrića u faze masovne industrijalizacije. To zahteva drugačiji set veština i drugačiji način razmišljanja o tehnologiji. Izbegavanja i kontradikcije lidera u ovoj oblasti nisu samo korporativni PR. Oni su mapa izazova koji će definisati narednih pet godina. Krećemo se ka budućnosti u kojoj je „inteligencija“ roba koja se rudari, prerađuje i prodaje kao struja. Da li će to dovesti do produktivnijeg društva ili do još veće centralizacije, zavisi od toga kako tumačimo ove rane signale i koja pitanja odlučimo da postavimo sada. Signali su tu za svakoga ko želi da sluša dalje od samog hype-a.
Napomena urednika: Kreirali smo ovaj sajt kao višejezični centar za vesti i vodiče o veštačkoj inteligenciji za ljude koji nisu kompjuterski genijalci, ali ipak žele da razumeju veštačku inteligenciju, koriste je sa više samopouzdanja i prate budućnost koja već stiže.
Пронашли сте грешку или нешто што треба исправити? Јавите нам.