Dug put do današnjeg AI hajpa
Trenutni nalet veštačke inteligencije deluje kao iznenadna oluja, ali je zapravo rezultat tihe odluke donete pre mnogo godina. Godine 2017, istraživači iz Google-a objavili su rad pod nazivom Attention Is All You Need. Ovaj rad je uveo Transformer arhitekturu. Taj specifičan dizajn omogućio je mašinama da obrađuju reči u odnosu na sve druge reči u rečenici istovremeno, umesto jednu po jednu. To je rešilo problem uskog grla sekvencijalne obrade. Danas se svaki veliki model, od ChatGPT-a do Claude-a, oslanja na ovaj jedan proboj. To se desilo oko 2026. Ne vidimo novi izum, već skaliranje sedam godina stare ideje. Ova promena nas je pomerila od jednostavnog prepoznavanja obrazaca ka kompleksnoj generaciji. Promenila je način na koji komuniciramo sa računarima. Sada je fokus na tome koliko podataka i električne energije možemo da ulijemo u ove sisteme. Rezultati su impresivni, ali osnova ostaje ista. Razumevanje ove istorije nam pomaže da sagledamo dalje od marketinga. Pokazuje da su današnji alati logičan zaključak specifičnih inženjerskih izbora napravljenih u poslednjoj deceniji.
Mehanizmi predviđanja i verovatnoća
Generativna AI funkcioniše kao masivni mehanizam za predviđanje. Ona ne razmišlja niti razume u ljudskom smislu. Umesto toga, izračunava statističku verovatnoću sledećeg tokena u nizu. Token je često reč ili deo reči. Kada postavite pitanje modelu, on gleda milijarde parametara koje je naučio tokom treninga. Zatim pogađa koja reč treba da sledi na osnovu obrazaca koje je video u podacima za obuku. Ovaj proces se često naziva stohastički papagaj. Taj termin sugeriše da mašina ponavlja obrasce bez razumevanja dubljeg značenja. Ova razlika je ključna za svakoga ko danas koristi ove alate. Ako tretirate AI kao pretraživač, možda ćete se razočarati. On ne traži činjenice u bazi podataka. On generiše tekst koji izgleda kao činjenice na osnovu verovatnoće. Zato modeli mogu da haluciniraju. Dizajnirani su da budu tečni, a ne nužno tačni. Podaci za obuku se obično sastoje od masivnog pretraživanja javnog interneta. To uključuje knjige, članke, kod i postove na forumima. Model uči strukturu ljudskog jezika i logiku programiranja. Takođe pokupi pristrasnosti i greške prisutne u tim izvorima. Obim ove obuke je ono što čini da moderni sistemi deluju drugačije od chatbota iz prošlosti. Stariji sistemi su se oslanjali na kruta pravila. Moderni sistemi se oslanjaju na fleksibilnu matematiku. Ova fleksibilnost im omogućava da sa iznenađujućom lakoćom obavljaju kreativne zadatke, kodiranje i prevođenje. Ipak, osnovni mehanizam ostaje matematičko nagađanje. To je veoma sofisticirano nagađanje, ali nije proces svesnog razmišljanja.
Način na koji ovi modeli obrađuju informacije prati specifičan ciklus od tri koraka:
- Model identifikuje obrasce u ogromnim skupovima podataka.
- Dodeljuje težine različitim tokenima na osnovu konteksta.
- Generiše najverovatniju sledeću reč u nizu.
Nova geografija računarstva
Uticaj ove tehnologije nije ravnomerno raspoređen širom planete. Vidimo masivnu koncentraciju moći u nekoliko geografskih centara. Većina vodećih modela razvija se u Sjedinjenim Američkim Državama ili Kini. Ovo stvara novu vrstu zavisnosti za druge nacije. Zemlje u Evropi, Africi i jugoistočnoj Aziji sada raspravljaju o tome kako da održe digitalni suverenitet. Moraju odlučiti da li da grade sopstvenu skupu infrastrukturu ili da se oslone na strane provajdere. Cena ulaska je izuzetno visoka. Obuka modela vrhunskog nivoa zahteva desetine hiljada specijalizovanih čipova i ogromne količine električne energije. Ovo stvara barijeru za manje kompanije i zemlje u razvoju. Tu je i pitanje kulturne reprezentacije. Pošto su većina podataka za obuku na engleskom, ovi modeli često odražavaju zapadne vrednosti i norme. Ovo može dovesti do oblika kulturnog izravnavanja. Lokalni jezici i tradicije mogu biti ignorisani ili pogrešno predstavljeni od strane sistema izgrađenih na drugom kraju sveta. Na ekonomskoj strani, promena je jednako dramatična. Kompanije u svakoj vremenskoj zoni pokušavaju da shvate kako da integrišu ove alate. U nekim regionima, AI se vidi kao način da se preskoče tradicionalne faze razvoja. U drugima, posmatra se kao pretnja autsorsing industrijama koje održavaju lokalne ekonomije. Trenutno stanje tržišta u 2026 pokazuje jasnu podelu. Globalno tržište rada postaje nestabilnije jer se zadaci poput osnovnog kodiranja i unosa podataka automatizuju. Ovo nije samo priča iz Silicijumske doline. To je priča o tome kako će se svaka ekonomija na zemlji prilagoditi novoj eri automatizovanog kognitivnog rada. Odluke koje donosi nekoliko proizvođača hardvera sada diktiraju ekonomsku budućnost čitavih regiona.
BotNews.today користи АИ алате за истраживање, писање, уређивање и превођење садржаја. Наш тим прегледа и надгледа процес како би информације биле корисне, јасне и поуздане.
Život sa automatizovanim asistentom
Da biste razumeli svakodnevni uticaj, razmotrite život marketing menadžera po imenu Markus. Pre dve godine, Markus je provodio jutra pišući mejlove, a popodneva koordinirajući sa grafičkim dizajnerima. Danas je njegov radni proces drugačiji. Dan počinje tako što ubacuje grubi opis proizvoda u lokalni model. U roku od nekoliko sekundi, ima pet različitih pravaca za kampanju. Ne koristi ih onakve kakvi jesu. Umesto toga, provodi naredna dva sata dorađujući rezultat. Proverava ton brenda i činjenične greške. Jednom je dobio nacrt koji je izmislio funkciju proizvoda koja ne postoji. Ovo je nova realnost rada. Manje je reč o stvaranju od nule, a više o uređivanju i kuriranju. Markus je produktivniji, ali je i umorniji. Tempo rada se ubrzao. Pošto početni nacrt traje sekunde, njegovi klijenti očekuju finalne verzije za nekoliko sati umesto dana. Ovo stvara konstantan pritisak da se proizvede više. To je ciklus brzog izbacivanja sadržaja koji ostavlja malo prostora za dublje razmišljanje. Izvan kancelarije, to vidimo u vladi i obrazovanju. Nastavnici prepravljaju svoje planove i programe kako bi uzeli u obzir AI asistenciju. Odmiču se od eseja za domaći zadatak ka usmenim ispitima uživo. Lokalne samouprave koriste AI za sumiranje javnih rasprava i prevođenje dokumenata za zajednice imigranata. Ovo su opipljive koristi. U bolnici u ruralnoj Indiji, lekar koristi AI alat za pomoć pri skriningu očnih bolesti. Alat je obučen na globalnom skupu podataka, ali pomaže u rešavanju lokalnog nedostatka specijalista. Ovi primeri pokazuju da je tehnologija alat za proširenje sposobnosti. Ona ne zamenjuje čoveka, već menja prirodu zadatka. Izazov je u tome što je alat često nepredvidiv. Sistem koji danas radi savršeno, sutra može da zakaže nakon malog ažuriranja. Ova nestabilnost je stalna pozadinska buka za sve, od individualnih kreatora do velikih korporacija. Svi učimo da koristimo alat koji se još uvek gradi dok ga držimo. Za više detalja, možete pročitati sveobuhvatnu analizu AI industrije na našem glavnom sajtu.
Skrivena cena predviđanja
Moramo postaviti teška pitanja o skrivenim troškovima ovog napretka. Prvo, tu je pitanje vlasništva nad podacima. Većina modela koje danas koristimo obučena je na podacima prikupljenim sa interneta bez izričitog pristanka. Da li je etično graditi proizvod vredan milijardu dolara koristeći kreativni rad miliona ljudi koji nikada neće videti ni cent tog profita? Ovo je pravna siva zona koju sudovi tek počinju da rešavaju. Zatim, tu je uticaj na životnu sredinu. Energija potrebna za obuku i pokretanje ovih modela je zapanjujuća. Kako prelazimo na veće sisteme, ugljenični otisak raste. Možemo li opravdati ovu potrošnju energije u vreme klimatske krize? Nedavne studije u časopisu Nature ističu masivnu potrošnju vode potrebnu za hlađenje data centara. Takođe moramo uzeti u obzir problem crne kutije. Čak ni inženjeri koji grade ove modele ne razumeju u potpunosti zašto donose određene odluke. Ako AI odbije zahtev za kredit ili intervju za posao, kako možemo revidirati tu odluku? Nedostatak transparentnosti je veliki rizik za građanske slobode. Verujemo našoj infrastrukturi sistemima koje ne možemo u potpunosti objasniti. Tu je i rizik od institucionalnog propadanja. Ako se oslanjamo na AI da generiše naše vesti, pravne podneske i kod, šta se dešava sa ljudskom ekspertizom? Možemo se naći u poziciji da više ne možemo da verifikujemo kvalitet rezultata jer smo izgubili veštine da sami obavimo posao. Ovo nisu samo tehničke prepreke. To su fundamentalni izazovi za to kako organizujemo društvo. Menjamo dugoročnu stabilnost za kratkoročnu efikasnost. Moramo se zapitati da li je to trgovina na koju smo zaista spremni.
Имате причу о вештачкој интелигенцији, алат, тренд или питање које мислите да бисмо требали да покријемо? Пошаљите нам своју идеју за чланак — волели бисмо да је чујемо.
Ispod haube lokalnih modela
Za napredne korisnike, fokus se pomerio sa jednostavnih promptova na kompleksne integracije radnih procesa. Prava vrednost više nije u veb interfejsu chatbota. Ona je u API-ju. Programeri sada upravljaju strogim ograničenjima stope i troškovima tokena. Odmiču se od masivnih modela opšte namene ka manjim, specijalizovanim. Ovde na scenu stupaju lokalno skladištenje i lokalno izvršavanje. Alati poput Llama.cpp omogućavaju korisnicima da pokreću moćne modele na sopstvenom hardveru. Ovo rešava problem privatnosti i uklanja zavisnost od stalne internet veze. Međutim, pokretanje ovih modela lokalno zahteva značajan VRAM. Većina korisnika smatra da je 24GB minimum za pristojno iskustvo sa modelima srednje veličine. Tu je i trend kvantizacije. To je tehnika koja smanjuje preciznost težina modela kako bi radili brže i koristili manje memorije. 4-bitni kvantizovani model često može da radi skoro jednako dobro kao puna 16-bitna verzija, zauzimajući delić prostora. Takođe vidimo uspon Retrieval Augmented Generation (RAG). Ovo omogućava modelu da pogleda privatne dokumente korisnika pre generisanja odgovora. Smanjuje halucinacije tako što model usidri u specifične, verifikovane činjenice. Ovo je most između opšteg mehanizma za predviđanje i korisnog poslovnog alata. Sledeća granica je kontekstualni prozor. Prešli smo sa modela koji su mogli da zapamte nekoliko stranica teksta na one koji mogu obraditi čitave biblioteke odjednom. Ovo omogućava analizu masivnih baza koda ili dugih pravnih dokumenata. Izazov je sada upravljanje kašnjenjem koje dolazi sa ovim velikim unosima. Kako pomeramo granice onoga što ovi sistemi mogu, usko grlo više nije softver. To su fizičke granice silicijuma i brzina svetlosti. Izveštaji iz MIT Technology Review i IEEE Spectrum sugerišu da je optimizacija hardvera sada glavni pokretač AI sposobnosti.
Napredni korisnici se trenutno fokusiraju na tri glavne oblasti optimizacije:
- Kvantizacija smanjuje memorijske zahteve za lokalni hardver.
- RAG sistemi povezuju modele sa privatnim, verifikovanim podacima.
- API integracija omogućava automatizovane radne procese u više koraka.
Nedovršena priča
Put do ove tačke bio je popločan specifičnim tehničkim izborima. Izabrali smo skalu umesto efikasnosti i verovatnoću umesto logike. To nam je dalo alate koji deluju magično, ali ostaju duboko manjkavi. Hype ciklus će se na kraju ohladiti, ali tehnologija će ostati. Ostali smo u svetu gde je linija između ljudske i mašinske kreacije trajno zamućena. Otvoreno pitanje je kako ćemo definisati vrednost u dobu beskonačnog, jeftinog sadržaja. Ako mašina može da napiše pesmu ili program za nekoliko sekundi, kolika je vrednost ljudskog napora da učini isto? Još uvek tražimo odgovor. Za sada, najbolji pristup je mešavina radoznalosti i skepticizma. Trebalo bi da koristimo ove alate da proširimo naše sposobnosti dok ostajemo svesni njihovih ograničenja. Budućnost AI nije gotov proizvod. To je kontinuirani pregovor između onoga što možemo da izgradimo i onoga što bi trebalo da izgradimo.
Napomena urednika: Kreirali smo ovaj sajt kao višejezični centar za vesti i vodiče o veštačkoj inteligenciji za ljude koji nisu kompjuterski genijalci, ali ipak žele da razumeju veštačku inteligenciju, koriste je sa više samopouzdanja i prate budućnost koja već stiže.
Пронашли сте грешку или нешто што треба исправити? Јавите нам.