DeepSeek, Perplexity i novi talas AI izazivača

Era skupih monopola u svetu veštačke inteligencije se polako završava. Protekle dve godine industrija je funkcionisala pod pretpostavkom da vrhunske performanse zahtevaju milijarde dolara u hardveru i ogromnu potrošnju energije. DeepSeek i Perplexity sada dokazuju da efikasnost može da pobedi čistu sirovu snagu. DeepSeek je šokirao tržište objavljivanjem modela koji pariraju liderima industrije uz delić troškova obuke. U međuvremenu, Perplexity iz temelja menja način na koji komuniciramo sa internetom, zamenjujući tradicionalnu listu linkova direktnim, citiranim odgovorima. Ova promena nije samo u novim alatima, već u fundamentalnoj promeni ekonomije inteligencije. Fokus se pomerio sa toga koliko model može biti veliki na to koliko malo može koštati njegovo pokretanje. Kako ovi izazivači dobijaju na zamahu, etablirani giganti su primorani da brane svoje profitabilne poslovne modele od talasa agilnih, specijalizovanih konkurenata koji prioritet daju korisnosti, a ne marketinškom hajp-u.

Šok efikasnosti na tržištu inteligencije

DeepSeek predstavlja promenu u realnosti AI proizvoda. Dok se mnoge kompanije fokusiraju na izgradnju što većih neuralnih mreža, ovaj tim se usredsredio na arhitektonsku optimizaciju. Njihov DeepSeek-V3 model koristi pristup „mešavine eksperata“ (Mixture of Experts) koji aktivira samo mali deo ukupnih parametara za bilo koji zadatak. To omogućava modelu da zadrži visoke performanse uz drastično smanjenje računarske snage potrebne za svaku generisanu reč. Narativ oko ove kompanije često se vrti oko niskog budžeta za obuku, koji je navodno ispod šest miliona dolara. Ova cifra dovodi u pitanje ideju da samo najbogatije nacije i korporacije mogu graditi vrhunske modele. To sugeriše da je barijera za ulazak u svet mašinskog učenja niža nego što se ranije mislilo.

Perplexity pristupa problemu iz ugla korisničkog interfejsa. To je „mašina za odgovore“, a ne tradicionalni pretraživač. Koristi postojeće velike jezičke modele za skeniranje interneta u realnom vremenu, izvlačenje relevantnih informacija i njihovo predstavljanje u kohezivnom pasusu sa fusnotama. Ovaj dizajnerski izbor rešava primarnu slabost standardnih AI modela, a to je tendencija da iznose činjenice koje su zastarele ili potpuno izmišljene. Zasnivanjem svakog odgovora na podacima sa veba u realnom vremenu, Perplexity je stvorio alat koji deluje pouzdanije za profesionalno istraživanje od običnog chat bot-a. Proizvod nije samo sam model, već sistem preuzimanja i citiranja koji ga okružuje. Ovakav pristup vrši ogroman pritisak na tradicionalne provajdere pretrage koji se oslanjaju na prihode od reklama kada korisnici klikću kroz više stranica rezultata.

BotNews.today користи АИ алате за истраживање, писање, уређивање и превођење садржаја. Наш тим прегледа и надгледа процес како би информације биле корисне, јасне и поуздане.

Ako korisnik dobije odgovor iz prve, nema razloga da pretražuje listu sponzorisanih linkova ili navigira kroz nepregledne veb stranice. Ovo stvara direktan konflikt između korisnosti alata i trenutne ekonomske strukture veba.

Geopolitika jeftinog računarstva

Globalni uticaj ovih izazivača ukorenjen je u demokratizaciji vrhunskih performansi. Kada trošak pokretanja modela padne za devedeset procenata, potencijal za integraciju u svakodnevni softver eksponencijalno raste. Programeri na tržištima u razvoju, koji su ranije bili isključeni zbog visokih cena API-ja, sada mogu graditi sofisticirane aplikacije. Ovo menja težište čitave industrije. Ako najefikasniji modeli dolaze izvan tradicionalnih centara Silicijumske doline, strateška prednost masivnih domaćih server farmi počinje da bledi. To pokreće razgovor o suverenitetu modela i o tome da li zemlje treba da zavise od nekoliko centralizovanih provajdera ili da ulažu u sopstvene efikasne arhitekture. Ovo je signal koji vredi pratiti jer pomera industriju od dinamike „pobednik uzima sve“ ka fragmentisanijem i konkurentnijem tržištu.

Poslovni kupci počinju da osećaju ovu promenu na svom budžetu. Narativ o nižim troškovima menja način na koji kompanije planiraju svoje dugoročne tehnološke stekove. Ako model poput DeepSeek-a može pružiti osamdeset procenata korisnosti skupljeg rivala po deset procenata cene, poslovno opravdanje za skuplju opciju nestaje za većinu rutinskih zadataka. Ovo stvara tržište u nivoima gde su najskuplji modeli rezervisani za veoma kompleksno zaključivanje, dok većinu posla obavljaju efikasni izazivači. Ova ekonomska realnost utiče i na svet oglašavanja. Perplexity eksperimentiše sa modelom gde su reklame integrisane u proces istraživanja umesto da budu smetnja. Ovo bi moglo redefinisati kako brendovi dopiru do potrošača u eri kada ljudi više ne posećuju početne stranice niti skroluju kroz rezultate pretrage. Uticaj osećaju svi, od softverskog inženjera koji bira API do marketinškog direktora koji pokušava da pronađe publiku u svetu trenutnih odgovora.

Utorak sa mašinama za odgovore

Da bismo razumeli uticaj na realan svet, zamislite dan u životu finansijske analitičarke Sare. Ranije bi Sara započinjala jutro otvaranjem deset različitih tabova kako bi proverila kretanja na tržištu i vesti. Provodila bi sate sintetizujući podatke u jutarnji izveštaj. Danas koristi mašinu za odgovore da upita specifične podatke iz više izvora istovremeno. Traži poređenje tri različita kvartalna izveštaja i dobija citirani sažetak za nekoliko sekundi. Tačnost podataka je zagarantovana jer sistem vuče informacije direktno iz izvornog teksta. Ona više ne troši vreme na pronalaženje informacija. Troši ga na proveru i donošenje odluka na osnovu njih. Ovo je priča o distribuciji pretrage na delu. Interfejs je postao istraživač, a Sara je postala urednik. Njen radni proces je brži, ali je i zavisniji od tačnosti citata koje pruža mašina.

Kasnije tokom dana, Sari je potreban prilagođeni skript za automatizaciju unosa podataka. Umesto korišćenja asistenta opšte namene koji može biti skup, ona koristi specijalizovani model za kodiranje od izazivača kao što je DeepSeek. Model pruža kod trenutno, a pošto je trošak inferencije tako nizak, njena kompanija joj dozvoljava da ga koristi za hiljade malih zadataka tokom dana bez brige o budžetu. Ovako se menja tržište modela. Postaje pozadinski alat, a ne dragocen resurs. Pritisak na tradicionalno ponašanje pretrage je vidljiv kada Sara shvati da nije koristila standardnu traku za pretragu tri dana. Nema potrebe za listom linkova kada može imati strukturiran dokument. Sledeće tačke ilustruju promenu u njenoj dnevnoj rutini:

Sara zamenjuje ručno prikupljanje vesti automatizovanim citiranim sažecima koji se ažuriraju u realnom vremenu.
Koristi jeftine modele za repetitivne zadatke kodiranja koji su ranije bili preskupi za automatizaciju.
Njeno oslanjanje na tradicionalne pretraživače podržane reklamama pada na gotovo nulu jer nalazi veću vrednost u direktnim odgovorima.
Ušteda vremena joj omogućava da se fokusira na strategiju visokog nivoa i odnose sa klijentima umesto na lov na podatke.

Skrivena cena besplatne inteligencije

Sokratovski skepticizam zahteva da se zapitamo čega se odričemo u zamenu za ovu efikasnost. Ako je model znatno jeftiniji za obuku i pokretanje, odakle dolaze te uštede? Moramo se zapitati da li su podaci korišćeni za obuku ovih efikasnih modela dobijeni uz isti nivo provere kao i kod skupljih pandana. Postoji rizik da će trka za najnižom cenom dovesti do trke ka dnu kada je u pitanju privatnost podataka i prava intelektualne svojine. Ako kompanija ne naplaćuje mnogo za svoj model, da li umesto toga monetizuje podatke koje korisnici unose u njega? Moramo razmotriti i skrivenu cenu modela „mašine za odgovore“. Kada Perplexity sumira veb stranicu, ta stranica gubi posetioca. Ako kreatori originalnog sadržaja nisu kompenzovani, sama informacija na koju se ove mašine oslanjaju može na kraju nestati. Ko će finansirati novinarstvo i istraživanje 2026 ako čitaoci nikada zapravo ne posete izvor?

Još jedno teško pitanje uključuje pouzdanost ovih agilnih arhitektura. Da li pristup „mešavine eksperata“ uvodi nove tipove grešaka koje je teže otkriti? Moramo se zapitati da li žrtvujemo dubinu zarad brzine. Postoji opasnost da će korisnici postati previše zavisni od sažetih citata bez provere originalnog konteksta. To bi moglo dovesti do površnog razumevanja kompleksnih tema gde se nijanse gube u potrazi za konciznim odgovorom. Takođe treba biti skeptičan prema tvrdnjama o troškovima obuke. Da li su ove cifre potpuno transparentne ili izostavljaju troškove ljudskog rada i ekološki uticaj hardvera? Kako idemo ka svetu jeftine inteligencije, moramo ostati oprezni po pitanju kvaliteta i etike sistema koje integrišemo u svoje živote. Buka novog izdanja proizvoda često može nadjačati signal njegovih dugoročnih posledica.

Ispod haube novih izazivača

Za napredne korisnike, privlačnost ovih izazivača leži u njihovoj tehničkoj fleksibilnosti i mogućnostima integracije. DeepSeek-V3 koristi okvir za obuku koji optimizuje za FP8 preciznost, što omogućava brže računanje bez značajnog gubitka tačnosti. Ovo je veliki tehnički korak koji pomaže u objašnjenju njihove isplativosti. Njihov mehanizam „Multi-head Latent Attention“ smanjuje memorijski otisak modela tokom inferencije, što je kritičan faktor za programere koji žele da hostuju ove modele na sopstvenom hardveru. Mnogi od ovih novih modela su objavljeni sa otvorenim težinama (open weights), što znači da se mogu pokretati lokalno ili na privatnim cloud instancama. Ovo je velika prednost za preduzeća koja ne smeju da rizikuju slanje osetljivih podataka API-ju treće strane. Sposobnost finog podešavanja ovih modela na specifičnim skupovima podataka dodatno povećava njihovu vrednost za nišne primene u pravnom, medicinskom ili finansijskom sektoru.

Имате причу о вештачкој интелигенцији, алат, тренд или питање које мислите да бисмо требали да покријемо? Пошаљите нам своју идеју за чланак — волели бисмо да је чујемо.

Perplexity nudi drugačiju vrstu tehničke vrednosti kroz svoj API, koji omogućava programerima da ugrade mogućnosti pretrage direktno u svoje aplikacije. Ovo zaobilazi potrebu za posebnim indeksom pretrage i posebnim jezičkim modelom. Sistem automatski upravlja uzemljenjem i citiranjem. Međutim, postoje ograničenja. Ograničenja API stope (rate limits) i latencija pretrage veba u realnom vremenu mogu biti usko grlo za aplikacije visokog obima. Korisnici takođe moraju upravljati kompromisom između brzine pretrage i dubine analize. Lokalno skladištenje ovih rezultata pretrage je još jedno razmatranje za napredne korisnike koji moraju da održavaju revizorski trag o tome odakle potiču njihove informacije. Sledeći tehnički faktori trenutno definišu konkurentsku prednost ovih alata:

Upotreba „Multi-head Latent Attention“ za smanjenje upotrebe KV keš memorije tokom zadataka sa dugim kontekstom.
Podrška za FP8 obuku i inferenciju radi maksimizacije protoka modernog GPU hardvera.
Integracija RAG cevovoda u realnom vremenu koji može da obradi hiljade istovremenih veb upita.
Dostupnost otvorenih težina za lokalno raspoređivanje u sigurnim okruženjima.

Budućnost selektivne inteligencije

Uspon DeepSeek-a i Perplexity-ja označava početak zrelijeg AI tržišta. Udaljavamo se od noviteta modela koji mogu da pričaju ka korisnosti modela koji mogu efikasno da rade. Težište se pomera ka provajderima koji mogu isporučiti visokokvalitetne rezultate po održivoj ceni. Ovo nije samo trend za trenutni 2026 već dugoročna promena u načinu na koji gradimo i konzumiramo digitalne usluge. Pritisak na tradicionalnu pretragu i provajdere skupih modela samo će se povećavati kako ovi izazivači budu usavršavali svoje proizvode. Za korisnika, to znači veći izbor i bolje alate. Za industriju, to znači obnovljen fokus na inženjersku izvrsnost umesto na brutalnu računarsku snagu. Pravi pobednici biće oni koji mogu da razlikuju buku hajp ciklusa od signala istinske strukturne promene u tehnološkoj ekonomiji.

Napomena urednika: Kreirali smo ovaj sajt kao višejezični centar za vesti i vodiče o veštačkoj inteligenciji za ljude koji nisu kompjuterski genijalci, ali ipak žele da razumeju veštačku inteligenciju, koriste je sa više samopouzdanja i prate budućnost koja već stiže.

Пронашли сте грешку или нешто што треба исправити? Јавите нам.

Frequently Asked Questions

Kako čitaoci mogu praktično da koriste članke o „Pratimo čipove“?

Saznajte sve o poluprovodnicima, GPU lansiranjima i AI infrastrukturi. Pratimo čipove nudi jasne analize i vesti iz sveta hardvera za široku publiku. Koristite ove članke da uporedite alate, razumete rizike, postavite bolja pitanja i odlučite šta zaslužuje pažnju pre nego što potrošite vreme ili novac.

Zašto je „Pratimo kompanije“ važno za obične čitaoce o AI?

Pratite najnovije vesti o kompanijama, strategije proizvoda, akvizicije i promene poslovnih modela na jednom mestu. Važno je jer povezuje vesti o AI sa praktičnim izborima o radu, privatnosti, troškovima, poverenju i alatima koje ljudi zaista koriste.