DeepSeek, Perplexity és az AI-kihívók új hulláma

A drága mesterséges intelligencia-monopóliumok korszaka leáldozóban van. Az elmúlt két évben az iparág abban a hitben élt, hogy a csúcsteljesítményhez dollármilliárdok kellenek a számítási kapacitásba és hatalmas energiafogyasztás. A DeepSeek és a Perplexity most bebizonyítják, hogy a hatékonyság legyőzheti a puszta méretet. A DeepSeek azzal sokkolta a piacot, hogy olyan modelleket adott ki, amelyek a piaci vezetők teljesítményét nyújtják, a betanítási költségek töredékéért. Eközben a Perplexity alapjaiban változtatja meg az internetezési szokásainkat: a hagyományos linklisták helyett közvetlen, forrásokkal ellátott válaszokat kínál. Ez a váltás nem csupán új eszközökről szól, hanem az intelligencia gazdaságtanának alapvető átalakulásáról. A hangsúly átkerült arról, hogy mekkora egy modell, arra, hogy milyen olcsón futtatható. Ahogy ezek a kihívók teret nyernek, a nagy óriáscégek kénytelenek megvédeni magas haszonkulcsú üzleti modelljeiket a karcsú, specializált versenytársak hullámával szemben, amelyek a hype helyett a hasznosságot helyezik előtérbe.

Hatékonysági sokk az intelligencia piacán

A DeepSeek az AI-világ termékvalóságának elmozdulását jelzi. Míg sok vállalat a lehető legnagyobb neurális hálózatok építésére fókuszál, ez a csapat az architekturális optimalizálásra koncentrált. A DeepSeek-V3 modelljük „Mixture of Experts” megközelítést alkalmaz, amely csak a paraméterek egy kis részét aktiválja az adott feladathoz. Ez lehetővé teszi a modellnek, hogy megőrizze a magas teljesítményt, miközben drasztikusan csökkenti az egyes szavak generálásához szükséges számítási teljesítményt. A cég körüli narratíva gyakran az alacsony, állítólag hatmillió dollár alatti betanítási költség körül forog. Ez az adat megkérdőjelezi azt az elképzelést, hogy csak a leggazdagabb nemzetek és vállalatok képesek élvonalbeli modelleket építeni. Azt sugallja, hogy a magas szintű machine learning belépési küszöbe alacsonyabb, mint korábban gondoltuk.

A Perplexity a felhasználói felület oldaláról közelíti meg a problémát. Ez egy válaszmotor, nem pedig egy hagyományos keresőmotor. Meglévő nagy nyelvi modelleket használ az élő web átvizsgálására, a releváns információk kinyerésére, majd azokat összefüggő bekezdésekben, lábjegyzetekkel mutatja be. Ez a tervezési döntés kezeli a standard AI-modellek elsődleges gyengeségét, azaz a hajlamot az elavult vagy teljesen kitalált tények állítására. Azzal, hogy minden választ valós idejű webes adatokra alapoz, a Perplexity egy olyan eszközt hozott létre, amely professzionális kutatáshoz megbízhatóbbnak tűnik, mint egy átlagos chatbot. A termék nem csupán maga a modell, hanem az azt körülvevő lekérdezési és hivatkozási rendszer. Ez a megközelítés óriási nyomást helyez a hagyományos keresőszolgáltatókra, amelyek a felhasználók által több oldalon átkattintott hirdetési bevételekre támaszkodnak.

A BotNews.today mesterséges intelligencia eszközöket használ a tartalom kutatására, írására, szerkesztésére és fordítására. Csapatunk felülvizsgálja és felügyeli a folyamatot, hogy az információ hasznos, világos és megbízható maradjon.

Ha egy felhasználó elsőre megkapja a választ, nincs oka végigböngészni a szponzorált linkek listáját vagy zsúfolt weboldalakon navigálni. Ez közvetlen konfliktust teremt az eszköz hasznossága és a web jelenlegi gazdasági struktúrája között.

Az olcsó számítási kapacitás geopolitikája

Ezeknek a kihívóknak a globális hatása a nagy teljesítményű következtetés (inference) demokratizálódásában gyökerezik. Amikor egy modell futtatási költsége kilencven százalékkal csökken, a mindennapi szoftverekbe való integráció lehetősége exponenciálisan nő. A feltörekvő piacokon dolgozó fejlesztők, akiket korábban kizártak a csúcskategóriás API-k használatából, most kifinomult alkalmazásokat építhetnek. Ez megváltoztatja az egész iparág súlypontját. Ha a leghatékonyabb modellek a hagyományos Silicon Valley-i központokon kívülről érkeznek, a hatalmas hazai szerverfarmok stratégiai előnye csökkenni kezd. Ez párbeszédet kényszerít ki a modell-szuverenitásról, és arról, hogy az országoknak néhány központi szolgáltatótól kell-e függniük, vagy saját hatékony architektúrákba kell-e fektetniük. Ezt a jelet érdemes követni, mert az iparágat a „győztes mindent visz” dinamikától egy töredezettebb és versenyképesebb piac felé tereli.

A vállalati vásárlók kezdik érezni ezt a változást a pénzügyi eredményeiken. Az alacsonyabb költségű következtetés narratívája megváltoztatja, hogyan tervezik a cégek hosszú távú technológiai struktúráikat. Ha egy modell, mint a DeepSeek, egy drágább rivális hasznosságának nyolcvan százalékát nyújtja tíz százalékos áron, a legtöbb rutinfeladatnál elpárolog az üzleti indoklás a drágább opció mellett. Ez egy rétegzett piacot hoz létre, ahol a legdrágább modelleket a rendkívül összetett érvelésre tartják fenn, míg a munka nagy részét hatékony kihívók végzik. Ez a gazdasági valóság a hirdetési világot is érinti. A Perplexity olyan modellel kísérletezik, ahol a hirdetések a kutatási folyamatba integrálódnak, ahelyett, hogy elvonnák a figyelmet. Ez újraértelmezheti, hogyan érik el a márkák a fogyasztókat egy olyan korban, amikor az emberek már nem látogatják a kezdőlapokat, és nem görgetik a keresési találatokat. A hatást mindenki érzi, a szoftvermérnöktől, aki API-t választ, a marketingigazgatóig, aki közönséget próbál találni az azonnali válaszok világában.

Egy kedd a válaszmotorokkal

A valós hatás megértéséhez vegyük egy Sarah nevű pénzügyi elemző napját. Régebben Sarah tíz különböző lap megnyitásával kezdte a reggelt, hogy ellenőrizze a piaci mozgásokat és a híreket. Órákat töltött az adatok összefoglalásával egy reggeli tájékoztatóhoz. Ma egy válaszmotort használ, hogy egyszerre több forrásból kérdezzen le konkrét adatpontokat. Három különböző negyedéves jelentés összehasonlítását kéri, és másodpercek alatt megkapja a hivatkozott összefoglalót. Az adatok helyessége pontos, mert a rendszer közvetlenül a forrásszövegből dolgozik. Már nem az információkereséssel tölti az idejét, hanem az ellenőrzéssel és a döntéshozatallal. Ez a keresési disztribúció története a gyakorlatban. A felület lett a kutató, Sarah pedig a szerkesztő. A munkafolyamata gyorsabb, de jobban függ a motor által biztosított hivatkozások pontosságától.

A nap folyamán Sarah-nak egy egyedi szkriptet kell írnia egy adatbeviteli feladat automatizálásához. Ahelyett, hogy egy általános célú asszisztenst használna, ami prémium költséggel járhat, egy olyan kihívó speciális kódoló modelljét használja, mint a DeepSeek. A modell azonnal biztosítja a kódot, és mivel a következtetési költség olyan alacsony, a cége lehetővé teszi, hogy naponta több ezer apró feladathoz használja anélkül, hogy aggódnia kellene a költségvetés miatt. Így változik a modellpiac. Háttérszolgáltatássá válik, nem pedig drága erőforrássá. A hagyományos keresési viselkedésre nehezedő nyomás akkor válik láthatóvá, amikor Sarah rájön, hogy három napja nem használt szabványos keresősávot. Nincs szüksége linklistára, ha strukturált dokumentumot kaphat. A következő pontok szemléltetik a napi rutinjának változását:

Sarah a kézi hírösszegyűjtést automatizált, hivatkozott összefoglalókra cseréli, amelyek valós időben frissülnek.
Alacsony költségű modelleket használ ismétlődő kódolási feladatokhoz, amelyek korábban túl drágák voltak a nagyüzemi automatizáláshoz.
A hagyományos, hirdetésekkel támogatott keresőmotorok iránti függősége majdnem nullára csökken, mivel a közvetlen válaszokban több értéket talál.
A megtakarított idő lehetővé teszi, hogy a magas szintű stratégiára és az ügyfélkapcsolatokra összpontosítson az adatvadászat helyett.

Az ingyenes intelligencia rejtett ára

A szókratészi szkepticizmus megköveteli, hogy megkérdezzük, miről mondunk le ezért a hatékonyságért cserébe. Ha egy modell betanítása és futtatása lényegesen olcsóbb, honnan származnak a megtakarítások? Meg kell kérdeznünk, hogy az ezeknek a hatékony modelleknek a betanításához használt adatokat ugyanolyan alapossággal szerezték-e be, mint a drágább társaiknál. Fennáll a kockázata annak, hogy az árak csökkentéséért folytatott verseny az adatvédelem és a szellemi tulajdonjogok leépítéséhez vezet. Ha egy vállalat nem kér sokat a modelljéért, vajon nem a felhasználók által betáplált adatokat monetizálja-e? Figyelembe kell vennünk a válaszmotor-modell rejtett költségeit is. Amikor a Perplexity összefoglal egy weboldalt, az az oldal elveszít egy látogatót. Ha az eredeti tartalom készítőit nem kártalanítják, az az információ, amire ezek a motorok támaszkodnak, végül eltűnhet. Ki fogja finanszírozni a 2026 újságírását és kutatását, ha az olvasók sosem látogatják meg a forrást?

Egy másik nehéz kérdés ezeknek a karcsú architektúráknak a megbízhatósága. Vajon a „Mixture of Experts” megközelítés új típusú hibákat vezet be, amelyeket nehezebb észlelni? Meg kell kérdeznünk, hogy a sebesség kedvéért feláldozzuk-e a mélységet. Fennáll a veszélye, hogy a felhasználók túlságosan támaszkodnak az összefoglalt hivatkozásokra anélkül, hogy ellenőriznék az eredeti kontextust. Ez az összetett témák felületes megértéséhez vezethet, ahol a нюанsok elvesznek a tömör válaszok hajszolásában. Szkeptikusnak kell lennünk a betanítási költségekre vonatkozó állításokkal szemben is. Vajon ezek az adatok teljesen átláthatóak, vagy figyelmen kívül hagyják az emberi munkaerő költségét és a hardver környezeti hatását? Ahogy haladunk az olcsó intelligencia világa felé, ébernek kell maradnunk az általunk integrált rendszerek minőségével és etikájával kapcsolatban. Egy új termék megjelenésének zaja gyakran elnyomhatja a hosszú távú következmények jelzéseit.

A motorháztető alatt: az új kihívók

A haladó felhasználók számára ezeknek a kihívóknak a vonzereje a technikai rugalmasságban és az integrációs képességekben rejlik. A DeepSeek-V3 olyan betanítási keretrendszert használ, amely FP8 pontosságra optimalizál, ami gyorsabb számítást tesz lehetővé a pontosság jelentős csökkenése nélkül. Ez egy jelentős technikai mérföldkő, amely segít megmagyarázni a költséghatékonyságukat. A Multi-head Latent Attention mechanizmusuk csökkenti a modell memóriafoglalását a következtetés során, ami kritikus tényező azoknak a fejlesztőknek, akik saját hardveren szeretnék futtatni ezeket a modelleket. Sok új modell nyílt súlyokkal (open weights) jelenik meg, ami azt jelenti, hogy helyileg vagy privát cloud példányokon is futtathatók. Ez hatalmas előny azoknak a vállalatoknak, amelyek nem kockáztathatják meg, hogy érzékeny adatokat küldjenek egy harmadik fél API-jához. Ezen modellek finomhangolása konkrét adatkészleteken tovább növeli az értéküket a jogi, orvosi vagy pénzügyi szektor speciális alkalmazásai számára.

Van egy AI-történet, eszköz, trend vagy kérdés, amiről úgy gondolja, hogy foglalkoznunk kellene vele? Küldje el nekünk cikkötletét — szívesen meghallgatnánk.

A Perplexity másfajta technikai értéket kínál az API-ján keresztül, amely lehetővé teszi a fejlesztőknek, hogy közvetlenül a saját alkalmazásaikba építsenek keresési képességeket. Ez kiküszöböli a külön keresési index és a külön nyelvi modell szükségességét. A rendszer automatikusan kezeli a megalapozottságot és a hivatkozást. Vannak azonban korlátok. Az API-sebességkorlátok és a valós idejű webes keresés késleltetése szűk keresztmetszet lehet a nagy volumenű alkalmazásoknál. A felhasználóknak kezelniük kell a kompromisszumot a keresés sebessége és az elemzés mélysége között. A keresési eredmények helyi tárolása egy másik szempont a haladó felhasználók számára, akiknek auditálható nyomvonalra van szükségük az információik eredetéről. A következő technikai tényezők határozzák meg jelenleg ezeknek az eszközöknek a versenyelőnyét:

A Multi-head Latent Attention használata a KV cache memóriahasználat csökkentésére hosszú kontextusú feladatoknál.
Az FP8 betanítás és következtetés támogatása a modern GPU-hardverek áteresztőképességének maximalizálására.
Valós idejű RAG-pipeline-ok integrációja, amelyek több ezer egyidejű webes lekérdezést képesek kezelni.
Nyílt súlyok elérhetősége a biztonságos környezetben történő helyi telepítéshez.

A szelektív intelligencia jövője

A DeepSeek és a Perplexity felemelkedése egy érettebb AI-piac kezdetét jelzi. Távolodunk a beszélő modellek újdonságától, és haladunk a hatékonyan dolgozni képes modellek hasznossága felé. A súlypont azok felé a szolgáltatók felé tolódik, akik fenntartható áron tudnak kiváló minőségű eredményeket szállítani. Ez nem csupán a jelenlegi 2026 trendje, hanem hosszú távú változás abban, hogyan építünk és fogyasztunk digitális szolgáltatásokat. A hagyományos keresőkre és a magas költségű modellszolgáltatókra nehezedő nyomás csak nőni fog, ahogy ezek a kihívók finomítják termékeiket. A felhasználó számára ez több választási lehetőséget és jobb eszközöket jelent. Az iparág számára ez a mérnöki kiválóságra való megújult összpontosítást jelenti a nyers számítási erővel szemben. Az igazi nyertesek azok lesznek, akik képesek különbséget tenni a hype-ciklus zaja és a technológiai gazdaság valódi strukturális változásának jelei között.

A szerkesztő megjegyzése: Ezt az oldalt többnyelvű AI hírek és útmutatók központjaként hoztuk létre olyan emberek számára, akik nem számítógépes zsenik, de mégis szeretnék megérteni a mesterséges intelligenciát, magabiztosabban használni, és követni a már megérkező jövőt.

Hibát talált, vagy valami javításra szorul? Tudassa velünk.

Frequently Asked Questions

Hogyan használhatják az olvasók a „Chip Watch” cikkeket a gyakorlatban?

Kövesse a félvezető-ipar legfrissebb híreit, GPU-megjelenéseket és az AI-számítástechnika fejlődését a Chip Watch rovatban. Használja ezeket a cikkeket eszközök összehasonlítására, kockázatok megértésére, jobb kérdések feltevésére és annak eldöntésére, mire érdemes figyelmet fordítani idő vagy pénz ráfordítása előtt.

Miért fontos a „Cégfigyelő” a hétköznapi AI-olvasóknak?

Kövesse nyomon a legfontosabb vállalati híreket, stratégiai váltásokat és piaci trendeket a Cégfigyelő rovatunkban. Ez azért fontos, mert az AI-híreket gyakorlati döntésekhez kapcsolja a munkáról, adatvédelemről, költségekről, bizalomról és az emberek által valóban használt eszközökről.

Hatékonysági sokk az intelligencia piacán