DeepSeek, Perplexity och nästa våg av AI-utmanare

Eran av dyra monopol inom artificiell intelligens börjar lida mot sitt slut. Under de senaste två åren har branschen arbetat utifrån antagandet att topprestanda kräver miljarder dollar i beräkningskraft och massiv energiförbrukning. DeepSeek och Perplexity bevisar nu att effektivitet kan slå rå skala. DeepSeek chockade marknaden genom att släppa modeller som matchar branschledarnas prestanda till en bråkdel av träningskostnaden. Samtidigt förändrar Perplexity fundamentalt hur människor interagerar med internet genom att ersätta den traditionella listan av länkar med direkta, källhänvisade svar. Detta skifte handlar inte bara om nya verktyg. Det handlar om en grundläggande förändring i intelligensens ekonomi. Fokus har flyttats från hur stor en modell kan vara till hur lite det kan kosta att köra den. Allt eftersom dessa utmanare vinner mark tvingas de etablerade jättarna försvara sina affärsmodeller med höga marginaler mot en våg av slimmade, specialiserade konkurrenter som prioriterar nytta framför hype.

Effektivitetschocken på intelligensmarknaden

DeepSeek representerar ett skifte i produktverkligheten inom AI-världen. Medan många företag fokuserar på att bygga största möjliga neurala nätverk, fokuserade detta team på arkitektonisk optimering. Deras DeepSeek-V3-modell använder en Mixture of Experts-metod som bara aktiverar en liten del av de totala parametrarna för en given uppgift. Detta gör att modellen kan bibehålla hög prestanda samtidigt som den drastiskt minskar beräkningskraften som krävs för varje ord den genererar. Berättelsen kring detta företag kretsar ofta kring dess låga träningsbudget, som enligt uppgift ligger under sex miljoner dollar. Denna siffra utmanar idén om att bara de rikaste nationerna och företagen kan bygga frontier-modeller. Det antyder att tröskeln för att komma in i maskininlärning på hög nivå är lägre än man tidigare trott.

Perplexity närmar sig problemet ur användargränssnittets perspektiv. Det är en svarsmaskin snarare än en traditionell sökmotor. Den använder befintliga stora språkmodeller för att skanna live-webben, extrahera relevant information och presentera den i ett sammanhängande stycke med fotnoter. Detta designval adresserar den främsta svagheten hos standard-AI-modeller, vilket är deras tendens att påstå fakta som är föråldrade eller helt påhittade. Genom att förankra varje svar i webbdata i realtid har Perplexity skapat ett verktyg som känns mer pålitligt för professionell forskning än en vanlig chatbot. Produkten är inte bara själva modellen utan systemet för hämtning och citering som omger den. Detta tillvägagångssätt sätter enorm press på traditionella sökleverantörer som förlitar sig på annonsintäkter från användare som klickar sig igenom flera sidor med resultat.

BotNews.today använder AI-verktyg för att forska, skriva, redigera och översätta innehåll. Vårt team granskar och övervakar processen för att hålla informationen användbar, tydlig och tillförlitlig.

Om en användare får sitt svar på första försöket har de ingen anledning att bläddra igenom en lista med sponsrade länkar eller navigera genom röriga webbplatser. Detta skapar en direkt konflikt mellan verktygets nytta och webbens nuvarande ekonomiska struktur.

Geopolitiken kring billig beräkningskraft

Den globala effekten av dessa utmanare är rotad i demokratiseringen av högpresterande inferens. När kostnaden för att köra en modell sjunker med nittio procent expanderar potentialen för integration i vardaglig mjukvara exponentiellt. Utvecklare på tillväxtmarknader som tidigare var utestängda från att använda topp-API:er kan nu bygga sofistikerade applikationer. Detta ändrar tyngdpunkten för hela branschen. Om de mest effektiva modellerna kommer utanför de traditionella Silicon Valley-naven börjar den strategiska fördelen med massiva inhemska serverhallar att minska. Det tvingar fram ett samtal om modellsouveränitet och om länder bör vara beroende av ett fåtal centraliserade leverantörer eller investera i sina egna effektiva arkitekturer. Detta är en signal värd att följa eftersom den flyttar branschen bort från en vinnaren-tar-allt-dynamik mot en mer fragmenterad och konkurrensutsatt marknad.

Företagsköpare börjar känna av detta skifte i sina resultaträkningar. Berättelsen om billigare inferens förändrar hur företag planerar sina långsiktiga teknikstackar. Om en modell som DeepSeek kan ge åttio procent av nyttan hos en dyrare rival till tio procent av priset, försvinner affärsnyttan för det dyrare alternativet för de flesta rutinuppgifter. Detta skapar en marknad i flera nivåer där de dyraste modellerna är reserverade för mycket komplexa resonemang, medan huvuddelen av arbetet hanteras av effektiva utmanare. Denna ekonomiska verklighet påverkar också reklamvärlden. Perplexity experimenterar med en modell där annonser integreras i forskningsprocessen snarare än att vara en distraktion från den. Detta kan omdefiniera hur varumärken når konsumenter i en tid där människor inte längre besöker hemsidor eller bläddrar igenom sökresultat. Effekten känns av alla, från mjukvaruingenjören som väljer ett API till marknadschefen som försöker hitta en publik i en värld av omedelbara svar.

En tisdag med svarsmaskinerna

För att förstå den verkliga effekten, betänk en dag i livet för en finansanalytiker vid namn Sarah. Förr i tiden började Sarah sin morgon med att öppna tio olika flikar för att kontrollera marknadsrörelser och nyhetsrapporter. Hon tillbringade timmar med att sammanställa data till en morgongenomgång. Idag använder hon en svarsmaskin för att fråga efter specifika datapunkter från flera källor samtidigt. Hon ber om en jämförelse av tre olika kvartalsrapporter och får en källhänvisad sammanfattning på några sekunder. Informationen hon får är korrekt eftersom systemet hämtar direkt från källtexten. Hon lägger inte längre sin tid på att hitta information. Hon lägger sin tid på att verifiera den och fatta beslut baserat på den. Detta är sökdistributionens historia i praktiken. Gränssnittet har blivit forskaren, och Sarah har blivit redaktören. Hennes arbetsflöde är snabbare, men det är också mer beroende av noggrannheten i källhänvisningarna som maskinen tillhandahåller.

Senare under dagen behöver Sarah skriva ett anpassat skript för att automatisera en datainmatningsuppgift. Istället för att använda en assistent för allmänna ändamål som kan kosta en premie, använder hon en specialiserad kodningsmodell från en utmanare som DeepSeek. Modellen tillhandahåller koden omedelbart, och eftersom inferenskostnaden är så låg tillåter hennes företag henne att använda den för tusentals små uppgifter under dagen utan att oroa sig för budgeten. Det är så här modellmarknaden förändras. Den håller på att bli en bakgrundsnytta snarare än en dyrbar resurs. Trycket på traditionellt sökbeteende syns när Sarah inser att hon inte har använt en vanlig sökfält på tre dagar. Hon har inget behov av en lista med länkar när hon kan få ett strukturerat dokument. Följande punkter illustrerar skiftet i hennes dagliga rutin:

Sarah ersätter manuell nyhetsaggregering med automatiserade källhänvisade sammanfattningar som uppdateras i realtid.
Hon använder billiga modeller för repetitiva kodningsuppgifter som tidigare var för dyra att automatisera i stor skala.
Hennes beroende av traditionella annonsfinansierade sökmotorer sjunker till nära noll när hon finner mer värde i direkta svar.
Tiden som sparas gör att hon kan fokusera på strategi på hög nivå och kundrelationer istället för datainsamling.

Det dolda priset för gratis intelligens

Sokratisk skepticism kräver att vi frågar oss vad vi ger upp i utbyte mot denna effektivitet. Om en modell är betydligt billigare att träna och köra, varifrån kom dessa besparingar? Vi måste fråga om datan som användes för att träna dessa effektiva modeller erhölls med samma nivå av granskning som dyrare motsvarigheter. Det finns en risk att kapplöpningen mot botten när det gäller pris kommer att leda till en kapplöpning mot botten när det gäller dataintegritet och immateriella rättigheter. Om ett företag inte tar mycket betalt för sin modell, tjänar de istället pengar på datan som användare matar in i den? Vi måste också överväga den dolda kostnaden för svarsmaskinsmodellen. När Perplexity sammanfattar en webbplats förlorar den webbplatsen en besökare. Om skaparna av det ursprungliga innehållet inte kompenseras, kan den information som dessa maskiner förlitar sig på så småningom försvinna. Vem ska finansiera journalistiken och forskningen från 2026 om läsarna aldrig faktiskt besöker källan?

En annan svår fråga rör tillförlitligheten hos dessa slimmade arkitekturer. Introducerar Mixture of Experts-metoden nya typer av fel som är svårare att upptäcka? Vi måste fråga om vi offrar djup för snabbhetens skull. Det finns en fara att användare blir överdrivet beroende av de sammanfattade källhänvisningarna utan att någonsin kontrollera det ursprungliga sammanhanget. Detta kan leda till en ytlig förståelse av komplexa ämnen där nyanser går förlorade i jakten på ett kortfattat svar. Vi bör också vara skeptiska till påståendena om träningskostnader. Är dessa siffror helt transparenta, eller utelämnar de kostnaden för mänskligt arbete och hårdvarans miljöpåverkan? När vi rör oss mot en värld av billig intelligens måste vi förbli vaksamma på kvaliteten och etiken i de system vi integrerar i våra liv. Bruset från en ny produktlansering kan ofta dränka signalen om dess långsiktiga konsekvenser.

Under huven på de nya utmanarna

För

Frequently Asked Questions

Hur kan läsare använda artiklar om ”Chip Watch” praktiskt?

Chip Watch bevakar halvledarnyheter, GPU-lanseringar och AI-beräkningar för att göra komplex teknik begriplig för en bred publik. Använd artiklarna för att jämföra verktyg, förstå risker, ställa bättre frågor och avgöra vad som förtjänar uppmärksamhet innan du lägger tid eller pengar.

Varför är ”Företagsbevakning” viktigt för vanliga AI-läsare?

Följ de senaste företagsnyheterna, strategierna och förvärven inom AI-branschen. Vi analyserar vad som händer, varför det spelar roll och vad som väntar härnäst. Det är viktigt eftersom det kopplar AI-nyheter till praktiska val om arbete, integritet, kostnader, förtroende och de verktyg människor faktiskt använder.

Effektivitetschocken på intelligensmarknaden