DeepSeek, Perplexity और AI की अगली लहर
महंगे आर्टिफिशियल इंटेलिजेंस एकाधिकार का युग समाप्त हो रहा है। पिछले दो वर्षों से, उद्योग इस धारणा पर काम कर रहा था कि टॉप-टियर प्रदर्शन के लिए अरबों डॉलर के कंप्यूट और भारी ऊर्जा खपत की आवश्यकता होती है। DeepSeek और Perplexity अब साबित कर रहे हैं कि दक्षता कच्चे पैमाने (raw scale) को मात दे सकती है। DeepSeek ने ऐसे मॉडल जारी करके बाजार को चौंका दिया है जो उद्योग के दिग्गजों के प्रदर्शन से मेल खाते हैं, वह भी ट्रेनिंग लागत के एक छोटे से हिस्से में। इस बीच, Perplexity इंटरनेट के साथ लोगों के बातचीत करने के तरीके को मौलिक रूप से बदल रहा है, जहाँ यह लिंक की पारंपरिक सूची को सीधे, उद्धृत (cited) उत्तरों से बदल रहा है। यह बदलाव केवल नए टूल्स के बारे में नहीं है। यह इंटेलिजेंस की अर्थशास्त्र में एक मूलभूत बदलाव के बारे में है। ध्यान इस बात से हट गया है कि मॉडल कितना बड़ा हो सकता है और इस पर आ गया है कि इसे चलाने में कितना कम खर्च हो सकता है। जैसे-जैसे ये चैलेंजर्स आगे बढ़ रहे हैं, स्थापित दिग्गज अपने उच्च-मार्जिन बिजनेस मॉडल का बचाव करने के लिए मजबूर हैं, जो कि दुबले-पतले, विशेष प्रतिस्पर्धियों की लहर के खिलाफ है जो प्रचार (hype) से ऊपर उपयोगिता को प्राथमिकता देते हैं।
इंटेलिजेंस मार्केट को दक्षता का झटका
DeepSeek AI दुनिया की प्रोडक्ट रियलिटी में एक बदलाव का प्रतिनिधित्व करता है। जबकि कई कंपनियां सबसे बड़े संभव न्यूरल नेटवर्क बनाने पर ध्यान केंद्रित करती हैं, इस टीम ने आर्किटेक्चरल ऑप्टिमाइजेशन पर ध्यान केंद्रित किया। उनका DeepSeek-V3 मॉडल ‘Mixture of Experts’ दृष्टिकोण का उपयोग करता है जो किसी भी कार्य के लिए कुल पैरामीटर्स के केवल एक छोटे हिस्से को सक्रिय करता है। यह मॉडल को उच्च प्रदर्शन बनाए रखने की अनुमति देता है, जबकि हर शब्द उत्पन्न करने के लिए आवश्यक कंप्यूटेशनल शक्ति को काफी कम कर देता है। इस कंपनी के बारे में चर्चा अक्सर इसके कम ट्रेनिंग बजट पर केंद्रित होती है, जो कथित तौर पर छह मिलियन डॉलर से कम है। यह आंकड़ा इस विचार को चुनौती देता है कि केवल सबसे अमीर देश और निगम ही फ्रंटियर मॉडल बना सकते हैं। यह बताता है कि हाई-लेवल मशीन लर्निंग के लिए प्रवेश की बाधा पहले की तुलना में कम है।
Perplexity समस्या को यूजर इंटरफेस के नजरिए से देखता है। यह एक पारंपरिक सर्च इंजन के बजाय एक ‘आंसर इंजन’ है। यह लाइव वेब को स्कैन करने, प्रासंगिक जानकारी निकालने और इसे फुटनोट्स के साथ एक सुसंगत पैराग्राफ में प्रस्तुत करने के लिए मौजूदा लार्ज लैंग्वेज मॉडल का उपयोग करता है। यह डिज़ाइन विकल्प मानक AI मॉडल की प्राथमिक कमजोरी को संबोधित करता है, जो कि पुरानी या पूरी तरह से मनगढ़ंत तथ्यों को बताने की उनकी प्रवृत्ति है। हर प्रतिक्रिया को रियल-टाइम वेब डेटा में ग्राउंड करके, Perplexity ने एक ऐसा टूल बनाया है जो पेशेवर शोध के लिए मानक चैट बॉट की तुलना में अधिक विश्वसनीय लगता है। प्रोडक्ट केवल मॉडल ही नहीं है, बल्कि इसके चारों ओर मौजूद रिट्रीवल और साइटेशन की प्रणाली भी है। यह दृष्टिकोण उन पारंपरिक सर्च प्रोवाइडर्स पर भारी दबाव डालता है जो परिणामों के कई पेजों पर क्लिक करने वाले उपयोगकर्ताओं से मिलने वाले विज्ञापन राजस्व पर निर्भर हैं।
BotNews.today सामग्री का शोध करने, लिखने, संपादित करने और अनुवाद करने के लिए AI उपकरणों का उपयोग करता है। हमारी टीम जानकारी को उपयोगी, स्पष्ट और विश्वसनीय बनाए रखने के लिए प्रक्रिया की समीक्षा और पर्यवेक्षण करती है।
सस्ते कंप्यूट की भू-राजनीति
इन चैलेंजर्स का वैश्विक प्रभाव हाई-परफॉर्मेंस इन्फरेंस के लोकतंत्रीकरण में निहित है। जब किसी मॉडल को चलाने की लागत नब्बे प्रतिशत तक गिर जाती है, तो रोजमर्रा के सॉफ्टवेयर में इसके एकीकरण की संभावना तेजी से बढ़ती है। उभरते बाजारों के डेवलपर्स जो पहले टॉप-टियर APIs का उपयोग करने में असमर्थ थे, अब परिष्कृत एप्लिकेशन बना सकते हैं। यह पूरे उद्योग के लिए गुरुत्वाकर्षण का केंद्र बदल देता है। यदि सबसे कुशल मॉडल पारंपरिक सिलिकॉन वैली हब के बाहर से आ रहे हैं, तो विशाल घरेलू सर्वर फार्मों का रणनीतिक लाभ कम होने लगता है। यह मॉडल संप्रभुता के बारे में बातचीत को मजबूर करता है और यह कि क्या देशों को कुछ केंद्रीकृत प्रदाताओं पर निर्भर रहना चाहिए या अपने स्वयं के कुशल आर्किटेक्चर में निवेश करना चाहिए। यह अनुसरण करने योग्य एक संकेत है क्योंकि यह उद्योग को ‘विजेता-सब-ले-जाता है’ गतिशीलता से दूर एक अधिक खंडित और प्रतिस्पर्धी बाजार की ओर ले जाता है।
एंटरप्राइज खरीदार अपने बॉटम लाइन में इस बदलाव को महसूस करने लगे हैं। कम लागत वाले इन्फरेंस का नैरेटिव बदल रहा है कि कंपनियां अपने दीर्घकालिक टेक्नोलॉजी स्टैक की योजना कैसे बनाती हैं। यदि DeepSeek जैसा मॉडल दस प्रतिशत कीमत पर अधिक महंगे प्रतिद्वंद्वी की अस्सी प्रतिशत उपयोगिता प्रदान कर सकता है, तो अधिकांश नियमित कार्यों के लिए अधिक महंगे विकल्प का व्यावसायिक मामला खत्म हो जाता है। यह एक स्तरीय बाजार बनाता है जहाँ सबसे महंगे मॉडल अत्यधिक जटिल तर्क के लिए आरक्षित होते हैं, जबकि अधिकांश काम कुशल चैलेंजर्स द्वारा संभाला जाता है। यह आर्थिक वास्तविकता विज्ञापन की दुनिया को भी प्रभावित कर रही है। Perplexity एक ऐसे मॉडल के साथ प्रयोग कर रहा है जहाँ विज्ञापन शोध प्रक्रिया में एकीकृत होते हैं, न कि उससे ध्यान भटकाने वाले। यह फिर से परिभाषित कर सकता है कि ब्रांड उन उपभोक्ताओं तक कैसे पहुंचते हैं जो अब होमपेज पर नहीं जाते या सर्च परिणामों के माध्यम से स्क्रॉल नहीं करते हैं। इसका प्रभाव सॉफ्टवेयर इंजीनियर से लेकर मार्केटिंग एक्जीक्यूटिव तक हर किसी पर पड़ता है जो तत्काल उत्तरों की दुनिया में दर्शकों को खोजने की कोशिश कर रहा है।
आंसर इंजन के साथ एक मंगलवार
वास्तविक दुनिया के प्रभाव को समझने के लिए, सारा नाम की एक वित्तीय विश्लेषक के जीवन का एक दिन देखें। अतीत में, सारा अपनी सुबह दस अलग-अलग टैब खोलकर बाजार की गतिविधियों और समाचार रिपोर्टों की जांच करके शुरू करती थी। वह डेटा को सुबह के संक्षिप्त विवरण में संश्लेषित करने में घंटों बिताती थी। आज, वह एक साथ कई स्रोतों में विशिष्ट डेटा पॉइंट्स को क्वेरी करने के लिए एक आंसर इंजन का उपयोग करती है। वह तीन अलग-अलग त्रैमासिक रिपोर्टों की तुलना करने के लिए कहती है और सेकंडों में एक उद्धृत सारांश प्राप्त करती है। उसे प्राप्त डेटा की स्पेलिंग सटीक है क्योंकि सिस्टम सीधे स्रोत टेक्स्ट से खींचता है। वह अब अपना समय जानकारी खोजने में नहीं बिताती है। वह अपना समय इसे सत्यापित करने और इसके आधार पर निर्णय लेने में बिताती है। यह सर्च डिस्ट्रीब्यूशन की कहानी है। इंटरफेस शोधकर्ता बन गया है, और सारा संपादक बन गई है। उसका वर्कफ़्लो तेज़ है, लेकिन यह इंजन द्वारा प्रदान किए गए साइटेशन की सटीकता पर भी अधिक निर्भर है।
दिन में बाद में, सारा को डेटा एंट्री कार्य को स्वचालित करने के लिए एक कस्टम स्क्रिप्ट लिखने की आवश्यकता होती है। एक सामान्य-उद्देश्य वाले सहायक का उपयोग करने के बजाय जो प्रीमियम खर्च कर सकता है, वह DeepSeek जैसे चैलेंजर से एक विशेष कोडिंग मॉडल का उपयोग करती है। मॉडल तुरंत कोड प्रदान करता है, और क्योंकि इन्फरेंस लागत इतनी कम है, उसकी कंपनी उसे बजट की चिंता किए बिना पूरे दिन में हजारों छोटे कार्यों के लिए उपयोग करने की अनुमति देती है। यह वह तरीका है जिससे मॉडल बाजार बदल रहा है। यह एक कीमती संसाधन के बजाय एक बैकग्राउंड यूटिलिटी बन रहा है। पारंपरिक सर्च व्यवहार पर दबाव तब दिखाई देता है जब सारा को एहसास होता है कि उसने तीन दिनों से मानक सर्च बार का उपयोग नहीं किया है। जब उसके पास एक संरचित दस्तावेज़ हो सकता है तो उसे लिंक की सूची की कोई आवश्यकता नहीं है। निम्नलिखित बिंदु उसकी दिनचर्या में बदलाव को दर्शाते हैं:
- सारा मैन्युअल समाचार एकत्रीकरण को स्वचालित उद्धृत सारांशों के साथ बदल देती है जो रियल-टाइम में अपडेट होते हैं।
- वह दोहराव वाले कोडिंग कार्यों के लिए कम लागत वाले मॉडल का उपयोग करती है जो पहले बड़े पैमाने पर स्वचालित करने के लिए बहुत महंगे थे।
- पारंपरिक विज्ञापन-समर्थित सर्च इंजन पर उसकी निर्भरता लगभग शून्य हो जाती है क्योंकि उसे सीधे उत्तरों में अधिक मूल्य मिलता है।
- बचाया गया समय उसे डेटा शिकार के बजाय उच्च-स्तरीय रणनीति और क्लाइंट संबंधों पर ध्यान केंद्रित करने की अनुमति देता है।
मुफ्त इंटेलिजेंस की छिपी हुई कीमत
सुकराती संदेह के लिए हमें यह पूछने की आवश्यकता है कि हम इस दक्षता के बदले में क्या दे रहे हैं। यदि कोई मॉडल प्रशिक्षित करने और चलाने के लिए काफी सस्ता है, तो वह बचत कहाँ से आई? हमें यह पूछना चाहिए कि क्या इन कुशल मॉडलों को प्रशिक्षित करने के लिए उपयोग किया गया डेटा उतने ही स्तर की जांच के साथ प्राप्त किया गया था जितना कि अधिक महंगे समकक्षों के साथ। एक जोखिम है कि कीमत पर दौड़ नीचे की ओर बौद्धिक संपदा अधिकारों और डेटा गोपनीयता पर दौड़ की ओर ले जाएगी। यदि कोई कंपनी अपने मॉडल के लिए बहुत अधिक शुल्क नहीं ले रही है, तो क्या वह इसके बजाय उस डेटा का मुद्रीकरण कर रही है जिसे उपयोगकर्ता इसमें फीड करते हैं? हमें आंसर इंजन मॉडल की छिपी हुई लागत पर भी विचार करना चाहिए। जब Perplexity किसी वेबसाइट का सारांश देता है, तो वह वेबसाइट एक आगंतुक खो देती है। यदि मूल सामग्री के रचनाकारों को मुआवजा नहीं दिया जाता है, तो वही जानकारी जिस पर ये इंजन निर्भर हैं, अंततः गायब हो सकती है। यदि पाठक वास्तव में स्रोत पर कभी नहीं जाते हैं तो 2026 की पत्रकारिता और शोध को कौन निधि देगा?
एक और कठिन सवाल इन दुबले आर्किटेक्चर की विश्वसनीयता से संबंधित है। क्या ‘Mixture of Experts’ दृष्टिकोण त्रुटियों के नए प्रकार पेश करता है जिन्हें पहचानना कठिन है? हमें यह पूछना चाहिए कि क्या हम गति के लिए गहराई का त्याग कर रहे हैं। एक खतरा है कि उपयोगकर्ता मूल संदर्भ की जांच किए बिना सारांशित साइटेशन पर अत्यधिक निर्भर हो जाएंगे। यह जटिल विषयों की एक उथली समझ की ओर ले जा सकता है जहाँ संक्षिप्त उत्तर की खोज में बारीकियां खो जाती हैं। हमें ट्रेनिंग लागत के दावों के बारे में भी संदेही होना चाहिए। क्या ये आंकड़े पूरी तरह से पारदर्शी हैं, या वे मानव श्रम की लागत और हार्डवेयर के पर्यावरणीय प्रभाव को छोड़ देते हैं? जैसे-जैसे हम सस्ती इंटेलिजेंस की दुनिया की ओर बढ़ रहे हैं, हमें उन प्रणालियों की गुणवत्ता और नैतिकता के बारे में सतर्क रहना चाहिए जिन्हें हम अपने जीवन में एकीकृत कर रहे हैं। एक नए प्रोडक्ट रिलीज का शोर अक्सर इसके दीर्घकालिक परिणामों के संकेत को डुबो सकता है।
नए चैलेंजर्स के हुड के नीचे
पावर यूजर के लिए, इन चैलेंजर्स का आकर्षण उनकी तकनीकी लचीलापन और एकीकरण क्षमताओं में निहित है। DeepSeek-V3 एक ट्रेनिंग फ्रेमवर्क का उपयोग करता है जो FP8 प्रिसिजन के लिए अनुकूलित है, जो सटीकता में महत्वपूर्ण नुकसान के बिना तेज़ गणना की अनुमति देता है। यह एक प्रमुख तकनीकी मील का पत्थर है जो उनकी लागत दक्षता को समझाने में मदद करता है। उनका ‘Multi-head Latent Attention’ मैकेनिज्म इन्फरेंस के दौरान मॉडल के मेमोरी फुटप्रिंट को कम करता है, जो उन डेवलपर्स के लिए एक महत्वपूर्ण कारक है जो इन मॉडलों को अपने स्वयं के हार्डवेयर पर होस्ट करना चाहते हैं। इनमें से कई नए मॉडल ओपन वेट्स के साथ जारी किए जाते हैं, जिसका अर्थ है कि उन्हें स्थानीय रूप से या निजी क्लाउड इंस्टेंस पर चलाया जा सकता है। यह उन उद्यमों के लिए एक बड़ा लाभ है जो संवेदनशील डेटा को थर्ड-पार्टी API पर भेजने का जोखिम नहीं उठा सकते। विशिष्ट डेटासेट पर इन मॉडलों को फाइन-ट्यून करने की क्षमता कानूनी, चिकित्सा या वित्तीय क्षेत्रों में आला अनुप्रयोगों के लिए उनके मूल्य को और बढ़ाती है।
क्या आपके पास कोई AI कहानी, उपकरण, ट्रेंड या प्रश्न है जिसके बारे में आपको लगता है कि हमें कवर करना चाहिए? हमें अपना लेख विचार भेजें — हमें इसे सुनकर खुशी होगी।Perplexity अपने API के माध्यम से एक अलग प्रकार का तकनीकी मूल्य प्रदान करता है, जो डेवलपर्स को सीधे अपने स्वयं के अनुप्रयोगों में सर्च क्षमताएं बनाने की अनुमति देता है। यह एक अलग सर्च इंडेक्स और एक अलग भाषा मॉडल की आवश्यकता को दरकिनार करता है। सिस्टम ग्राउंडिंग और साइटेशन को स्वचालित रूप से संभालता है। हालाँकि, विचार करने के लिए सीमाएँ हैं। API रेट लिमिट और रियल-टाइम वेब सर्चिंग की लेटेंसी उच्च-वॉल्यूम अनुप्रयोगों के लिए एक बाधा हो सकती है। उपयोगकर्ताओं को सर्च की गति और विश्लेषण की गहराई के बीच व्यापार-बंद (trade-off) का प्रबंधन भी करना होगा। इन सर्च परिणामों का स्थानीय भंडारण उन पावर उपयोगकर्ताओं के लिए एक और विचार है जिन्हें यह बनाए रखने की आवश्यकता है कि उनकी जानकारी कहाँ से आई। निम्नलिखित तकनीकी कारक वर्तमान में इन टूल्स के लिए प्रतिस्पर्धी बढ़त को परिभाषित कर रहे हैं:
- लंबे संदर्भ कार्यों के दौरान KV कैश मेमोरी उपयोग को कम करने के लिए ‘Multi-head Latent Attention’ का उपयोग।
- आधुनिक GPU हार्डवेयर के थ्रूपुट को अधिकतम करने के लिए FP8 ट्रेनिंग और इन्फरेंस के लिए समर्थन।
- रियल-टाइम RAG पाइपलाइनों का एकीकरण जो हजारों समवर्ती वेब क्वेरी को संभाल सकती हैं।
- सुरक्षित वातावरण में स्थानीय तैनाती के लिए ओपन वेट्स की उपलब्धता।
चयनात्मक इंटेलिजेंस का भविष्य
DeepSeek और Perplexity का उदय एक अधिक परिपक्व AI बाजार की शुरुआत का प्रतीक है। हम उन मॉडलों की नवीनता से दूर जा रहे हैं जो बात कर सकते हैं और उन मॉडलों की उपयोगिता की ओर बढ़ रहे हैं जो कुशलतापूर्वक काम कर सकते हैं। गुरुत्वाकर्षण का केंद्र उन प्रदाताओं की ओर स्थानांतरित हो रहा है जो टिकाऊ मूल्य बिंदु पर उच्च गुणवत्ता वाले परिणाम दे सकते हैं। यह केवल वर्तमान 2026 के लिए एक प्रवृत्ति नहीं है, बल्कि डिजिटल सेवाओं को बनाने और उपभोग करने के तरीके में एक दीर्घकालिक बदलाव है। पारंपरिक सर्च और उच्च लागत वाले मॉडल प्रदाताओं पर दबाव केवल बढ़ेगा क्योंकि ये चैलेंजर्स अपने उत्पादों को परिष्कृत करते हैं। उपयोगकर्ता के लिए, इसका मतलब है अधिक विकल्प और बेहतर टूल्स। उद्योग के लिए, इसका मतलब है ब्रूट-फोर्स गणना पर इंजीनियरिंग उत्कृष्टता पर नए सिरे से ध्यान देना। असली विजेता वे होंगे जो हाइप साइकिल के शोर और टेक अर्थव्यवस्था में वास्तविक संरचनात्मक परिवर्तन के संकेत के बीच अंतर कर सकते हैं।
संपादक का नोट: हमने इस साइट को उन लोगों के लिए एक बहुभाषी AI समाचार और गाइड हब के रूप में बनाया है जो कंप्यूटर गीक नहीं हैं, लेकिन फिर भी आर्टिफिशियल इंटेलिजेंस को समझना चाहते हैं, इसे अधिक आत्मविश्वास के साथ उपयोग करना चाहते हैं, और उस भविष्य का अनुसरण करना चाहते हैं जो पहले से ही आ रहा है।
कोई त्रुटि मिली या कुछ ऐसा जिसे सुधारने की आवश्यकता है? हमें बताएं।