DeepSeek, Perplexity आणि AI चॅलेंजर्सची नवीन लाट
महागड्या आर्टिफिशियल इंटेलिजन्स मक्तेदारीचा काळ आता संपत आला आहे. गेल्या दोन वर्षांपासून, उद्योगाचा असा समज होता की अव्वल दर्जाच्या कामगिरीसाठी अब्जावधी डॉलर्सचे कम्प्युट आणि प्रचंड ऊर्जेची गरज असते. आता DeepSeek आणि Perplexity हे सिद्ध करत आहेत की कार्यक्षमता (efficiency) ही कच्च्या स्केलपेक्षाही सरस ठरू शकते. DeepSeek ने उद्योगातील दिग्गजांच्या बरोबरीची कामगिरी अत्यंत कमी ट्रेनिंग खर्चात करून बाजारात खळबळ उडवून दिली आहे. दुसरीकडे, Perplexity इंटरनेट वापरकर्त्यांचा अनुभव पूर्णपणे बदलत आहे; पारंपारिक लिंकच्या यादीऐवजी ते थेट आणि संदर्भासहित उत्तरे देत आहेत. हा बदल केवळ नवीन टूल्सपुरता मर्यादित नाही, तर तो इंटेलिजन्सच्या अर्थशास्त्रातील एक मूलभूत बदल आहे. आता लक्ष मॉडेल किती मोठे आहे यावरून ते चालवण्यासाठी किती कमी खर्च येतो, याकडे वळले आहे. जसे हे चॅलेंजर्स पुढे येत आहेत, तसे प्रस्थापित कंपन्यांना त्यांच्या महागड्या बिझनेस मॉडेल्सचे रक्षण करणे कठीण होत आहे, कारण हे नवीन स्पर्धक हायपपेक्षा उपयुक्ततेला (utility) अधिक महत्त्व देत आहेत.
इंटेलिजन्स मार्केटला बसलेला कार्यक्षमतेचा धक्का
DeepSeek ने AI जगाच्या प्रॉडक्ट रिअॅलिटीमध्ये मोठा बदल घडवला आहे. अनेक कंपन्या शक्य तितके मोठे न्यूरल नेटवर्क बनवण्यावर लक्ष केंद्रित करत असताना, या टीमने आर्किटेक्चरल ऑप्टिमायझेशनवर भर दिला. त्यांचे DeepSeek-V3 मॉडेल ‘Mixture of Experts’ दृष्टिकोनाचा वापर करते, जे कोणत्याही कामासाठी एकूण पॅरामीटर्सपैकी फक्त छोटा भाग सक्रिय करते. यामुळे मॉडेलची कामगिरी उच्च राहते आणि प्रत्येक शब्दासाठी लागणारी कम्प्युटेशनल पॉवर मोठ्या प्रमाणात कमी होते. या कंपनीची चर्चा अनेकदा त्यांच्या कमी ट्रेनिंग बजेटभोवती फिरते, जे सहा दशलक्ष डॉलर्सपेक्षा कमी असल्याचे सांगितले जाते. ही आकडेवारी या कल्पनेला आव्हान देते की फक्त श्रीमंत देश किंवा कॉर्पोरेशनच फ्रंटियर मॉडेल्स बनवू शकतात. हे दर्शवते की हाय-लेव्हल मशीन लर्निंगमध्ये प्रवेश करण्यासाठीची अडथळ्यांची पातळी पूर्वीपेक्षा खूपच कमी झाली आहे.
Perplexity समस्येकडे युजर इंटरफेसच्या दृष्टिकोनातून पाहते. हे पारंपारिक सर्च इंजिन नसून एक ‘आन्सर इंजिन’ आहे. हे सध्याच्या मोठ्या लँग्वेज मॉडेल्सचा वापर करून लाइव्ह वेब स्कॅन करते, संबंधित माहिती काढते आणि ती फुटनोट्ससह एका सुसंगत परिच्छेदात मांडते. ही डिझाइन निवड स्टँडर्ड AI मॉडेल्सच्या मुख्य कमतरतेवर मात करते, जी जुनी किंवा चुकीची माहिती देण्याची असते. प्रत्येक उत्तर रिअल-टाइम वेब डेटावर आधारित असल्याने, Perplexity ने असे टूल तयार केले आहे जे प्रोफेशनल रिसर्चसाठी स्टँडर्ड चॅट बॉटपेक्षा अधिक विश्वासार्ह वाटते. हे प्रॉडक्ट केवळ मॉडेल नसून त्याभोवतीची रिट्रिव्हल आणि सायटेशनची सिस्टिम आहे. हा दृष्टिकोन पारंपारिक सर्च प्रोव्हाइडर्सवर प्रचंड दबाव टाकतो, जे युजर्सनी अनेक पेजेसवर क्लिक केल्यामुळे मिळणाऱ्या जाहिरातींच्या उत्पन्नावर अवलंबून असतात.
BotNews.today सामग्री संशोधन, लेखन, संपादन आणि भाषांतरित करण्यासाठी AI साधनांचा वापर करते. माहिती उपयुक्त, स्पष्ट आणि विश्वसनीय ठेवण्यासाठी आमची टीम प्रक्रियेचे पुनरावलोकन आणि पर्यवेक्षण करते.
स्वस्त कम्प्युटचे भू-राजकारण
या चॅलेंजर्सचा जागतिक प्रभाव हाय-परफॉर्मन्स इन्फरन्सच्या लोकशाहीकरणामध्ये आहे. जेव्हा मॉडेल चालवण्याचा खर्च ९० टक्क्यांनी कमी होतो, तेव्हा दैनंदिन सॉफ्टवेअरमध्ये त्याचे एकत्रीकरण होण्याची शक्यता कित्येक पटीने वाढते. उदयोन्मुख बाजारपेठेतील डेव्हलपर्स, ज्यांना पूर्वी महागड्या API मुळे संधी मिळत नव्हती, ते आता प्रगत ॲप्लिकेशन्स बनवू शकतात. यामुळे संपूर्ण उद्योगाचे गुरुत्वाकर्षण केंद्र बदलत आहे. जर सर्वात कार्यक्षम मॉडेल्स पारंपारिक सिलिकॉन व्हॅली हबच्या बाहेरून येत असतील, तर मोठ्या डोमेस्टिक सर्व्हर फार्म्सचा धोरणात्मक फायदा कमी होऊ लागतो. यामुळे मॉडेल सार्वभौमत्वावर चर्चा सुरू झाली आहे आणि देश काही मोजक्या केंद्रीकृत प्रोव्हाइडर्सवर अवलंबून राहतील की स्वतःचे कार्यक्षम आर्किटेक्चर विकसित करतील, हा प्रश्न महत्त्वाचा ठरतो. हा एक महत्त्वाचा संकेत आहे कारण तो उद्योगाला ‘विजेता सर्व काही घेतो’ या डायनॅमिक्सकडून अधिक विखुरलेल्या आणि स्पर्धात्मक बाजारपेठेच्या दिशेने नेत आहे.
एंटरप्राइझ खरेदीदारांना आता त्यांच्या नफ्यावर याचा परिणाम जाणवू लागला आहे. कमी खर्चात इन्फरन्स मिळवण्याची चर्चा कंपन्यांच्या दीर्घकालीन तंत्रज्ञान नियोजनाला बदलत आहे. जर DeepSeek सारखे मॉडेल महागड्या प्रतिस्पर्ध्याच्या ८० टक्के उपयुक्तता १० टक्के किमतीत देऊ शकत असेल, तर बहुतेक नियमित कामांसाठी महागड्या पर्यायाची गरज उरत नाही. यामुळे एक टियर मार्केट तयार होत आहे, जिथे महागडी मॉडेल्स अत्यंत जटिल तर्कासाठी राखीव आहेत, तर उर्वरित काम कार्यक्षम चॅलेंजर्स हाताळत आहेत. ही आर्थिक वास्तविकता जाहिरात क्षेत्रालाही प्रभावित करत आहे. Perplexity अशा मॉडेलवर प्रयोग करत आहे जिथे जाहिराती संशोधनाच्या प्रक्रियेत समाविष्ट केल्या जातात, त्यापासून विचलित करण्यासाठी नाहीत. लोक जेव्हा होमपेजला भेट देत नाहीत किंवा सर्च रिझल्ट्स स्क्रोल करत नाहीत, अशा युगात ब्रँड्स ग्राहकांपर्यंत कसे पोहोचतील, हे हे पुन्हा परिभाषित करू शकते. याचा परिणाम सॉफ्टवेअर इंजिनिअरपासून ते मार्केटिंग एक्झिक्युटिव्हपर्यंत सर्वांना जाणवत आहे.
आन्सर इंजिन्ससोबतचा एक मंगळवार
वास्तविक जगातील प्रभाव समजून घेण्यासाठी, सारा नावाच्या फायनान्शियल ॲनालिस्टच्या एका दिवसाचा विचार करा. पूर्वी, सारा सकाळी बाजारातील हालचाली आणि बातम्या तपासण्यासाठी दहा वेगवेगळे टॅब्स उघडत असे. तिला डेटा एकत्र करून मॉर्निंग ब्रीफ बनवण्यासाठी तास लागायचे. आज, ती एकाच वेळी अनेक स्त्रोतांकडून विशिष्ट डेटा पॉईंट्स मिळवण्यासाठी आन्सर इंजिनचा वापर करते. ती तीन वेगवेगळ्या तिमाही अहवालांची तुलना करण्यास सांगते आणि काही सेकंदात संदर्भासहित सारांश मिळवते. तिला मिळालेल्या डेटाचे स्पेलिंग अचूक असते कारण सिस्टिम थेट मूळ मजकुरातून माहिती घेते. ती आता माहिती शोधण्यात वेळ घालवत नाही. ती ती पडताळण्यात आणि त्यावर आधारित निर्णय घेण्यात वेळ घालवते. हे सर्च डिस्ट्रिब्युशनचे उदाहरण आहे. इंटरफेस आता संशोधक बनला आहे आणि सारा संपादक बनली आहे. तिचे काम वेगवान झाले आहे, पण ते इंजिनने दिलेल्या सायटेशन्सच्या अचूकतेवर अधिक अवलंबून आहे.
दिवसाच्या शेवटी, साराला डेटा एंट्रीचे काम ऑटोमेट करण्यासाठी एक कस्टम स्क्रिप्ट लिहिण्याची गरज पडते. महागड्या जनरल-पर्पज असिस्टंटचा वापर करण्याऐवजी, ती DeepSeek सारख्या चॅलेंजरच्या स्पेशलाइज्ड कोडिंग मॉडेलचा वापर करते. मॉडेल त्वरित कोड प्रदान करते आणि इन्फरन्स खर्च खूप कमी असल्याने, तिची कंपनी तिला बजेटची चिंता न करता दिवसभरात हजारो छोट्या कामांसाठी याचा वापर करण्याची परवानगी देते. मॉडेल मार्केट अशा प्रकारे बदलत आहे. ते आता एक मौल्यवान संसाधनापेक्षा बॅकग्राउंड युटिलिटी बनत आहे. जेव्हा साराला जाणीव होते की तिने तीन दिवसांपासून स्टँडर्ड सर्च बार वापरलाच नाही, तेव्हा पारंपारिक सर्च वर्तनावरील दबाव दिसून येतो. जेव्हा तिला स्ट्रक्चर्ड डॉक्युमेंट मिळू शकते, तेव्हा तिला लिंक्सच्या यादीची गरज उरत नाही. खालील मुद्दे तिच्या दैनंदिन दिनचर्येतील बदल दर्शवतात:
- सारा मॅन्युअल न्यूज ॲग्रिगेशनच्या जागी रिअल-टाइममध्ये अपडेट होणाऱ्या ऑटोमेटेड सायटेड सारांशांचा वापर करते.
- ती पुनरावृत्ती होणाऱ्या कोडिंग कामांसाठी कमी खर्चाच्या मॉडेल्सचा वापर करते, जी पूर्वी ऑटोमेट करणे खूप महाग होते.
- तिचे पारंपारिक जाहिरात-आधारित सर्च इंजिनवरील अवलंबित्व जवळजवळ शून्यावर आले आहे कारण तिला थेट उत्तरांमध्ये अधिक मूल्य मिळते.
- वाचलेला वेळ तिला डेटा शोधण्याऐवजी उच्च-स्तरीय धोरण आणि क्लायंट संबंधांवर लक्ष केंद्रित करण्यास मदत करतो.
मोफत इंटेलिजन्सची छुपी किंमत
सॉक्रेटीक संशयवाद आपल्याला विचारण्यास भाग पाडतो की या कार्यक्षमतेच्या बदल्यात आपण काय गमावत आहोत? जर एखादे मॉडेल ट्रेन करण्यासाठी आणि चालवण्यासाठी लक्षणीयरीत्या स्वस्त असेल, तर ती बचत कोठून आली? आपण हे विचारले पाहिजे की या कार्यक्षम मॉडेल्सना ट्रेन करण्यासाठी वापरलेला डेटा महागड्या मॉडेल्सइतक्याच बारकाईने मिळवला होता का? अशी भीती आहे की किमतीच्या स्पर्धेमुळे डेटा प्रायव्हसी आणि बौद्धिक संपदा अधिकारांकडे दुर्लक्ष होऊ शकते. जर एखादी कंपनी तिच्या मॉडेलसाठी जास्त शुल्क आकारत नसेल, तर ती युजर्सनी दिलेल्या डेटाचे मुद्रीकरण (monetize) करत आहे का? आपण आन्सर इंजिन मॉडेलच्या छुपे खर्चाचाही विचार केला पाहिजे. जेव्हा Perplexity एखाद्या वेबसाइटचा सारांश देते, तेव्हा त्या वेबसाइटचा एक व्हिजिटर कमी होतो. जर मूळ आशय निर्मात्यांना मोबदला मिळाला नाही, तर ज्या माहितीवर हे इंजिन्स अवलंबून आहेत, तीच माहिती कालांतराने नाहीशी होऊ शकते. जर वाचकांनी मूळ स्त्रोताला भेट दिलीच नाही, तर 2026 चे पत्रकारिता आणि संशोधन कोण चालवणार?
आणखी एक कठीण प्रश्न या लीन आर्किटेक्चरच्या विश्वासार्हतेबद्दल आहे. ‘Mixture of Experts’ दृष्टिकोनामुळे अशा प्रकारच्या त्रुटी निर्माण होतात का ज्या शोधणे कठीण आहे? आपण वेगाच्या नादात खोली (depth) गमावत आहोत का? अशी भीती आहे की युजर्स मूळ संदर्भ तपासल्याशिवाय केवळ सारांशित सायटेशन्सवर अवलंबून राहतील. यामुळे जटिल विषयांची समज वरवरची होऊ शकते, जिथे संक्षिप्त उत्तराच्या शोधात बारकावे हरवले जातात. ट्रेनिंग खर्चाच्या दाव्यांबद्दलही आपण संशयी असले पाहिजे. हे आकडे पूर्णपणे पारदर्शक आहेत का, की त्यात मानवी श्रमाचा खर्च आणि हार्डवेअरचा पर्यावरणीय परिणाम वगळला आहे? जसजसे आपण स्वस्त इंटेलिजन्सच्या जगाकडे जात आहोत, तसतसे आपण आपल्या जीवनात समाविष्ट करत असलेल्या सिस्टिम्सच्या गुणवत्तेबद्दल आणि नैतिकतेबद्दल सतर्क राहिले पाहिजे. नवीन प्रॉडक्ट लाँचचा गोंधळ अनेकदा त्याच्या दीर्घकालीन परिणामांचा सिग्नल दाबून टाकतो.
नवीन चॅलेंजर्सच्या पडद्यामागे
पॉवर युजरसाठी, या चॅलेंजर्सचे आकर्षण त्यांच्या तांत्रिक लवचिकतेत आणि एकत्रीकरण क्षमतेत आहे. DeepSeek-V3 एक ट्रेनिंग फ्रेमवर्क वापरते जे FP8 प्रिसिजनसाठी ऑप्टिमाइझ करते, ज्यामुळे अचूकतेत लक्षणीय घट न होता वेगवान गणना शक्य होते. ही एक मोठी तांत्रिक मैलाचा दगड आहे जी त्यांची खर्च कार्यक्षमता स्पष्ट करण्यास मदत करते. त्यांची ‘Multi-head Latent Attention’ यंत्रणा इन्फरन्स दरम्यान मॉडेलची मेमरी फूटप्रिंट कमी करते, जे डेव्हलपर्ससाठी एक महत्त्वाचा घटक आहे ज्यांना हे मॉडेल्स स्वतःच्या हार्डवेअरवर होस्ट करायचे आहेत. यापैकी अनेक नवीन मॉडेल्स ओपन वेट्ससह रिलीज केली जातात, याचा अर्थ ती स्थानिक पातळीवर किंवा खाजगी क्लाउड इन्स्टन्सवर चालवता येतात. ज्या एंटरप्राइजेसना संवेदनशील डेटा थर्ड-पार्टी API कडे पाठवण्याचा धोका पत्करायचा नाही, त्यांच्यासाठी हा एक मोठा फायदा आहे. विशिष्ट डेटासेटवर या मॉडेल्सना फाइन-ट्यून करण्याची क्षमता कायदेशीर, वैद्यकीय किंवा आर्थिक क्षेत्रातील विशिष्ट ॲप्लिकेशन्ससाठी त्यांचे मूल्य अधिक वाढवते.
तुम्ही आम्हाला कव्हर करावे असे तुम्हाला वाटणारी AI कथा, साधन, ट्रेंड किंवा प्रश्न आहे का? तुमची लेखाची कल्पना आम्हाला पाठवा — आम्हाला ती ऐकायला आवडेल.Perplexity त्याच्या API द्वारे वेगळ्या प्रकारचे तांत्रिक मूल्य प्रदान करते, जे डेव्हलपर्सना सर्च क्षमता थेट त्यांच्या स्वतःच्या ॲप्लिकेशन्समध्ये तयार करण्यास अनुमती देते. यामुळे वेगळ्या सर्च इंडेक्सची आणि वेगळ्या लँग्वेज मॉडेलची गरज उरत नाही. सिस्टिम ग्राउंडिंग आणि सायटेशन आपोआप हाताळते. तथापि, विचारात घेण्यासारख्या काही मर्यादा आहेत. API रेट लिमिट्स आणि रिअल-टाइम वेब सर्चिंगची लेटन्सी मोठ्या प्रमाणात ॲप्लिकेशन्ससाठी अडथळा ठरू शकते. युजर्सना सर्चचा वेग आणि विश्लेषणाची खोली यांच्यातील समतोल साधावा लागतो. या सर्च रिझल्ट्सचे स्थानिक स्टोरेज हा पॉवर युजर्ससाठी आणखी एक विचार आहे ज्यांना त्यांची माहिती कोठून आली याचा ऑडिट ट्रेल राखणे आवश्यक आहे. खालील तांत्रिक घटक सध्या या टूल्ससाठी स्पर्धात्मक धार निश्चित करत आहेत:
- लांब संदर्भ कार्यांदरम्यान KV कॅशे मेमरी वापर कमी करण्यासाठी ‘Multi-head Latent Attention’ चा वापर.
- आधुनिक GPU हार्डवेअरचा थ्रूपुट वाढवण्यासाठी FP8 ट्रेनिंग आणि इन्फरन्ससाठी सपोर्ट.
- हजारो समवर्ती वेब क्वेरी हाताळू शकणाऱ्या रिअल-टाइम RAG पाइपलाइनचे एकत्रीकरण.
- सुरक्षित वातावरणात स्थानिक उपयोजनासाठी (deployment) ओपन वेट्सची उपलब्धता.
निवडक इंटेलिजन्सचे भविष्य
DeepSeek आणि Perplexity चा उदय अधिक परिपक्व AI मार्केटची सुरुवात दर्शवतो. आपण बोलू शकणाऱ्या मॉडेल्सच्या नाविन्याकडून कार्यक्षमतेने काम करू शकणाऱ्या मॉडेल्सच्या उपयुक्ततेकडे जात आहोत. गुरुत्वाकर्षण केंद्र अशा प्रोव्हाइडर्सकडे सरकत आहे जे शाश्वत किमतीत उच्च दर्जाचे रिझल्ट देऊ शकतात. हा केवळ सध्याच्या 2026 चा ट्रेंड नसून आपण डिजिटल सेवा कशा बनवतो आणि वापरतो यातील दीर्घकालीन बदल आहे. पारंपारिक सर्च आणि महागड्या मॉडेल प्रोव्हाइडर्सवरचा दबाव वाढणारच आहे, कारण हे चॅलेंजर्स त्यांची उत्पादने अधिक परिष्कृत करत आहेत. युजरसाठी, याचा अर्थ अधिक निवड आणि चांगली टूल्स असा आहे. उद्योगासाठी, याचा अर्थ ब्रूट फोर्स कम्प्युटेशनपेक्षा इंजिनिअरिंग उत्कृष्टतेवर पुन्हा लक्ष केंद्रित करणे असा आहे. खरे विजेते तेच असतील जे हायप सायकलचा गोंधळ आणि टेक अर्थव्यवस्थेतील खऱ्या स्ट्रक्चरल बदलाचा सिग्नल यातील फरक ओळखू शकतील.
संपादकाची नोंद: आम्ही ही साइट बहुभाषिक AI बातम्या आणि मार्गदर्शिका केंद्र म्हणून अशा लोकांसाठी तयार केली आहे जे संगणक तज्ञ नाहीत, परंतु तरीही कृत्रिम बुद्धिमत्ता समजून घेऊ इच्छितात, अधिक आत्मविश्वासाने तिचा वापर करू इच्छितात आणि आधीच येत असलेल्या भविष्याचा मागोवा घेऊ इच्छितात.
काही चूक आढळली किंवा काही दुरुस्त करायचे आहे का? आम्हाला कळवा.