फाउंडर्स, आलोचक और शोधकर्ता: वो बातचीत जो पढ़ने लायक है
ज्यादातर लोग OpenAI के CEO का नाम जानते हैं। लेकिन बहुत कम लोग उन शोधकर्ताओं के नाम जानते हैं जिन्होंने उस पेपर को लिखा था जिसने आज के लार्ज लैंग्वेज मॉडल्स (LLMs) के युग को परिभाषित किया। ज्ञान की यह कमी हमें यह सोचने पर मजबूर कर देती है कि तकनीक असल में कैसे आगे बढ़ती है। हम आर्टिफिशियल इंटेलिजेंस को प्रोडक्ट लॉन्च की एक सीरीज की तरह देखते हैं, जबकि असल में यह गणितीय सफलताओं का एक धीमा संचय है। फाउंडर्स पूंजी और पब्लिक नैरेटिव को मैनेज करते हैं। शोधकर्ता वेट्स (weights) और लॉजिक को मैनेज करते हैं। इन दोनों के बीच का अंतर समझना ही मार्केटिंग के धुएं के आर-पार देखने का एकमात्र तरीका है। अगर आप सिर्फ फाउंडर्स को फॉलो करते हैं, तो आप एक फिल्म देख रहे हैं। अगर आप शोधकर्ताओं को फॉलो करते हैं, तो आप स्क्रिप्ट पढ़ रहे हैं। यह लेख इस बात पर चर्चा करेगा कि यह अंतर क्यों मायने रखता है और उन संकेतों को कैसे पहचानें जो वास्तव में इंडस्ट्री के भविष्य को तय करते हैं। हम करिश्माई भाषणों से आगे बढ़कर लैब की ठंडी सच्चाई को देखेंगे। अब समय आ गया है कि हम उन लोगों पर ध्यान दें जो कोड लिखते हैं, न कि सिर्फ उन पर जो प्रेस रिलीज पर साइन करते हैं।
मशीन युग के अदृश्य वास्तुकार
फाउंडर्स पब्लिक चेहरा होते हैं। वे वर्ल्ड इकोनॉमिक फोरम में बोलते हैं और कांग्रेस के सामने गवाही देते हैं। उनका काम अरबों की फंडिंग जुटाना और एक ऐसा ब्रांड बनाना है जो अनिवार्य लगे। वे ऐसे शब्दों का इस्तेमाल करते हैं जो जादू जैसा महसूस कराते हैं। शोधकर्ता अलग होते हैं। वे Python और LaTeX में काम करते हैं। उन्हें लॉस फंक्शन्स और टोकन एफिशिएंसी की चिंता होती है। एक फाउंडर कह सकता है कि उनका मॉडल ‘सोच’ रहा है। एक शोधकर्ता आपको बताएगा कि यह एक विशिष्ट प्रायिकता वितरण (probability distribution) के आधार पर अगले सबसे संभावित शब्द की भविष्यवाणी कर रहा है। भ्रम इसलिए पैदा होता है क्योंकि मीडिया इन दोनों समूहों को एक ही मानता है। जब कोई CEO कहता है कि एक मॉडल जलवायु परिवर्तन को हल करेगा, तो यह एक सेल्स पिच है। जब कोई शोधकर्ता स्पार्स ऑटोएनकोडर पर पेपर प्रकाशित करता है, तो यह एक तकनीकी दावा है। एक उम्मीद है, दूसरा तथ्य।
जनता अक्सर उम्मीद को ही तथ्य समझ लेती है। इससे ज्यादा वादे और कम डिलीवरी का एक चक्र शुरू हो जाता है। इस क्षेत्र को समझने के लिए, आपको कार बेचने वाले व्यक्ति को इंजन डिजाइन करने वाले व्यक्ति से अलग करना होगा। इंजन डिजाइनर को पता होता है कि बोल्ट कहाँ ढीले हैं। सेल्सपर्सन आपको कभी ढीले बोल्ट के बारे में नहीं बताएगा क्योंकि उनका काम स्टॉक की कीमत को ऊंचा रखना है। जब भी कोई नया मॉडल आता है, हम यही होते हुए देखते हैं। फाउंडर हाइप बनाने के लिए एक रहस्यमयी ट्वीट करता है। शोधकर्ता arXiv पर एक तकनीकी रिपोर्ट का लिंक पोस्ट करता है। ट्वीट को दस लाख व्यूज मिलते हैं। तकनीकी रिपोर्ट को कुछ हजार लोग पढ़ते हैं जो वास्तव में चीजें बनाते हैं। यह एक फीडबैक लूप बनाता है जहाँ सबसे तेज आवाजें बाकी सबके लिए वास्तविकता को परिभाषित करती हैं।
नवाचार के सार्वजनिक चेहरे से परे
इस विभाजन का वैश्विक नीति पर गहरा असर पड़ता है। सरकारें फिलहाल फाउंडर्स की चेतावनियों के आधार पर कानून बना रही हैं। ये फाउंडर्स अक्सर ऐसे अस्तित्वगत खतरों (existential risks) के बारे में चेतावनी देते हैं जो साइंस फिक्शन जैसे लगते हैं। इससे ध्यान मौजूदा नुकसानों के बजाय काल्पनिक भविष्य पर बना रहता है। इस बीच, शोधकर्ता डेटा बायस और ऊर्जा खपत जैसे तत्काल मुद्दों की ओर इशारा कर रहे हैं। केवल प्रसिद्ध नामों को सुनने से, हम गलत चीजों को रेगुलेट करने का जोखिम उठाते हैं। हम भविष्य की किसी सुपरइंटेलिजेंस पर प्रतिबंध लगा सकते हैं, जबकि इस तथ्य को नजरअंदाज कर देते हैं कि मौजूदा मॉडल अपने डेटा सेंटर्स को ठंडा करने के लिए छोटे शहरों का पानी खत्म कर रहे हैं। यह सिर्फ अमेरिकी मुद्दा नहीं है। यूरोप और एशिया में भी यही स्थिति है।
जिन आवाजों को सबसे ज्यादा एयरटाइम मिलता है, वे वही हैं जिनके पास सबसे बड़ा मार्केटिंग बजट है। यह एक ‘विजेता सब ले जाता है’ वाला माहौल बनाता है जहाँ कुछ कंपनियां पूरी दुनिया के लिए एजेंडा तय करती हैं। यदि हम अपना दृष्टिकोण व्यापक नहीं करते हैं, तो हम सिलिकॉन वैली के कुछ लोगों को यह तय करने की अनुमति दे रहे हैं कि क्या सुरक्षित है और क्या संभव है। सत्ता का यह केंद्रीकरण अपने आप में एक जोखिम है। यह उस क्षेत्र में विचारों की विविधता को सीमित करता है जिसे इसकी सबसे ज्यादा जरूरत है। हमें टोरंटो यूनिवर्सिटी या टोक्यो की लैब के लोगों को भी उतना ही सुनना चाहिए जितना हम सैन फ्रांसिस्को के लोगों को सुनते हैं। वैज्ञानिक प्रगति एक वैश्विक प्रयास है, लेकिन नैरेटिव फिलहाल एक स्थानीय एकाधिकार है। हमें Nature जैसी पत्रिकाओं को देखना चाहिए ताकि कॉर्पोरेट बोर्डरूम के बाहर हो रही वास्तविक प्रगति को समझ सकें।
दुनिया गलत लोगों की बात क्यों सुनती है
एक बड़ी लैब के लीड रिसर्चर के दिन के बारे में सोचें। वे जागते हैं और तीन मिलियन डॉलर की ट्रेनिंग रन के परिणाम देखते हैं। वे देखते हैं कि मॉडल उम्मीद से ज्यादा ‘हैलुसिनेट’ कर रहा है। वे शोर खोजने के लिए डेटा क्लस्टर्स को देखने में दस घंटे बिताते हैं। वे 2024 के चुनाव या मानवता के भाग्य के बारे में नहीं सोच रहे हैं। वे सोच रहे हैं कि मॉडल जटिल वाक्यों में नकारात्मकता (negation) को समझने में विफल क्यों है। वे न्यूरॉन एक्टिवेशन के हीट मैप्स देख रहे हैं। उनकी सफलता को बिट्स प्रति कैरेक्टर या किसी विशिष्ट बेंचमार्क पर सटीकता में मापा जाता है। अब एक फाउंडर के दिन पर विचार करें। वे किसी राष्ट्राध्यक्ष से मिलने के लिए प्राइवेट जेट में हैं। वे नई अर्थव्यवस्था के ट्रिलियन डॉलर के अवसर के बारे में बात कर रहे हैं।
शोधकर्ता ‘कैसे’ (how) से निपटता है। फाउंडर ‘क्यों यह पैसे के लायक है’ से निपटता है। एक ऐप बनाने वाले डेवलपर के लिए, शोधकर्ता ज्यादा महत्वपूर्ण व्यक्ति है। शोधकर्ता API लेटेंसी और कॉन्टेक्स्ट विंडो निर्धारित करता है। फाउंडर कीमत तय करता है। यदि आप कोई बिजनेस बनाने की कोशिश कर रहे हैं, तो आपको यह जानने की जरूरत है कि क्या तकनीक वास्तव में वह कर सकती है जो फाउंडर कहता है। अक्सर, ऐसा नहीं होता। हमने इसे स्वायत्त ड्राइविंग (autonomous driving) के शुरुआती दिनों में देखा था। फाउंडर्स ने कहा था कि 2026 तक हमारे पास लाखों रोबोटैक्सी होंगी। शोधकर्ता जानते थे कि भारी बारिश में एज केसेस अभी भी एक अनसुलझी समस्या थी। जनता ने फाउंडर्स पर विश्वास किया। शोधकर्ता सही थे।
यही पैटर्न जेनरेटिव AI स्पेस में भी दोहराया जा रहा है। हमें बताया जाता है कि मॉडल जल्द ही वकीलों और डॉक्टरों की जगह ले लेंगे। यदि आप तकनीकी पेपर पढ़ते हैं, तो आप देखेंगे कि मॉडल अभी भी बुनियादी तार्किक निरंतरता (logical consistency) के साथ संघर्ष कर रहे हैं। डेमो और वास्तविकता के बीच का अंतर ही वह जगह है जहाँ कंपनियां पैसे खोती हैं। आप आर्टिफिशियल इंटेलिजेंस ट्रेंड्स पर एक गहरी जानकारी पा सकते हैं ताकि देख सकें कि इन तकनीकी सीमाओं का आज कैसे परीक्षण किया जा रहा है। यह अंतर एक ठोस निवेश और एक सट्टा बुलबुले (speculative bubble) के बीच का फर्क है। जब आप कोई नया दावा सुनें, तो खुद से पूछें कि क्या यह किसी पेपर से आया है या प्रेस रिलीज से। जवाब आपको बता देगा कि इसे कितना महत्व देना है। MIT Technology Review के पत्रकार अक्सर लैब और लॉबी के बीच के इस अंतर को उजागर करते हैं। हमें याद रखना चाहिए कि फाउंडर्स को खामियों को छिपाने के लिए प्रोत्साहित किया जाता है, जबकि शोधकर्ताओं को उन्हें खोजने के लिए। पहला हाइप बनाता है और दूसरा सच्चाई। लंबे समय में, सच्चाई ही एकमात्र चीज है जो टिकती है। हमने इसे 2026 में देखा था जब तकनीकी वास्तविकता के बोझ तले हाइप की पहली लहर ठंडी होने लगी थी।
लैब बनाम बोर्डरूम का एक मंगलवार
हमें विकास के मौजूदा रास्ते के बारे में कठिन सवाल पूछने चाहिए। उस शोध के लिए पैसे कौन दे रहा है जिसके बारे में फाउंडर्स दावा करते हैं कि इससे सभी को फायदा होगा? अधिकांश शीर्ष शोधकर्ताओं ने प्राइवेट लैब्स के लिए शिक्षा जगत (academia) छोड़ दिया है। इसका मतलब है कि वे जो ज्ञान पैदा करते हैं वह अब सार्वजनिक वस्तु नहीं है। यह एक कॉर्पोरेट रहस्य है। जब किसी बात को साबित करने के लिए इस्तेमाल किया गया डेटा पेवॉल के पीछे छिपा हो, तो वैज्ञानिक पद्धति का क्या होता है? हम ओपन साइंस से हटकर बंद प्रतिस्पर्धी लाभ के मॉडल की ओर बढ़ रहे हैं। क्या कुछ व्यक्तियों की प्रसिद्धि इस क्षेत्र की मदद कर रही है या यह व्यक्तित्व का एक ऐसा पंथ (cult of personality) बना रही है जो असहमति को हतोत्साहित करता है? यदि कोई शोधकर्ता किसी फ्लैगशिप मॉडल में कोई बड़ी खामी पाता है, तो क्या वह इसे रिपोर्ट करने में सुरक्षित महसूस करता है यदि इससे कंपनी का मूल्यांकन गिर सकता है?
BotNews.today सामग्री का शोध करने, लिखने, संपादित करने और अनुवाद करने के लिए AI उपकरणों का उपयोग करता है। हमारी टीम जानकारी को उपयोगी, स्पष्ट और विश्वसनीय बनाए रखने के लिए प्रक्रिया की समीक्षा और पर्यवेक्षण करती है।
इन फर्मों पर वित्तीय दबाव बहुत अधिक है। हमें पर्यावरणीय लागत पर भी विचार करना होगा। क्या इन मॉडल्स को ट्रेन करने के भारी कार्बन फुटप्रिंट के बदले थोड़े बेहतर बेंचमार्क का पीछा करना सार्थक है? हम अक्सर पर्यावरण के लिए AI के लाभों के बारे में बात करते हैं, लेकिन हम शायद ही कभी कोई ऐसा बही-खाता देखते हैं जो दोनों को संतुलित करता हो। अंत में, उस संस्कृति का मालिक कौन है जिस पर ये मॉडल ट्रेन किए गए हैं? शोधकर्ता अपने सिस्टम बनाने के लिए इंटरनेट के सामूहिक आउटपुट का उपयोग करते हैं। फिर फाउंडर्स उसी आउटपुट के एक डिस्टिल्ड वर्जन तक पहुंचने के लिए जनता से शुल्क लेते हैं। यह धन का एक ऐसा हस्तांतरण है जिस पर सुर्खियों में शायद ही कभी चर्चा होती है। ये सिर्फ तकनीकी समस्याएं नहीं हैं। ये सामाजिक और नैतिक दुविधाएं हैं जिन्हें हल करने के लिए केवल एक बेहतर एल्गोरिदम से कहीं अधिक की आवश्यकता है।
तकनीकी बाधाएं और स्थानीय कार्यान्वयन
जो लोग इन प्लेटफॉर्म्स पर निर्माण कर रहे हैं, उनके लिए दर्शन से ज्यादा तकनीकी विवरण मायने रखते हैं। मौजूदा API सीमाएं एंटरप्राइज एडॉप्शन के लिए एक बड़ी बाधा हैं। अधिकांश प्रदाताओं के पास सख्त रेट लिमिट्स हैं जो हाई-वॉल्यूम रियल-टाइम प्रोसेसिंग को रोकती हैं। यही कारण है कि कई फर्में लोकल स्टोरेज और लोकल एग्जीक्यूशन को देख रही हैं। लोकल हार्डवेयर पर Llama 3 जैसे मॉडल्स का उपयोग बेहतर डेटा गोपनीयता और कम दीर्घकालिक लागत की अनुमति देता है। हालांकि, हार्डवेयर की आवश्यकताएं कठिन हैं। 70 बिलियन पैरामीटर वाले मॉडल को अच्छी गति से चलाने के लिए, आपको महत्वपूर्ण VRAM वाले हाई-एंड GPUs की आवश्यकता होती है। यहीं पर गीक सेक्शन वित्तीय सेक्शन से मिलता है। H100 क्लस्टर की लागत एक ऐसी बाधा है जो सत्ता को अमीरों के हाथों में रखती है।
हम विशेष फाइन-ट्यूनिंग की ओर भी बदलाव देख रहे हैं। हर चीज के लिए एक सामान्य मॉडल का उपयोग करने के बजाय, डेवलपर्स विशिष्ट डेटासेट्स पर प्रशिक्षित छोटे मॉडल्स का उपयोग कर रहे हैं। इससे सटीकता में सुधार होता है और टोकन काउंट कम होता है। यहाँ तकनीकी चुनौती डेटा क्यूरेशन की है। यदि इनपुट डेटा खराब है, तो फाइन-ट्यून किया गया मॉडल सामान्य मॉडल से भी बदतर होगा। हम तथ्यात्मक डेटा में मॉडल्स को ग्राउंड करने के लिए रिट्रीवल ऑगमेंटेड जनरेशन (RAG) का अधिक उपयोग देख रहे हैं। यह विशाल कॉन्टेक्स्ट विंडोज की आवश्यकता को दरकिनार करता है और हैलुसिनेशन को कम करता है। लेकिन RAG की अपनी सीमाएं हैं, विशेष रूप से इस बात में कि यह रिट्रीव किए गए दस्तावेजों की रैंकिंग को कैसे संभालता है। यदि सर्च स्टेप विफल हो जाता है, तो मॉडल आउटपुट बेकार है। अधिकांश उपयोगकर्ता यह नहीं समझते हैं कि AI का प्रदर्शन उतना ही डेटाबेस पर निर्भर करता है जितना कि खुद मॉडल पर।
जानकारी के लिए अंतिम फिल्टर
AI का भविष्य किसी एक व्यक्ति द्वारा बताई गई एक कहानी नहीं है। यह उन लोगों के बीच एक उलझा हुआ, चल रहा विवाद है जो एक विजन बेचते हैं और जो वास्तविकता बनाते हैं। टेक न्यूज का एक स्मार्ट उपभोक्ता बनने के लिए, आपको करिश्माई फाउंडर से आगे देखना सीखना होगा। पेपर्स पर नाम देखें। उन शोधकर्ताओं को खोजें जो यह बताने को तैयार हैं कि उनके मॉडल क्या नहीं कर सकते। इंडस्ट्री में विरोधाभास बग नहीं हैं। वे कहानी का सबसे ईमानदार हिस्सा हैं। यह क्षेत्र विकसित होता रहेगा क्योंकि तकनीकी समस्याएं हल होने से बहुत दूर हैं। जीवित सवाल यह है: क्या हम मौजूदा युग को परिभाषित करने वाली भारी संसाधन खपत के बिना एक वास्तव में बुद्धिमान सिस्टम बना सकते हैं? जब तक हम इसका जवाब नहीं देते, हाइप विज्ञान से आगे निकलती रहेगी। हमें किसी भी ऐसे नैरेटिव के प्रति संशयपूर्ण रहना चाहिए जो शामिल ट्रेड-ऑफ का उल्लेख किए बिना एक सही समाधान का वादा करता है।
संपादक का नोट: हमने इस साइट को उन लोगों के लिए एक बहुभाषी AI समाचार और गाइड हब के रूप में बनाया है जो कंप्यूटर गीक नहीं हैं, लेकिन फिर भी आर्टिफिशियल इंटेलिजेंस को समझना चाहते हैं, इसे अधिक आत्मविश्वास के साथ उपयोग करना चाहते हैं, और उस भविष्य का अनुसरण करना चाहते हैं जो पहले से ही आ रहा है।
कोई त्रुटि मिली या कुछ ऐसा जिसे सुधारने की आवश्यकता है? हमें बताएं।