हम यहाँ कैसे पहुँचे: AI बूम का संक्षिप्त इतिहास

आर्टिफिशियल इंटेलिजेंस (AI) का मौजूदा उछाल 2022 के अंत में किसी वायरल चैटबॉट से शुरू नहीं हुआ था। इसकी शुरुआत 2017 में Google के इंजीनियरों द्वारा प्रकाशित एक विशेष रिसर्च पेपर से हुई, जिसका शीर्षक था “Attention Is All You Need”। इस दस्तावेज़ ने ‘ट्रांसफॉर्मर’ आर्किटेक्चर को पेश किया, जिसने मशीनों के मानवीय भाषा को प्रोसेस करने के तरीके को ही बदल दिया। इससे पहले, कंप्यूटर एक लंबे वाक्य के संदर्भ (context) को बनाए रखने में संघर्ष करते थे। वे अक्सर पैराग्राफ के अंत तक पहुँचते-पहुँचते शुरुआत की बात भूल जाते थे। ट्रांसफॉर्मर ने मॉडल को अलग-अलग शब्दों के महत्व को एक साथ तौलने की अनुमति देकर इसे ठीक किया। यह तकनीकी बदलाव ही मुख्य कारण है कि आधुनिक टूल्स रोबोटिक लगने के बजाय सुसंगत महसूस होते हैं। हम अभी अनुक्रमिक प्रोसेसिंग (sequential processing) से दूर जाने के उस एक फैसले के बड़े पैमाने पर परिणामों के बीच जी रहे हैं। यह इतिहास केवल बेहतर कोड के बारे में नहीं है। यह वैश्विक स्तर पर जानकारी के साथ हमारे बातचीत करने के तरीके में आए एक मूलभूत बदलाव के बारे में है। उत्तर खोजने से लेकर उन्हें उत्पन्न करने तक के इस बदलाव ने आज के हर इंटरनेट उपयोगकर्ता की बुनियादी अपेक्षाओं को बदल दिया है।

तर्क से ऊपर सांख्यिकीय भविष्यवाणी

टेक्नोलॉजी की वर्तमान स्थिति को समझने के लिए, इस विचार को छोड़ना होगा कि ये सिस्टम ‘सोच’ रहे हैं। वे ऐसा नहीं कर रहे हैं। वे विशाल सांख्यिकीय इंजन हैं जो किसी अनुक्रम के अगले हिस्से की भविष्यवाणी करते हैं। जब आप कोई प्रॉम्प्ट टाइप करते हैं, तो सिस्टम यह निर्धारित करने के लिए अपने ट्रेनिंग डेटा को देखता है कि आपके इनपुट के बाद कौन सा शब्द सबसे अधिक संभावित है। यह अतीत की तर्क-आधारित प्रोग्रामिंग से एक अलग रास्ता है। पहले के दशकों में, सॉफ्टवेयर सख्त ‘इफ-देन’ नियमों का पालन करता था। यदि उपयोगकर्ता ने बटन क्लिक किया, तो सॉफ्टवेयर ने एक विशिष्ट क्रिया की। आज, आउटपुट संभावना पर आधारित है। इसका मतलब है कि मॉडल की सेटिंग्स के आधार पर एक ही इनपुट के अलग-अलग परिणाम हो सकते हैं। इस बदलाव ने एक नए प्रकार का सॉफ्टवेयर बनाया है जो लचीला तो है, लेकिन उन गलतियों के प्रति भी प्रवण है जो एक पारंपरिक कैलकुलेटर कभी नहीं करेगा।

इस ट्रेनिंग का पैमाना ही वह चीज़ है जो परिणामों को बुद्धिमत्ता जैसा महसूस कराता है। कंपनियों ने इन मॉडलों को फीड करने के लिए लगभग पूरे सार्वजनिक इंटरनेट को खंगाल लिया है। इसमें किताबें, लेख, कोड रिपॉजिटरी और फ़ोरम पोस्ट शामिल हैं। अरबों पैरामीटर्स का विश्लेषण करके, मॉडल शब्दों के अर्थ को समझे बिना मानवीय सोच की संरचना सीख लेते हैं। समझ की इसी कमी के कारण एक मॉडल एक सटीक कानूनी संक्षिप्त विवरण (legal brief) तो लिख सकता है, लेकिन एक साधारण गणित की समस्या में विफल हो सकता है। यह गणना नहीं कर रहा है। यह उन लोगों के पैटर्न की नकल कर रहा है जिन्होंने पहले गणित किया है। इस अंतर को समझना किसी भी पेशेवर क्षमता में इन टूल्स का उपयोग करने वाले व्यक्ति के लिए महत्वपूर्ण है। यह स्पष्ट करता है कि सिस्टम इतने आत्मविश्वासी क्यों होते हैं, भले ही वे पूरी तरह से गलत हों।

BotNews.today सामग्री का शोध करने, लिखने, संपादित करने और अनुवाद करने के लिए AI उपकरणों का उपयोग करता है। हमारी टीम जानकारी को उपयोगी, स्पष्ट और विश्वसनीय बनाए रखने के लिए प्रक्रिया की समीक्षा और पर्यवेक्षण करती है।

सिलिकॉन के लिए वैश्विक दौड़

इस तकनीकी बदलाव का प्रभाव सॉफ्टवेयर से कहीं आगे तक फैला है। इसने हार्डवेयर के लिए एक बड़े पैमाने पर भू-राजनीतिक संघर्ष को जन्म दिया है। विशेष रूप से, दुनिया अब हाई-एंड ग्राफिक्स प्रोसेसिंग यूनिट्स या GPUs पर निर्भर है। ये चिप्स मूल रूप से वीडियो गेम के लिए डिज़ाइन किए गए थे, लेकिन एक साथ कई छोटी गणनाएं करने की उनकी क्षमता उन्हें AI के लिए एकदम सही बनाती है। एक कंपनी, NVIDIA, अब वैश्विक अर्थव्यवस्था में एक केंद्रीय भूमिका निभाती है क्योंकि यह इन मॉडलों को ट्रेन करने के लिए आवश्यक चिप्स का उत्पादन करती है। राष्ट्र अब इन चिप्स के साथ तेल या सोने जैसा व्यवहार कर रहे हैं। ये रणनीतिक संपत्ति हैं जो यह तय करती हैं कि आर्थिक विकास के अगले दशक में कौन से देश नेतृत्व करेंगे।

इस निर्भरता ने उन लोगों के बीच एक विभाजन पैदा कर दिया है जो भारी कंप्यूट पावर का खर्च उठा सकते हैं और जो नहीं उठा सकते। एक टॉप-टियर मॉडल को ट्रेन करने में अब बिजली और हार्डवेयर पर करोड़ों डॉलर का खर्च आता है। प्रवेश के लिए यह उच्च बाधा का मतलब है कि संयुक्त राज्य अमेरिका और चीन की कुछ बड़ी कंपनियों के पास अधिकांश शक्ति है। प्रभाव का यह केंद्रीकरण दुनिया भर के नियामकों के लिए एक बड़ी चिंता का विषय है। यह डेटा को स्टोर करने के तरीके से लेकर स्टार्टअप को बुनियादी टूल्स तक पहुंचने के लिए कितना भुगतान करना होगा, सब कुछ प्रभावित करता है। उद्योग का आर्थिक गुरुत्वाकर्षण डेटा केंद्रों के मालिकों की ओर स्थानांतरित हो गया है। यह शुरुआती इंटरनेट युग से एक महत्वपूर्ण बदलाव है जहाँ एक छोटी टीम कम बजट में विश्व स्तरीय उत्पाद बना सकती थी। 2026 में, प्रवेश की लागत पहले से कहीं अधिक है।

जब अमूर्त काम दोपहर का काम बन जाता है

ज्यादातर लोगों के लिए, इस तकनीक का इतिहास इसकी दैनिक उपयोगिता से कम महत्वपूर्ण है। सारा नाम की एक मार्केटिंग मैनेजर पर विचार करें। कुछ साल पहले, उसका दिन घंटों के मैन्युअल रिसर्च और ड्राफ्टिंग में बीतता था। वह ट्रेंड्स खोजती, दर्जनों लेख पढ़ती और फिर उन्हें एक रिपोर्ट में संकलित करती। आज, उसका वर्कफ़्लो अलग है। वह टॉप ट्रेंड्स को सारांशित करने और एक प्रारंभिक रूपरेखा तैयार करने के लिए एक मॉडल का उपयोग करती है। वह अब केवल एक लेखिका नहीं है। वह मशीन द्वारा उत्पन्न सामग्री की एडिटर है। यह बदलाव कीबोर्ड से जुड़े हर उद्योग में हो रहा है। यह केवल गति के बारे में नहीं है। यह खाली पन्ने को हटाने के बारे में है। मशीन पहला ड्राफ्ट प्रदान करती है, और इंसान दिशा प्रदान करता है।

इस बदलाव के नौकरी की सुरक्षा और कौशल विकास के लिए व्यावहारिक दांव हैं। यदि एक जूनियर एनालिस्ट अब इन टूल्स का उपयोग करके तीन लोगों का काम कर सकता है, तो एंट्री-लेवल जॉब मार्केट का क्या होगा? हम एक “सुपर-यूज़र” मॉडल की ओर बढ़ रहे हैं जहाँ एक व्यक्ति जटिल कार्यों को पूरा करने के लिए कई AI एजेंट्स का प्रबंधन करता है। यह सॉफ्टवेयर इंजीनियरिंग में दिखाई देता है, जहाँ GitHub Copilot जैसे टूल्स कोड के पूरे ब्लॉक का सुझाव देते हैं। डेवलपर टाइप करने में कम और ऑडिटिंग में अधिक समय बिताता है। इस नई वास्तविकता के लिए कौशल के एक अलग सेट की आवश्यकता है। आपको अब हर सिंटैक्स नियम को याद रखने की आवश्यकता नहीं है। आपको यह जानने की जरूरत है कि सही सवाल कैसे पूछें और एकदम सही दिखने वाले टेक्स्ट के समुद्र में सूक्ष्म गलती को कैसे पहचानें। 2026 में एक पेशेवर का दिन अब प्रॉम्प्टिंग और सत्यापन का एक निरंतर चक्र है। यहाँ कुछ तरीके दिए गए हैं कि यह व्यवहार में कैसा दिखता है:

सॉफ्टवेयर डेवलपर्स दोहराव वाले यूनिट टेस्ट और बॉयलरप्लेट कोड लिखने के लिए मॉडलों का उपयोग करते हैं।
कानूनी सहायक विशिष्ट कीवर्ड के लिए डिस्कवरी के हजारों पन्नों को स्कैन करने के लिए उनका उपयोग करते हैं।
चिकित्सा शोधकर्ता यह भविष्यवाणी करने के लिए उनका उपयोग करते हैं कि विभिन्न प्रोटीन संरचनाएं कैसे इंटरैक्ट कर सकती हैं।
ग्राहक सेवा टीमें मानवीय हस्तक्षेप के बिना नियमित पूछताछ को संभालने के लिए उनका उपयोग करती हैं।

ब्लैक बॉक्स की छिपी हुई लागत

जैसे-जैसे हम इन प्रणालियों पर अधिक निर्भर होते हैं, हमें उनकी छिपी हुई लागतों के बारे में कठिन सवाल पूछने चाहिए। पहला पर्यावरणीय प्रभाव है। एक बड़े भाषा मॉडल के लिए एक सिंगल क्वेरी को मानक Google सर्च की तुलना में काफी अधिक बिजली की आवश्यकता होती है। जब इसे लाखों उपयोगकर्ताओं द्वारा गुणा किया जाता है, तो कार्बन फुटप्रिंट काफी बड़ा हो जाता है। पानी के उपयोग का मुद्दा भी है। डेटा केंद्रों को उन सर्वरों को ठंडा करने के लिए भारी मात्रा में पानी की आवश्यकता होती है जो इन मॉडलों को चलाते हैं। क्या हम तेजी से ईमेल ड्राफ्टिंग के लिए स्थानीय जल सुरक्षा का व्यापार करने को तैयार हैं? यह एक ऐसा सवाल है जिसे डेटा केंद्रों के पास के कई समुदाय पूछने लगे हैं। हमें डेटा को भी देखना होगा। अधिकांश मॉडल रचनाकारों की सहमति के बिना कॉपीराइट सामग्री पर प्रशिक्षित किए गए थे। इसने कलाकारों और लेखकों की ओर से मुकदमों की एक लहर पैदा कर दी है, जो तर्क देते हैं कि उनका काम एक ऐसा उत्पाद बनाने के लिए चुराया गया था जो अंततः उन्हें प्रतिस्थापित कर सकता है।

फिर ब्लैक बॉक्स की समस्या है। जो इंजीनियर इन मॉडलों को बनाते हैं, वे भी पूरी तरह से नहीं समझते कि वे कुछ निर्णय क्यों लेते हैं। जब AI का उपयोग भर्ती या ऋण अनुमोदन जैसे संवेदनशील कार्यों के लिए किया जाता है, तो पारदर्शिता की यह कमी खतरनाक होती है। यदि कोई मॉडल किसी विशेष समूह के खिलाफ पूर्वाग्रह विकसित करता है, तो मूल कारण को ढूंढना और ठीक करना मुश्किल हो सकता है। हम अनिवार्य रूप से महत्वपूर्ण सामाजिक निर्णयों को एक ऐसी प्रणाली को आउटसोर्स कर रहे हैं जो अपने स्वयं के तर्क की व्याख्या नहीं कर सकती है। हम एक मशीन को जवाबदेह कैसे ठहराएं? हम यह कैसे सुनिश्चित करें कि इन प्रणालियों को प्रशिक्षित करने के लिए उपयोग किया जाने वाला डेटा पुराने पूर्वाग्रहों को मजबूत नहीं कर रहा है? ये सैद्धांतिक समस्याएं नहीं हैं। ये सक्रिय मुद्दे हैं जिन्हें नवीनतम AI विकास अलग-अलग स्तर की सफलता के साथ संबोधित करने की कोशिश कर रहे हैं।

क्या आपके पास कोई AI कहानी, उपकरण, ट्रेंड या प्रश्न है जिसके बारे में आपको लगता है कि हमें कवर करना चाहिए? हमें अपना लेख विचार भेजें — हमें इसे सुनकर खुशी होगी।

लेटेंसी और टोकन इकोनॉमी

जो लोग इन टूल्स को पेशेवर वर्कफ़्लो में एकीकृत करना चाहते हैं, उनके लिए तकनीकी विवरण मायने रखते हैं। इन मॉडलों के साथ अधिकांश बातचीत एक एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस या API के माध्यम से होती है। यहीं पर आप टोकन की अवधारणा का सामना करते हैं। एक टोकन लगभग चार अंग्रेजी टेक्स्ट के अक्षर होते हैं। मॉडल शब्द नहीं पढ़ते। वे टोकन पढ़ते हैं। यह महत्वपूर्ण है क्योंकि अधिकांश प्रदाता प्रोसेस किए गए टोकन की संख्या के आधार पर शुल्क लेते हैं। यदि आप एक ऐसा टूल बना रहे हैं जो लंबे दस्तावेजों का विश्लेषण करता है, तो आपकी लागत जल्दी बढ़ सकती है। आपको कॉन्टेक्स्ट विंडो को भी प्रबंधित करना होगा। यह जानकारी की वह मात्रा है जिसे मॉडल एक समय में “याद” रख सकता है। शुरुआती मॉडलों में छोटी विंडो थी, लेकिन नए संस्करण एक ही प्रॉम्प्ट में पूरी किताबें प्रोसेस कर सकते हैं। हालाँकि, बड़ी विंडो अक्सर उच्च लेटेंसी और टेक्स्ट के बीच में विशिष्ट विवरणों को खोने की संभावना को बढ़ा देती है।

एक और महत्वपूर्ण क्षेत्र स्थानीय स्टोरेज और गोपनीयता की प्रक्रिया है। कई उद्यम संवेदनशील डेटा को थर्ड-पार्टी सर्वर पर भेजने में संकोच करते हैं। इसने Llama 3 जैसे स्थानीय मॉडलों के उदय को जन्म दिया है जो आंतरिक हार्डवेयर पर चल सकते हैं। स्थानीय रूप से मॉडल चलाने के लिए आपके GPU पर महत्वपूर्ण VRAM की आवश्यकता होती है। उदाहरण के लिए, 70 बिलियन पैरामीटर मॉडल को चलाने के लिए आमतौर पर दो हाई-एंड कार्ड की आवश्यकता होती है। यहीं पर क्वांटाइजेशन काम आता है। यह एक ऐसी तकनीक है जो गणना में उपयोग की जाने वाली संख्याओं की सटीकता को कम करके मॉडल के आकार को सिकोड़ती है। यह एक शक्तिशाली मॉडल को सटीकता में मामूली गिरावट के साथ उपभोक्ता हार्डवेयर पर चलने की अनुमति देता है। डेवलपर्स को इन कारकों को संतुलित करना होगा:

API लागत बनाम स्थानीय रूप से मॉडल चलाने का हार्डवेयर खर्च।
छोटे मॉडल की गति बनाम बड़े मॉडल की तर्क क्षमता।
डेटा को ऑन-प्रेमिस रखने की सुरक्षा बनाम क्लाउड की सुविधा।
पीक उपयोग के घंटों के दौरान सार्वजनिक API पर रेट-थ्रॉटलिंग की सीमाएं।

आगे का रास्ता

AI बूम का इतिहास एक अच्छे विचार को स्केल करने की कहानी है। ट्रांसफॉर्मर आर्किटेक्चर को लेकर और उस पर भारी मात्रा में डेटा और कंप्यूट पावर डालकर, हमने कुछ ऐसा बनाया है जो कंप्यूटिंग के एक नए युग जैसा लगता है। लेकिन हम अभी शुरुआती चरणों में हैं। आज बहुत से लोग जो भ्रम महसूस कर रहे हैं, वह तकनीक जो कर सकती है और हम उससे जो उम्मीद करते हैं, उसके बीच के अंतर से आता है। यह संवर्धन (augmentation) के लिए एक टूल है, मानवीय निर्णय का प्रतिस्थापन नहीं। आने वाले वर्षों में सबसे सफल लोग वे होंगे जो इन प्रणालियों की सांख्यिकीय प्रकृति को समझते हैं। वे जानेंगे कि मशीन पर कब भरोसा करना है और कब उसके काम को सत्यापित करना है। हम एक ऐसे भविष्य की ओर बढ़ रहे हैं जहाँ AI को प्रबंधित करने की क्षमता उतनी ही मौलिक होगी जितनी कि वर्ड प्रोसेसर का उपयोग करने की क्षमता।

संपादक का नोट: हमने इस साइट को उन लोगों के लिए एक बहुभाषी AI समाचार और गाइड हब के रूप में बनाया है जो कंप्यूटर गीक नहीं हैं, लेकिन फिर भी आर्टिफिशियल इंटेलिजेंस को समझना चाहते हैं, इसे अधिक आत्मविश्वास के साथ उपयोग करना चाहते हैं, और उस भविष्य का अनुसरण करना चाहते हैं जो पहले से ही आ रहा है।

कोई त्रुटि मिली या कुछ ऐसा जिसे सुधारने की आवश्यकता है? हमें बताएं।

Frequently Asked Questions

“नीतिशास्त्र और दर्शन” सामान्य AI पाठकों के लिए क्यों महत्वपूर्ण है?

एआई और उन्नत प्रणालियों के नैतिक प्रश्नों, मानवीय मूल्यों और दार्शनिक पहलुओं के बारे में विस्तार से जानें। यह इसलिए महत्वपूर्ण है क्योंकि यह AI खबरों को काम, गोपनीयता, लागत, भरोसे और उन टूल्स से जोड़ता है जिन्हें लोग वास्तव में इस्तेमाल करते हैं।

“लैब नोट्स” में पाठकों को किस बात पर ध्यान देना चाहिए?

एआई अनुसंधान, प्रयोगों और तकनीकी प्रगति के व्यावहारिक प्रभाव को समझने के लिए लैब नोट्स पढ़ें, जो विशेषज्ञों और सामान्य पाठकों दोनों के लिए उपयोगी है। पाठकों को दावों के पीछे के प्रमाण, टूल या घोषणा की सीमाएँ, किसे लाभ होता है, अभी क्या बदल रहा है और क्या अभी भी अनिश्चित है, इन बातों पर ध्यान देना चाहिए।