आपण इथे कसे पोहोचलो: AI क्रांतीचा थोडक्यात इतिहास

आर्टिफिशियल इंटेलिजन्सची सध्याची लाट २०२२ च्या अखेरीस एका व्हायरल चॅटबॉटने सुरू झाली नाही. तिची सुरुवात २०१७ मध्ये गुगलच्या इंजिनिअर्सनी प्रसिद्ध केलेल्या ‘अटेंशन इज ऑल यू नीड’ (Attention Is All You Need) या शोधनिबंधाने झाली. या दस्तऐवजाने ‘ट्रान्सफॉर्मर’ (Transformer) आर्किटेक्चरची ओळख करून दिली, ज्याने मशीन मानवी भाषा कशी समजून घेतात हे पूर्णपणे बदलून टाकले. याआधी, संगणकांना लांब वाक्यांचा संदर्भ लक्षात ठेवणे कठीण जायचे. ते अनेकदा परिच्छेदाच्या शेवटी पोहोचेपर्यंत सुरुवातीचा भाग विसरून जायचे. ट्रान्सफॉर्मरने मॉडेलला वेगवेगळ्या शब्दांचे महत्त्व एकाच वेळी मोजण्याची क्षमता देऊन ही समस्या सोडवली. हा एक तांत्रिक बदलच मुख्य कारण आहे की आजची आधुनिक टूल्स रोबोटिक वाटण्याऐवजी सुसंगत वाटतात. आपण सध्या त्या एका निर्णयाचे परिणाम अनुभवत आहोत, ज्याने सीक्वेंशियल प्रोसेसिंगपासून दूर जाण्याचा मार्ग निवडला. हा इतिहास केवळ चांगल्या कोडिंगबद्दल नाही, तर जागतिक स्तरावर आपण माहितीशी कसा संवाद साधतो, यातील मूलभूत बदलाचा आहे. उत्तरे शोधण्याकडून ती तयार करण्याकडे झालेला हा प्रवास आजच्या प्रत्येक इंटरनेट वापरकर्त्याच्या अपेक्षा बदलणारा ठरला आहे.

तर्कापेक्षा सांख्यिकीय अंदाज

तंत्रज्ञानाची सध्याची स्थिती समजून घेण्यासाठी, या प्रणाली विचार करत आहेत हा विचार सोडून द्यावा लागेल. त्या तसे करत नाहीत. त्या प्रचंड सांख्यिकीय इंजिन्स आहेत, जी पुढील शब्दाचा अंदाज लावतात. जेव्हा तुम्ही एखादा प्रॉम्प्ट टाईप करता, तेव्हा सिस्टम तिच्या ट्रेनिंग डेटाचा वापर करून हे ठरवते की तुमच्या इनपुटनंतर कोणता शब्द येण्याची शक्यता सर्वात जास्त आहे. हे पूर्वीच्या लॉजिक-आधारित प्रोग्रामिंगपेक्षा वेगळे आहे. पूर्वीच्या दशकांमध्ये, सॉफ्टवेअर कडक ‘इफ-देन’ (if-then) नियमांचे पालन करायचे. जर वापरकर्त्याने बटण क्लिक केले, तर सॉफ्टवेअरने विशिष्ट कृती करायची. आज, आउटपुट हे संभाव्यतेवर आधारित आहे. याचा अर्थ असा की मॉडेलच्या सेटिंग्जवर अवलंबून एकाच इनपुटचे वेगवेगळे आउटपुट असू शकतात. या बदलामुळे अशा प्रकारचे सॉफ्टवेअर तयार झाले आहे जे लवचिक आहे, परंतु त्यात अशा चुका होण्याची शक्यता असते ज्या पारंपारिक कॅल्क्युलेटर कधीही करणार नाही.

या ट्रेनिंगची व्याप्तीच निकालांना बुद्धिमत्तेसारखे भासवते. कंपन्यांनी या मॉडेल्सना फीड करण्यासाठी जवळजवळ संपूर्ण सार्वजनिक इंटरनेट स्क्रेप केले आहे. यामध्ये पुस्तके, लेख, कोड रिपॉझिटरीज आणि फोरम पोस्ट्सचा समावेश आहे. अब्जावधी पॅरामीटर्सचे विश्लेषण करून, मॉडेल्स शब्दांचा अर्थ न समजता मानवी विचारांची रचना शिकतात. या समजाच्या अभावामुळेच एक मॉडेल उत्तम कायदेशीर मसुदा लिहू शकते, पण साध्या गणिताच्या प्रश्नात अपयशी ठरू शकते. ते गणना करत नाही, तर ज्यांनी आधी गणित केले आहे त्यांच्या पॅटर्नची नक्कल करत आहे. व्यावसायिक क्षेत्रात ही टूल्स वापरणाऱ्या प्रत्येकासाठी हा फरक समजून घेणे अत्यंत महत्त्वाचे आहे. यामुळेच हे स्पष्ट होते की जेव्हा सिस्टम पूर्णपणे चुकीच्या असतात, तेव्हाही त्या इतक्या आत्मविश्वासाने उत्तरे का देतात.

BotNews.today सामग्री संशोधन, लेखन, संपादन आणि भाषांतरित करण्यासाठी AI साधनांचा वापर करते. माहिती उपयुक्त, स्पष्ट आणि विश्वसनीय ठेवण्यासाठी आमची टीम प्रक्रियेचे पुनरावलोकन आणि पर्यवेक्षण करते.

सिलिकॉनसाठी जागतिक शर्यत

या तांत्रिक बदलाचा प्रभाव सॉफ्टवेअरच्या पलीकडे गेला आहे. यामुळे हार्डवेअरसाठी मोठी भू-राजकीय धावपळ सुरू झाली आहे. विशेषतः, जग आता हाय-एंड ग्राफिक्स प्रोसेसिंग युनिट्स किंवा GPU वर अवलंबून आहे. हे चिप्स मूळतः व्हिडिओ गेम्ससाठी डिझाइन केले होते, परंतु त्यांची एकाच वेळी अनेक लहान गणना करण्याची क्षमता त्यांना AI साठी परिपूर्ण बनवते. NVIDIA नावाची एक कंपनी आता जागतिक अर्थव्यवस्थेत मध्यवर्ती भूमिकेत आहे, कारण ती हे मॉडेल्स ट्रेन करण्यासाठी आवश्यक चिप्स तयार करते. देश आता या चिप्सना तेल किंवा सोन्यासारखे मानत आहेत. ही धोरणात्मक मालमत्ता आहे जी ठरवेल की पुढच्या दशकात आर्थिक विकासात कोणते देश आघाडीवर असतील.

या अवलंबित्वेमुळे ज्यांच्याकडे प्रचंड कॉम्प्युट पॉवर आहे आणि ज्यांच्याकडे नाही, त्यांच्यात एक दरी निर्माण झाली आहे. आज एक टॉप-टीअर मॉडेल ट्रेन करण्यासाठी वीज आणि हार्डवेअरवर कोट्यवधी डॉलर्स खर्च होतात. प्रवेशासाठीचा हा उच्च अडथळा म्हणजे अमेरिका आणि चीनमधील काही मोठ्या कॉर्पोरेशनकडे बहुतांश सत्ता आहे. प्रभावाचे हे केंद्रीकरण जगभरातील नियामकांसाठी चिंतेची बाब आहे. याचा परिणाम डेटा कसा साठवला जातो यापासून ते स्टार्टअपला मूलभूत टूल्स वापरण्यासाठी किती पैसे द्यावे लागतात, यापर्यंत सर्व गोष्टींवर होतो. उद्योगाचे आर्थिक गुरुत्वाकर्षण डेटा सेंटरच्या मालकांकडे झुकले आहे. सुरुवातीच्या इंटरनेट युगापेक्षा हा मोठा बदल आहे, जिथे एक छोटी टीम कमी बजेटमध्ये जागतिक दर्जाचे उत्पादन तयार करू शकत होती. 2026 मध्ये, प्रवेशाचा खर्च पूर्वीपेक्षा कितीतरी जास्त आहे.

जेव्हा अमूर्त गोष्ट दुपारचे काम बनते

बहुतेक लोकांसाठी, या तंत्रज्ञानाचा इतिहास त्याच्या दैनंदिन उपयुक्ततेपेक्षा कमी महत्त्वाचा आहे. सारा नावाच्या मार्केटिंग मॅनेजरचा विचार करा. काही वर्षांपूर्वी, तिचा दिवस तासनतास मॅन्युअल रिसर्च आणि ड्राफ्टिंगमध्ये जायचा. ती ट्रेंड्स शोधायची, डझनभर लेख वाचायची आणि मग त्यांचा सारांश अहवालात मांडायची. आज, तिची कामाची पद्धत वेगळी आहे. ती टॉप ट्रेंड्सचा सारांश काढण्यासाठी आणि प्राथमिक आराखडा तयार करण्यासाठी मॉडेलचा वापर करते. ती आता लेखिका राहिलेली नाही. ती मशीन-जनरेटेड कंटेंटची एडिटर आहे. हा बदल कीबोर्डचा वापर करणाऱ्या प्रत्येक उद्योगात घडत आहे. हे केवळ वेगाबद्दल नाही. हे कोऱ्या पानापासून सुटका मिळवण्याबद्दल आहे. मशीन पहिला मसुदा देते आणि माणूस दिशा देतो.

या बदलाचे नोकरीची सुरक्षा आणि कौशल्य विकासासाठी व्यावहारिक परिणाम आहेत. जर एखादा ज्युनियर ॲनालिस्ट आता या टूल्सचा वापर करून तिघांचे काम करू शकत असेल, तर एंट्री-लेव्हल जॉब मार्केटचे काय होईल? आपण ‘सुपर-युजर’ मॉडेलकडे वाटचाल करत आहोत, जिथे एक व्यक्ती जटिल कार्ये पूर्ण करण्यासाठी अनेक AI एजंट्सचे व्यवस्थापन करते. हे सॉफ्टवेअर इंजिनिअरिंगमध्ये दिसते, जिथे GitHub Copilot सारखी टूल्स कोडचे संपूर्ण ब्लॉक्स सुचवतात. डेव्हलपर टाईप करण्यात कमी आणि ऑडिट करण्यात जास्त वेळ घालवतो. या नवीन वास्तवासाठी वेगळ्या कौशल्यांची गरज आहे. तुम्हाला आता प्रत्येक सिंटॅक्स नियम लक्षात ठेवण्याची गरज नाही. तुम्हाला योग्य प्रश्न कसे विचारायचे आणि परिपूर्ण दिसणाऱ्या मजकुरात सूक्ष्म चूक कशी शोधायची हे माहित असणे आवश्यक आहे. 2026 मधील व्यावसायिकाचा दिवस आता प्रॉम्पटिंग आणि व्हेरिफायिंगच्या सततच्या चक्रात जातो. हे प्रत्यक्षात कसे दिसते याची काही उदाहरणे खालीलप्रमाणे आहेत:

सॉफ्टवेअर डेव्हलपर्स पुनरावृत्ती होणारे युनिट टेस्ट आणि बॉयलरप्लेट कोड लिहिण्यासाठी मॉडेल्सचा वापर करतात.
कायदेशीर सहाय्यक विशिष्ट कीवर्ड्ससाठी हजारो पानांचे स्कॅनिंग करण्यासाठी त्यांचा वापर करतात.
वैद्यकीय संशोधक विविध प्रथिने संरचना (protein structures) कशी संवाद साधू शकतात याचा अंदाज लावण्यासाठी त्यांचा वापर करतात.
ग्राहक सेवा टीम मानवी हस्तक्षेपाशिवाय नियमित चौकशी हाताळण्यासाठी त्यांचा वापर करतात.

ब्लॅक बॉक्सची शांत किंमत

जसजसे आपण या प्रणालींवर अवलंबून राहतो, तसतसे आपल्याला त्यांच्या लपलेल्या खर्चाबद्दल कठीण प्रश्न विचारले पाहिजेत. पहिली गोष्ट म्हणजे पर्यावरणीय परिणाम. मोठ्या लँग्वेज मॉडेलला विचारलेल्या एका प्रश्नासाठी सामान्य गुगल सर्चपेक्षा लक्षणीयरीत्या जास्त वीज लागते. जेव्हा हे लाखो वापरकर्त्यांपर्यंत पोहोचते, तेव्हा कार्बन फूटप्रिंट लक्षणीय बनते. पाण्याचा वापर हा देखील एक मुद्दा आहे. डेटा सेंटर्सना हे मॉडेल्स चालवणारे सर्व्हर थंड करण्यासाठी प्रचंड पाणी लागते. आपण जलद ईमेल ड्राफ्टिंगसाठी स्थानिक पाणी सुरक्षेचा बळी देण्यास तयार आहोत का? हा प्रश्न डेटा सेंटरजवळील अनेक समुदाय विचारू लागले आहेत. आपल्याला डेटाकडेही पाहण्याची गरज आहे. बहुतेक मॉडेल्स निर्मात्यांच्या संमतीशिवाय कॉपीराइट केलेल्या साहित्यावर ट्रेन केली गेली आहेत. यामुळे कलाकार आणि लेखकांकडून खटल्यांची लाट आली आहे, ज्यांचे म्हणणे आहे की त्यांचे काम अशा उत्पादनासाठी चोरले गेले जे कदाचित भविष्यात त्यांची जागा घेईल.

त्यानंतर ‘ब्लॅक बॉक्स’ची समस्या आहे. हे मॉडेल्स बनवणारे इंजिनिअर्सही ते काही निर्णय का घेतात, हे पूर्णपणे समजू शकत नाहीत. जेव्हा AI चा वापर नोकरी किंवा कर्जाच्या मंजुरीसारख्या संवेदनशील कामांसाठी केला जातो, तेव्हा पारदर्शकतेचा हा अभाव धोकादायक ठरतो. जर एखाद्या मॉडेलने विशिष्ट गटाविरुद्ध पूर्वग्रह विकसित केला, तर त्याचे मूळ कारण शोधणे आणि ते दुरुस्त करणे कठीण होऊ शकते. आपण अनिवार्यपणे महत्त्वाचे सामाजिक निर्णय अशा सिस्टमकडे सोपवत आहोत जी स्वतःचे तर्क स्पष्ट करू शकत नाही. आपण मशीनला जबाबदार कसे धरू शकतो? या सिस्टमला ट्रेन करण्यासाठी वापरलेला डेटा जुन्या पूर्वग्रहांना बळकटी देत नाही याची खात्री आपण कशी करू शकतो? हे केवळ सैद्धांतिक प्रश्न नाहीत. हे सक्रिय मुद्दे आहेत ज्यांना लेटेस्ट AI डेव्हलपमेंट्स विविध स्तरांवरील यशासह संबोधित करण्याचा प्रयत्न करत आहेत. तुम्ही आम्हाला कव्हर करावे असे तुम्हाला वाटणारी AI कथा, साधन, ट्रेंड किंवा प्रश्न आहे का? तुमची लेखाची कल्पना आम्हाला पाठवा — आम्हाला ती ऐकायला आवडेल.

लॅटन्सी आणि टोकन इकॉनॉमी

जे लोक ही टूल्स व्यावसायिक वर्कफ्लोमध्ये समाकलित करू इच्छितात, त्यांच्यासाठी तांत्रिक तपशील महत्त्वाचे आहेत. या मॉडेल्सशी बहुतेक संवाद ॲप्लिकेशन प्रोग्रामिंग इंटरफेस किंवा API द्वारे होतो. इथेच तुम्हाला ‘टोकन्स’ची संकल्पना समजते. एक टोकन म्हणजे साधारणपणे इंग्रजी मजकुराचे चार अक्षरे. मॉडेल्स शब्द वाचत नाहीत. ते टोकन्स वाचतात. हे महत्त्वाचे आहे कारण बहुतेक प्रदाते प्रक्रिया केलेल्या टोकन्सच्या संख्येवर आधारित शुल्क आकारतात. जर तुम्ही लांब दस्तऐवजांचे विश्लेषण करणारे टूल बनवत असाल, तर तुमचा खर्च वेगाने वाढू शकतो. तुम्हाला ‘कॉन्टेक्स्ट विंडो’ देखील व्यवस्थापित करावी लागेल. ही अशी माहिती आहे जी मॉडेल एका वेळी ‘लक्षात’ ठेवू शकते. सुरुवातीच्या मॉडेल्समध्ये लहान विंडोज होत्या, परंतु नवीन आवृत्त्या एकाच प्रॉम्प्टमध्ये संपूर्ण पुस्तकांवर प्रक्रिया करू शकतात. तथापि, मोठ्या विंडोजमुळे अनेकदा लॅटन्सी वाढते आणि मजकुराच्या मध्यभागी मॉडेलचे लक्ष विचलित होण्याची शक्यता वाढते.

दुसरा महत्त्वाचा भाग म्हणजे स्थानिक स्टोरेज आणि गोपनीयतेची प्रक्रिया. अनेक उपक्रम संवेदनशील डेटा थर्ड-पार्टी सर्व्हरवर पाठवण्यास संकोच करतात. यामुळे Llama 3 सारख्या स्थानिक मॉडेल्सचा उदय झाला आहे, जे अंतर्गत हार्डवेअरवर चालू शकतात. स्थानिक पातळीवर मॉडेल चालवण्यासाठी तुमच्या GPU वर लक्षणीय VRAM आवश्यक असते. उदाहरणार्थ, ७० अब्ज पॅरामीटरचे मॉडेल चालवण्यासाठी साधारणपणे दोन हाय-एंड कार्ड्स लागतात. इथेच ‘क्वांटायझेशन’ (quantization) कामाला येते. हे एक तंत्र आहे जे गणितांमध्ये वापरल्या जाणाऱ्या संख्यांची अचूकता कमी करून मॉडेलचा आकार कमी करते. यामुळे एक शक्तिशाली मॉडेल केवळ अचूकतेत थोडासा बदल करून ग्राहक हार्डवेअरवर चालू शकते. डेव्हलपर्सनी या घटकांचा समतोल राखला पाहिजे:

API खर्च विरुद्ध मॉडेल्स स्थानिक पातळीवर चालवण्याचा हार्डवेअर खर्च.
लहान मॉडेलचा वेग विरुद्ध मोठ्या मॉडेलची तर्क करण्याची क्षमता.
डेटा ऑन-प्रिमाइस ठेवण्याची सुरक्षा विरुद्ध क्लाउडची सोय.
पीक अवर्स दरम्यान सार्वजनिक API वर रेट-थ्रॉटलिंगच्या मर्यादा.

पुढील मार्ग

AI क्रांतीचा इतिहास ही एका चांगल्या कल्पनेला स्केल करण्याची गोष्ट आहे. ट्रान्सफॉर्मर आर्किटेक्चर घेऊन आणि त्यावर प्रचंड डेटा आणि कॉम्प्युट टाकून, आपण अशी गोष्ट तयार केली आहे जी संगणकीय युगाची नवीन सुरुवात वाटते. पण आपण अजूनही सुरुवातीच्या टप्प्यात आहोत. आज अनेकांना जाणवणारा गोंधळ हा तंत्रज्ञान काय करू शकते आणि आपण त्याकडून काय अपेक्षा करतो, यातील दरीमुळे आहे. हे मानवी निर्णयाची जागा घेण्यासाठी नाही, तर त्याला वाढवण्यासाठी (augmentation) एक साधन आहे. येत्या काही वर्षांत जे लोक या प्रणालींचे सांख्यिकीय स्वरूप समजून घेतील, तेच सर्वात यशस्वी ठरतील. त्यांना माहित असेल की मशीनवर कधी विश्वास ठेवायचा आणि कधी त्याचे काम तपासायचे. आपण अशा भविष्याकडे वाटचाल करत आहोत जिथे AI व्यवस्थापित करण्याची क्षमता ही वर्ड प्रोसेसर वापरण्याइतकीच मूलभूत असेल.

संपादकाची नोंद: आम्ही ही साइट बहुभाषिक AI बातम्या आणि मार्गदर्शिका केंद्र म्हणून अशा लोकांसाठी तयार केली आहे जे संगणक तज्ञ नाहीत, परंतु तरीही कृत्रिम बुद्धिमत्ता समजून घेऊ इच्छितात, अधिक आत्मविश्वासाने तिचा वापर करू इच्छितात आणि आधीच येत असलेल्या भविष्याचा मागोवा घेऊ इच्छितात.

काही चूक आढळली किंवा काही दुरुस्त करायचे आहे का? आम्हाला कळवा.

Frequently Asked Questions

“नीतिशास्त्र आणि तत्त्वज्ञान” सामान्य AI वाचकांसाठी का महत्त्वाचे आहे?

प्रगत AI प्रणालींचे नीतिशास्त्र, मानवी मूल्ये आणि तत्त्वज्ञानविषयक पैलूंचे सखोल विश्लेषण आणि स्पष्टीकरण. हे महत्त्वाचे आहे कारण ते AI बातम्यांना काम, गोपनीयता, खर्च, विश्वास आणि लोक प्रत्यक्ष वापरत असलेल्या साधनांबद्दलच्या व्यवहार्य निवडींशी जोडते.

“लॅब नोट्स” मध्ये वाचकांनी काय लक्षात ठेवावे?

संशोधन प्रयोगशाळा, तांत्रिक प्रगती आणि एआय मॉडेल अपडेट्सबद्दल सखोल आणि सोप्या भाषेत माहिती देणारा विभाग. वाचकांनी दाव्यांमागील पुरावे, प्रत्येक साधन किंवा घोषणेच्या मर्यादा, कोणाला फायदा होतो, आता काय बदलते आहे आणि काय अजून अनिश्चित आहे हे पाहावे.