संस्थापक, टीकाकार आणि संशोधक: वाचण्यासारखे महत्त्वाचे संवाद
बहुतेक लोकांना OpenAI च्या CEO चे नाव माहित असते. पण लार्ज लँग्वेज मॉडेल्सचा सध्याचा काळ घडवून आणणाऱ्या शोधनिबंधांच्या लेखकांची नावे फार कमी लोकांना माहित आहेत. ज्ञानातील ही दरी तंत्रज्ञान प्रत्यक्षात कसे प्रगत होते, याबद्दल एक चुकीची प्रतिमा निर्माण करते. आपण आर्टिफिशियल इंटेलिजन्सला एखाद्या उत्पादनाच्या लाँचिंगसारखे पाहतो, पण प्रत्यक्षात हा गणितीय प्रगतीचा एक संथ प्रवास आहे. संस्थापक भांडवल आणि लोकांसमोरील कथा सांभाळतात, तर संशोधक त्याचे वजन (weights) आणि तर्क (logic) सांभाळतात. यातील फरक समजून घेणे म्हणजे मार्केटिंगच्या धुराच्या पलीकडे पाहणे होय. जर तुम्ही फक्त संस्थापकांचे अनुसरण करत असाल, तर तुम्ही एक चित्रपट पाहत आहात. जर तुम्ही संशोधकांचे अनुसरण करत असाल, तर तुम्ही त्याची पटकथा वाचत आहात. हा लेख यातील फरक का महत्त्वाचा आहे आणि भविष्याला दिशा देणारे संकेत कसे ओळखावेत, यावर प्रकाश टाकतो. आपण करिश्माई भाषणांच्या पलीकडे जाऊन लॅबमधील थंड वास्तवाकडे पाहणार आहोत. आता फक्त प्रेस रिलीजवर स्वाक्षरी करणाऱ्यांच्या ऐवजी कोड लिहिणाऱ्या लोकांवर लक्ष केंद्रित करण्याची वेळ आली आहे.
मशीन युगाचे अदृश्य शिल्पकार
संस्थापक हे लोकांसमोरील चेहरा असतात. ते World Economic Forum मध्ये बोलतात आणि काँग्रेससमोर साक्ष देतात. त्यांचे काम अब्जावधींचे फंडिंग मिळवणे आणि एक अपरिहार्य वाटणारा ब्रँड तयार करणे हे असते. ते अशा शब्दांचा वापर करतात जे जादूचा भास निर्माण करतात. संशोधक वेगळे असतात. ते Python आणि LaTeX मध्ये काम करतात. त्यांना लॉस फंक्शन्स आणि टोकन कार्यक्षमतेची काळजी असते. एखादा संस्थापक म्हणू शकतो की त्यांचे मॉडेल विचार करत आहे. पण संशोधक तुम्हाला सांगेल की ते विशिष्ट संभाव्यता वितरणावर आधारित पुढचा सर्वात संभाव्य शब्द ओळखत आहे. गोंधळ इथेच होतो कारण मीडिया या दोन्ही गटांना एकच समजते. जेव्हा एखादा CEO म्हणतो की त्यांचे मॉडेल हवामान बदल सोडवेल, तेव्हा ती एक विक्रीची युक्ती असते. जेव्हा एखादा संशोधक स्पार्स ऑटोएनकोडरवर पेपर प्रकाशित करतो, तेव्हा तो एक तांत्रिक दावा असतो. एक आशा आहे, तर दुसरे वास्तव आहे.
लोक अनेकदा आशेलाच वास्तव समजतात. यामुळे अति-वचन आणि कमी पूर्तता यांचे चक्र सुरू होते. हे क्षेत्र समजून घेण्यासाठी, तुम्हाला कार विकणारा आणि इंजिन डिझाइन करणारा यांच्यातील फरक ओळखणे आवश्यक आहे. इंजिन डिझाइन करणाऱ्याला माहित असते की नट-बोल्ट कुठे सैल आहेत. सेल्समन तुम्हाला कधीही सैल बोल्टबद्दल सांगणार नाही कारण त्याचे काम शेअरची किंमत उच्च ठेवणे असते. प्रत्येक वेळी नवीन मॉडेल आल्यावर हेच घडते. संस्थापक हायप निर्माण करण्यासाठी एक गूढ ट्विट करतो. संशोधक arXiv वर तांत्रिक अहवालाची लिंक पोस्ट करतो. ट्विटला लाखो व्ह्यूज मिळतात. तांत्रिक अहवाल काही हजार लोक वाचतात जे प्रत्यक्षात काम करतात. यामुळे एक फीडबॅक लूप तयार होतो जिथे सर्वात मोठ्या आवाजाचे लोक इतरांसाठी वास्तव ठरवतात.
नाविन्याच्या सार्वजनिक चेहऱ्याच्या पलीकडे
या विभाजनाचे जागतिक धोरणांवर मोठे परिणाम होतात. सरकारे सध्या संस्थापकांच्या इशाऱ्यांवर आधारित कायदे करत आहेत. हे संस्थापक अनेकदा अशा अस्तित्वाच्या धोक्यांबद्दल चेतावणी देतात जे सायन्स फिक्शनसारखे वाटते. यामुळे सध्याच्या हानीपेक्षा काल्पनिक भविष्यावर जास्त लक्ष केंद्रित केले जाते. दरम्यान, संशोधक डेटा बायस आणि ऊर्जेचा वापर यांसारख्या तात्काळ समस्यांकडे लक्ष वेधत आहेत. फक्त प्रसिद्ध नावांचे ऐकल्यामुळे, आपण चुकीच्या गोष्टींचे नियमन करण्याचा धोका पत्करतो. आपण कदाचित भविष्यातील सुपरइंटेलिजन्सवर बंदी घालू, पण सध्याची मॉडेल्स डेटा सेंटर्स थंड करण्यासाठी लहान शहरांमधील पाणी कसे संपवत आहेत, याकडे दुर्लक्ष करू. ही फक्त अमेरिकन समस्या नाही. युरोप आणि आशियामध्येही हीच स्थिती आहे.
ज्यांच्याकडे मार्केटिंगचे बजेट जास्त आहे, त्यांचेच आवाज जास्त ऐकू येतात. यामुळे ‘विजेता सर्व काही घेतो’ अशी परिस्थिती निर्माण होते, जिथे काही कंपन्या संपूर्ण ग्रहासाठी अजेंडा ठरवतात. जर आपण आपला दृष्टिकोन व्यापक केला नाही, तर आपण सिलिकॉन व्हॅलीतील काही लोकांना काय सुरक्षित आहे आणि काय शक्य आहे हे ठरवण्याची मुभा देऊ. सत्तेचे हे केंद्रीकरण स्वतःच एक धोका आहे. हे अशा क्षेत्रात विचारांची विविधता मर्यादित करते जिथे तिची गरज आहे. आपल्याला सॅन फ्रान्सिस्कोमधील लोकांप्रमाणेच टोरंटो विद्यापीठ किंवा टोकियोमधील लॅबमधील लोकांचेही ऐकणे आवश्यक आहे. वैज्ञानिक प्रगती हा जागतिक प्रयत्न आहे, परंतु सध्याची कथा एका स्थानिक मक्तेदारीसारखी आहे. कॉर्पोरेट बोर्डरूमच्या बाहेर होत असलेली खरी प्रगती पाहण्यासाठी आपल्याला Nature सारख्या जर्नल्सकडे पाहणे आवश्यक आहे.
जग चुकीच्या लोकांचे ऐकते का?
एका मोठ्या लॅबमधील मुख्य संशोधकाच्या दिवसाचा विचार करा. ते उठतात आणि तीन दशलक्ष डॉलर्स खर्च करून केलेल्या ट्रेनिंग रनचे निकाल तपासतात. त्यांना दिसते की मॉडेल अपेक्षेपेक्षा जास्त ‘हॅल्युसिनेशन’ करत आहे. ते दहा तास डेटा क्लस्टर्स तपासण्यात घालवतात जेणेकरून गोंधळ (noise) शोधता येईल. ते २०२४ च्या निवडणुकीचा किंवा मानवतेच्या भवितव्याचा विचार करत नाहीत. ते विचार करत आहेत की मॉडेल जटिल वाक्यांमधील नकार का समजू शकत नाही. ते न्यूरॉन ॲक्टिव्हेशनचे हीट मॅप्स पाहत आहेत. त्यांच्या यशाचे मोजमाप प्रति कॅरेक्टर बिट्स किंवा विशिष्ट बेंचमार्कवर आधारित असते. आता एका संस्थापकाच्या दिवसाचा विचार करा. ते खाजगी जेटमध्ये राष्ट्राध्यक्षांना भेटायला जात आहेत. ते नवीन अर्थव्यवस्थेच्या ट्रिलियन डॉलर्सच्या संधीबद्दल बोलत आहेत.
संशोधक ‘कसे’ (how) यावर काम करतो. संस्थापक ‘पैशासाठी हे का महत्त्वाचे आहे’ यावर काम करतो. ॲप बनवणाऱ्या डेव्हलपरसाठी, संशोधक अधिक महत्त्वाचा आहे. संशोधक API लेटन्सी आणि कॉन्टेक्स्ट विंडो ठरवतो. संस्थापक किंमत ठरवतो. जर तुम्ही व्यवसाय करण्याचा प्रयत्न करत असाल, तर तुम्हाला हे माहित असणे आवश्यक आहे की तंत्रज्ञान खरोखर ते करू शकते का जे संस्थापक सांगत आहेत. अनेकदा, ते करू शकत नाही. आपण हे स्वायत्त ड्रायव्हिंगच्या सुरुवातीच्या काळात पाहिले आहे. संस्थापकांनी सांगितले की 2026 पर्यंत आपल्याकडे लाखो रोबोटॅक्सी असतील. संशोधकांना माहित होते की मुसळधार पावसात येणाऱ्या समस्या अजूनही सुटलेल्या नाहीत. जनतेने संस्थापकांवर विश्वास ठेवला. संशोधक बरोबर होते.
हाच पॅटर्न जनरेटिव्ह AI क्षेत्रात पुन्हा दिसत आहे. आपल्याला सांगितले जाते की मॉडेल्स लवकरच वकील आणि डॉक्टरांची जागा घेतील. जर तुम्ही तांत्रिक पेपर्स वाचले, तर तुम्हाला दिसेल की मॉडेल्स अजूनही मूलभूत तार्किक सुसंगततेशी संघर्ष करत आहेत. डेमो आणि वास्तव यातील दरी हीच अशी जागा आहे जिथे कंपन्यांचे पैसे वाया जातात. तुम्ही आर्टिफिशियल इंटेलिजन्स ट्रेंड्सचा सखोल अभ्यास वाचून हे तांत्रिक अडथळे आज कसे तपासले जात आहेत हे पाहू शकता. हा फरक म्हणजे एक ठोस गुंतवणूक आणि सट्टा बुडबुडा यातील फरक आहे. जेव्हा तुम्ही नवीन दावा ऐकता, तेव्हा स्वतःला विचारा की तो पेपरमधून आला आहे की प्रेस रिलीजमधून. याचे उत्तर तुम्हाला सांगेल की त्या दाव्याला किती महत्त्व द्यायचे. MIT Technology Review चे पत्रकार अनेकदा लॅब आणि लॉबीमधील ही दरी अधोरेखित करतात. हे लक्षात ठेवले पाहिजे की संस्थापकांना त्रुटी लपवण्यासाठी प्रोत्साहन दिले जाते, तर संशोधकांना त्या शोधण्यासाठी. पहिले हायप निर्माण करते आणि दुसरे सत्य शोधते. दीर्घकाळात, सत्य हीच एकमेव गोष्ट आहे जी टिकते. आपण हे 2026 मध्ये पाहिले जेव्हा तांत्रिक वास्तवाच्या ओझ्याखाली हायपची पहिली लाट शांत होऊ लागली.
लॅबमधील मंगळवार विरुद्ध बोर्डरूम
विकासाच्या सध्याच्या मार्गाबद्दल आपल्याला कठीण प्रश्न विचारणे आवश्यक आहे. संस्थापक ज्या संशोधनाचा दावा करत आहेत की त्याचा सर्वांना फायदा होईल, त्यासाठी पैसे कोण देत आहे? बहुतेक अव्वल संशोधक शैक्षणिक संस्था सोडून खाजगी लॅबमध्ये गेले आहेत. याचा अर्थ असा की ते निर्माण करत असलेले ज्ञान आता सार्वजनिक हित राहिले नाही. ते एक कॉर्पोरेट गुपित बनले आहे. जेव्हा एखादा मुद्दा सिद्ध करण्यासाठी वापरलेला डेटा पेवॉलच्या मागे लपवला जातो, तेव्हा वैज्ञानिक पद्धतीचे काय होते? आपण ओपन सायन्सकडून बंदिस्त स्पर्धात्मक फायद्याच्या मॉडेलकडे जाताना पाहत आहोत. काही व्यक्तींची प्रसिद्धी क्षेत्राला मदत करत आहे की ती व्यक्तिपूजेची संस्कृती निर्माण करत आहे जी मतभेदांना प्रोत्साहन देत नाही? जर एखाद्या संशोधकाला फ्लॅगशिप मॉडेलमध्ये मोठी त्रुटी आढळली, तर कंपनीचे मूल्य कमी होऊ शकते हे जाणून ते ती रिपोर्ट करण्यास सुरक्षित वाटतील का?
BotNews.today सामग्री संशोधन, लेखन, संपादन आणि भाषांतरित करण्यासाठी AI साधनांचा वापर करते. माहिती उपयुक्त, स्पष्ट आणि विश्वसनीय ठेवण्यासाठी आमची टीम प्रक्रियेचे पुनरावलोकन आणि पर्यवेक्षण करते.
या कंपन्यांवरील आर्थिक दबाव प्रचंड आहे. आपल्याला पर्यावरणीय खर्चाचाही विचार करावा लागेल. या मॉडेल्सना ट्रेन करण्यासाठी लागणारा प्रचंड कार्बन फूटप्रिंट, थोड्या चांगल्या बेंचमार्क्ससाठी योग्य आहे का? आपण अनेकदा पर्यावरणासाठी AI च्या फायद्यांबद्दल बोलतो, पण आपण क्वचितच असा हिशोब पाहतो जो दोन्ही गोष्टींचे संतुलन राखतो. शेवटी, ज्या संस्कृतीवर हे मॉडेल्स ट्रेन केले जातात, तिची मालकी कोणाची आहे? संशोधक त्यांच्या सिस्टम तयार करण्यासाठी इंटरनेटच्या सामूहिक आउटपुटचा वापर करतात. त्यानंतर संस्थापक त्याच आउटपुटच्या डिस्टिल्ड आवृत्तीसाठी लोकांकडून पैसे आकारतात. ही संपत्तीची देवाणघेवाण आहे ज्यावर हेडलाईन्समध्ये क्वचितच चर्चा केली जाते. या फक्त तांत्रिक समस्या नाहीत. हे सामाजिक आणि नैतिक पेच आहेत ज्यांना सोडवण्यासाठी फक्त एक चांगले अल्गोरिदम पुरेसे नाही.
तांत्रिक मर्यादा आणि स्थानिक अंमलबजावणी
जे लोक या प्लॅटफॉर्मवर काहीतरी बनवत आहेत, त्यांच्यासाठी तत्त्वज्ञानापेक्षा तांत्रिक तपशील महत्त्वाचे आहेत. सध्याच्या API मर्यादा एंटरप्राइझ एडॉप्शनसाठी एक मोठा अडथळा आहेत. बहुतेक प्रदात्यांकडे कठोर रेट लिमिट्स आहेत जे हाय-व्हॉल्यूम रिअल-टाइम प्रोसेसिंगला प्रतिबंधित करतात. म्हणूनच अनेक कंपन्या स्थानिक स्टोरेज आणि स्थानिक अंमलबजावणीकडे पाहत आहेत. स्थानिक हार्डवेअरवर Llama 3 सारखी मॉडेल्स वापरल्याने डेटा प्रायव्हसी सुधारते आणि दीर्घकालीन खर्च कमी होतो. तथापि, हार्डवेअरच्या गरजा खूप जास्त आहेत. ७० अब्ज पॅरामीटरचे मॉडेल चांगल्या वेगाने चालवण्यासाठी, तुम्हाला लक्षणीय VRAM असलेल्या हाय-एंड GPUs ची आवश्यकता असते. इथेच ‘गीक’ विभाग आणि आर्थिक विभाग एकत्र येतात. H100 क्लस्टरची किंमत हा एक प्रवेशाचा अडथळा आहे जो सत्ता श्रीमंतांच्या हातात ठेवतो.
आपण स्पेशलाइज्ड फाइन ट्यूनिंगकडेही शिफ्ट होताना पाहत आहोत. प्रत्येक गोष्टीसाठी सामान्य मॉडेल वापरण्याऐवजी, डेव्हलपर्स विशिष्ट डेटासेटवर ट्रेन केलेली लहान मॉडेल्स वापरत आहेत. यामुळे अचूकता सुधारते आणि टोकन संख्या कमी होते. येथे तांत्रिक आव्हान डेटा क्युरेशनचे आहे. जर इनपुट डेटा खराब असेल, तर फाइन-ट्यून केलेले मॉडेल सामान्य मॉडेलपेक्षा वाईट असेल. आपण मॉडेल्सना तथ्यात्मक डेटावर आधारित करण्यासाठी Retrieval Augmented Generation (RAG) चा वापर वाढताना पाहत आहोत. हे मोठ्या कॉन्टेक्स्ट विंडोची गरज टाळते आणि हॅल्युसिनेशन कमी करते. पण RAG च्या स्वतःच्या मर्यादा आहेत, विशेषतः ते रिट्राइव्ह केलेल्या डॉक्युमेंट्सचे रँकिंग कसे हाताळते यात. जर सर्च स्टेप अयशस्वी झाली, तर मॉडेलचे आउटपुट निरुपयोगी ठरते. बहुतेक वापरकर्त्यांना हे समजत नाही की AI चे कार्यप्रदर्शन हे मॉडेलइतकेच ते ज्या डेटाबेसवर क्वेरी करते त्यावर अवलंबून असते.
माहितीसाठी अंतिम फिल्टर
AI चे भविष्य ही एका व्यक्तीने सांगितलेली एकच गोष्ट नाही. हा एक गोंधळलेला, चालू असलेला वाद आहे जो दृष्टी विकणाऱ्यांमध्ये आणि वास्तव घडवणाऱ्यांमध्ये सुरू आहे. टेक न्यूजचा स्मार्ट ग्राहक होण्यासाठी, तुम्हाला करिश्माई संस्थापकाच्या पलीकडे पाहण्यास शिकले पाहिजे. पेपर्सवरील नावे शोधा. जे संशोधक त्यांचे मॉडेल्स काय करू शकत नाहीत याबद्दल बोलण्यास तयार आहेत, त्यांना शोधा. उद्योगातील विरोधाभास हे ‘बग’ नाहीत. ते कथेचा सर्वात प्रामाणिक भाग आहेत. हे क्षेत्र विकसित होत राहील कारण तांत्रिक समस्या अजून सुटलेल्या नाहीत. जिवंत प्रश्न हाच आहे: आपण सध्याच्या युगाची व्याख्या असलेल्या प्रचंड संसाधन वापराशिवाय खरोखर बुद्धिमान प्रणाली तयार करू शकतो का? जोपर्यंत आपण याचे उत्तर देत नाही, तोपर्यंत हायप विज्ञानापेक्षा पुढे राहील. आपण अशा कोणत्याही कथेबद्दल संशयी राहिले पाहिजे जी कोणत्याही तडजोडीचा उल्लेख न करता परिपूर्ण समाधानाचे आश्वासन देते.
संपादकाची नोंद: आम्ही ही साइट बहुभाषिक AI बातम्या आणि मार्गदर्शिका केंद्र म्हणून अशा लोकांसाठी तयार केली आहे जे संगणक तज्ञ नाहीत, परंतु तरीही कृत्रिम बुद्धिमत्ता समजून घेऊ इच्छितात, अधिक आत्मविश्वासाने तिचा वापर करू इच्छितात आणि आधीच येत असलेल्या भविष्याचा मागोवा घेऊ इच्छितात.
काही चूक आढळली किंवा काही दुरुस्त करायचे आहे का? आम्हाला कळवा.