സ്ഥാപകർ, വിമർശകർ, ഗവേഷകർ: വായിച്ചിരിക്കേണ്ട സംഭാഷണങ്ങൾ
OpenAI-യുടെ CEO ആരാണെന്ന് മിക്കവർക്കും അറിയാം. എന്നാൽ ലാർജ് ലാംഗ്വേജ് മോഡലുകളുടെ ഇന്നത്തെ കാലഘട്ടത്തെ നിർവചിച്ച ഗവേഷണ പ്രബന്ധങ്ങളുടെ രചയിതാക്കൾ ആരൊക്കെയാണെന്ന് ചോദിച്ചാൽ പലർക്കും അറിയില്ല. അറിവിലുള്ള ഈ വിടവ് സാങ്കേതികവിദ്യ എങ്ങനെയാണ് യഥാർത്ഥത്തിൽ പുരോഗമിക്കുന്നതെന്ന് തെറ്റായ രീതിയിൽ മനസ്സിലാക്കാൻ ഇടയാക്കുന്നു. ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിനെ നാം ഒരു പരമ്പരയായി വരുന്ന പ്രൊഡക്റ്റ് ലോഞ്ചുകളായാണ് കാണുന്നത്, എന്നാൽ യഥാർത്ഥത്തിൽ ഇതൊരു ഗണിതശാസ്ത്രപരമായ മുന്നേറ്റങ്ങളുടെ സാവധാനത്തിലുള്ള കൂടിച്ചേരലാണ്. സ്ഥാപകർ മൂലധനത്തെയും പൊതുജനമധ്യത്തിലെ കഥകളെയും നിയന്ത്രിക്കുന്നു. ഗവേഷകർ മോഡലിന്റെ വെയ്റ്റുകളെയും ലോജിക്കിനെയും കൈകാര്യം ചെയ്യുന്നു. ഈ വ്യത്യാസം മനസ്സിലാക്കിയാൽ മാത്രമേ മാർക്കറ്റിംഗ് തന്ത്രങ്ങൾക്കപ്പുറത്തുള്ള സത്യം കാണാൻ കഴിയൂ. നിങ്ങൾ സ്ഥാപകരെ മാത്രം പിന്തുടരുകയാണെങ്കിൽ, നിങ്ങൾ ഒരു സിനിമ കാണുകയാണ്. നിങ്ങൾ ഗവേഷകരെ പിന്തുടരുകയാണെങ്കിൽ, നിങ്ങൾ തിരക്കഥ വായിക്കുകയാണ്. ഈ ലേഖനം എന്തുകൊണ്ടാണ് ഈ വ്യത്യാസം പ്രധാനമെന്നും വ്യവസായത്തിന്റെ ഭാവി നിർണ്ണയിക്കുന്ന സൂചനകൾ എങ്ങനെ തിരിച്ചറിയാമെന്നും പരിശോധിക്കുന്നു. ആകർഷകമായ പ്രസംഗങ്ങൾക്കപ്പുറം ലാബുകളിലെ തണുത്ത യാഥാർത്ഥ്യത്തിലേക്ക് നമുക്ക് കടക്കാം. പ്രസ് റിലീസുകളിൽ ഒപ്പിടുന്നവരെ മാത്രം ശ്രദ്ധിക്കാതെ, കോഡ് എഴുതുന്നവരെ ശ്രദ്ധിക്കേണ്ട സമയമാണിത്.
മെഷീൻ യുഗത്തിലെ അദൃശ്യ ശില്പികൾ
സ്ഥാപകരാണ് പൊതുമുഖങ്ങൾ. അവർ വേൾഡ് ഇക്കണോമിക് ഫോറത്തിൽ സംസാരിക്കുകയും കോൺഗ്രസിന് മുമ്പാകെ സാക്ഷി പറയുകയും ചെയ്യുന്നു. കോടിക്കണക്കിന് ഫണ്ടിംഗ് നേടുകയും അനിവാര്യമായ ഒരു ബ്രാൻഡ് കെട്ടിപ്പടുക്കുകയുമാണ് അവരുടെ ജോലി. മാന്ത്രികത തോന്നിപ്പിക്കുന്ന വാക്കുകളാണ് അവർ ഉപയോഗിക്കുന്നത്. ഗവേഷകർ വ്യത്യസ്തരാണ്. അവർ Python-ലും LaTeX-ലും പ്രവർത്തിക്കുന്നു. ലോസ് ഫംഗ്ഷനുകളിലും ടോക്കൺ എഫിഷ്യൻസിയിലുമാണ് അവർ ശ്രദ്ധിക്കുന്നത്. തങ്ങളുടെ മോഡൽ ചിന്തിക്കുകയാണെന്ന് ഒരു സ്ഥാപകൻ പറഞ്ഞേക്കാം. എന്നാൽ ഒരു ഗവേഷകൻ നിങ്ങളോട് പറയും, അതൊരു പ്രത്യേക പ്രോബബിലിറ്റി ഡിസ്ട്രിബ്യൂഷൻ അടിസ്ഥാനമാക്കി അടുത്ത വാക്ക് പ്രവചിക്കുകയാണെന്ന്. മാധ്യമങ്ങൾ ഈ രണ്ട് കൂട്ടരെയും ഒന്നായി കാണുന്നതുകൊണ്ടാണ് ആശയക്കുഴപ്പം ഉണ്ടാകുന്നത്. ഒരു മോഡൽ കാലാവസ്ഥാ വ്യതിയാനത്തെ പരിഹരിക്കുമെന്ന് ഒരു CEO പറയുമ്പോൾ, അതൊരു സെയിൽസ് പിച്ച് മാത്രമാണ്. എന്നാൽ സ്പേഴ്സ് ഓട്ടോഎൻകോഡറുകളെക്കുറിച്ച് ഒരു ഗവേഷകൻ പ്രബന്ധം പ്രസിദ്ധീകരിക്കുമ്പോൾ, അതൊരു സാങ്കേതിക അവകാശവാദമാണ്. ഒന്ന് പ്രതീക്ഷയാണ്, മറ്റൊന്ന് വസ്തുതയാണ്.
പൊതുജനങ്ങൾ പലപ്പോഴും പ്രതീക്ഷയെ വസ്തുതയായി തെറ്റിദ്ധരിക്കുന്നു. ഇത് അമിത വാഗ്ദാനങ്ങളുടെയും കുറഞ്ഞ പ്രകടനത്തിന്റെയും ഒരു ചക്രത്തിലേക്ക് നയിക്കുന്നു. ഈ മേഖലയെ മനസ്സിലാക്കാൻ, കാർ വിൽക്കുന്ന ആളെയും എഞ്ചിൻ ഡിസൈൻ ചെയ്ത ആളെയും നിങ്ങൾ വേർതിരിച്ചറിയണം. എഞ്ചിൻ ഡിസൈനർക്ക് എവിടെയാണ് ബോൾട്ടുകൾ അയഞ്ഞതെന്ന് കൃത്യമായി അറിയാം. സെയിൽസ്മാൻ ഒരിക്കലും അയഞ്ഞ ബോൾട്ടുകളെക്കുറിച്ച് നിങ്ങളോട് പറയില്ല, കാരണം ഓഹരി വില ഉയർന്ന നിലയിൽ നിർത്തുക എന്നതാണ് അവരുടെ ജോലി. ഓരോ തവണ പുതിയ മോഡൽ പുറത്തിറങ്ങുമ്പോഴും ഇത് ആവർത്തിക്കുന്നത് നാം കാണുന്നു. ഹൈപ്പ് ഉണ്ടാക്കാൻ സ്ഥാപകൻ ഒരു നിഗൂഢമായ ട്വീറ്റ് ഇടുന്നു. ഗവേഷകൻ arXiv-ലെ ഒരു സാങ്കേതിക റിപ്പോർട്ടിലേക്ക് ലിങ്ക് നൽകുന്നു. ട്വീറ്റിന് ദശലക്ഷക്കണക്കിന് കാഴ്ചകൾ ലഭിക്കുന്നു. സാങ്കേതിക റിപ്പോർട്ട് വായിക്കുന്നത് കാര്യങ്ങൾ യഥാർത്ഥത്തിൽ നിർമ്മിക്കുന്ന കുറച്ചുപേർ മാത്രമാണ്. ഇത് ഏറ്റവും ഉച്ചത്തിൽ സംസാരിക്കുന്നവർ മറ്റെല്ലാവർക്കും വേണ്ടി യാഥാർത്ഥ്യത്തെ നിർവചിക്കുന്ന ഒരു ഫീഡ്ബാക്ക് ലൂപ്പ് സൃഷ്ടിക്കുന്നു.
നവീകരണത്തിന്റെ പൊതുമുഖത്തിനപ്പുറം
ഈ വിഭജനം ആഗോള നയങ്ങളിൽ വലിയ പ്രത്യാഘാതങ്ങൾ ഉണ്ടാക്കുന്നു. സ്ഥാപകരുടെ മുന്നറിയിപ്പുകളെ അടിസ്ഥാനമാക്കിയാണ് ഗവൺമെന്റുകൾ ഇപ്പോൾ നിയമങ്ങൾ എഴുതുന്നത്. സയൻസ് ഫിക്ഷൻ പോലെ തോന്നിക്കുന്ന അസ്തിത്വപരമായ അപകടങ്ങളെക്കുറിച്ച് ഈ സ്ഥാപകർ പലപ്പോഴും മുന്നറിയിപ്പ് നൽകുന്നു. ഇത് നിലവിലെ ദോഷങ്ങളേക്കാൾ സാങ്കൽപ്പിക ഭാവിയെക്കുറിച്ച് ശ്രദ്ധ കേന്ദ്രീകരിക്കാൻ ഇടയാക്കുന്നു. അതേസമയം, ഡാറ്റാ ബയസ്, ഊർജ്ജ ഉപഭോഗം തുടങ്ങിയ അടിയന്തര പ്രശ്നങ്ങളെക്കുറിച്ച് ഗവേഷകർ ചൂണ്ടിക്കാട്ടുന്നു. പ്രശസ്തരായ പേരുകൾ മാത്രം കേൾക്കുന്നതിലൂടെ, തെറ്റായ കാര്യങ്ങൾ നിയന്ത്രിക്കാൻ നാം സാധ്യതയുണ്ട്. ഭാവിയിലെ സൂപ്പർ ഇന്റലിജൻസിനെ നാം നിരോധിച്ചേക്കാം, എന്നാൽ ഡാറ്റാ സെന്ററുകൾ തണുപ്പിക്കാൻ ചെറിയ പട്ടണങ്ങളിലെ ജലസ്രോതസ്സുകൾ വറ്റിച്ചുകളയുന്ന കാര്യം നാം അവഗണിക്കുന്നു. ഇതൊരു അമേരിക്കൻ പ്രശ്നം മാത്രമല്ല. യൂറോപ്പിലും ഏഷ്യയിലും ഇതേ അവസ്ഥ തന്നെയാണ് നിലനിൽക്കുന്നത്.
ഏറ്റവും കൂടുതൽ മാർക്കറ്റിംഗ് ബജറ്റുള്ളവരുടെ ശബ്ദമാണ് കൂടുതൽ കേൾക്കുന്നത്. ഇത് കുറച്ചു കമ്പനികൾക്ക് ലോകം മുഴുവൻ അജണ്ട നിശ്ചയിക്കാൻ കഴിയുന്ന ഒരു സാഹചര്യം സൃഷ്ടിക്കുന്നു. നമ്മുടെ കാഴ്ചപ്പാട് വികസിപ്പിച്ചില്ലെങ്കിൽ, സിലിക്കൺ വാലിയിലെ കുറച്ചുപേർക്ക് എന്താണ് സുരക്ഷിതം, എന്താണ് സാധ്യം എന്ന് നിർവചിക്കാൻ നാം അവസരം നൽകും. ഈ അധികാര കേന്ദ്രീകരണം തന്നെ ഒരു അപകടമാണ്. ഇത് ചിന്താ വൈവിധ്യത്തെ പരിമിതപ്പെടുത്തുന്നു. സാൻ ഫ്രാൻസിസ്കോയിലെ ആളുകളെ കേൾക്കുന്നതുപോലെ തന്നെ ടൊറന്റോ സർവകലാശാലയിലെ ആളുകളെയും ടോക്കിയോയിലെ ലാബുകളെയും നാം കേൾക്കേണ്ടതുണ്ട്. ശാസ്ത്രീയ പുരോഗതി ഒരു ആഗോള പരിശ്രമമാണ്, എന്നാൽ നിലവിൽ വിവരണം ഒരു പ്രാദേശിക കുത്തകയാണ്. കോർപ്പറേറ്റ് ബോർഡ് റൂമുകൾക്ക് പുറത്ത് നടക്കുന്ന യഥാർത്ഥ പുരോഗതി കാണാൻ Nature പോലുള്ള ജേണലുകൾ നാം പരിശോധിക്കേണ്ടതുണ്ട്.
ലോകം എന്തുകൊണ്ട് തെറ്റായ ആളുകളെ ശ്രദ്ധിക്കുന്നു
ഒരു പ്രധാന ലാബിലെ ലീഡ് ഗവേഷകന്റെ ഒരു ദിവസത്തെക്കുറിച്ച് ചിന്തിക്കുക. മൂന്ന് ദശലക്ഷം ഡോളർ ചിലവായ ഒരു ട്രെയിനിംഗ് റണ്ണിന്റെ ഫലം പരിശോധിച്ചുകൊണ്ടാണ് അവർ ഉണരുന്നത്. മോഡൽ പ്രതീക്ഷിച്ചതിലും കൂടുതൽ ഹാലുസിനേഷൻ കാണിക്കുന്നുണ്ടെന്ന് അവർ മനസ്സിലാക്കുന്നു. നോയിസ് കണ്ടെത്താൻ ഡാറ്റ ക്ലസ്റ്ററുകൾ നോക്കി അവർ പത്ത് മണിക്കൂർ ചിലവഴിക്കുന്നു. അവർ 2024-ലെ തിരഞ്ഞെടുപ്പിനെക്കുറിച്ചോ മനുഷ്യരാശിയുടെ വിധിയെക്കുറിച്ചോ അല്ല ചിന്തിക്കുന്നത്. സങ്കീർണ്ണമായ വാക്യങ്ങളിലെ നിഷേധം മനസ്സിലാക്കാൻ മോഡലിന് എന്തുകൊണ്ട് കഴിയുന്നില്ല എന്നതിനെക്കുറിച്ചാണ് അവർ ചിന്തിക്കുന്നത്. അവർ ന്യൂറോൺ ആക്റ്റിവേഷന്റെ ഹീറ്റ് മാപ്പുകൾ നോക്കുന്നു. അവരുടെ വിജയം ബിറ്റ്സ് പെർ ക്യാരക്ടർ അല്ലെങ്കിൽ ഒരു പ്രത്യേക ബെഞ്ച്മാർക്കിലെ കൃത്യത എന്നിവയിലാണ് അളക്കുന്നത്. ഇനി ഒരു സ്ഥാപകന്റെ ദിവസത്തെക്കുറിച്ച് ചിന്തിക്കുക. ഒരു രാഷ്ട്രത്തലവനെ കാണാൻ അവർ പ്രൈവറ്റ് ജെറ്റിലാണ്. പുതിയ സമ്പദ്വ്യവസ്ഥയുടെ ട്രില്യൺ ഡോളർ അവസരത്തെക്കുറിച്ച് അവർ സംസാരിക്കുന്നു.
ഗവേഷകൻ ‘എങ്ങനെ’ എന്നതിനെ കൈകാര്യം ചെയ്യുന്നു. സ്ഥാപകൻ ‘എന്തുകൊണ്ട് ഇത് പണത്തിന് മൂല്യമുള്ളതാകുന്നു’ എന്നതിനെ കൈകാര്യം ചെയ്യുന്നു. ഒരു ആപ്പ് നിർമ്മിക്കുന്ന ഡെവലപ്പർക്ക്, ഗവേഷകനാണ് കൂടുതൽ പ്രധാനപ്പെട്ട വ്യക്തി. API ലേറ്റൻസിയും കോൺടെക്സ്റ്റ് വിൻഡോയും നിർണ്ണയിക്കുന്നത് ഗവേഷകനാണ്. വില നിർണ്ണയിക്കുന്നത് സ്ഥാപകനാണ്. നിങ്ങൾ ഒരു ബിസിനസ്സ് കെട്ടിപ്പടുക്കാൻ ശ്രമിക്കുകയാണെങ്കിൽ, സ്ഥാപകൻ പറയുന്നത് പോലെ സാങ്കേതികവിദ്യയ്ക്ക് പ്രവർത്തിക്കാൻ കഴിയുമോ എന്ന് നിങ്ങൾ അറിഞ്ഞിരിക്കണം. പലപ്പോഴും, അതിന് കഴിയില്ല. സ്വയംഭരണാധികാരമുള്ള ഡ്രൈവിംഗിന്റെ ആദ്യകാലങ്ങളിൽ നാം ഇത് കണ്ടതാണ്. 2026-ഓടെ ദശലക്ഷക്കണക്കിന് റോബോടാക്സികൾ ഉണ്ടാകുമെന്ന് സ്ഥാപകർ പറഞ്ഞു. കനത്ത മഴയിലെ എഡ്ജ് കേസുകൾ ഇപ്പോഴും പരിഹരിക്കപ്പെടാത്ത പ്രശ്നമാണെന്ന് ഗവേഷകർക്ക് അറിയാമായിരുന്നു. പൊതുജനങ്ങൾ സ്ഥാപകരെ വിശ്വസിച്ചു. ഗവേഷകർ പറഞ്ഞതാണ് ശരിയായിരുന്നത്.
ഇതേ പാറ്റേൺ ജനറേറ്റീവ് AI മേഖലയിലും ആവർത്തിക്കുന്നു. മോഡലുകൾ ഉടൻ തന്നെ അഭിഭാഷകരെയും ഡോക്ടർമാരെയും മാറ്റിസ്ഥാപിക്കുമെന്ന് നമ്മോട് പറയുന്നു. നിങ്ങൾ സാങ്കേതിക പ്രബന്ധങ്ങൾ വായിച്ചാൽ, മോഡലുകൾക്ക് ഇപ്പോഴും അടിസ്ഥാനപരമായ ലോജിക്കൽ സ്ഥിരതയിൽ ബുദ്ധിമുട്ടുണ്ടെന്ന് കാണാം. ഡെമോയും യാഥാർത്ഥ്യവും തമ്മിലുള്ള വിടവിലാണ് കമ്പനികൾക്ക് പണം നഷ്ടപ്പെടുന്നത്. ഈ സാങ്കേതിക പരിധികൾ ഇന്ന് എങ്ങനെയാണ് പരീക്ഷിക്കപ്പെടുന്നതെന്ന് കാണാൻ നിങ്ങൾക്ക് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ട്രെൻഡുകളെക്കുറിച്ചുള്ള ആഴത്തിലുള്ള വിശകലനം കണ്ടെത്താം. ഈ വ്യത്യാസമാണ് ഒരു നല്ല നിക്ഷേപവും ഊഹക്കച്ചവട കുമിളയും തമ്മിലുള്ളത്. ഒരു പുതിയ അവകാശവാദം കേൾക്കുമ്പോൾ, അത് ഒരു പ്രബന്ധത്തിൽ നിന്നാണോ അതോ പ്രസ് റിലീസിൽ നിന്നാണോ വന്നതെന്ന് സ്വയം ചോദിക്കുക. അതിന് എത്രത്തോളം പ്രാധാന്യം നൽകണമെന്ന് ഉത്തരം നിങ്ങളോട് പറയും. MIT Technology Review-ലെ മാധ്യമപ്രവർത്തകർ ലാബും ലോബിയും തമ്മിലുള്ള ഈ വിടവ് പലപ്പോഴും എടുത്തുകാണിക്കാറുണ്ട്. സ്ഥാപകർക്ക് പോരായ്മകൾ മറച്ചുവെക്കാൻ പ്രോത്സാഹനമുണ്ട്, എന്നാൽ ഗവേഷകർക്ക് അവ കണ്ടെത്താൻ പ്രോത്സാഹനമുണ്ട് എന്ന് നാം ഓർക്കണം. ആദ്യത്തേത് ഹൈപ്പ് നിർമ്മിക്കുന്നു, രണ്ടാമത്തേത് സത്യം നിർമ്മിക്കുന്നു. ദീർഘകാലാടിസ്ഥാനത്തിൽ, സത്യം മാത്രമാണ് നിലനിൽക്കുന്നത്. സാങ്കേതിക യാഥാർത്ഥ്യത്തിന്റെ ഭാരത്തിന് കീഴിൽ ആദ്യത്തെ ഹൈപ്പ് തരംഗം തണുക്കാൻ തുടങ്ങിയ 2026-ൽ നാം ഇത് കണ്ടതാണ്.
ലാബിലെ ഒരു ചൊവ്വാഴ്ചയും ബോർഡ് റൂമും
വികസനത്തിന്റെ നിലവിലെ പാതയെക്കുറിച്ച് നാം ബുദ്ധിമുട്ടുള്ള ചോദ്യങ്ങൾ ചോദിക്കണം. എല്ലാവർക്കും പ്രയോജനം ചെയ്യുമെന്ന് സ്ഥാപകർ അവകാശപ്പെടുന്ന ഗവേഷണത്തിന് പണം നൽകുന്നത് ആരാണ്? മുൻനിര ഗവേഷകരിൽ ഭൂരിഭാഗവും അക്കാദമി വിട്ട് സ്വകാര്യ ലാബുകളിലേക്ക് പോയി. ഇതിനർത്ഥം അവർ ഉൽപ്പാദിപ്പിക്കുന്ന അറിവ് ഇനി ഒരു പൊതുനന്മയല്ല എന്നാണ്. അതൊരു കോർപ്പറേറ്റ് രഹസ്യമാണ്. ഒരു കാര്യം തെളിയിക്കാൻ ഉപയോഗിക്കുന്ന ഡാറ്റ പേവാളിന് പിന്നിൽ ഒളിപ്പിക്കുമ്പോൾ ശാസ്ത്രീയ രീതിക്ക് എന്ത് സംഭവിക്കും? ഓപ്പൺ സയൻസിൽ നിന്ന് മാറി അടഞ്ഞ മത്സര നേട്ടത്തിന്റെ മാതൃകയിലേക്കുള്ള മാറ്റം നാം കാണുന്നു. കുറച്ചു വ്യക്തികളുടെ പ്രശസ്തി ഈ മേഖലയെ സഹായിക്കുന്നുണ്ടോ അതോ വിയോജിപ്പിനെ നിരുത്സാഹപ്പെടുത്തുന്ന ഒരു വ്യക്തിത്വ ആരാധനയാണോ അത് സൃഷ്ടിക്കുന്നത്? ഒരു ഫ്ലാഗ്ഷിപ്പ് മോഡലിൽ ഒരു വലിയ പോരായ്മ ഗവേഷകൻ കണ്ടെത്തിയാൽ, അത് കമ്പനിയുടെ മൂല്യത്തെ ബാധിക്കുമെങ്കിൽ അത് റിപ്പോർട്ട് ചെയ്യാൻ അവർക്ക് സുരക്ഷിതത്വം തോന്നുന്നുണ്ടോ?
ഉള്ളടക്കം ഗവേഷണം ചെയ്യാനും എഴുതാനും എഡിറ്റ് ചെയ്യാനും വിവർത്തനം ചെയ്യാനും BotNews.today AI ടൂളുകൾ ഉപയോഗിക്കുന്നു. വിവരങ്ങൾ ഉപയോഗപ്രദവും വ്യക്തവും വിശ്വസനീയവുമാക്കാൻ ഞങ്ങളുടെ ടീം ഈ പ്രക്രിയ അവലോകനം ചെയ്യുകയും മേൽനോട്ടം വഹിക്കുകയും ചെയ്യുന്നു.
ഈ സ്ഥാപനങ്ങളിലെ സാമ്പത്തിക സമ്മർദ്ദം വളരെ വലുതാണ്. പാരിസ്ഥിതിക ചെലവും നാം പരിഗണിക്കണം. കുറച്ചുകൂടി മികച്ച ബെഞ്ച്മാർക്കുകൾക്ക് വേണ്ടി ഈ മോഡലുകൾ പരിശീലിപ്പിക്കുന്നതിന്റെ വലിയ കാർബൺ ഫുട്പ്രിന്റ് മൂല്യവത്താണോ? പരിസ്ഥിതിക്ക് AI നൽകുന്ന ഗുണങ്ങളെക്കുറിച്ച് നാം പലപ്പോഴും സംസാരിക്കാറുണ്ട്, എന്നാൽ രണ്ടും ബാലൻസ് ചെയ്യുന്ന ഒരു കണക്ക് പുസ്തകം നാം അപൂർവ്വമായേ കാണാറുള്ളൂ. അവസാനമായി, ഈ മോഡലുകൾ പരിശീലിപ്പിച്ച സംസ്കാരത്തിന്റെ ഉടമസ്ഥർ ആരാണ്? തങ്ങളുടെ സിസ്റ്റങ്ങൾ നിർമ്മിക്കാൻ ഗവേഷകർ ഇന്റർനെറ്റിന്റെ കൂട്ടായ ഉൽപ്പാദനം ഉപയോഗിക്കുന്നു. ആ ഉൽപ്പാദനത്തിന്റെ ഒരു ഡിസ്റ്റിൽഡ് പതിപ്പ് ആക്സസ് ചെയ്യാൻ സ്ഥാപകർ പൊതുജനങ്ങളിൽ നിന്ന് പണം ഈടാക്കുന്നു. വാർത്തകളിൽ അപൂർവ്വമായി മാത്രം ചർച്ച ചെയ്യപ്പെടുന്ന ഒരു സമ്പത്ത് കൈമാറ്റമാണിത്. ഇവ വെറും സാങ്കേതിക പ്രശ്നങ്ങളല്ല. ഒരു മികച്ച അൽഗോരിതം കൊണ്ട് മാത്രം പരിഹരിക്കാൻ കഴിയാത്ത സാമൂഹികവും ധാർമ്മികവുമായ പ്രതിസന്ധികളാണിവ.
സാങ്കേതിക പരിമിതികളും പ്രാദേശിക നടപ്പിലാക്കലും
ഈ പ്ലാറ്റ്ഫോമുകളിൽ നിർമ്മിക്കുന്നവർക്ക്, തത്ത്വചിന്തയേക്കാൾ സാങ്കേതിക വിശദാംശങ്ങളാണ് പ്രധാനം. നിലവിലെ API പരിധികൾ എന്റർപ്രൈസ് സ്വീകാര്യതയ്ക്ക് ഒരു വലിയ തടസ്സമാണ്. മിക്ക ദാതാക്കൾക്കും ഉയർന്ന വോളിയം തത്സമയ പ്രോസസ്സിംഗ് തടയുന്ന കർശനമായ റേറ്റ് പരിധികളുണ്ട്. അതുകൊണ്ടാണ് പല കമ്പനികളും ലോക്കൽ സ്റ്റോറേജിലേക്കും ലോക്കൽ എക്സിക്യൂഷനിലേക്കും നോക്കുന്നത്. ലോക്കൽ ഹാർഡ്വെയറിൽ Llama 3 പോലുള്ള മോഡലുകൾ ഉപയോഗിക്കുന്നത് മികച്ച ഡാറ്റാ സ്വകാര്യതയ്ക്കും ദീർഘകാലാടിസ്ഥാനത്തിൽ കുറഞ്ഞ ചെലവിനും സഹായിക്കുന്നു. എന്നിരുന്നാലും, ഹാർഡ്വെയർ ആവശ്യകതകൾ കൂടുതലാണ്. 70 ബില്യൺ പാരാമീറ്റർ മോഡൽ മികച്ച വേഗതയിൽ പ്രവർത്തിപ്പിക്കാൻ, ഉയർന്ന VRAM ഉള്ള ഹൈ-എൻഡ് GPU-കൾ ആവശ്യമാണ്. ഇവിടെയാണ് ഗീക്ക് വിഭാഗം സാമ്പത്തിക വിഭാഗവുമായി കണ്ടുമുട്ടുന്നത്. ഒരു H100 ക്ലസ്റ്ററിന്റെ വില പണക്കാർക്ക് മാത്രം അധികാരം നൽകുന്ന ഒരു പ്രവേശന തടസ്സമാണ്.
സ്പെഷ്യലൈസ്ഡ് ഫൈൻ ട്യൂണിംഗിലേക്കുള്ള മാറ്റവും നാം കാണുന്നു. എല്ലാത്തിനും ഒരു പൊതു മോഡൽ ഉപയോഗിക്കുന്നതിന് പകരം, ഡെവലപ്പർമാർ പ്രത്യേക ഡാറ്റാസെറ്റുകളിൽ പരിശീലിപ്പിച്ച ചെറിയ മോഡലുകൾ ഉപയോഗിക്കുന്നു. ഇത് കൃത്യത മെച്ചപ്പെടുത്തുകയും ടോക്കൺ എണ്ണം കുറയ്ക്കുകയും ചെയ്യുന്നു. ഇവിടെയുള്ള സാങ്കേതിക വെല്ലുവിളി ഡാറ്റ ക്യൂറേഷനാണ്. ഇൻപുട്ട് ഡാറ്റ മോശമാണെങ്കിൽ, ഫൈൻ ട്യൂൺ ചെയ്ത മോഡൽ പൊതുവായതിനേക്കാൾ മോശമായിരിക്കും. വസ്തുതാപരമായ ഡാറ്റയിൽ മോഡലുകളെ ഉറപ്പിക്കാൻ റിട്രീവൽ ഓഗ്മെന്റഡ് ജനറേഷൻ (RAG) കൂടുതൽ ഉപയോഗിക്കുന്നത് നാം കാണുന്നു. ഇത് വലിയ കോൺടെക്സ്റ്റ് വിൻഡോകളുടെ ആവശ്യകത ഒഴിവാക്കുകയും ഹാലുസിനേഷനുകൾ കുറയ്ക്കുകയും ചെയ്യുന്നു. എന്നാൽ RAG-ന് അതിന്റേതായ പരിധികളുണ്ട്, പ്രത്യേകിച്ചും വീണ്ടെടുത്ത രേഖകളുടെ റാങ്കിംഗ് അത് എങ്ങനെ കൈകാര്യം ചെയ്യുന്നു എന്നതിൽ. സെർച്ച് ഘട്ടം പരാജയപ്പെട്ടാൽ, മോഡൽ ഔട്ട്പുട്ട് ഉപയോഗശൂന്യമാണ്. ഒരു AI-യുടെ പ്രകടനം അത് ക്വറി ചെയ്യുന്ന ഡാറ്റാബേസിനെ ആശ്രയിച്ചിരിക്കും എന്ന് മിക്ക ഉപയോക്താക്കളും മനസ്സിലാക്കുന്നില്ല.
വിവരങ്ങൾക്കായുള്ള അന്തിമ ഫിൽട്ടർ
AI-യുടെ ഭാവി ഒരു വ്യക്തി പറയുന്ന ഒരൊറ്റ കഥയല്ല. ഒരു കാഴ്ചപ്പാട് വിൽക്കുന്നവരും യാഥാർത്ഥ്യം നിർമ്മിക്കുന്നവരും തമ്മിലുള്ള കുഴപ്പമുള്ള, തുടരുന്ന സംവാദമാണിത്. ടെക് വാർത്തകളുടെ സ്മാർട്ട് ഉപഭോക്താവാകാൻ, ആകർഷകമായ സ്ഥാപകനപ്പുറം നോക്കാൻ നിങ്ങൾ പഠിക്കണം. പ്രബന്ധങ്ങളിലെ പേരുകൾ നോക്കുക. തങ്ങളുടെ മോഡലുകൾക്ക് എന്ത് ചെയ്യാൻ കഴിയില്ലെന്ന് പറയാൻ തയ്യാറുള്ള ഗവേഷകരെ നോക്കുക. വ്യവസായത്തിലെ വൈരുദ്ധ്യങ്ങൾ ബഗുകളല്ല. അവ കഥയുടെ ഏറ്റവും സത്യസന്ധമായ ഭാഗമാണ്. സാങ്കേതിക പ്രശ്നങ്ങൾ പരിഹരിക്കപ്പെടാത്തതുകൊണ്ട് ഈ മേഖല വികസിച്ചുകൊണ്ടേയിരിക്കും. ഇപ്പോഴും ബാക്കി നിൽക്കുന്ന ചോദ്യം ഇതാണ്: നിലവിലെ കാലഘട്ടത്തെ നിർവചിക്കുന്ന വലിയ വിഭവ ഉപഭോഗമില്ലാതെ നമുക്ക് ശരിക്കും ബുദ്ധിയുള്ള ഒരു സിസ്റ്റം നിർമ്മിക്കാൻ കഴിയുമോ? അതിന് ഉത്തരം ലഭിക്കുന്നത് വരെ, ഹൈപ്പ് ശാസ്ത്രത്തേക്കാൾ വേഗത്തിൽ മുന്നോട്ട് പോകും. ഉൾപ്പെട്ടിരിക്കുന്ന വിട്ടുവീഴ്ചകളെക്കുറിച്ച് പരാമർശിക്കാതെ ഒരു മികച്ച പരിഹാരം വാഗ്ദാനം ചെയ്യുന്ന ഏത് വിവരണത്തെയും നാം സംശയത്തോടെ കാണണം.
Nota do editor: Criamos este site como um centro de notícias e guias de IA multilíngue para pessoas que não são geeks de computador, mas que ainda querem entender a inteligência artificial, usá-la com mais confiança e acompanhar o futuro que já está chegando.
ഒരു പിശകോ തിരുത്തേണ്ട എന്തെങ്കിലും കണ്ടെത്തിയോ? ഞങ്ങളെ അറിയിക്കുക.