പലരും ശ്രദ്ധിക്കാതെ പോയ ഏറ്റവും പ്രധാനപ്പെട്ട AI ഇന്റർവ്യൂകൾ!
ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ (AI) ഭാവി എന്താണെന്നതിനെക്കുറിച്ചുള്ള ഏറ്റവും പ്രധാനപ്പെട്ട വിവരങ്ങൾ പലപ്പോഴും മിനുക്കിയെടുത്ത പ്രസ് റിലീസുകളിലോ വലിയ പ്രസംഗങ്ങളിലോ കാണാൻ കഴിയില്ല. പകരം, മിക്കവരും ഒഴിവാക്കുന്ന നീണ്ട ഇന്റർവ്യൂകളിലെ ചെറിയ ഇടവേളകളിലും, ടെക്നിക്കൽ കാര്യങ്ങൾക്കിടയിലുമാണ് അവ ഒളിഞ്ഞിരിക്കുന്നത്. ഒരു CEO മൂന്ന് മണിക്കൂർ നീളുന്ന ഒരു ടെക്നിക്കൽ podcast-ൽ സംസാരിക്കുമ്പോൾ, അവരുടെ കോർപ്പറേറ്റ് മുഖംമൂടി അഴിഞ്ഞുവീഴാറുണ്ട്. പബ്ലിക് മാർക്കറ്റിംഗിന് വിപരീതമായ കാര്യങ്ങളാണ് ഈ നിമിഷങ്ങൾ വെളിപ്പെടുത്തുന്നത്. ഔദ്യോഗിക പ്രസ്താവനകൾ സുരക്ഷയെക്കുറിച്ചും എല്ലാവർക്കും ലഭ്യമാക്കുന്നതിനെക്കുറിച്ചും സംസാരിക്കുമ്പോൾ, സ്ക്രിപ്റ്റ് ചെയ്യാത്ത ഈ സംഭാഷണങ്ങൾ സൂചിപ്പിക്കുന്നത് വൻതോതിലുള്ള പവർ നേടാനുള്ള മത്സരത്തെക്കുറിച്ചാണ്. കഴിഞ്ഞ ഒരു വർഷത്തെ ചർച്ചകളിൽ നിന്ന് മനസ്സിലാക്കാൻ കഴിയുന്നത്, ഇൻഡസ്ട്രി ഇപ്പോൾ സാധാരണ chatbot-കളിൽ നിന്ന് മാറി വലിയ ഇൻഫ്രാസ്ട്രക്ചർ ആവശ്യമുള്ള സ്പെഷ്യലൈസ്ഡ് ഏജന്റുകളിലേക്ക് നീങ്ങുകയാണെന്നാണ്. നിങ്ങൾ വെറും ഹെഡ്ലൈനുകൾ മാത്രമാണ് വായിക്കുന്നതെങ്കിൽ, നിലവിലെ രീതികൾക്ക് പരിമിതികളുണ്ടെന്ന കാര്യം നിങ്ങൾ മിസ്സ് ചെയ്തിട്ടുണ്ടാകും. ഹാർഡ്വെയർ പരിമിതികളെക്കുറിച്ചും ഇന്റലിജൻസിനെക്കുറിച്ചും ഈ നേതാക്കൾ സംസാരിക്കുന്ന രീതിയിലാണ് യഥാർത്ഥ കഥ ഒളിഞ്ഞിരിക്കുന്നത്.
ഈ മാറ്റങ്ങൾ മനസ്സിലാക്കാൻ OpenAI, Anthropic, Google DeepMind എന്നിവയിലെ നേതാക്കളുടെ സംഭാഷണങ്ങൾ ശ്രദ്ധിക്കണം. മോഡലുകൾക്ക് എന്ത് ചെയ്യാൻ കഴിയും എന്നതിനേക്കാൾ അവ എങ്ങനെ നിർമ്മിക്കപ്പെടുന്നു എന്നതിലേക്കാണ് ഇപ്പോൾ ശ്രദ്ധ മാറുന്നത്. ഉദാഹരണത്തിന്, Anthropic-ലെ ഡാരിയോ അമോഡെ (Dario Amodei) scaling laws-നെ കുറിച്ച് സംസാരിക്കുമ്പോൾ, അദ്ദേഹം വെറുതെ മോഡലുകൾ വലുതാക്കുന്നതിനെക്കുറിച്ചല്ല പറയുന്നത്. ഒരു സിംഗിൾ മോഡൽ ട്രെയിൻ ചെയ്യാൻ കോടിക്കണക്കിന് ഡോളർ ചിലവാകുന്ന ഒരു ഭാവിയെക്കുറിച്ചാണ് അദ്ദേഹം സൂചിപ്പിക്കുന്നത്. ഇൻഡസ്ട്രിയുടെ തുടക്കകാലത്ത് കുറഞ്ഞ തുക കൊണ്ട് മത്സരിക്കാമായിരുന്ന അവസ്ഥയിൽ നിന്നുള്ള വലിയൊരു മാറ്റമാണിത്. ഈ “compute tax” താങ്ങാൻ കഴിയുന്ന കമ്പനികളും അല്ലാത്തവരും തമ്മിലുള്ള വലിയൊരു വിടവ് ഈ ഇന്റർവ്യൂകൾ വെളിപ്പെടുത്തുന്നു. ട്രെയിനിംഗ് ഡാറ്റ എവിടെ നിന്ന് വരുന്നു എന്ന ചോദ്യത്തിന് മറുപടിയായി എക്സിക്യൂട്ടീവുകൾ പലപ്പോഴും synthetic data-യെ കുറിച്ച് സംസാരിക്കാറുണ്ട്. ഇന്റർനെറ്റിലെ വിവരങ്ങൾ ഏകദേശം തീർന്നു കഴിഞ്ഞു എന്നതിന്റെ സൂചനയാണിത്. മനുഷ്യർ എഴുതിയ ടെക്സ്റ്റുകൾ അനുകരിക്കുന്നതിന് പകരം സ്വന്തം ലോജിക്കിൽ നിന്ന് മോഡലുകളെ എങ്ങനെ പഠിപ്പിക്കാം എന്നാണ് ഇൻഡസ്ട്രി ഇപ്പോൾ ചിന്തിക്കുന്നത്. ഇതൊരു ബ്ലോഗ് പോസ്റ്റിലും വരാറില്ലെങ്കിലും ടെക്നിക്കൽ വൃത്തങ്ങളിലെ പ്രധാന ചർച്ചാവിഷയമാണിത്.
ഈ വെളിപ്പെടുത്തലുകൾക്ക് ആഗോളതലത്തിൽ വലിയ പ്രാധാന്യമുണ്ട്. നമ്മൾ ഇപ്പോൾ “compute sovereignty” എന്ന അവസ്ഥയിലേക്ക് നീങ്ങുകയാണ്. രാജ്യങ്ങൾ ഇപ്പോൾ വെറും സോഫ്റ്റ്വെയറിന് വേണ്ടിയല്ല തിരയുന്നത്, മറിച്ച് ഈ മോഡലുകൾ പ്രവർത്തിപ്പിക്കാനുള്ള ഇൻഫ്രാസ്ട്രക്ചറിന് വേണ്ടിയാണ്. വരും കാലങ്ങളിൽ ക്ലെവർ കോഡിംഗിനേക്കാൾ ഊർജ്ജ ഉൽപ്പാദനവും ചിപ്പ് സപ്ലൈ ചെയിനുമായിരിക്കും വികസനത്തെ നിർണ്ണയിക്കുക. ഇത് ഗവൺമെന്റുകൾ മുതൽ ചെറുകിട ബിസിനസ്സ് ഉടമകളെ വരെ ബാധിക്കും. ഈ മോഡലുകൾ ട്രെയിൻ ചെയ്യാൻ ഒരു ചെറിയ നഗരത്തിന് ആവശ്യമായ ഊർജ്ജം വേണമെങ്കിൽ, അധികാരം സ്വാഭാവികമായും ചിലരുടെ കൈകളിൽ മാത്രമായി ഒതുങ്ങും. ഇത് പല കമ്പനികളും പറയുന്ന “ഓപ്പൺ ആക്സസ്” എന്ന ആശയത്തിന് വിരുദ്ധമാണ്. AI-യുടെ “ഓപ്പൺ” യുഗം അവസാനിക്കുകയാണെന്നാണ് ഈ ടെക്നിക്കൽ ചർച്ചകൾ നൽകുന്ന സൂചന. ഈ മാറ്റം ഇതിനകം തന്നെ വെഞ്ച്വർ ക്യാപിറ്റൽ നിക്ഷേപങ്ങളെയും വാഷിംഗ്ടണിലെയും ബ്രസൽസിലെയും വ്യാപാര നയങ്ങളെയും സ്വാധീനിക്കുന്നുണ്ട്. ലോകം ഈ യാഥാർത്ഥ്യങ്ങളോട് പ്രതികരിക്കുമ്പോൾ പൊതുജനങ്ങൾ ഇപ്പോഴും പുതിയ chatbot ഫീച്ചറുകളുടെ പിന്നാലെയാണ്. ഈ മാറ്റങ്ങളെക്കുറിച്ച് കൂടുതൽ അറിയാൻ നിങ്ങൾക്ക് പുതിയ AI industry analysis പിന്തുടരാവുന്നതാണ്.
ഇതിന്റെ പ്രായോഗിക വശം മനസ്സിലാക്കാൻ ഒരു സോഫ്റ്റ്വെയർ കമ്പനിയിലെ ഡെവലപ്പറുടെ കാര്യം നോക്കാം. ഇപ്പോൾ ഒരു ഡെവലപ്പർ വെറുതെ കോഡ് എഴുതുക മാത്രമല്ല ചെയ്യുന്നത്. ഏതൊക്കെ API-കൾ മാറുമെന്നും എവിടെയാണ് കൂടുതൽ compute വരികയെന്നും മനസ്സിലാക്കാൻ അവർ ഗവേഷകരുടെ ഇന്റർവ്യൂകൾ മണിക്കൂറുകളോളം കാണുന്നു. “reasoning tokens” ആണ് പുതിയ മുൻഗണന എന്ന് ഒരു ഗവേഷകൻ പറയുന്നത് കേൾക്കുമ്പോൾ, തന്റെ നിലവിലെ സ്ട്രാറ്റജി മാറ്റേണ്ടതുണ്ടെന്ന് ഡെവലപ്പർ തിരിച്ചറിയുന്നു. വെറും സിമ്പിൾ ആപ്പുകൾ നിർമ്മിക്കുന്നതിന് പകരം സങ്കീർണ്ണമായ ചിന്താശേഷിയുള്ള സിസ്റ്റങ്ങൾ ഡിസൈൻ ചെയ്യാൻ അവർ നിർബന്ധിതരാകുന്നു. ഇതൊരു തിയറി മാത്രമല്ല, മറിച്ച് ഒരു യൂട്യൂബ് ചാനലിലെ ചർച്ചയിൽ നിന്ന് ലഭിക്കുന്ന പ്രായോഗിക അറിവാണ്. AI എന്നത് ഒരു ഫിനിഷ്ഡ് പ്രൊഡക്റ്റ് ആണെന്ന തെറ്റായ ധാരണ പലർക്കുമുണ്ട്. സത്യത്തിൽ ഇതൊരു ചലിച്ചുകൊണ്ടിരിക്കുന്ന ലക്ഷ്യമാണ്. ഒരു എക്സിക്യൂട്ടീവ് ഊർജ്ജ ഉപഭോഗത്തെക്കുറിച്ചുള്ള ചോദ്യത്തിൽ നിന്ന് ഒഴിഞ്ഞുമാറുമ്പോൾ, നിങ്ങളുടെ API ചിലവ് കൂടാൻ പോകുന്നു എന്നാണ് അതിന്റെ അർത്ഥം. ഒരു മോഡൽ സംസാരിക്കുന്നതിന് മുൻപ് “ചിന്തിക്കുന്ന” ഡെമോ കാണിക്കുമ്പോൾ, ഭാവിയിൽ latency ഒരു ഫീച്ചറായി മാറുമെന്ന് അവർ നിങ്ങളെ ഓർമ്മിപ്പിക്കുകയാണ്.
ഈ ഇന്റർവ്യൂകളിലെ ദൃശ്യങ്ങൾ വെറും വാക്കുകൾക്ക് നൽകാൻ കഴിയാത്ത അറിവ് നൽകുന്നുണ്ട്. ജോലികളെ AI മാറ്റിസ്ഥാപിക്കുമോ എന്ന ചോദ്യത്തിന് മറുപടി നൽകുമ്പോൾ CEO-മാരുടെ ബോഡി ലാംഗ്വേജ് ശ്രദ്ധിക്കണം. അവരുടെ വാക്കുകൾ മയപ്പെടുത്തിയതാണെങ്കിലും മുഖഭാവങ്ങൾ പലപ്പോഴും കാര്യങ്ങൾ ഗൗരവമാണെന്ന് സൂചിപ്പിക്കാറുണ്ട്. Artificial General Intelligence (AGI) എപ്പോൾ വരുമെന്ന ചോദ്യത്തിന് “ഈ പതിറ്റാണ്ടിനുള്ളിൽ” എന്ന് മറുപടി നൽകുമ്പോഴും, അവരുടെ ചർച്ചകളിലെ തീവ്രത സൂചിപ്പിക്കുന്നത് അത് വളരെ വേഗം സംഭവിക്കുമെന്നാണ്. ഇത് പൊതുജനങ്ങളുടെ പ്രതീക്ഷകളും കമ്പനികൾ യഥാർത്ഥത്തിൽ നിർമ്മിക്കുന്നതും തമ്മിലുള്ള വിടവ് വർദ്ധിപ്പിക്കുന്നു. സാങ്കേതികവിദ്യ അതിവേഗം മുന്നേറുമ്പോൾ ബിസിനസ്സുകൾ പതുക്കെ തയ്യാറെടുക്കുകയാണെങ്കിൽ അത് വലിയ സാമ്പത്തിക പ്രത്യാഘാതങ്ങൾ ഉണ്ടാക്കും. OpenAI o1 സീരീസ് പോലുള്ള പുതിയ ഉൽപ്പന്നങ്ങൾ കാണിക്കുന്നത് “ചിന്തിക്കുന്ന” മോഡലുകൾ എന്നത് വെറുമൊരു തിയറിയല്ല എന്നാണ്. മെഷീനുകൾ ലോജിക് പ്രോസസ്സ് ചെയ്യുന്ന രീതിയിൽ വന്ന വലിയൊരു മാറ്റമാണിത്.
ഈ ഇന്റർവ്യൂകളെ സംശയത്തോടെ നോക്കിയാൽ ചില മറഞ്ഞിരിക്കുന്ന ചിലവുകളും പ്രശ്നങ്ങളും കാണാം. ഈ മോഡലുകൾ കൂടുതൽ കാര്യക്ഷമമാകുകയാണെങ്കിൽ പിന്നെന്തിനാണ് ഊർജ്ജത്തിന്റെ ആവശ്യം ഇത്രയധികം കൂടുന്നത്? കാര്യക്ഷമതയെക്കുറിച്ച് സംസാരിക്കുമ്പോൾ തന്നെ പുതിയ ഡാറ്റാ സെന്ററുകൾക്കായി കോടിക്കണക്കിന് ഡോളർ അവർ ആവശ്യപ്പെടുന്നു. ഇതിന് കൃത്യമായ മറുപടി ലഭ്യമല്ല. ഇതിന്റെ ചിലവ് അവസാനം ആര് വഹിക്കും? ഇത് വെറും സാമ്പത്തിക പ്രശ്നം മാത്രമല്ല, പരിസ്ഥിതിയെയും സമൂഹത്തെയും ബാധിക്കുന്ന ഒന്നാണ്. അതുപോലെ “agentic” AI-യുടെ കാലത്തെ സ്വകാര്യതയും വലിയൊരു ചോദ്യമാണ്. ഒരു AI നിങ്ങൾക്ക് വേണ്ടി പ്രവർത്തിക്കണമെങ്കിൽ അതിന് നിങ്ങളുടെ പേഴ്സണൽ ഡാറ്റ ആവശ്യമാണ്. സുരക്ഷയും ഉപയോഗവും എങ്ങനെ ഒത്തുപോകും എന്നതിൽ വ്യക്തമായ മറുപടി ലഭ്യമല്ല. കൂടാതെ, ഈ മോഡലുകൾക്ക് പിന്നിലെ അധ്വാനത്തെക്കുറിച്ചും നമ്മൾ ചിന്തിക്കണം. വികസ്വര രാജ്യങ്ങളിലെ കുറഞ്ഞ വേതനമുള്ള തൊഴിലാളികളാണ് പലപ്പോഴും ഈ ഡാറ്റ ലേബൽ ചെയ്യുന്നത്. വലിയ വിഷനുകളെക്കുറിച്ച് സംസാരിക്കുമ്പോൾ ഈ ഭാഗം പലപ്പോഴും വിട്ടുപോകാറുണ്ട്.
ഉള്ളടക്കം ഗവേഷണം ചെയ്യാനും എഴുതാനും എഡിറ്റ് ചെയ്യാനും വിവർത്തനം ചെയ്യാനും BotNews.today AI ടൂളുകൾ ഉപയോഗിക്കുന്നു. വിവരങ്ങൾ ഉപയോഗപ്രദവും വ്യക്തവും വിശ്വസനീയവുമാക്കാൻ ഞങ്ങളുടെ ടീം ഈ പ്രക്രിയ അവലോകനം ചെയ്യുകയും മേൽനോട്ടം വഹിക്കുകയും ചെയ്യുന്നു.
പവർ യൂസർമാർക്കും ഡെവലപ്പർമാർക്കും ഈ ഇന്റർവ്യൂകളിലെ ടെക്നിക്കൽ ഭാഗങ്ങളാണ് ഏറ്റവും പ്രധാനം. നിലവിലെ ആർക്കിടെക്ചറുകളുടെ പരിമിതികളെക്കുറിച്ചാണ് ഇപ്പോൾ ചർച്ചകൾ നടക്കുന്നത്. പ്രോസസറും മെമ്മറിയും തമ്മിലുള്ള ഡാറ്റാ കൈമാറ്റത്തിന്റെ വേഗത കുറയുന്ന “memory wall”-നെ കുറിച്ച് നമ്മൾ കൂടുതൽ കേൾക്കുന്നു. അതുകൊണ്ടാണ് ലോക്കൽ സ്റ്റോറേജും edge computing-ഉം പ്രധാന ചർച്ചാവിഷയമാകുന്നത്. ക്ലൗഡ് വളരെ സാവധാനത്തിലോ ചിലവേറിയതോ ആണെങ്കിൽ, ഇൻഡസ്ട്രി ചെറിയ മോഡലുകളിലേക്ക് മാറേണ്ടി വരും. ഭാവിയിൽ മാർക്കറ്റ് രണ്ടായി തിരിയുമെന്ന് ഈ ഇന്റർവ്യൂകൾ സൂചിപ്പിക്കുന്നു. സങ്കീർണ്ണമായ കാര്യങ്ങൾക്കായി ക്ലൗഡിലെ വലിയ മോഡലുകളും ദൈനംദിന ആവശ്യങ്ങൾക്കായി ഒപ്റ്റിമൈസ് ചെയ്ത ചെറിയ മോഡലുകളും ഉണ്ടാകും. “quantization”, “speculative decoding” തുടങ്ങിയ സാങ്കേതിക വിദ്യകൾ ഡെവലപ്പർമാർ ശ്രദ്ധിക്കണം. ഒരു ആപ്ലിക്കേഷൻ എത്രത്തോളം വിജയിക്കുമെന്ന് തീരുമാനിക്കുന്നത് ഇതാണ്. മാർക്കറ്റിംഗ് വലിയ വാഗ്ദാനങ്ങൾ നൽകുമ്പോഴും, ടെക്നിക്കൽ യാഥാർത്ഥ്യം ടോക്കൺ ചിലവുകളും റേറ്റ് ലിമിറ്റുകളും തമ്മിലുള്ള പോരാട്ടമാണ്. മോഡൽ എന്നത് ഒരു വലിയ “compound AI system”-ന്റെ ഭാഗം മാത്രമായി മാറുന്ന ലോകത്തേക്കാണ് നമ്മൾ പോകുന്നത്.
- ഉത്തരങ്ങൾ ഉറപ്പുവരുത്താൻ ഒന്നിലധികം ടൂളുകൾ ഉപയോഗിക്കുന്ന കോമ്പൗണ്ട് സിസ്റ്റങ്ങളിലേക്കുള്ള മാറ്റം.
- ഒരു ചോദ്യം പ്രോസസ്സ് ചെയ്യാൻ മോഡൽ കൂടുതൽ സമയം ചിലവഴിക്കുന്ന inference-time compute-ന്റെ പ്രാധാന്യം.
ചുരുക്കത്തിൽ, AI ലോകത്തെ ഏറ്റവും പ്രധാനപ്പെട്ട വിവരങ്ങൾ നമ്മുടെ കൺമുന്നിൽ തന്നെ ഒളിഞ്ഞിരിപ്പുണ്ട്. വലിയ ഇന്റർവ്യൂകൾ ശ്രദ്ധിക്കാതെ ഹൈലൈറ്റുകൾ മാത്രം നോക്കുന്നവർക്ക് വലിയ മാറ്റങ്ങൾ മിസ്സ് ആകുന്നു. ഇൻഡസ്ട്രി ഇപ്പോൾ കണ്ടുപിടുത്തങ്ങളുടെ ഘട്ടത്തിൽ നിന്ന് വൻതോതിലുള്ള വ്യവസായവൽക്കരണത്തിലേക്ക് മാറുകയാണ്. ഇതിന് വ്യത്യസ്തമായ കഴിവുകളും ചിന്താഗതിയും ആവശ്യമാണ്. നേതാക്കളുടെ ഒഴിഞ്ഞുമാറലുകളും വൈരുദ്ധ്യങ്ങളും വെറും കോർപ്പറേറ്റ് പിആർ (PR) മാത്രമല്ല, വരും വർഷങ്ങളിലെ വെല്ലുവിളികളുടെ ഭൂപടം കൂടിയാണത്. “ഇന്റലിജൻസ്” എന്നത് വൈദ്യുതി പോലെ ഖനനം ചെയ്തും ശുദ്ധീകരിച്ചും വിൽക്കുന്ന ഒരു ചരക്കായി മാറുന്ന ഭാവിക്കായി നമ്മൾ കാത്തിരിക്കുകയാണ്. ഇത് ഒരു നല്ല സമൂഹത്തിലേക്കാണോ അതോ അധികാരം കേന്ദ്രീകരിക്കപ്പെടുന്ന അവസ്ഥയിലേക്കാണോ നയിക്കുന്നത് എന്നത് നമ്മൾ എങ്ങനെ ഇതിനെ കാണുന്നു എന്നതിനെ ആശ്രയിച്ചിരിക്കും. വെറും ഹൈപ്പിന് അപ്പുറം കേൾക്കാൻ തയ്യാറുള്ളവർക്ക് ഈ സൂചനകൾ വ്യക്തമാണ്.
Redaktörens anmärkning: Vi skapade den här webbplatsen som ett flerspråkigt nav för AI-nyheter och guider för människor som inte är datornördar, men som ändå vill förstå artificiell intelligens, använda den med större självförtroende och följa den framtid som redan är här.
ഒരു പിശകോ തിരുത്തേണ്ട എന്തെങ്കിലും കണ്ടെത്തിയോ? ഞങ്ങളെ അറിയിക്കുക.