ഈ വർഷം AI നേതാക്കൾ യഥാർത്ഥത്തിൽ എന്താണ് പറയുന്നത്?
ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിനെക്കുറിച്ചുള്ള സംഭാഷണങ്ങൾ ഇപ്പോൾ മോഡലിന്റെ വലുപ്പത്തിൽ നിന്ന് അതിന്റെ ചിന്താശേഷിയുടെ ഗുണനിലവാരത്തിലേക്ക് മാറിയിരിക്കുന്നു. കഴിഞ്ഞ കുറച്ചു വർഷങ്ങളായി, കൂടുതൽ ഡാറ്റയും ചിപ്പുകളും ഉപയോഗിച്ചാൽ സിസ്റ്റങ്ങൾ കൂടുതൽ സ്മാർട്ടാകും എന്ന ‘സ്കെയിലിംഗ് ലോ’കളിലായിരുന്നു വ്യവസായം ശ്രദ്ധ കേന്ദ്രീകരിച്ചിരുന്നത്. എന്നാൽ ഇപ്പോൾ, പ്രധാന ലാബുകളിലെ നേതാക്കൾ ഒരു മാറ്റത്തിന്റെ സൂചന നൽകുന്നു. അമിതമായ സ്കെയിലിംഗ് കൊണ്ട് വലിയ ഗുണമില്ല എന്നതാണ് പ്രധാന കാര്യം. പകരം, ഗവേഷകർ ‘ഇൻഫറൻസ്-ടൈം കമ്പ്യൂട്ട്’ എന്ന് വിളിക്കുന്ന കാര്യത്തിലേക്കാണ് ശ്രദ്ധ മാറിയിരിക്കുന്നത്. അതായത്, ഒരു മോഡൽ മറുപടി നൽകുന്നതിന് മുൻപ് ചിന്തിക്കാൻ കൂടുതൽ സമയം നൽകുക. 2026-ൽ, നമ്മൾ ചാറ്റ്ബോട്ട് യുഗത്തിന്റെ അവസാനവും യുക്തിപരമായ ചിന്തയുടെ (reasoning era) തുടക്കവുമാണ് കാണുന്നത്. ഇതൊരു ചെറിയ സാങ്കേതിക മാറ്റമല്ല. പഴയ സിസ്റ്റങ്ങളുടെ വേഗതയേറിയതും എന്നാൽ ഉപരിപ്ലവവുമായ പ്രതികരണങ്ങളിൽ നിന്ന് മാറി, കൂടുതൽ ആലോചിച്ചും തന്ത്രപരമായും പ്രവർത്തിക്കുന്ന ഒരു ഇന്റലിജൻസിലേക്കുള്ള മാറ്റമാണിത്. മോഡലുകൾ കൂടുതൽ വേഗത്തിലാകുമെന്ന് കരുതിയ ഉപയോക്താക്കൾക്ക് ഇപ്പോൾ മനസ്സിലാകുന്നത്, ഏറ്റവും മികച്ച ടൂളുകൾ കൂടുതൽ സാവധാനത്തിലാകുന്നുണ്ടെങ്കിലും ഗണിതം, ശാസ്ത്രം, ലോജിക് എന്നിവയിലെ കഠിനമായ പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നതിൽ അവ കൂടുതൽ കഴിവുള്ളവയായി മാറുന്നുണ്ടെന്നാണ്.
വേഗതയിൽ നിന്ന് തന്ത്രത്തിലേക്ക്
എന്താണ് സംഭവിക്കുന്നതെന്ന് മനസ്സിലാക്കാൻ, ഈ മോഡലുകൾ എങ്ങനെയാണ് പ്രവർത്തിക്കുന്നതെന്ന് നോക്കണം. മിക്ക ആദ്യകാല ലാർജ് ലാംഗ്വേജ് മോഡലുകളും പ്രവർത്തിച്ചിരുന്നത് സൈക്കോളജിസ്റ്റുകൾ ‘സിസ്റ്റം 1 തിങ്കിംഗ്’ എന്ന് വിളിക്കുന്ന രീതിയിലാണ്. ഇത് വേഗതയേറിയതും പെട്ടെന്നുള്ളതുമാണ്. നിങ്ങൾ ഒരു സാധാരണ മോഡലിനോട് ഒരു ചോദ്യം ചോദിക്കുമ്പോൾ, അത് പരിശീലനത്തിലൂടെ പഠിച്ച പാറ്റേണുകൾ വെച്ച് ഉടൻ തന്നെ മറുപടി നൽകുന്നു. അത് യഥാർത്ഥത്തിൽ പ്ലാൻ ചെയ്യുന്നില്ല, വെറുതെ സംസാരിക്കാൻ തുടങ്ങുകയാണ്. OpenAI പോലുള്ള കമ്പനികൾ മുന്നോട്ട് വെക്കുന്ന പുതിയ ദിശ ‘സിസ്റ്റം 2 തിങ്കിംഗ്’ ആണ്. ഇത് സാവധാനമുള്ളതും കൂടുതൽ വിശകലനാത്മകവും യുക്തിസഹവുമാണ്. ഒരു മോഡൽ തന്റെ ഓരോ ഘട്ടവും പരിശോധിക്കാനായി ഇടയ്ക്ക് നിർത്തുന്നതോ, ഇടയ്ക്ക് വെച്ച് ലോജിക് തിരുത്തുന്നതോ നിങ്ങൾ ശ്രദ്ധിച്ചിട്ടുണ്ടാകും. ഇതിനെ ‘ചെയിൻ ഓഫ് തോട്ട് പ്രോസസ്സിംഗ്’ എന്ന് വിളിക്കുന്നു. ഇത് മോഡലിന് പരിശീലന സമയത്ത് പഠിച്ച കാര്യങ്ങളിൽ മാത്രം ആശ്രയിക്കാതെ, മറുപടി നൽകുന്ന സമയത്ത് കൂടുതൽ കമ്പ്യൂട്ടേഷണൽ പവർ ഉപയോഗിക്കാൻ സഹായിക്കുന്നു.
ഈ മാറ്റം പൊതുജനങ്ങൾക്കിടയിലുള്ള ഒരു വലിയ തെറ്റിദ്ധാരണ തിരുത്തുന്നു. AI എന്നത് വിവരങ്ങളുടെ ഒരു സ്റ്റാറ്റിക് ഡാറ്റാബേസ് ആണെന്നാണ് പലരും കരുതുന്നത്. എന്നാൽ വാസ്തവത്തിൽ, ആധുനിക AI ഒരു ഡൈനാമിക് റീസണിംഗ് എഞ്ചിനായി മാറുകയാണ്. പൊതുജനങ്ങൾ ഇപ്പോഴും ഇതിനെ ഒരു സെർച്ച് എഞ്ചിനായി കാണുമ്പോൾ, വ്യവസായം ഇതിനെ സ്വയം പ്രവർത്തിക്കുന്ന പ്രശ്നപരിഹാരകരായാണ് നിർമ്മിക്കുന്നത്. **ഇൻഫറൻസ്-ടൈം കമ്പ്യൂട്ട്** എന്ന ഈ മാറ്റം AI ഉപയോഗിക്കുന്നതിന്റെ ചിലവിലും മാറ്റം വരുത്തുന്നു. മോഡലിനെ ഒരിക്കൽ ട്രെയിൻ ചെയ്യാൻ എത്ര ചിലവാകും എന്നതല്ല, ഓരോ ക്വറിക്കും എത്ര വൈദ്യുതിയും പ്രോസസ്സിംഗ് പവറും ആവശ്യമാണ് എന്നതാണ് പ്രധാനം. ഇത് ടെക് കമ്പനികളുടെ ബിസിനസ് മോഡലുകളെ വലിയ രീതിയിൽ ബാധിക്കുന്നു. വിലകുറഞ്ഞ, ഉയർന്ന വോളിയം ഇടപെടലുകളിൽ നിന്ന് മാറി, ഓരോ ഔട്ട്പുട്ടിനും വലിയ വിഭവങ്ങൾ ആവശ്യമുള്ള സങ്കീർണ്ണമായ റീസണിംഗ് ജോലികളിലേക്കാണ് അവർ നീങ്ങുന്നത്. പ്രധാന ലാബുകളിൽ നിന്നുള്ള ഔദ്യോഗിക ഗവേഷണ കുറിപ്പുകളിൽ നിങ്ങൾക്ക് ഈ മാറ്റങ്ങളെക്കുറിച്ച് കൂടുതൽ വായിക്കാം.
കമ്പ്യൂട്ടേഷന്റെ ഭൗമരാഷ്ട്രീയ ചിലവ്
ഈ മാറ്റത്തിന്റെ ആഗോള പ്രഭാവം ഊർജ്ജത്തിലും പരമാധികാരത്തിലുമാണ് കേന്ദ്രീകരിച്ചിരിക്കുന്നത്. മോഡലുകൾക്ക് ചിന്തിക്കാൻ കൂടുതൽ സമയം വേണമെന്നതിനാൽ, അവയ്ക്ക് കൂടുതൽ പവർ ആവശ്യമാണ്. ഇതൊരു സിലിക്കൺ വാലി പ്രശ്നം മാത്രമല്ല, പല രാജ്യങ്ങൾക്കും ഇതൊരു ദേശീയ സുരക്ഷാ പ്രശ്നമാണ്. ഡാറ്റാ സെന്ററുകൾക്ക് വൻതോതിൽ വൈദ്യുതി നൽകാനുള്ള കഴിവ് സാമ്പത്തിക മത്സരത്തിന് അത്യന്താപേക്ഷിതമാണെന്ന് ഗവൺമെന്റുകൾ തിരിച്ചറിയുന്നു. ആണവ ഊർജ്ജം മുതൽ വൻകിട സോളാർ ഫാമുകൾ വരെ, ഊർജ്ജ സ്രോതസ്സുകൾക്കായി ഒരു ഓട്ടം തന്നെ നടക്കുന്നുണ്ട്. ഇത് അടിസ്ഥാന സൗകര്യങ്ങൾ താങ്ങാൻ കഴിയുന്ന രാജ്യങ്ങളും അല്ലാത്തവരും തമ്മിൽ പുതിയൊരു വിഭജനം സൃഷ്ടിക്കുന്നു. പാരിസ്ഥിതിക ചിലവും വർദ്ധിക്കുകയാണ്. AI ഊർജ്ജ ഗ്രിഡുകളെ ഒപ്റ്റിമൈസ് ചെയ്യാൻ സഹായിക്കുമെങ്കിലും, വൈദ്യുതിയുടെ പെട്ടെന്നുള്ള ആവശ്യം കാര്യക്ഷമതയിലുണ്ടാകുന്ന നേട്ടങ്ങളെക്കാൾ കൂടുതലാണ്. Google DeepMind-ലെയും മറ്റ് സ്ഥാപനങ്ങളിലെയും നേതാക്കൾ കൂടുതൽ കാര്യക്ഷമമായ ആർക്കിടെക്ചറുകളിലൂടെ ഈ പ്രശ്നം പരിഹരിക്കാൻ ശ്രമിക്കുകയാണ്.
- രാജ്യങ്ങൾ ഇപ്പോൾ കമ്പ്യൂട്ട് ക്ലസ്റ്ററുകളെ പവർ പ്ലാന്റുകൾ അല്ലെങ്കിൽ തുറമുഖങ്ങൾ പോലെ പ്രധാനപ്പെട്ട അടിസ്ഥാന സൗകര്യങ്ങളായി കാണുന്നു.
- സ്പെഷ്യലൈസ്ഡ് ഹാർഡ്വെയറുകൾക്കായുള്ള ആവശ്യം ആഗോള ഇലക്ട്രോണിക്സ് വിലയെ ബാധിക്കുന്ന ഒരു സപ്ലൈ ചെയിൻ തടസ്സം സൃഷ്ടിക്കുന്നു.
- ചരിത്രപരമായ സാങ്കേതിക പശ്ചാത്തലം പരിഗണിക്കാതെ, ഊർജ്ജ സമ്പന്നമായ പ്രദേശങ്ങൾ സാങ്കേതിക വികസനത്തിന്റെ പുതിയ കേന്ദ്രങ്ങളായി മാറുന്നു.
- ഈ സിസ്റ്റങ്ങളുടെ ഭീമമായ കാർബൺ ഫുട്പ്രിന്റ് കൈകാര്യം ചെയ്യുന്നതിനൊപ്പം നവീകരണത്തിനുള്ള ആവശ്യം സന്തുലിതമാക്കാൻ റെഗുലേറ്ററി ബോഡികൾ പാടുപെടുകയാണ്.
തൊഴിൽ വിപണിയിലും ഇതിന്റെ അലയൊലികൾ അനുഭവപ്പെടുന്നുണ്ട്. പണ്ട്, AI ലളിതമായ ശാരീരിക ജോലികൾ പകരം വെക്കുമെന്നായിരുന്നു ഭയം. ഇപ്പോൾ, അത് ഉയർന്ന തലത്തിലുള്ള വൈജ്ഞാനിക ജോലികളിലേക്ക് മാറിയിരിക്കുന്നു. ഈ പുതിയ മോഡലുകൾക്ക് നിയമപരമായ രേഖകളോ മെഡിക്കൽ ഗവേഷണമോ വിശകലനം ചെയ്യാൻ കഴിയുന്നതിനാൽ, പ്രൊഫഷണൽ ക്ലാസിനെ ഇത് പ്രതീക്ഷിച്ചതിലും കൂടുതൽ ബാധിക്കുന്നു. ഇതൊരു ഓട്ടോമേഷൻ മാത്രമല്ല, വൈദഗ്ധ്യത്തിന്റെ പുനർവിതരണം കൂടിയാണ്. ലണ്ടനിലെ ഒരു ജൂനിയർ അനലിസ്റ്റിനോ ബാംഗ്ലൂരിലെ ഒരു ഡെവലപ്പർക്കോ ഇപ്പോൾ ഒരു സീനിയർ പാർട്ണറുടെ റീസണിംഗ് കഴിവുകൾ ലഭ്യമാണ്. ഇത് ശ്രേണികളെ പരത്തുകയും പരമ്പരാഗത വിദ്യാഭ്യാസത്തിന്റെ മൂല്യത്തെ മാറ്റുകയും ചെയ്യുന്നു. ആർക്കാണ് കൂടുതൽ അറിവുള്ളത് എന്നതല്ല, ആരുടെ നിർദ്ദേശപ്രകാരമാണ് മെഷീന്റെ റീസണിംഗ് പവർ മികച്ച രീതിയിൽ ഉപയോഗിക്കുന്നത് എന്നതാണ് ചോദ്യം.
ഓട്ടോമേറ്റഡ് ഓഫീസിലെ ഒരു ചൊവ്വാഴ്ച
സാറ എന്ന പ്രോജക്ട് മാനേജരുടെ ഒരു ദിവസം പരിഗണിക്കുക. ഒരു വർഷം മുൻപ്, മീറ്റിംഗുകൾ സംഗ്രഹിക്കാനോ ഇമെയിലുകളിലെ തെറ്റുകൾ തിരുത്താനോ ആണ് സാറ AI ഉപയോഗിച്ചിരുന്നത്. ഇന്ന്, അവളുടെ വർക്ക്ഫ്ലോ കുറഞ്ഞ മേൽനോട്ടത്തിൽ പ്രവർത്തിക്കുന്ന **agentic workflows**-നെ ചുറ്റിപ്പറ്റിയാണ്. ദിവസം തുടങ്ങുമ്പോൾ അവൾ ഇൻബോക്സ് നോക്കാറില്ല. പകരം, അവളുടെ AI ഏജന്റ് ഇതിനകം സന്ദേശങ്ങൾ തരംതിരിച്ചുവെച്ച ഡാഷ്ബോർഡ് ആണ് നോക്കുന്നത്. ഏജന്റ് പ്രധാനപ്പെട്ടവ അടയാളപ്പെടുത്തുക മാത്രമല്ല ചെയ്തത്; അവളുടെ കലണ്ടർ പരിശോധിച്ച് വ്യാഴാഴ്ചത്തെ മീറ്റിംഗിൽ ഒരു തടസ്സം കണ്ടെത്തി, മറ്റ് മൂന്ന് പേരുടെ ലഭ്യതയനുസരിച്ച് പുതിയ സമയം നിർദ്ദേശിക്കുകയും ചെയ്തു. കൂടാതെ, തലേദിവസം നടന്ന സംഭാഷണത്തിന്റെ അടിസ്ഥാനത്തിൽ ഒരു പ്രോജക്ട് ബ്രീഫ് തയ്യാറാക്കുകയും, ഷെയർഡ് ഡ്രൈവിൽ നിന്ന് ഡാറ്റ എടുത്ത് ഏറ്റവും പുതിയ അക്കൗണ്ടിംഗ് റിപ്പോർട്ടുമായി ബജറ്റ് കണക്കുകൾ പരിശോധിക്കുകയും ചെയ്തു.
ഉച്ചയോടെ, സാറ ഒരു സങ്കീർണ്ണമായ കരാർ പരിശോധിക്കുകയാണ്. അൻപത് പേജുകളും വായിക്കുന്നതിന് പകരം, കമ്പനിയുടെ ബൗദ്ധിക സ്വത്തവകാശ നയവുമായി പൊരുത്തപ്പെടാത്ത ക്ലോസുകൾ കണ്ടെത്താൻ അവൾ മോഡലിനോട് ആവശ്യപ്പെടുന്നു. മറുപടി നൽകാൻ മോഡൽ കുറച്ചു മിനിറ്റുകൾ എടുക്കുന്നു. ഇതാണ് റീസണിംഗ് ഘട്ടം. കോർപ്പറേറ്റ് നിയമങ്ങളുടെ ഡാറ്റാബേസുമായി ഓരോ വാക്യവും അത് പരിശോധിക്കുകയാണ്. മോഡൽ നൽകുന്നത് വെറുമൊരു സംഗ്രഹമല്ല, അതൊരു ലോജിക്കൽ ഓഡിറ്റ് ആയതുകൊണ്ട് കാത്തിരിക്കുന്നത് മൂല്യമുള്ളതാണെന്ന് സാറയ്ക്ക് അറിയാം. ഒരു പ്രത്യേക ടാക്സ് കോഡ് മോഡൽ വ്യാഖ്യാനിച്ച രീതിയിൽ ചെറിയൊരു പിശക് അവൾ കണ്ടെത്തുന്നുണ്ടെങ്കിലും, ഭൂരിഭാഗം ജോലികളും ഇതിനകം പൂർത്തിയായതിൽ അവൾ അത്ഭുതപ്പെടുന്നു. വൈകുന്നേരം, ഒരു എതിരാളിയായ കമ്പനിയെക്കുറിച്ചുള്ള അനാലിസിസ് ഏജന്റ് പൂർത്തിയാക്കിയെന്ന അറിയിപ്പ് അവൾക്ക് ലഭിക്കുന്നു. അത് പബ്ലിക് ഫയലിംഗുകൾ പരിശോധിക്കുകയും വിപണി ട്രെൻഡുകൾ ക്രോഡീകരിക്കുകയും ബോർഡ് മീറ്റിംഗിനായി എൺപത് ശതമാനം തയ്യാറായ ഒരു സ്ലൈഡ് ഡെക്ക് നിർമ്മിക്കുകയും ചെയ്തു. ഞങ്ങളുടെ പ്ലാറ്റ്ഫോമിലെ ഏറ്റവും പുതിയ വ്യവസായ ഉൾക്കാഴ്ചകളിൽ നിങ്ങൾക്ക് ഇത്തരം പ്രായോഗിക ഉദാഹരണങ്ങൾ കണ്ടെത്താം.
ഇവിടെ കാര്യങ്ങൾ വളരെ പ്രായോഗികമാണ്. സാറ ഇപ്പോൾ ഒരു എഴുത്തുകാരിയോ ഷെഡ്യൂളറോ അല്ല. അവളൊരു ഓർക്കസ്ട്രേറ്ററാണ്. AI അവരുടെ ജോലി ചെയ്തുതരുമെന്ന് കരുതുന്നതാണ് പലർക്കും പറ്റുന്ന തെറ്റ്. വാസ്തവത്തിൽ, ജോലികൾ ചെയ്യുന്നത് AI ആണ്, എന്നാൽ ലോജിക്കിനും അന്തിമ തീരുമാനത്തിനും ഉത്തരവാദി സാറയാണ്. ജോലി ചെയ്യുന്നതിൽ നിന്ന് ജോലി മാനേജ് ചെയ്യുന്നതിലേക്കുള്ള മാറ്റമാണിത്. റീസണിംഗ് ചെയിനിലെ ചെറിയ തെറ്റുകൾ കണ്ടെത്താനുള്ള കഴിവ് ഉൾപ്പെടെയുള്ള പുതിയൊരു സെറ്റ് കഴിവുകൾ ഇതിന് ആവശ്യമാണ്. മോഡൽ തെറ്റായ ഒരു ലോജിക്കൽ ലീപ്പ് എടുക്കുകയാണെങ്കിൽ, ആ ലോജിക് എവിടെ നിന്നാണെന്ന് കണ്ടെത്താൻ സാറയ്ക്ക് കഴിയണം. ലളിതമായ ജനറേഷനിൽ നിന്ന് സങ്കീർണ്ണമായ വെരിഫിക്കേഷനിലേക്കാണ് വിഷയം മാറുന്നത്.
ഉള്ളടക്കം ഗവേഷണം ചെയ്യാനും എഴുതാനും എഡിറ്റ് ചെയ്യാനും വിവർത്തനം ചെയ്യാനും BotNews.today AI ടൂളുകൾ ഉപയോഗിക്കുന്നു. വിവരങ്ങൾ ഉപയോഗപ്രദവും വ്യക്തവും വിശ്വസനീയവുമാക്കാൻ ഞങ്ങളുടെ ടീം ഈ പ്രക്രിയ അവലോകനം ചെയ്യുകയും മേൽനോട്ടം വഹിക്കുകയും ചെയ്യുന്നു.
സിന്തറ്റിക് ഇന്റലിജൻസിന്റെ ധാർമ്മിക കടം
റീസണിംഗിലേക്കുള്ള ഈ മാറ്റം സാങ്കേതികവിദ്യയുടെ മറഞ്ഞിരിക്കുന്ന ചിലവുകളെക്കുറിച്ച് ബുദ്ധിമുട്ടുള്ള ചോദ്യങ്ങൾ ഉയർത്തുന്നു. ഒരു മോഡൽ കൂടുതൽ സമയം ചിന്തിക്കുന്നുണ്ടെങ്കിൽ, ആ സമയത്തിന് ആരാണ് പണം നൽകുന്നത്? സാമ്പത്തിക ചിലവ് വ്യക്തമാണ്, എന്നാൽ സ്വകാര്യതയുമായി ബന്ധപ്പെട്ട ചിലവ് കൂടുതൽ അവ്യക്തമാണ്. ഫലപ്രദമായി ചിന്തിക്കാൻ, ഈ മോഡലുകൾക്ക് കൂടുതൽ കോൺടെക്സ്റ്റ് ആവശ്യമാണ്. നിങ്ങളുടെ ബിസിനസ്സ്, വ്യക്തിപരമായ താൽപ്പര്യങ്ങൾ, സ്വകാര്യ ഡാറ്റ എന്നിവയെക്കുറിച്ച് കൂടുതൽ അറിയണം. ഏറ്റവും ഉപയോഗപ്രദമായ AI നിങ്ങളെ ഏറ്റവും നന്നായി അറിയുന്നതാണ് എന്ന ലോകത്തേക്കാണ് നമ്മൾ നീങ്ങുന്നത്. ഇത് വലിയൊരു സ്വകാര്യത ഭീഷണി സൃഷ്ടിക്കുന്നു. നിങ്ങളുടെ ഏജന്റിന് നിങ്ങളുടെ മുഴുവൻ ഇമെയിൽ ചരിത്രത്തിലേക്കും കോർപ്പറേറ്റ് ഡാറ്റാബേസിലേക്കും പ്രവേശനമുണ്ടെങ്കിൽ, ആ വിവരങ്ങൾ ഒരു തേർഡ് പാർട്ടി ഉടമസ്ഥതയിലുള്ള സെർവറുകളാണ് പ്രോസസ്സ് ചെയ്യുന്നത്. ഡാറ്റ ചോർച്ചയ്ക്കോ അനധികൃത പ്രൊഫൈലിംഗിനോ ഉള്ള സാധ്യത മുമ്പത്തേക്കാൾ കൂടുതലാണ്. Reuters പോലുള്ള ഏജൻസികളുടെ റിപ്പോർട്ടുകൾ, ഉയർന്ന നിലവാരമുള്ള പരിശീലന വിവരങ്ങൾക്കായുള്ള വിശപ്പ് വർദ്ധിക്കുമ്പോൾ ഡാറ്റ സ്ക്രാപ്പിംഗും പ്രോസസ്സിംഗും എങ്ങനെ കൂടുതൽ ആക്രമണാത്മകമാകുന്നുവെന്ന് വ്യക്തമാക്കുന്നു.
മരിച്ച ഇന്റർനെറ്റിനെക്കുറിച്ചുള്ള ചോദ്യവുമുണ്ട്. റീസണിംഗ് മോഡലുകൾ ഉയർന്ന നിലവാരമുള്ള ഉള്ളടക്കം നിർമ്മിക്കുന്നതിൽ മികച്ചതാകുമ്പോൾ, വെബ് സിന്തറ്റിക് ടെക്സ്റ്റുകളും ചിത്രങ്ങളും വീഡിയോകളും കൊണ്ട് നിറയുകയാണ്. മറ്റ് AI മോഡലുകളുടെ ഔട്ട്പുട്ടിൽ നിന്ന് AI മോഡലുകൾ പരിശീലിക്കാൻ തുടങ്ങിയാൽ, കാലക്രമേണ മനുഷ്യന്റെ അറിവിന്റെ ഗുണനിലവാരം കുറയ്ക്കുന്ന ഒരു ഫീഡ്ബാക്ക് ലൂപ്പിന് നമ്മൾ കാരണമാകും. ഇതാണ് ‘മോഡൽ കൊളാപ്സ് തിയറി’. സിന്തറ്റിക് റീസണിംഗ് വിലകുറഞ്ഞതും വേഗതയേറിയതുമായ ഒരു അന്തരീക്ഷത്തിൽ മനുഷ്യന്റെ അവബോധത്തിന്റെയും യഥാർത്ഥ ചിന്തയുടെയും മൂല്യം നമ്മൾ എങ്ങനെ സംരക്ഷിക്കും? മനുഷ്യന്റെ വൈദഗ്ധ്യത്തിന്റെ തകർച്ചയെക്കുറിച്ചും നമ്മൾ ചോദിക്കണം. ഒരു നിയമപരമായ കേസിനോ മെഡിക്കൽ ഡയഗ്നോസിസിനോ ആവശ്യമായ എല്ലാ റീസണിംഗും ചെയ്യാൻ AI-ക്ക് കഴിയുമെങ്കിൽ, മെഷീൻ പരാജയപ്പെടുമ്പോൾ അത് കണ്ടെത്താനുള്ള അടിസ്ഥാന കഴിവുകൾ അടുത്ത തലമുറ ഡോക്ടർമാർക്കും അഭിഭാഷകർക്കും ഉണ്ടാകുമോ? ഇത്തരം സിസ്റ്റങ്ങളെ അമിതമായി ആശ്രയിക്കുന്നത് അവയില്ലാതെ പ്രവർത്തിക്കാൻ കഴിയാത്ത ഒരു ദുർബലമായ സമൂഹത്തെ സൃഷ്ടിക്കുന്നു.
ഞങ്ങൾ ഉൾപ്പെടുത്തണമെന്ന് നിങ്ങൾ കരുതുന്ന ഒരു AI സ്റ്റോറിയോ, ടൂളോ, ട്രെൻഡോ, ചോദ്യമോ നിങ്ങളുടെ പക്കലുണ്ടോ? നിങ്ങളുടെ ലേഖന ആശയം ഞങ്ങൾക്ക് അയയ്ക്കുക — അത് കേൾക്കാൻ ഞങ്ങൾ ആഗ്രഹിക്കുന്നു.
പവർ യൂസറുടെ ആർക്കിടെക്ചർ
അടിസ്ഥാന ഇന്റർഫേസിന് അപ്പുറത്തേക്ക് പോകാൻ ആഗ്രഹിക്കുന്നവർക്ക്, സാങ്കേതിക ആവശ്യകതകൾ മാറിക്കൊണ്ടിരിക്കുകയാണ്. വേഗതയേറിയ ഇന്റർനെറ്റ് കണക്ഷൻ ഉണ്ടാവുക എന്നത് മാത്രമല്ല കാര്യം. ഈ റീസണിംഗ് മോഡലുകളെ തങ്ങളുടെ ലോക്കൽ എൻവയോൺമെന്റുകളിലേക്ക് എങ്ങനെ സംയോജിപ്പിക്കാം എന്നാണ് പവർ യൂസർമാർ ഇപ്പോൾ നോക്കുന്നത്. ഇതിൽ API പരിധികൾ മാനേജ് ചെയ്യുന്നതും ലേറ്റൻസിയും കൃത്യതയും തമ്മിലുള്ള സന്തുലിതാവസ്ഥ മനസ്സിലാക്കുന്നതും ഉൾപ്പെടുന്നു. നിങ്ങൾ ഒരു റീസണിംഗ് മോഡൽ ഉപയോഗിക്കുമ്പോൾ, പലപ്പോഴും സെക്കൻഡിൽ കുറഞ്ഞ ടോക്കണുകളാണ് ലഭിക്കുന്നത്. മോഡൽ ആന്തരിക പരിശോധനകൾ നടത്തുന്നതുകൊണ്ടാണ് ഇങ്ങനെ സംഭവിക്കുന്നത്. ഡെവലപ്പർമാർക്ക് ഇതിനർത്ഥം വോയിസ് അസിസ്റ്റന്റുകൾ അല്ലെങ്കിൽ ലൈവ് ചാറ്റ് പോലുള്ള തത്സമയ ആപ്ലിക്കേഷനുകൾക്ക് ഇപ്പോഴും ചെറിയ, വേഗതയേറിയ മോഡലുകൾ ഉപയോഗിക്കേണ്ടി വരുമെന്നും, കനത്ത റീസണിംഗ് ജോലികൾ കൂടുതൽ ശേഷിയുള്ള ബാക്കെൻഡിലേക്ക് മാറ്റാമെന്നുമാണ്.
- സ്വകാര്യ ഡാറ്റ ക്ലൗഡിലേക്ക് അയക്കാതെ തന്നെ മോഡലിന് ആക്സസ് ഉണ്ടെന്ന് ഉറപ്പാക്കാൻ റിട്രീവൽ-ഓഗ്മെന്റഡ് ജനറേഷൻ (RAG)-നായി ലോക്കൽ സ്റ്റോറേജ് നിർണ്ണായകമാകുന്നു.
- ക്വാണ്ടൈസേഷൻ ടെക്നിക്കുകൾ ഉപയോഗിച്ച് ഉപയോക്താക്കൾക്ക് ഈ മോഡലുകളുടെ ചെറിയ പതിപ്പുകൾ കൺസ്യൂമർ ഹാർഡ്വെയറിൽ പ്രവർത്തിപ്പിക്കാം, എങ്കിലും റീസണിംഗ് ആഴത്തിൽ ചെറിയ കുറവുണ്ടാകാം.
- റീസണിംഗ് മോഡലുകൾക്കുള്ള ആയിരം ടോക്കണുകളുടെ വില സാധാരണ മോഡലുകളെ അപേക്ഷിച്ച് വളരെ കൂടുതലായതിനാൽ, API ചിലവ് മാനേജ്മെന്റ് ഇപ്പോൾ സ്റ്റാർട്ടപ്പുകളുടെ പ്രധാന ആശങ്കയാണ്.
- ഉപയോക്താവ് ഒരു ടാസ്ക് സമർപ്പിച്ച് മറുപടിക്കായി കാത്തിരിക്കുന്ന അസിൻക്രണസ് പ്രോസസ്സിംഗിലേക്കാണ് വർക്ക്ഫ്ലോ ഇന്റഗ്രേഷൻ നീങ്ങുന്നത്.
ഈ മോഡലുകളുടെ പരിധികളെക്കുറിച്ചും കമ്മ്യൂണിറ്റിയിലെ ഗീക്കുകൾ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നുണ്ട്. മികച്ച റീസണിംഗ് എഞ്ചിനുകൾക്ക് പോലും കോൺടെക്സ്റ്റ് വിൻഡോ പരിധിയുണ്ട്. മോഡലിന് ഒരേസമയം അതിന്റെ ആക്ടീവ് മെമ്മറിയിൽ സൂക്ഷിക്കാൻ കഴിയുന്ന വിവരങ്ങളുടെ അളവാണിത്. ഈ വിൻഡോകൾ വലുതാകുന്നുണ്ടെങ്കിലും, മുഴുവൻ കോഡ് ലൈബ്രറികളും നീണ്ട നിയമപരമായ ചരിത്രങ്ങളും പ്രോസസ്സ് ചെയ്യുന്നതിന് ഇതൊരു തടസ്സമാണ്. വെക്റ്റർ ഡാറ്റാബേസുകളും കാര്യക്ഷമമായ ഇൻഡെക്സിംഗും വഴി ഈ മെമ്മറി മാനേജ് ചെയ്യുന്നതാണ് AI എഞ്ചിനീയറിംഗിലെ നിലവിലെ അതിർത്തി. Ollama അല്ലെങ്കിൽ LM Studio പോലുള്ള ലോക്കൽ ഹോസ്റ്റിംഗ് ടൂളുകളുടെ വർദ്ധനവും നമ്മൾ കാണുന്നുണ്ട്, ഇത് ഉപയോക്താക്കളെ മോഡലുകൾ പൂർണ്ണമായും ഓഫ്ലൈനായി പ്രവർത്തിപ്പിക്കാൻ അനുവദിക്കുന്നു. സ്വകാര്യതയ്ക്കുള്ള ഏറ്റവും മികച്ച പരിഹാരമാണിത്, എന്നാൽ മിക്ക ലാപ്ടോപ്പുകളിലും ഇല്ലാത്ത വലിയ GPU വിഭവങ്ങൾ ഇതിന് ആവശ്യമാണ്.
മുന്നോട്ടുള്ള പാത
നമ്മൾ സാക്ഷ്യം വഹിക്കുന്ന അടിസ്ഥാനപരമായ മാറ്റം AI ഒരു ടൂളിൽ നിന്ന് ഒരു പങ്കാളിയായി മാറുന്നു എന്നതാണ്. വ്യവസായത്തിൽ നിന്നുള്ള സൂചനകൾ വ്യക്തമാണ്. കൂടുതൽ ഡാറ്റ ചേർക്കുന്നത് മാത്രമാണ് ഉത്തരമെന്ന ഘട്ടം നമ്മൾ പിന്നിട്ടു. മോഡലുകൾ അവരുടെ സമയം എങ്ങനെ ഉപയോഗിക്കുന്നു, മനുഷ്യന്റെ യുക്തിയുമായി അവ എങ്ങനെ ഇടപഴകുന്നു എന്നതാണ് ഭാവി. ഇത് ഉൾപ്പെട്ടിരിക്കുന്ന എല്ലാവർക്കും കൂടുതൽ സങ്കീർണ്ണമായ ഒരു അന്തരീക്ഷം സൃഷ്ടിക്കുന്നു. ഉപയോക്താക്കൾ മെഷീനുകളെ ഓഡിറ്റ് ചെയ്യുന്നതിൽ കൂടുതൽ മികച്ചവരാകണം, കമ്പനികൾ ഈ സിസ്റ്റങ്ങളുടെ ഭീമമായ ഊർജ്ജവും സാമ്പത്തിക ചിലവും മാനേജ് ചെയ്യുന്നതിൽ കൂടുതൽ ശ്രദ്ധിക്കണം. AI എന്നത് Google-ന്റെ മികച്ച പതിപ്പാണെന്ന പൊതുധാരണ മാറി, AI എന്നത് ഡിജിറ്റൽ അധ്വാനത്തിന്റെ പുതിയൊരു രൂപമാണെന്ന യാഥാർത്ഥ്യം വരുന്നു. ഈ സിസ്റ്റങ്ങളെ പൂർണ്ണമായും വിശ്വസനീയമാക്കാൻ കഴിയുമോ അതോ റീസണിംഗിലെ സങ്കീർണ്ണത എപ്പോഴും മനുഷ്യന്റെ മേൽനോട്ടം ആവശ്യമുള്ള ഒരു പിശക് സാധ്യത നിലനിർത്തുമോ എന്നതാണ് ഇപ്പോഴും ബാക്കിയുള്ള ചോദ്യം. സാങ്കേതികവിദ്യ വികസിക്കുന്നത് തുടരുമ്പോൾ, മനുഷ്യന്റെ ചിന്തയും മെഷീന്റെ യുക്തിയും തമ്മിലുള്ള അതിർവരമ്പ് നിർവചിക്കാൻ കൂടുതൽ പ്രയാസകരമാകും.
Editor’s note: We created this site as a multilingual AI news and guides hub for people who are not computer geeks, but still want to understand artificial intelligence, use it with more confidence, and follow the future that is already arriving.
ഒരു പിശകോ തിരുത്തേണ്ട എന്തെങ്കിലും കണ്ടെത്തിയോ? ഞങ്ങളെ അറിയിക്കുക.