AI കാലഘട്ടത്തിൽ മാനുഷിക മൂല്യങ്ങൾ എന്താണ് അർത്ഥമാക്കുന്നത്?
ന്യൂട്രൽ കോഡ് എന്ന മിഥ്യ
ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിനെക്കുറിച്ചുള്ള ചർച്ചകൾ പലപ്പോഴും സാങ്കേതിക മാനദണ്ഡങ്ങളിലും പ്രോസസ്സിംഗ് പവറിലുമാണ് കേന്ദ്രീകരിക്കുന്നത്. പാരാമീറ്ററുകളെയും പെറ്റാബൈറ്റുകളെയും കുറിച്ച് നമ്മൾ സംസാരിക്കുന്നത് അവ മാത്രമാണ് പ്രധാനപ്പെട്ട അളവുകോലുകൾ എന്ന മട്ടിലാണ്. എന്നാൽ ഈ ശ്രദ്ധ കൂടുതൽ ഗൗരവകരമായ ഒരു യാഥാർത്ഥ്യത്തെ മറച്ചുവെക്കുന്നു. ഓരോ ലാർജ് ലാംഗ്വേജ് മോഡലും അതിനെ രൂപപ്പെടുത്തിയ മനുഷ്യന്റെ മുൻഗണനകളുടെ ഒരു കണ്ണാടിയാണ്. ന്യൂട്രൽ അൽഗോരിതം എന്ന് ഒന്നില്ല. ഒരു സിസ്റ്റം ഉത്തരം നൽകുമ്പോൾ, അത് വസ്തുനിഷ്ഠമായ സത്യത്തിന്റെ ശൂന്യതയിൽ നിന്നല്ല വരുന്നത്. ഡെവലപ്പർമാരും ഡാറ്റ ലേബലർമാരും നിശ്ചയിച്ച പ്രത്യേക മൂല്യങ്ങളുടെ പ്രതിഫലനമാണത്. ഇതിലെ പ്രധാന കാര്യം ലളിതമാണ്. നമ്മൾ യന്ത്രങ്ങളെ ചിന്തിക്കാൻ പഠിപ്പിക്കുകയല്ല. മറിച്ച്, നമ്മുടെ സവിശേഷവും പലപ്പോഴും വൈരുദ്ധ്യമുള്ളതുമായ സാമൂഹിക മാനദണ്ഡങ്ങളെ അനുകരിക്കാൻ അവയെ പഠിപ്പിക്കുകയാണ്. ലോജിക്കിൽ നിന്ന് എത്തിക്സിലേക്കുള്ള ഈ മാറ്റം ഇന്റർനെറ്റിന്റെ കണ്ടുപിടുത്തത്തിന് ശേഷമുള്ള കമ്പ്യൂട്ടിംഗിലെ ഏറ്റവും വലിയ മാറ്റമാണ്. ഇത് ഹാർഡ്വെയറിൽ നിന്ന് ഉത്തരവാദിത്തത്തെ മനുഷ്യരിലേക്ക് മാറ്റുന്നു, ആരാണോ ഒരു ‘ശരിയായ’ ഉത്തരം എന്താണെന്ന് നിർവചിക്കുന്നത് അവരിലേക്ക്.
വ്യവസായം ഇപ്പോൾ കേവലമായ കഴിവുകളിൽ നിന്ന് സുരക്ഷയിലേക്കും അലൈൻമെന്റിലേക്കും മാറിയിരിക്കുന്നു. ഇതൊരു സാങ്കേതിക മാറ്റമായി തോന്നാമെങ്കിലും, യഥാർത്ഥത്തിൽ ഇതൊരു രാഷ്ട്രീയ പ്രക്രിയയാണ്. ഒരു മോഡൽ സഹായകരവും ദോഷകരമല്ലാത്തതും സത്യസന്ധവുമായിരിക്കണമെന്ന് നമ്മൾ ആവശ്യപ്പെടുമ്പോൾ, വ്യത്യസ്ത സംസ്കാരങ്ങളിൽ വ്യത്യസ്ത അർത്ഥങ്ങളുള്ള വാക്കുകളാണ് നമ്മൾ ഉപയോഗിക്കുന്നത്. സാൻ ഫ്രാൻസിസ്കോയിലെ ഒരു ബോർഡ്റൂമിൽ സാർവത്രികമായി തോന്നുന്ന ഒരു മൂല്യം ജക്കാർത്തയിൽ അപമാനകരമായോ അപ്രസക്തമായോ തോന്നാം. ആഗോളതലവും പ്രാദേശിക മൂല്യങ്ങളും തമ്മിലുള്ള ഈ സംഘർഷമാണ് ആധുനിക ടെക് ലോകത്തെ പ്രധാന പ്രശ്നം. AI-യെ ഒരു സ്വയംഭരണ ശക്തിയായി കാണുന്നത് നിർത്തി, അതിനെ മനുഷ്യന്റെ ഉദ്ദേശ്യങ്ങളുടെ ഒരു വിപുലീകരണമായി കാണാൻ നമ്മൾ തുടങ്ങണം. ഇതിന് മാർക്കറ്റിംഗ് ഹൈപ്പുകൾക്കപ്പുറം തിരശ്ശീലയ്ക്ക് പിന്നിൽ നടക്കുന്ന യഥാർത്ഥ തീരുമാനങ്ങൾ എന്താണെന്ന് കാണേണ്ടതുണ്ട്.
മനുഷ്യ തീരുമാനങ്ങളുടെ മെക്കാനിക്കൽ കണ്ണാടി
യന്ത്രങ്ങളിലേക്ക് മൂല്യങ്ങൾ എങ്ങനെ കടന്നുവരുന്നു എന്ന് മനസ്സിലാക്കാൻ, Reinforcement Learning from Human Feedback അഥവാ RLHF നോക്കണം. ആയിരക്കണക്കിന് മനുഷ്യ കരാറുകാർ ഒരു മോഡലിൽ നിന്നുള്ള വ്യത്യസ്ത ഉത്തരങ്ങളെ റാങ്ക് ചെയ്യുന്ന പ്രക്രിയയാണിത്. അവർ ഒരു ഉത്തരത്തിന്റെ രണ്ട് പതിപ്പുകൾ കാണുകയും തങ്ങൾക്ക് കൂടുതൽ മാന്യമോ കൃത്യമോ എന്ന് തോന്നുന്നത് തിരഞ്ഞെടുക്കുകയും ചെയ്യുന്നു. കാലക്രമേണ, ഈ മനുഷ്യ മുൻഗണനകളുമായി ചില പാറ്റേണുകളെ ബന്ധിപ്പിക്കാൻ മോഡൽ പഠിക്കുന്നു. ഇതൊരു സത്യം തേടലല്ല. ഇതൊരു അംഗീകാരം തേടലാണ്. മോഡൽ അടിസ്ഥാനപരമായി അതിന്റെ മനുഷ്യ മൂല്യനിർണ്ണയക്കാരെ സന്തോഷിപ്പിക്കാൻ പരിശീലിപ്പിക്കപ്പെടുകയാണ്. ഇത് ധാർമ്മികതയുടെ ഒരു പുറംചട്ട സൃഷ്ടിക്കുന്നു, അത് യഥാർത്ഥത്തിൽ ഒരു പ്രത്യേക കൂട്ടം ആളുകൾ കേൾക്കാൻ ആഗ്രഹിക്കുന്ന കാര്യങ്ങളുടെ സ്ഥിതിവിവരക്കണക്ക് മാത്രമാണ്.
ഈ പ്രക്രിയ വലിയൊരു അളവിലുള്ള ആത്മനിഷ്ഠത കൊണ്ടുവരുന്നു. ലേബലർമാരിൽ ഭൂരിഭാഗവും ഒരു പ്രത്യേക ജനവിഭാഗത്തിൽ നിന്നുള്ളവരാണെങ്കിൽ, മോഡൽ സ്വാഭാവികമായും ആ ഗ്രൂപ്പിന്റെ സ്ലാങ്, സാമൂഹിക സൂചനകൾ, രാഷ്ട്രീയ പക്ഷപാതങ്ങൾ എന്നിവ സ്വീകരിക്കും. അതുകൊണ്ടാണ് പല ജനപ്രിയ മോഡലുകളുടെയും ആദ്യകാല പതിപ്പുകൾ പാശ്ചാത്യേതര സന്ദർഭങ്ങളിൽ ബുദ്ധിമുട്ടിയത്. അവ തകരാറിലായതല്ല. അവ പരിശീലിപ്പിച്ചതുപോലെ തന്നെ പ്രവർത്തിക്കുകയായിരുന്നു. അവരെ വിലയിരുത്താൻ പണം നൽകിയ ആളുകളുടെ മൂല്യങ്ങളാണ് അവ പ്രതിഫലിപ്പിച്ചത്. നീതി, പക്ഷപാതം തുടങ്ങിയ അമൂർത്തമായ ആശയങ്ങൾ കോഡിന്റെ കൃത്യമായ വരികളായി മാറുന്നത് ഈ തലത്തിലാണ്. പൊതുജനങ്ങൾ ഒരു ചാറ്റ് ഇന്റർഫേസ് കാണുന്നതിന് വളരെ മുമ്പേ നടക്കുന്ന, അധ്വാനം ആവശ്യമുള്ള ഒരു മാനുവൽ പ്രക്രിയയാണിത്. ഇത് ആധുനിക ഇന്റലിജൻസിന്റെ അദൃശ്യമായ അടിസ്ഥാന സൗകര്യമാണ്.
AI-ക്ക് ഒരു ആന്തരിക ധാർമ്മിക കോമ്പസ് ഉണ്ടെന്നതാണ് മിക്ക ആളുകളും ഈ വിഷയത്തിൽ വരുത്തുന്ന തെറ്റിദ്ധാരണ. അതിനില്ല. അതിനൊരു റിവാർഡ് ഫംഗ്ഷൻ മാത്രമേയുള്ളൂ. ഒരു മോഡൽ ഒരു ചോദ്യത്തിന് ഉത്തരം നൽകാൻ വിസമ്മതിക്കുമ്പോൾ, ആ വിഷയം തെറ്റാണെന്ന് അതിന് ‘തോന്നുന്നത്’ കൊണ്ടല്ല. അതിന്റെ ട്രെയിനിംഗ് ഡാറ്റ ആ പ്രത്യേക പാറ്റേൺ ഒഴിവാക്കാൻ കനത്ത രീതിയിൽ ക്രമീകരിച്ചിട്ടുള്ളതുകൊണ്ടാണ്. ഈ വ്യത്യാസം വളരെ പ്രധാനമാണ്. യന്ത്രം ധാർമ്മികമാണെന്ന് നമ്മൾ വിശ്വസിച്ചാൽ, നിയമങ്ങൾ നിശ്ചയിക്കുന്ന ആളുകളെ ചോദ്യം ചെയ്യുന്നത് നമ്മൾ നിർത്തും. ഓരോ വിസമ്മതവും ഓരോ സഹായകരമായ നുറുങ്ങും ഒരു മനുഷ്യ തീരുമാനത്തെ അടിസ്ഥാനമാക്കിയുള്ള പ്രോഗ്രാം ചെയ്ത പ്രതികരണമാണെന്ന് നമ്മൾ തിരിച്ചറിയണം. ഇത് തിരിച്ചറിയുന്നതിലൂടെ, ആരാണ് ഈ നിയമങ്ങൾ നിശ്ചയിക്കുന്നതെന്നും എന്തുകൊണ്ടാണെന്നും മികച്ച ചോദ്യങ്ങൾ ചോദിക്കാൻ നമുക്ക് തുടങ്ങാം.
ലേറ്റന്റ് സ്പേസിലെ ജിയോപൊളിറ്റിക്സ്
ഈ തീരുമാനങ്ങളുടെ ആഘാതം ആഗോളമാണ്. മുൻനിര AI മോഡലുകളിൽ ഭൂരിഭാഗവും പ്രധാനമായും ഇന്റർനെറ്റിലെ ഇംഗ്ലീഷ് ഭാഷാ ഡാറ്റയിലാണ് പരിശീലിപ്പിക്കപ്പെടുന്നത്. ഇത് പാശ്ചാത്യ മൂല്യങ്ങൾ ഡിഫോൾട്ടായ ഒരു ഡിജിറ്റൽ ഏകസംസ്കാരം സൃഷ്ടിക്കുന്നു. ലോകത്തിന്റെ മറ്റൊരു ഭാഗത്തുള്ള ഒരു ഉപയോക്താവ് കുടുംബ ബന്ധങ്ങളെക്കുറിച്ചോ നിയമപരമായ കാര്യങ്ങളെക്കുറിച്ചോ ഉപദേശം ചോദിക്കുമ്പോൾ, അവർക്ക് ലഭിക്കുന്നത് ഒരു പ്രത്യേക സാംസ്കാരിക ലെൻസിലൂടെ ഫിൽട്ടർ ചെയ്ത ഉത്തരങ്ങളാണ്. ഇതൊരു ഭാഷാ വിവർത്തനത്തിന്റെ കാര്യം മാത്രമല്ല. ഇതൊരു സാംസ്കാരിക വിവർത്തനത്തിന്റെ കാര്യമാണ്. ശ്രേണി, സ്വകാര്യത, സമൂഹം എന്നിവയുടെ സൂക്ഷ്മതകൾ ലോകമെമ്പാടും വളരെ വ്യത്യസ്തമാണ്, എന്നാൽ മോഡലുകൾ പലപ്പോഴും എല്ലാവർക്കും ഒരേപോലെയുള്ള പരിഹാരമാണ് നൽകുന്നത്. ‘ശരിയായ’ ചിന്തയുടെ ഈ കേന്ദ്രീകരണം ആഗോള പ്രസംഗങ്ങളിൽ വലിയ സ്വാധീനം ചെലുത്തുന്ന ഒരു പുതിയ തരം സോഫ്റ്റ് പവർ ആണ്.
ഇതിനോടുള്ള പ്രതികരണമായി പരമാധികാര AI മോഡലുകൾ വികസിപ്പിക്കാനുള്ള തിരക്ക് നമ്മൾ കാണുന്നുണ്ട്. ഫ്രാൻസ്, യുഎഇ, ഇന്ത്യ തുടങ്ങിയ രാജ്യങ്ങൾ തങ്ങളുടെ സവിശേഷമായ സാംസ്കാരിക മൂല്യങ്ങൾ പ്രതിനിധീകരിക്കപ്പെടുന്നുവെന്ന് ഉറപ്പാക്കാൻ സ്വന്തം അടിസ്ഥാന സൗകര്യങ്ങളിൽ നിക്ഷേപം നടത്തുന്നു. ഒരു വിദേശ മോഡലിനെ ആശ്രയിക്കുക എന്നാൽ ഒരു വിദേശ ലോകവീക്ഷണം ഇറക്കുമതി ചെയ്യുകയാണെന്ന് അവർ തിരിച്ചറിയുന്നു. AI-യുടെ ലേറ്റന്റ് സ്പേസിലുള്ള നിയന്ത്രണം ഭൗതിക അതിർത്തികളിലുള്ള നിയന്ത്രണം പോലെ തന്നെ പ്രധാനമാണെന്ന് സർക്കാരുകൾ തിരിച്ചറിയുന്നതോടെ ഈ പ്രവണത വേഗത്തിലായി. ഈ മോഡലുകളെ പരിശീലിപ്പിക്കാൻ ഉപയോഗിക്കുന്ന ഡാറ്റ ഒരു ഡിജിറ്റൽ ചരിത്ര പുസ്തകമായി പ്രവർത്തിക്കുന്നു. ആ പുസ്തകത്തിൽ ഒരു കാഴ്ചപ്പാട് മാത്രമേയുള്ളൂവെങ്കിൽ, ലഭിക്കുന്ന ഇന്റലിജൻസ് സ്വാഭാവികമായും പരിമിതമായിരിക്കും. അതുകൊണ്ടാണ് വൈവിധ്യമാർന്ന ഡാറ്റാ സെറ്റുകൾക്കായുള്ള ആവശ്യം വെറുമൊരു വൈവിധ്യ സംരംഭം മാത്രമല്ല. ആഗോളതലത്തിൽ കൃത്യതയ്ക്കും പ്രസക്തിക്കും ഇതൊരു ആവശ്യകതയാണ്.
അന്താരാഷ്ട്ര സഹകരണത്തിന് വലിയ പ്രാധാന്യമുണ്ട്. ഓരോ രാജ്യവും സ്വന്തം മൂല്യങ്ങളുമായി സ്വന്തം AI നിർമ്മിക്കുകയാണെങ്കിൽ, ഡിജിറ്റൽ അതിരുകൾക്കപ്പുറം ആശയവിനിമയം നടത്താൻ നമുക്ക് ബുദ്ധിമുട്ടായിരിക്കും. എന്നിരുന്നാലും, ഇതിന് പകരമുള്ളത് ഒരു താഴ്വരയിലെ കുറച്ച് കമ്പനികൾ കോടിക്കണക്കിന് ആളുകൾക്ക് ധാർമ്മിക അതിരുകൾ നിശ്ചയിക്കുന്ന ഒരു ലോകമാണ്. രണ്ടും തികഞ്ഞതല്ല. അടിസ്ഥാന മനുഷ്യാവകാശങ്ങളെക്കുറിച്ചുള്ള പൊതുവായ ധാരണ നിലനിർത്തിക്കൊണ്ടുതന്നെ പ്രാദേശിക സൂക്ഷ്മതകൾക്ക് ഇടം നൽകുക എന്നതാണ് വെല്ലുവിളി. മികച്ച ഹാർഡ്വെയർ കൊണ്ട് പരിഹരിക്കാൻ കഴിയാത്ത പ്രശ്നമാണിത്. ഇതിന് അന്താരാഷ്ട്ര നയതന്ത്രവും ഇന്നത്തെ ടെക് വ്യവസായത്തെ നയിക്കുന്ന പ്രോത്സാഹനങ്ങളെക്കുറിച്ചുള്ള വ്യക്തമായ കാഴ്ചപ്പാടും ആവശ്യമാണ്. AI എത്തിക്സ് ആൻഡ് ഗവേണൻസ് എന്നതിനെക്കുറിച്ചുള്ള ഞങ്ങളുടെ സമഗ്രമായ ഗൈഡിൽ നിങ്ങൾക്ക് ഈ വെല്ലുവിളികളെക്കുറിച്ച് കൂടുതൽ കണ്ടെത്താം.
തീരുമാനങ്ങൾ ലൂപ്പിൽ
സാറ എന്ന ഹയറിംഗ് മാനേജരുടെ ഒരു ദിവസം ചിന്തിക്കുക. പുതിയൊരു എഞ്ചിനീയറിംഗ് റോളിലേക്ക് നൂറുകണക്കിന് റെസ്യൂമുകൾ പരിശോധിക്കാൻ അവർ ഒരു AI ടൂൾ ഉപയോഗിക്കുന്നു. ‘ഉയർന്ന സാധ്യതയുള്ള’ ഉദ്യോഗാർത്ഥികളെ കണ്ടെത്താനാണ് ടൂൾ പരിശീലിപ്പിച്ചിരിക്കുന്നത്. ഉപരിതലത്തിൽ ഇത് കാര്യക്ഷമമായി തോന്നാം. എന്നാൽ ഇന്റർഫേസിന് താഴെ, മുൻകാല ഹയറിംഗ് ഡാറ്റയിൽ നിന്ന് പഠിച്ച മൂല്യങ്ങളാണ് ടൂൾ പ്രയോഗിക്കുന്നത്. കമ്പനി പ്രധാനമായും മൂന്ന് പ്രത്യേക സർവ്വകലാശാലകളിൽ നിന്നുള്ളവരെയാണ് നിയമിച്ചതെന്ന് ചരിത്രപരമായ ഡാറ്റ കാണിക്കുന്നുവെങ്കിൽ, AI ആ സ്കൂളുകൾക്ക് മുൻഗണന നൽകും. അത് മനുഷ്യന്റെ അർത്ഥത്തിൽ ‘വംശീയവാദിയോ’ ‘എലിറ്റിസ്റ്റോ’ അല്ല. വിലപ്പെട്ടതെന്ന് അതിനോട് പറഞ്ഞ പാറ്റേണിനായി അത് ഒപ്റ്റിമൈസ് ചെയ്യുകയാണ്. പരമ്പരാഗതമല്ലാത്ത പശ്ചാത്തലങ്ങളിൽ നിന്നുള്ള മിടുക്കരായ ഉദ്യോഗാർത്ഥികളെ ഈ ടൂൾ ഫിൽട്ടർ ചെയ്യുന്നുണ്ടെന്ന് സാറ പോലും തിരിച്ചറിഞ്ഞെന്നു വരില്ല, കാരണം അവർ ട്രെയിനിംഗ് ഡാറ്റയുടെ ‘മൂല്യ’ പ്രൊഫൈലുമായി യോജിക്കുന്നില്ല.
ഈ സാഹചര്യം എല്ലാ ദിവസവും ആയിരക്കണക്കിന് ഓഫീസുകളിൽ നടക്കുന്നു. മൂല്യങ്ങൾ അമൂർത്തമല്ല. ഒരു ജോലി ലഭിക്കുന്നതും അൽഗോരിതം അവഗണിക്കുന്നതും തമ്മിലുള്ള വ്യത്യാസമാണത്. ക്രെഡിറ്റ് സ്കോറിംഗ്, മെഡിക്കൽ ട്രയാജ്, ജുഡീഷ്യൽ സെന്റൻസിംഗ് എന്നിവയ്ക്കും ഇതേ ലോജിക് ബാധകമാണ്. ഓരോ കേസിലും, ‘റിസ്ക്’ അല്ലെങ്കിൽ ‘മെറിറ്റ്’ പോലുള്ള ഒരു മാനുഷിക മൂല്യം ഒരു നമ്പറായി മാറുന്നു. അപകടം എന്തെന്നാൽ, ഈ നമ്പറുകളെ നമ്മൾ വസ്തുനിഷ്ഠമായ സത്യങ്ങളായി കാണുന്നു, അല്ലാതെ അവ യഥാർത്ഥത്തിൽ ആത്മനിഷ്ഠമായ തീരുമാനങ്ങളാണെന്ന് തിരിച്ചറിയുന്നില്ല. ധാർമ്മിക വിധി പറയുന്ന കഠിനമായ ജോലി നമ്മൾ യന്ത്രത്തിന് വിട്ടുകൊടുക്കുന്നു, കാരണം അത് വേഗതയുള്ളതും കുറഞ്ഞ അസ്വസ്ഥതയുണ്ടാക്കുന്നതുമാണ്. എന്നാൽ യന്ത്രം നമ്മുടെ നിലവിലുള്ള പക്ഷപാതങ്ങളെ നമുക്ക് എളുപ്പത്തിൽ നിരീക്ഷിക്കാൻ കഴിയാത്ത അളവിൽ ഓട്ടോമേറ്റ് ചെയ്യുക മാത്രമാണ് ചെയ്യുന്നത്.
നമ്മൾ ദിവസവും ഉപയോഗിക്കുന്ന ഉൽപ്പന്നങ്ങൾ ഈ വാദങ്ങളെ യാഥാർത്ഥ്യമാക്കുന്നു. ഒരു ഫോട്ടോ എഡിറ്റിംഗ് ആപ്പ് ഒരാളുടെ ചർമ്മത്തിന്റെ നിറം ‘മെച്ചപ്പെടുത്താൻ’ സ്വയമേവ വെളുപ്പിക്കുമ്പോൾ, അത് ഒരു മൂല്യത്തെയാണ് പ്രകടിപ്പിക്കുന്നത്. ഒരു നാവിഗേഷൻ ആപ്പ് ‘കുറ്റകൃത്യങ്ങൾ കൂടുതലുള്ള’ പ്രദേശങ്ങൾ ഒഴിവാക്കുമ്പോൾ, അത് സുരക്ഷയെയും സാമൂഹിക വർഗ്ഗത്തെയും കുറിച്ച് ഒരു മൂല്യനിർണ്ണയം നടത്തുകയാണ്. ഇവ സാങ്കേതിക പിശകുകളല്ല. മനുഷ്യർ നൽകിയ ഡാറ്റയുടെയും റിവാർഡ് ഫംഗ്ഷനുകളുടെയും യുക്തിപരമായ നിഗമനങ്ങളാണിവ. നമ്മുടെ സോഫ്റ്റ്വെയർ നിരന്തരം നമുക്ക് വേണ്ടി ധാർമ്മിക തീരുമാനങ്ങൾ എടുക്കുന്ന ഒരു ലോകത്താണ് നമ്മൾ ജീവിക്കുന്നത്. മിക്കപ്പോഴും, എന്തെങ്കിലും തെറ്റ് സംഭവിക്കുന്നത് വരെ ഇത് സംഭവിക്കുന്നുണ്ടെന്ന് നമ്മൾ ശ്രദ്ധിക്കാറില്ല. യഥാർത്ഥത്തിൽ വെറും അനുമാനങ്ങൾ മാത്രം ഉൾക്കൊള്ളുന്ന ‘സഹായകരമായ’ ഫീച്ചറുകളെക്കുറിച്ച് നമ്മൾ കൂടുതൽ വിമർശനാത്മകമായി ചിന്തിക്കണം.
വ്യവസായത്തിലെ സമീപകാല മാറ്റം ‘സ്റ്റിയറബിലിറ്റി’യിലേക്കുള്ള നീക്കമാണ്. കമ്പനികൾ ഇപ്പോൾ ഉപയോക്താക്കൾക്ക് അവരുടെ AI-യുടെ ‘വ്യക്തിത്വ’ത്തിലോ ‘മൂല്യങ്ങളിലോ’ കൂടുതൽ നിയന്ത്രണം നൽകുന്നു. നിങ്ങൾക്ക് ഒരു മോഡലിനോട് ‘കൂടുതൽ ക്രിയേറ്റീവ്’ ആകാനോ ‘കൂടുതൽ പ്രൊഫഷണൽ’ ആകാനോ പറയാം. ഇത് ശാക്തീകരണമായി തോന്നാമെങ്കിലും, ഇത് യഥാർത്ഥത്തിൽ ഉത്തരവാദിത്തം ഉപയോക്താവിലേക്ക് തിരികെ മാറ്റുന്നു. AI പക്ഷപാതപരമായ ഉത്തരം നൽകിയാൽ, ഉപയോക്താവ് പാരാമീറ്ററുകൾ ശരിയായി സജ്ജീകരിച്ചില്ലെന്ന് കമ്പനിക്ക് വാദിക്കാം. ഇത് ഉത്തരവാദിത്തത്തിന്റെ ഒരു സങ്കീർണ്ണമായ വലയം സൃഷ്ടിക്കുന്നു, അവിടെ ഔട്ട്പുട്ടിന് ആരും യഥാർത്ഥത്തിൽ ഉത്തരവാദികളല്ല. നമ്മൾ നിശ്ചിത മൂല്യങ്ങളുടെ ലോകത്ത് നിന്ന് ദ്രാവകമായ, ഉപയോക്താവ് നിർവചിക്കുന്ന മൂല്യങ്ങളുടെ ലോകത്തേക്ക് മാറുകയാണ്, ഇത് അതിന്റേതായ റിസ്കുകളും റിവാർഡുകളും കൊണ്ടുവരുന്നു.
ഓട്ടോമേറ്റഡ് ധാർമ്മികതയുടെ വില
‘സുരക്ഷിതമായ’ AI എന്ന ആശയത്തിൽ നമ്മൾ സോക്രട്ടീസിന്റെ സംശയം പ്രയോഗിക്കണം. ഒരു മോഡൽ പൂർണ്ണമായും അലൈൻഡ് ആണെങ്കിൽ, അത് ആരുടെ മൂല്യങ്ങളുമായാണ് അലൈൻഡ് ആയിരിക്കുന്നത്? ഇന്ന് നമ്മൾ കാണുന്ന സുരക്ഷാ ഫിൽട്ടറുകൾക്ക് മറഞ്ഞിരിക്കുന്ന ഒരു വിലയുണ്ട്. പലപ്പോഴും, ഈ ഫിൽട്ടറുകൾ വികസ്വര രാജ്യങ്ങളിലെ കുറഞ്ഞ വേതനമുള്ള തൊഴിലാളികളെ ഉപയോഗിച്ചാണ് നിർമ്മിക്കുന്നത്. ഇന്റർനെറ്റിലെ ഏറ്റവും ഭയാനകമായ ഉള്ളടക്കം വായിക്കാൻ ആളുകൾക്ക് മണിക്കൂറിന് കുറച്ച് ഡോളർ നൽകുന്നു, അങ്ങനെ യന്ത്രത്തിന് അത് ഒഴിവാക്കാൻ പഠിക്കാം. മൂല്യനിർണ്ണയത്തിന്റെ മാനസികാഘാതം നമ്മൾ ഗ്ലോബൽ സൗത്തിലേക്ക് ഔട്ട്സോഴ്സ് ചെയ്യുകയാണ്. അതിന്റെ സുരക്ഷ ചൂഷണം ചെയ്യപ്പെട്ട തൊഴിലാളികളുടെ പുറത്ത് കെട്ടിപ്പടുത്തിട്ടുണ്ടെങ്കിൽ ഒരു AI യഥാർത്ഥത്തിൽ ‘ധാർമ്മികമാണോ’? ടെക് വ്യവസായം നേരിട്ട് ഉത്തരം നൽകാൻ ഇഷ്ടപ്പെടാത്ത ഒരു ചോദ്യമാണിത്.
മറ്റൊരു പരിമിതി ‘ധാർമ്മികതയുടെ മിഥ്യാധാരണ’ ആണ്. ഈ മോഡലുകൾ അനുകരണത്തിൽ വളരെ മികച്ചതായതിനാൽ, ധാർമ്മികതയെക്കുറിച്ച് സംസാരിക്കുമ്പോൾ അവ വളരെ ബോധ്യപ്പെടുത്തുന്നതായി തോന്നാം. തത്ത്വചിന്തകരെയും നിയമപരമായ മുൻവിധികളെയും എളുപ്പത്തിൽ ഉദ്ധരിക്കാൻ അവയ്ക്ക് കഴിയും. എന്നാൽ അതിലൊന്നും അവയ്ക്ക് മനസ്സിലാകുന്നില്ല. അവ ഒരു ക്രമത്തിലെ അടുത്ത ടോക്കൺ പ്രവചിക്കുക മാത്രമാണ് ചെയ്യുന്നത്.
ഉള്ളടക്കം ഗവേഷണം ചെയ്യാനും എഴുതാനും എഡിറ്റ് ചെയ്യാനും വിവർത്തനം ചെയ്യാനും BotNews.today AI ടൂളുകൾ ഉപയോഗിക്കുന്നു. വിവരങ്ങൾ ഉപയോഗപ്രദവും വ്യക്തവും വിശ്വസനീയവുമാക്കാൻ ഞങ്ങളുടെ ടീം ഈ പ്രക്രിയ അവലോകനം ചെയ്യുകയും മേൽനോട്ടം വഹിക്കുകയും ചെയ്യുന്നു.
- രാഷ്ട്രീയം അല്ലെങ്കിൽ മതം പോലുള്ള ആത്മനിഷ്ഠമായ വിഷയങ്ങൾക്ക് ‘ഗ്രൗണ്ട് ട്രൂത്ത്’ ആര് നിർവചിക്കുന്നു?
- ഒരു സ്വകാര്യ കോർപ്പറേഷന്റെ മൂല്യങ്ങൾ ഒരു ജനാധിപത്യ സമൂഹത്തിന്റെ മൂല്യങ്ങളുമായി സംഘർഷത്തിലാകുമ്പോൾ എന്ത് സംഭവിക്കും?
- പരിശീലന വേളയിൽ യഥാർത്ഥത്തിൽ എന്താണ് പ്രതിഫലം നൽകിയതെന്ന് കാണാൻ RLHF-ന്റെ ‘ബ്ലാക്ക് ബോക്സ്’ എങ്ങനെ ഓഡിറ്റ് ചെയ്യാം?
- ലോകം തന്നെ അന്യായമാണെങ്കിൽ ഒരു യന്ത്രത്തിന് എപ്പോഴെങ്കിലും പൂർണ്ണമായും ‘നീതിപൂർവ്വം’ പ്രവർത്തിക്കാൻ കഴിയുമോ?
നിയന്ത്രണങ്ങളുടെ വാസ്തുവിദ്യ
പവർ യൂസർമാർക്ക്, ഒരു AI-യുടെ ‘മൂല്യങ്ങൾ’ പലപ്പോഴും സിസ്റ്റം പ്രോംപ്റ്റിലും API കോൺഫിഗറേഷനിലുമാണ് കാണപ്പെടുന്നത്. അനുഭവത്തിന്റെ 80 ശതമാനത്തെ നിയന്ത്രിക്കുന്ന 20 ശതമാനം സാങ്കേതികവിദ്യയാണിത്. ഒരു API വഴി നിങ്ങൾ ഒരു മോഡലുമായി ഇടപഴകുമ്പോൾ, നിങ്ങൾക്ക് ‘ടെമ്പറേച്ചർ’, ‘ടോപ്പ്-പി’ ക്രമീകരണങ്ങൾ കാണാൻ കഴിയും. ഇവ വെറും സാങ്കേതിക നോബുകൾ മാത്രമല്ല. ഏറ്റവും സാധ്യതയുള്ള (പലപ്പോഴും ഏറ്റവും പക്ഷപാതപരമായ) പ്രതികരണത്തിൽ നിന്ന് മോഡലിന് എത്രത്തോളം വ്യതിചലിക്കാം എന്ന് അവ നിയന്ത്രിക്കുന്നു. കുറഞ്ഞ ടെമ്പറേച്ചർ മോഡലിനെ കൂടുതൽ പ്രവചിക്കാവുന്നതും ‘സുരക്ഷിതവുമാക്കുന്നു’, അതേസമയം ഉയർന്ന ടെമ്പറേച്ചർ കൂടുതൽ ‘ക്രിയേറ്റിവിറ്റി’ അനുവദിക്കുന്നു, എന്നാൽ കൂടുതൽ റിസ്കും ഉണ്ടാക്കുന്നു. മൂല്യനിർണ്ണയത്തിലെ പ്രതിരോധത്തിന്റെ ആദ്യ നിരയാണ് ഈ ക്രമീകരണങ്ങൾ.
വർക്ക്ഫ്ലോ ഇന്റഗ്രേഷനിലാണ് കാര്യങ്ങൾ യഥാർത്ഥത്തിൽ നടപ്പിലാകുന്നത്. ഉപയോക്താവിനും മോഡലിനും ഇടയിൽ ഇരിക്കുന്ന ‘ഗാർഡ്റെയിൽ’ ലെയറുകൾ ഡെവലപ്പർമാർ ഇപ്പോൾ നിർമ്മിക്കുന്നു. ഈ ലെയറുകൾ ഇൻപുട്ടും ഔട്ട്പുട്ടും മൂല്യ ലംഘനത്തിനായി പരിശോധിക്കാൻ സെക്കൻഡറി മോഡലുകൾ ഉപയോഗിക്കുന്നു. ഇത് നിയന്ത്രണത്തിന്റെ മൾട്ടി-ടയേർഡ് സിസ്റ്റം സൃഷ്ടിക്കുന്നു. എന്നിരുന്നാലും, ഈ ഗാർഡ്റെയിലുകൾക്ക് അവരുടേതായ API പരിധികളും ലേറ്റൻസി ചെലവുകളുമുണ്ട്. ഒരു സങ്കീർണ്ണമായ സുരക്ഷാ സ്റ്റാക്കിന് ഒരു പ്രതികരണം നൽകാൻ കുറച്ച് സെക്കൻഡുകൾ വൈകിപ്പിക്കാൻ കഴിയും, ഇത് പ്രൊഡക്ഷൻ എൻവയോൺമെന്റിൽ വലിയൊരു വിട്ടുവീഴ്ചയാണ്. കൂടാതെ, ഈ മോഡലുകളുടെ ലോക്കൽ സ്റ്റോറേജ് കൂടുതൽ സാധാരണമായിക്കൊണ്ടിരിക്കുകയാണ്. ഒരു മോഡൽ ലോക്കലായി റൺ ചെയ്യുന്നത് കോർപ്പറേറ്റ് ഫിൽട്ടറുകളെ മറികടക്കാൻ ഉപയോക്താവിനെ അനുവദിക്കുന്നു, എന്നാൽ ഇതിന് ഗണ്യമായ VRAM-ഉം GGUF അല്ലെങ്കിൽ EXL2 പോലുള്ള ഒപ്റ്റിമൈസ് ചെയ്ത ക്വാണ്ടൈസേഷൻ സാങ്കേതികതകളും ആവശ്യമാണ്.
യഥാർത്ഥ ഗീക്ക് ലെവൽ വെല്ലുവിളി മൂല്യങ്ങൾക്കായി ‘ഫൈൻ ട്യൂണിംഗ്’ ആണ്. ഇതിൽ ഒരു ബേസ് മോഡൽ എടുത്ത് പ്രത്യേക ഉദാഹരണങ്ങളുടെ ചെറിയ, ഉയർന്ന നിലവാരമുള്ള ഡാറ്റാസെറ്റിൽ പരിശീലിപ്പിക്കുന്നത് ഉൾപ്പെടുന്നു. കമ്പനികൾ തങ്ങളുടെ ബ്രാൻഡ് വോയിസ് അല്ലെങ്കിൽ നിയമപരമായ ആവശ്യകതകൾ പ്രതിഫലിപ്പിക്കുന്ന AI നിർമ്മിക്കുന്നത് ഇങ്ങനെയാണ്. മോഡലിന്റെ വെയ്റ്റുകളിലേക്ക് മൂല്യങ്ങൾ ‘ഹാർഡ് കോഡ്’ ചെയ്യാനുള്ള വഴിയാണിത്. എന്നാൽ ഈ പ്രക്രിയ ചെലവേറിയതാണ്, കൂടാതെ ഗ്രേഡിയന്റ് ഡിസന്റ്, ലോസ് ഫംഗ്ഷനുകൾ എന്നിവയെക്കുറിച്ച് ആഴത്തിലുള്ള അറിവ് ആവശ്യമാണ്. മിക്ക ഉപയോക്താക്കളും ഇത് ചെയ്യില്ല, എന്നാൽ ചെയ്യുന്നവർ യന്ത്രത്തിന്റെ ‘ധാർമ്മികതയെ’ യഥാർത്ഥത്തിൽ നിയന്ത്രിക്കുന്നവരാണ്. അവരുടെ പ്രത്യേക ഡിജിറ്റൽ ഇക്കോസിസ്റ്റത്തിനുള്ളിൽ എന്താണ് സാധ്യമായതെന്ന് അവർ അതിരുകൾ നിർവചിക്കുകയാണ്. സാങ്കേതിക നിയന്ത്രണങ്ങളാണ് യന്ത്രത്തിന്റെ എത്തിക്സിന്റെ യഥാർത്ഥ പരിധികൾ.
ഞങ്ങൾ ഉൾപ്പെടുത്തണമെന്ന് നിങ്ങൾ കരുതുന്ന ഒരു AI സ്റ്റോറിയോ, ടൂളോ, ട്രെൻഡോ, ചോദ്യമോ നിങ്ങളുടെ പക്കലുണ്ടോ? നിങ്ങളുടെ ലേഖന ആശയം ഞങ്ങൾക്ക് അയയ്ക്കുക — അത് കേൾക്കാൻ ഞങ്ങൾ ആഗ്രഹിക്കുന്നു.
അവസാനത്തെ മാനുഷിക അവകാശം
ദിവസാവസാനം, AI ഒരു ഉപകരണമാണ്, ദൈവമല്ല. അതിന് മൂല്യങ്ങളില്ല; അതിന് നിർദ്ദേശങ്ങളുണ്ട്. മനുഷ്യരെപ്പോലെയുള്ള ഇടപെടലുകളിലേക്കുള്ള സമീപകാല മാറ്റം ഈ വസ്തുതയെ മറച്ചുവെച്ചു, യന്ത്രത്തിന്റെ ‘വിധി’യിൽ വിശ്വസിക്കാൻ നമ്മളെ കൂടുതൽ പ്രേരിപ്പിക്കുന്നു. ഈ പ്രവണതയെ നമ്മൾ ചെറുക്കണം. ധാർമ്മിക ഫലങ്ങളുടെ ഉത്തരവാദിത്തം ഈ സിസ്റ്റങ്ങളെ രൂപകൽപ്പന ചെയ്യുകയും വിന്യസിക്കുകയും ഉപയോഗിക്കുകയും ചെയ്യുന്ന മനുഷ്യരിൽ തന്നെ ഉറച്ചുനിൽക്കുന്നു. ‘ദുഷ്ടനായ’ AI-യെക്കുറിച്ച് നമ്മൾ ആശങ്കപ്പെടുന്നതിനേക്കാൾ, സ്വന്തം പക്ഷപാതങ്ങളെ ന്യായീകരിക്കാൻ ‘ന്യൂട്രൽ’ AI ഉപയോഗിക്കുന്ന മനുഷ്യരെക്കുറിച്ച് നമ്മൾ ആശങ്കപ്പെടണം. യന്ത്രം അതിന്റെ ഉടമയുടെ ഉദ്ദേശ്യങ്ങൾ പോലെ മാത്രമേ മികച്ചതാകൂ.
തുടങ്ങിയതിനേക്കാൾ മൂർച്ചയുള്ള ചോദ്യങ്ങളുമായാണ് നമ്മൾ അവശേഷിക്കുന്നത്. AI നമ്മുടെ ജീവിതത്തിൽ കൂടുതൽ സംയോജിപ്പിക്കപ്പെടുമ്പോൾ, നമ്മുടെ മാനവികതയുടെ ഏതെല്ലാം ഭാഗങ്ങൾ ഓട്ടോമേറ്റ് ചെയ്യാൻ നമ്മൾ തയ്യാറാണെന്നും ഏതെല്ലാം ഭാഗങ്ങൾ നമ്മൾ സംരക്ഷിക്കണമെന്നും നമ്മൾ തീരുമാനിക്കേണ്ടതുണ്ട്. മികച്ച സെർച്ച് റിസൾട്ടുകളോ വേഗതയേറിയ ഇമെയിലുകളോ മാത്രമല്ല ഇതിലെ കാര്യം. നമ്മൾ ഒരു വർഗ്ഗമെന്ന നിലയിൽ ആരാണെന്നും എങ്ങനെയുള്ള ലോകമാണ് നമ്മൾ നിർമ്മിക്കാൻ ആഗ്രഹിക്കുന്നതെന്നും ആണ് പ്രധാനം. സാങ്കേതികവിദ്യയുടെ സൗകര്യം അതിന്റെ ഉപയോഗത്തിന്റെ പ്രത്യാഘാതങ്ങളെ കാണാതിരിക്കാൻ നമ്മളെ അനുവദിക്കരുത്. AI കാലഘട്ടം മാനുഷിക മൂല്യങ്ങളുടെ അവസാനമല്ല. അത് നമ്മുടെ ചരിത്രത്തിലെ പുതിയതും കൂടുതൽ ബുദ്ധിമുട്ടുള്ളതുമായ ഒരു അധ്യായത്തിന്റെ തുടക്കമാണ്. ഉദ്ദേശ്യത്തോടെ അത് എഴുതാൻ നമ്മൾ തയ്യാറായിരിക്കണം.
Editor’s note: We created this site as a multilingual AI news and guides hub for people who are not computer geeks, but still want to understand artificial intelligence, use it with more confidence, and follow the future that is already arriving.
ഒരു പിശകോ തിരുത്തേണ്ട എന്തെങ്കിലും കണ്ടെത്തിയോ? ഞങ്ങളെ അറിയിക്കുക.