നിങ്ങൾ ഒരു ഓപ്പൺ മോഡൽ ഡൗൺലോഡ് ചെയ്തില്ലെങ്കിലും അവ പ്രധാനമാകുന്നത് എന്തുകൊണ്ട്?
ആധുനിക കമ്പ്യൂട്ടിംഗിന്റെ അദൃശ്യമായ സുരക്ഷാ കവചം
ഓപ്പൺ മോഡലുകൾ ഇന്നത്തെ ലോകത്തിന്റെ നിശബ്ദമായ അടിത്തറയാണ്. നിങ്ങൾ Hugging Face-ൽ നിന്ന് ഒരു ഫയൽ പോലും ഡൗൺലോഡ് ചെയ്തില്ലെങ്കിലും, ഈ മോഡലുകളാണ് നിങ്ങൾ ഉപയോഗിക്കുന്ന പ്രൊപ്രൈറ്ററി സർവീസുകളുടെ വിലയും അവയിലെ പുതിയ ഫീച്ചറുകളുടെ വേഗതയും തീരുമാനിക്കുന്നത്. അവ ഒരു മത്സര വേദി ഒരുക്കുന്നു. അവയില്ലായിരുന്നെങ്കിൽ, ഈ നൂറ്റാണ്ടിലെ ഏറ്റവും പ്രധാനപ്പെട്ട സാങ്കേതികവിദ്യയിൽ ചില കമ്പനികൾക്ക് മാത്രമായി വലിയ കുത്തക ഉണ്ടാകുമായിരുന്നു. ഓപ്പൺ മോഡലുകൾ നൽകുന്ന അടിസ്ഥാനപരമായ കഴിവുകൾ വലിയ കമ്പനികളെ നിരന്തരം പുതുമകൾ കൊണ്ടുവരാനും വില നിയന്ത്രിക്കാനും പ്രേരിപ്പിക്കുന്നു. ഇത് വെറുമൊരു വിനോദമോ ഗവേഷകർക്ക് മാത്രമുള്ള ഒന്നോ അല്ല. ടെക് വ്യവസായത്തിലെ അധികാരം എങ്ങനെ വിഭജിക്കപ്പെടുന്നു എന്നതിലെ വലിയൊരു മാറ്റമാണിത്. Llama പോലുള്ള ഒരു മോഡൽ പുറത്തിറങ്ങുമ്പോൾ, സാധാരണ ഹാർഡ്വെയറുകളിൽ എന്ത് ചെയ്യാൻ കഴിയും എന്നതിന് അത് പുതിയൊരു മാതൃക സൃഷ്ടിക്കുന്നു. ഈ സമ്മർദ്ദം നിങ്ങൾ ദിവസവും ഉപയോഗിക്കുന്ന ക്ലോസ്ഡ് മോഡലുകളെ മികച്ചതാക്കി മാറ്റുന്നു. ഈ ഓപ്പൺ രീതിയുടെ പ്രത്യേകതകൾ മനസ്സിലാക്കുന്നത് ഈ മേഖല എങ്ങോട്ടാണ് പോകുന്നത് എന്ന് തിരിച്ചറിയാനുള്ള ആദ്യ പടിയാണ്.
‘ഓപ്പൺ’ എന്ന മാർക്കറ്റിംഗ് തന്ത്രത്തിന്റെ പൊരുൾ തേടി
ഈ കാര്യത്തിൽ ‘ഓപ്പൺ’ എന്നാൽ എന്താണെന്നതിനെക്കുറിച്ച് വലിയ ആശയക്കുഴപ്പമുണ്ട്. യഥാർത്ഥ ഓപ്പൺ സോഴ്സ് സോഫ്റ്റ്വെയർ ആർക്കും അതിന്റെ കോഡ് കാണാനും മാറ്റം വരുത്താനും വിതരണം ചെയ്യാനും അനുവാദം നൽകുന്നു. എന്നാൽ ലാർജ് ലാംഗ്വേജ് മോഡലുകളുടെ കാര്യത്തിൽ ഈ നിർവചനം അല്പം സങ്കീർണ്ണമാണ്. ആളുകൾ ഓപ്പൺ സോഴ്സ് എന്ന് വിളിക്കുന്ന മിക്ക മോഡലുകളും യഥാർത്ഥത്തിൽ ഓപ്പൺ വെയ്റ്റ് (open weight) മോഡലുകളാണ്. ഇതിനർത്ഥം കമ്പനി മോഡലിന്റെ പരിശീലനം കഴിഞ്ഞ ഫൈനൽ പാരാമീറ്ററുകൾ പുറത്തുവിട്ടു എന്നാണ്, എന്നാൽ അത് പരിശീലിപ്പിക്കാൻ ഉപയോഗിച്ച ഡാറ്റാസെറ്റുകളോ ഡാറ്റ വൃത്തിയാക്കാൻ ഉപയോഗിച്ച സ്ക്രിപ്റ്റുകളോ അവർ പുറത്തുവിട്ടിട്ടില്ല. ഡാറ്റ ഇല്ലാതെ നിങ്ങൾക്ക് ആ മോഡൽ പൂജ്യത്തിൽ നിന്ന് നിർമ്മിക്കാൻ കഴിയില്ല. നിങ്ങൾക്ക് ലഭിക്കുന്നത് പൂർത്തിയായ ഒരു ഉൽപ്പന്നം മാത്രമാണ്. കൂടാതെ പെർമിസീവ് ലൈസൻസുകളും ഉണ്ട്. ചില കമ്പനികൾ ഓപ്പൺ എന്ന് തോന്നിപ്പിക്കുന്ന എന്നാൽ വാണിജ്യപരമായ ഉപയോഗത്തിന് നിയന്ത്രണങ്ങളുള്ള ലൈസൻസുകളാണ് ഉപയോഗിക്കുന്നത്. ഉദാഹരണത്തിന്, ഒരു മോഡൽ വ്യക്തികൾക്ക് സൗജന്യമായിരിക്കാം, എന്നാൽ നിങ്ങളുടെ കമ്പനിക്ക് 70 കോടിയിലധികം ഉപയോക്താക്കളുണ്ടെങ്കിൽ പണം നൽകേണ്ടി വരും. ഇന്റർനെറ്റ് കെട്ടിപ്പടുത്ത പരമ്പരാഗത GPL അല്ലെങ്കിൽ MIT ലൈസൻസുകളിൽ നിന്ന് ഇത് വളരെ വ്യത്യസ്തമാണ്. അതുപോലെ, ഒരു കമ്പനിയുടെ പൂർണ്ണ നിയന്ത്രണത്തിലുള്ള ഒരു API-യെ ‘ഓപ്പൺ’ എന്ന് വിശേഷിപ്പിക്കുന്ന മാർക്കറ്റിംഗ് രീതിയും നാം കാണാറുണ്ട്. ഇത് ഒട്ടും ഓപ്പൺ അല്ല. യഥാർത്ഥ ഓപ്പൺ മോഡലുകൾ നിങ്ങൾക്ക് ഫയലുകൾ ഡൗൺലോഡ് ചെയ്യാനും ഇന്റർനെറ്റ് ഇല്ലാതെ സ്വന്തം ഹാർഡ്വെയറിൽ പ്രവർത്തിപ്പിക്കാനും അനുവാദം നൽകുന്നു. ഈ വ്യത്യാസം വളരെ പ്രധാനമാണ്, കാരണം ഇതിലൂടെയാണ് ആർക്കാണ് യഥാർത്ഥ നിയന്ത്രണമെന്ന് തീരുമാനിക്കപ്പെടുന്നത്. നിങ്ങൾ ഒരു API-യെ ആണ് ആശ്രയിക്കുന്നതെങ്കിൽ, ആ കമ്പനിക്ക് എപ്പോൾ വേണമെങ്കിലും അതിന്റെ നിയമങ്ങൾ മാറ്റാനോ സേവനം നിർത്താനോ കഴിയും. എന്നാൽ വെയ്റ്റുകൾ നിങ്ങളുടെ ഹാർഡ് ഡ്രൈവിൽ ഉണ്ടെങ്കിൽ, അതിന്റെ അധികാരം നിങ്ങൾക്കാണ്.
എന്തുകൊണ്ടാണ് രാജ്യങ്ങൾ പബ്ലിക് വെയ്റ്റുകളിൽ വിശ്വസിക്കുന്നത്?
ഈ മോഡലുകളുടെ ആഗോള സ്വാധീനം വളരെ വലുതാണ്. പല രാജ്യങ്ങളെ സംബന്ധിച്ചിടത്തോളം, അവരുടെ മുഴുവൻ AI അടിസ്ഥാന സൗകര്യങ്ങൾക്കും വേണ്ടി ഏതാനും അമേരിക്കൻ കമ്പനികളെ ആശ്രയിക്കുന്നത് വലിയൊരു റിസ്ക് ആണ്. ഇതിനെയാണ് ഡിജിറ്റൽ പരമാധികാരം (digital sovereignty) എന്ന് വിളിക്കുന്നത്. യൂറോപ്പിലെയും ഏഷ്യയിലെയും സർക്കാരുകൾ സ്വന്തം പ്രാദേശിക AI പതിപ്പുകൾ നിർമ്മിക്കാൻ ഓപ്പൺ മോഡലുകളെയാണ് ഇപ്പോൾ നോക്കുന്നത്. സിലിക്കൺ വാലിയിലെ മൂല്യങ്ങൾക്ക് പകരം സ്വന്തം സംസ്കാരവും ഭാഷാപരമായ പ്രത്യേകതകളും മോഡലുകളിൽ ഉൾപ്പെടുത്താൻ ഇത് അവരെ സഹായിക്കുന്നു. കൂടാതെ ഡാറ്റ സ്വന്തം രാജ്യത്തിനുള്ളിൽ തന്നെ സൂക്ഷിക്കാനും ഇത് സഹായിക്കുന്നു. ചെറുകിട ഇടത്തരം സംരംഭങ്ങൾക്കും ഇത് ഗുണകരമാണ്. തങ്ങളുടെ പ്രധാന സാങ്കേതികവിദ്യ എപ്പോൾ വേണമെങ്കിലും നഷ്ടപ്പെട്ടേക്കാം എന്ന പേടിയില്ലാതെ അവർക്ക് പുതിയ ടൂളുകൾ നിർമ്മിക്കാം. ഓപ്പൺ മോഡലുകൾ വികസ്വര രാജ്യങ്ങളിലെ ഡെവലപ്പർമാർക്കും വലിയ അവസരമാണ് നൽകുന്നത്. ലാഗോസിലോ ജക്കാർത്തയിലോ ഉള്ള ഒരാൾക്ക് സാൻ ഫ്രാൻസിസ്കോയിലുള്ള ഒരാൾക്ക് ലഭിക്കുന്ന അതേ സാങ്കേതികവിദ്യ ഉപയോഗിക്കാൻ കഴിയും. ഓപ്പൺ മോഡലുകൾ ഒരു വലിയ ഇക്കോസിസ്റ്റം തന്നെ സൃഷ്ടിക്കുന്നു. മോഡലുകൾ വേഗത്തിൽ പ്രവർത്തിപ്പിക്കാനുള്ള വഴികൾ ഡെവലപ്പർമാർ കണ്ടെത്തുന്നു. ഈ കൂട്ടായ മുന്നേറ്റം ഏതൊരു കമ്പനിയേക്കാളും വേഗത്തിൽ വളരുന്നു. ഈ പുരോഗതികൾ ഒടുവിൽ നാം ഭാവിയിൽ ഉപയോഗിക്കുന്ന പ്രൊപ്രൈറ്ററി മോഡലുകളിലേക്കും എത്തിച്ചേരുന്നു.
ക്ലൗഡ് ഇല്ലാത്ത ഒരു ദിവസം
സാറ എന്ന സോഫ്റ്റ്വെയർ ഡെവലപ്പറുടെ ജീവിതത്തിൽ ഇത് എങ്ങനെ മാറ്റമുണ്ടാക്കുന്നു എന്ന് നോക്കാം. സെൻസിറ്റീവ് ആയ രോഗീവിവരങ്ങൾ കൈകാര്യം ചെയ്യുന്ന ഒരു മെഡിക്കൽ സ്റ്റാർട്ടപ്പിലാണ് സാറ ജോലി ചെയ്യുന്നത്. ഡാറ്റ സുരക്ഷാ പ്രശ്നങ്ങൾ ഉള്ളതിനാൽ അവളുടെ കമ്പനിക്ക് ക്ലൗഡ് AI ഉപയോഗിക്കാൻ കഴിയില്ല. പകരം, സാറ ഒരു ലോക്കൽ സെർവറിൽ ഓപ്പൺ വെയ്റ്റ് മോഡലാണ് ഉപയോഗിക്കുന്നത്. രാവിലെ, കോഡ് മെച്ചപ്പെടുത്താൻ (refactor) അവൾ ഈ മോഡലിന്റെ സഹായം തേടുന്നു. മോഡൽ ലോക്കൽ ആയതിനാൽ അവളുടെ കോഡ് മറ്റാരും കാണില്ല എന്ന ഉറപ്പുണ്ട്. പിന്നീട്, മെഡിക്കൽ കാര്യങ്ങളിൽ പ്രത്യേക പരിശീലനം ലഭിച്ച ഒരു മോഡൽ ഉപയോഗിച്ച് അവൾ രോഗികളുടെ വിവരങ്ങൾ സംഗ്രഹിക്കുന്നു. ഉച്ചഭക്ഷണ സമയത്ത്, സാറ ലോക്കൽ ഇൻഫറൻസിലെ പുതിയ ട്രെൻഡുകളെക്കുറിച്ച് AI ഇൻഡസ്ട്രി അനാലിസിസ് ബ്ലോഗ് വായിക്കുന്നു. വൈകുന്നേരം, പുതിയൊരു ക്വാണ്ടൈസേഷൻ രീതി പരീക്ഷിച്ച് തന്റെ പഴയ ഹാർഡ്വെയറിൽ വലിയൊരു മോഡൽ പ്രവർത്തിപ്പിക്കാൻ അവൾക്ക് കഴിയുന്നു. ഇതാണ് ഓപ്പൺ ഇക്കോസിസ്റ്റത്തിന്റെ ഭംഗി. അവൾ ഒരു വലിയ കമ്പനിയുടെ പുതിയ ഫീച്ചറിനായി കാത്തിരിക്കേണ്ടതില്ല. ദിവസാവസാനം തന്റെ ടൂളിന്റെ കൃത്യത പതിനഞ്ച് ശതമാനം വർദ്ധിപ്പിക്കാൻ അവൾക്ക് കഴിഞ്ഞു. നിയമ സ്ഥാപനങ്ങൾ മുതൽ ക്രിയേറ്റീവ് ഏജൻസികൾ വരെ ഇന്ന് ഈ രീതിയിലേക്ക് മാറുകയാണ്. വിദ്യാഭ്യാസ മേഖലയിലും ഇത് വലിയ മാറ്റങ്ങൾ കൊണ്ടുവരുന്നു. AI എങ്ങനെ പ്രവർത്തിക്കുന്നു എന്ന് പഠിപ്പിക്കാൻ സർവ്വകലാശാലകൾ ഓപ്പൺ മോഡലുകൾ ഉപയോഗിക്കുന്നു. ഇന്റർനെറ്റ് ഇല്ലാത്ത വിദൂര സ്ഥലങ്ങളിലെ ഗവേഷകർക്കും ഇത് വലിയ അനുഗ്രഹമാണ്.
സൗജന്യ സോഫ്റ്റ്വെയറിന്റെ വലിയ വില
ഗുണങ്ങൾ ഉണ്ടെങ്കിലും, ഇതിന്റെ യഥാർത്ഥ ചെലവിനെക്കുറിച്ച് നാം ചിന്തിക്കേണ്ടതുണ്ട്. ഈ മോഡലുകൾ പരിശീലിപ്പിക്കാൻ ആവശ്യമായ വലിയ കമ്പ്യൂട്ടിംഗ് പവർ നൽകാൻ ആരാണ് പണം മുടക്കുന്നത്? Meta പോലുള്ള ഒരു കമ്പനി കോടിക്കണക്കിന് രൂപ ചിലവാക്കി ഒരു മോഡൽ നിർമ്മിച്ച് അത് സൗജന്യമായി നൽകുന്നതിന് പിന്നിലെ ലക്ഷ്യമെന്താണ്? ഇത് ചെറിയ എതിരാളികളെ ഇല്ലാതാക്കാനുള്ള തന്ത്രമാണോ? സുരക്ഷാ പ്രശ്നങ്ങളും നാം കാണാതിരുന്നുകൂടാ. ഒരു മോഡൽ പൂർണ്ണമായും ഓപ്പൺ ആണെങ്കിൽ, അതിലെ സുരക്ഷാ നിയന്ത്രണങ്ങൾ നീക്കം ചെയ്യാൻ എളുപ്പമാണ്. ഇത് ഡീപ്ഫേക്കുകൾ നിർമ്മിക്കാനോ ഹാനികരമായ കോഡുകൾ ഉണ്ടാക്കാനോ ദുരുപയോഗം ചെയ്യപ്പെട്ടേക്കാം.
ഉള്ളടക്കം ഗവേഷണം ചെയ്യാനും എഴുതാനും എഡിറ്റ് ചെയ്യാനും വിവർത്തനം ചെയ്യാനും BotNews.today AI ടൂളുകൾ ഉപയോഗിക്കുന്നു. വിവരങ്ങൾ ഉപയോഗപ്രദവും വ്യക്തവും വിശ്വസനീയവുമാക്കാൻ ഞങ്ങളുടെ ടീം ഈ പ്രക്രിയ അവലോകനം ചെയ്യുകയും മേൽനോട്ടം വഹിക്കുകയും ചെയ്യുന്നു.
ലോക്കൽ ഇൻഫറൻസിന്റെ ഉള്ളുകള്ളികൾ
പ്രൊഫഷണൽ ആവശ്യങ്ങൾക്കായി ഈ മോഡലുകൾ ഉപയോഗിക്കാൻ ആഗ്രഹിക്കുന്നവർക്ക് സാങ്കേതിക വിവരങ്ങൾ പ്രധാനമാണ്. ക്വാണ്ടൈസേഷൻ ഉപയോഗിച്ച് മോഡലുകളുടെ വലിപ്പം കുറച്ച് സാധാരണ GPU-കളിൽ അവ പ്രവർത്തിപ്പിക്കാം. ഉദാഹരണത്തിന്, 40GB മെമ്മറി വേണ്ട ഒരു മോഡലിനെ ഗുണനിലവാരം കുറയാതെ 8GB-യിലേക്ക് മാറ്റാം. Hugging Face അല്ലെങ്കിൽ Together AI പോലുള്ള പ്ലാറ്റ്ഫോമുകൾ വഴിയും ഈ മോഡലുകൾ ലഭ്യമാണ്. LoRA പോലുള്ള സാങ്കേതികവിദ്യകൾ ഉപയോഗിച്ച് കുറഞ്ഞ സമയത്തിനുള്ളിൽ നിങ്ങളുടെ സ്വന്തം ഡാറ്റയിൽ മോഡലിനെ പരിശീലിപ്പിക്കാം. പുതിയ ഓപ്പൺ മോഡലുകൾ വലിയ ഡോക്യുമെന്റുകൾ ഒരേസമയം കൈകാര്യം ചെയ്യാൻ സഹായിക്കുന്ന 32k അല്ലെങ്കിൽ 128k കോൺടെക്സ്റ്റ് വിൻഡോകൾ നൽകുന്നുണ്ട്. നിലവിലുള്ള സോഫ്റ്റ്വെയറുകളിലേക്ക് ഇവ ചേർക്കുന്നത് ഇപ്പോൾ വളരെ എളുപ്പമാണ്. ഭാവിയിൽ, ഈ ടൂളുകൾ കൂടുതൽ ലളിതമാകുമെന്ന് ഞങ്ങൾ പ്രതീക്ഷിക്കുന്നു.
- ക്രോസ് പ്ലാറ്റ്ഫോം ഇൻഫറൻസിനായി Llama.cpp
- ലോക്കൽ മോഡൽ മാനേജ്മെന്റിനായി Ollama
തിരഞ്ഞെടുപ്പിനെക്കുറിച്ചുള്ള അന്തിമ വിധി
ഓപ്പൺ മോഡലുകളോ ക്ലോസ്ഡ് മോഡലുകളോ എന്നുള്ളത് ഒരു തർക്കവിഷയമല്ല. മിക്കവരും ഇവ രണ്ടും കൂടി കലർന്ന രീതിയിലായിരിക്കും ഉപയോഗിക്കുക. Meta AI പോലുള്ള കമ്പനികളുടെ ക്ലോസ്ഡ് മോഡലുകൾ എളുപ്പത്തിൽ ഉപയോഗിക്കാവുന്നവയും മികച്ച പ്രകടനം കാഴ്ചവെക്കുന്നവയുമാണ്. എന്നാൽ ഓപ്പൺ മോഡലുകൾ നിങ്ങൾക്ക് നിയന്ത്രണവും സ്വകാര്യതയും നൽകുന്നു. നിങ്ങൾ നേരിട്ട് ഒരു മോഡൽ ഡൗൺലോഡ് ചെയ്തില്ലെങ്കിലും, മറ്റുള്ളവർക്ക് അത് ചെയ്യാൻ കഴിയുന്നു എന്നത് ഈ മേഖലയിൽ സുതാര്യത ഉറപ്പാക്കുന്നു. AI എന്നത് ഏതാനും ആളുകളുടെ രഹസ്യമല്ല, മറിച്ച് എല്ലാവർക്കും ഉപയോഗിക്കാവുന്ന ഒരു ഉപകരണമായി നിലനിൽക്കുന്നു എന്ന് ഇത് ഉറപ്പാക്കുന്നു.
ഞങ്ങൾ ഉൾപ്പെടുത്തണമെന്ന് നിങ്ങൾ കരുതുന്ന ഒരു AI സ്റ്റോറിയോ, ടൂളോ, ട്രെൻഡോ, ചോദ്യമോ നിങ്ങളുടെ പക്കലുണ്ടോ? നിങ്ങളുടെ ലേഖന ആശയം ഞങ്ങൾക്ക് അയയ്ക്കുക — അത് കേൾക്കാൻ ഞങ്ങൾ ആഗ്രഹിക്കുന്നു.
Lưu ý của biên tập viên: Chúng tôi tạo trang web này như một trung tâm tin tức và hướng dẫn AI đa ngôn ngữ dành cho những người không phải là chuyên gia máy tính, nhưng vẫn muốn hiểu trí tuệ nhân tạo, sử dụng nó tự tin hơn và theo dõi tương lai đang đến gần.
ഒരു പിശകോ തിരുത്തേണ്ട എന്തെങ്കിലും കണ്ടെത്തിയോ? ഞങ്ങളെ അറിയിക്കുക.