2026-ൽ LLM വിപണി എങ്ങനെയാണ് വിഭജിക്കപ്പെടുന്നത്?
മോണോലിത്തിക് AI മോഡലുകളുടെ കാലഘട്ടം അതിന്റെ സ്വാഭാവിക പരിധിയിലെത്തിയിരിക്കുന്നു. കഴിഞ്ഞ കുറച്ചു വർഷങ്ങളായി, കൂടുതൽ പാരാമീറ്ററുകളും കൂടുതൽ ഡാറ്റയും എല്ലാ ആവശ്യങ്ങൾക്കും മികച്ച ഫലങ്ങൾ നൽകുമെന്ന ലളിതമായ അടിസ്ഥാനത്തിലാണ് ടെക് ഇൻഡസ്ട്രി പ്രവർത്തിച്ചിരുന്നത്. 2026-ൽ വിപണി രണ്ട് വ്യത്യസ്തവും വിപരീതവുമായ ദിശകളിലേക്ക് തിരിഞ്ഞതോടെ ആ ധാരണ തകർന്നു. ലാർജ് ലാംഗ്വേജ് മോഡലുകൾക്കായി നമ്മൾ ഇപ്പോൾ ഒരു ഏകീകൃത പാതയല്ല കാണുന്നത്. പകരം, ഡീപ് റീസണിംഗിനായി രൂപകൽപ്പന ചെയ്ത കൂറ്റൻ ക്ലൗഡ്-ബേസ്ഡ് സിസ്റ്റങ്ങളും, പേഴ്സണൽ ഹാർഡ്വെയറിൽ പ്രവർത്തിക്കുന്ന അതി-കാര്യക്ഷമമായ ചെറിയ മോഡലുകളും തമ്മിലുള്ള വിഭജനമാണ് നമ്മൾ കാണുന്നത്. ഈ മാറ്റം കേവലം ടെക്നിക്കൽ ബെഞ്ച്മാർക്കുകളെക്കുറിച്ചുള്ളതല്ല. ബിസിനസ്സുകളും വ്യക്തികളും തങ്ങളുടെ പണം എങ്ങനെ ചെലവഴിക്കണമെന്നും ഡാറ്റ എവിടെ സൂക്ഷിക്കണമെന്നും തീരുമാനിക്കുന്നതിനെക്കുറിച്ചാണ്. ഏറ്റവും സ്മാർട്ടായ മോഡൽ ഏതാണെന്നല്ല, മറിച്ച് കൈയിലുള്ള ജോലിക്ക് അനുയോജ്യമായ മോഡൽ ഏതാണെന്നതാണ് ഇപ്പോഴത്തെ ചോദ്യം. ഏറ്റവും പുതിയ AI ഇൻഡസ്ട്രി ട്രെൻഡുകൾ പിന്തുടരുന്ന ആർക്കും ഈ വിഭജനം മനസ്സിലാക്കേണ്ടത് അത്യാവശ്യമാണ്, കാരണം കളിയുടെ നിയമങ്ങൾ എന്നെന്നേക്കുമായി മാറിയിരിക്കുന്നു.
ജനറലിസ്റ്റ് കാലഘട്ടത്തിന്റെ അന്ത്യം
ഈ വിഭജനത്തിന്റെ ആദ്യ ഭാഗം ഫ്രോണ്ടിയർ മോഡലുകളാണ്. ഇവ ആദ്യകാല GPT സിസ്റ്റങ്ങളുടെ പിൻഗാമികളാണ്, എന്നാൽ അവ കൂടുതൽ സ്പെഷ്യലൈസ്ഡ് ആയി മാറിയിരിക്കുന്നു. OpenAI പോലുള്ള കമ്പനികൾ സെൻട്രൽ റീസണിംഗ് എൻജിനുകളായി പ്രവർത്തിക്കുന്ന മോഡലുകൾക്കായി പരിശ്രമിക്കുന്നു. ഈ സിസ്റ്റങ്ങൾ കൂറ്റൻ സെർവർ ഫാമുകളിൽ അല്ലാതെ മറ്റൊരിടത്തും പ്രവർത്തിപ്പിക്കാൻ കഴിയാത്തത്ര വലുതാണ്. സങ്കീർണ്ണമായ ശാസ്ത്രീയ ഗവേഷണം, അഡ്വാൻസ്ഡ് കോഡിംഗ് ആർക്കിടെക്ചർ, ഉയർന്ന തലത്തിലുള്ള തന്ത്രപരമായ ആസൂത്രണം തുടങ്ങിയ പ്രശ്നങ്ങൾ കൈകാര്യം ചെയ്യാനാണ് ഇവ രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്. ഇവ ഇൻഡസ്ട്രിയുടെ ചെലവേറിയതും ഉയർന്ന ഊർജ്ജം ആവശ്യമുള്ളതുമായ തലച്ചോറുകളാണ്. എന്നിരുന്നാലും, ഈ ഭീമന്മാർ എല്ലാ സാധാരണ ജോലികളും കൈകാര്യം ചെയ്യുമെന്ന പൊതുധാരണ യാഥാർത്ഥ്യത്തിൽ നിന്ന് അകന്നുകൊണ്ടിരിക്കുകയാണ്. ഒരു സാധാരണ മെമ്മോ തയ്യാറാക്കാനോ കലണ്ടർ ക്രമീകരിക്കാനോ ആർക്കും ട്രില്യൺ പാരാമീറ്റർ മോഡലിന്റെ ആവശ്യമില്ല. ഈ തിരിച്ചറിവാണ് വിപണിയുടെ രണ്ടാം ഭാഗത്തിന് ജന്മം നൽകിയത്: സ്മോൾ ലാംഗ്വേജ് മോഡൽ (SLM).
സ്മോൾ ലാംഗ്വേജ് മോഡലുകൾ, അല്ലെങ്കിൽ SLM-കൾ, 2026-ലെ യൂട്ടിലിറ്റി പ്ലെയറുകളാണ്. ഈ മോഡലുകൾ വളരെ ലളിതമായാണ് രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്. ഇവയ്ക്ക് പലപ്പോഴും പത്ത് ബില്യണിൽ താഴെ പാരാമീറ്ററുകൾ മാത്രമേയുള്ളൂ, ഇത് ഹൈ-എൻഡ് സ്മാർട്ട്ഫോണുകളിലോ ആധുനിക ലാപ്ടോപ്പുകളിലോ ലോക്കലായി പ്രവർത്തിക്കാൻ അവയെ അനുവദിക്കുന്നു. ഒരു മോഡൽ ഉപയോഗപ്രദമാകാൻ ലോകത്തിന്റെ ചരിത്രത്തെക്കുറിച്ച് എല്ലാം അറിയണമെന്ന ആശയത്തിൽ നിന്ന് ഇൻഡസ്ട്രി മാറിനടന്നു. പകരം, ലോജിക്കൽ ഡിഡക്ഷൻ അല്ലെങ്കിൽ ക്ലീൻ പ്രോസ് പോലുള്ള പ്രത്യേക കഴിവുകളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്ന ഉയർന്ന നിലവാരമുള്ള, ക്യൂറേറ്റ് ചെയ്ത ഡാറ്റാസെറ്റുകളിൽ ഡെവലപ്പർമാർ ഈ ചെറിയ സിസ്റ്റങ്ങളെ പരിശീലിപ്പിക്കുന്നു. ഏറ്റവും കുറഞ്ഞ ചെലവിൽ പ്രവർത്തിക്കുന്ന ടൂളാണ് പലപ്പോഴും ഏറ്റവും മൂല്യമുള്ളതെന്ന വിപണിയാണ് ഇതിന്റെ ഫലം. കമ്പ്യൂട്ടിംഗിന്റെ ഭീമമായ ചെലവും സ്വകാര്യതയ്ക്കുള്ള വർദ്ധിച്ചുവരുന്ന ആവശ്യവുമാണ് ഈ വിഭജനത്തിന് കാരണം. ഓരോ കീസ്ട്രോക്കും ക്ലൗഡ് സെർവറിലേക്ക് അയക്കുന്നത് സാവധാനവും അപകടകരവുമാണെന്ന് ഉപയോക്താക്കൾ തിരിച്ചറിയാൻ തുടങ്ങിയിരിക്കുന്നു.
സോവറിൻ കമ്പ്യൂട്ടിംഗിന്റെ ജിയോപൊളിറ്റിക്സ്
ഈ വിപണി വിഭജനം ആഗോള അധികാര സമവാക്യങ്ങളിൽ വലിയ സ്വാധീനം ചെലുത്തുന്നുണ്ട്. സിലിക്കൺ വാലിയിലെ ചുരുക്കം ചില പ്രൊവൈഡർമാരെ മാത്രം ആശ്രയിക്കാൻ തയ്യാറല്ലാത്ത രാജ്യങ്ങൾ സോവറിൻ കമ്പ്യൂട്ടിംഗിലേക്ക് നീങ്ങുന്നത് നമ്മൾ കാണുന്നു. യൂറോപ്പിലെയും ഏഷ്യയിലെയും രാജ്യങ്ങൾ ലോക്കലൈസ്ഡ് മോഡലുകൾ ഹോസ്റ്റ് ചെയ്യുന്നതിനായി സ്വന്തം ഇൻഫ്രാസ്ട്രക്ചറിൽ വലിയ തോതിൽ നിക്ഷേപം നടത്തുന്നു. സെൻസിറ്റീവായ ദേശീയ ഡാറ്റ ഒരിക്കലും അതിർത്തി വിട്ടുപോകുന്നില്ലെന്ന് ഉറപ്പാക്കുകയാണ് ലക്ഷ്യം. ഫ്രോണ്ടിയർ മോഡലുകളുടെ ഭീമമായ ഊർജ്ജ, ഹാർഡ്വെയർ ആവശ്യകതകളോടുള്ള നേരിട്ടുള്ള പ്രതികരണമാണിത്. എല്ലാ രാജ്യങ്ങൾക്കും ഏറ്റവും വലിയ സിസ്റ്റങ്ങൾക്കായി കൂറ്റൻ ഡാറ്റാ സെന്ററുകൾ നിർമ്മിക്കാൻ കഴിയില്ല, എന്നാൽ മിക്കവാറും എല്ലാ രാജ്യങ്ങൾക്കും ചെറിയ, സ്പെഷ്യലൈസ്ഡ് മോഡലുകളുടെ ശൃംഖലയെ പിന്തുണയ്ക്കാൻ കഴിയും. ഇത് വ്യത്യസ്ത മേഖലകൾ അവരുടെ സാമ്പത്തിക ആവശ്യങ്ങൾക്കും റെഗുലേറ്ററി ചട്ടക്കൂടുകൾക്കും അനുസരിച്ച് വ്യത്യസ്ത ആർക്കിടെക്ചറുകൾ തിരഞ്ഞെടുക്കുന്ന വൈവിധ്യമാർന്ന ഇക്കോസിസ്റ്റത്തിലേക്ക് നയിച്ചു.
ഈ മോഡലുകളുടെ സപ്ലൈ ചെയിനും മാറിക്കൊണ്ടിരിക്കുകയാണ്. ഭീമൻ മോഡലുകൾക്ക് NVIDIA-യുടെ ഏറ്റവും പുതിയതും ചെലവേറിയതുമായ ചിപ്പുകൾ ആവശ്യമാണെങ്കിലും, ചെറിയ മോഡലുകൾ കൺസ്യൂമർ-ഗ്രേഡ് ഹാർഡ്വെയറിൽ പ്രവർത്തിക്കാൻ ഒപ്റ്റിമൈസ് ചെയ്യപ്പെടുന്നു. AI ബൂമിന്റെ ആദ്യ നാളുകളിൽ ഇല്ലാതിരുന്ന രീതിയിൽ ഇത് ഇന്റലിജൻസിലേക്കുള്ള പ്രവേശനം ജനാധിപത്യവൽക്കരിക്കുന്നു. വികസ്വര സമ്പദ്വ്യവസ്ഥയിലെ ഒരു സ്റ്റാർട്ടപ്പിന് ഇപ്പോൾ ഒരു ഫ്രോണ്ടിയർ സിസ്റ്റത്തിന്റെ API സബ്സ്ക്രിപ്ഷന്റെ ഒരു ചെറിയ ഭാഗം കൊണ്ട് ഒരു ചെറിയ, ഓപ്പൺ-സോഴ്സ് മോഡൽ ഫൈൻ-ട്യൂൺ ചെയ്യാൻ കഴിയും. ക്ലൗഡ് ക്രെഡിറ്റുകളിൽ വലിയ നിക്ഷേപം നടത്താതെ തന്നെ പ്രാദേശിക നവീകരണത്തിന് അവസരം നൽകിക്കൊണ്ട് ഈ മാറ്റം ഡിജിറ്റൽ വിടവ് കുറയ്ക്കുന്നു. പ്രാദേശിക ഭാഷകളെയും സാംസ്കാരിക സൂക്ഷ്മതകളെയും പ്രതിഫലിപ്പിക്കുന്ന, കൂടുതൽ വിതരണം ചെയ്യപ്പെട്ടതും പ്രതിരോധശേഷിയുള്ളതുമായ മെഷീൻ ഇന്റലിജൻസ് ശൃംഖലയിലേക്കുള്ള മാറ്റമാണ് ആഗോളതലത്തിൽ സംഭവിക്കുന്നത്.
ഹൈബ്രിഡ് ഇന്റലിജൻസ് യുഗത്തിലെ ഒരു ചൊവ്വാഴ്ച
ഇത് പ്രായോഗികമായി എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്ന് കാണാൻ, 2026-ലെ ഒരു പ്രൊഫഷണലിന്റെ സാധാരണ ദിവസം പരിഗണിക്കുക. ഇടത്തരം കമ്പനിയിലെ സോഫ്റ്റ്വെയർ എൻജിനീയറായ മാർക്കസിനെ പരിചയപ്പെടുക. മാർക്കസ് തന്റെ ദിവസം തുടങ്ങുമ്പോൾ കോഡ് എഡിറ്റർ തുറക്കുന്നു. പതിവ് ജോലികൾക്കായി അദ്ദേഹം ക്ലൗഡ്-ബേസ്ഡ് അസിസ്റ്റന്റിനെ ഉപയോഗിക്കുന്നില്ല. പകരം, മൂന്ന് ബില്യൺ പാരാമീറ്ററുള്ള ഒരു ചെറിയ മോഡൽ അദ്ദേഹത്തിന്റെ വർക്ക്സ്റ്റേഷനിൽ ലോക്കലായി പ്രവർത്തിക്കുന്നു. ഈ മോഡൽ കമ്പനിയുടെ സ്വകാര്യ കോഡ്ബേസിൽ പ്രത്യേകം പരിശീലിപ്പിച്ചതാണ്. ഇത് തത്സമയം കോഡ് കംപ്ലീഷനുകൾ നിർദ്ദേശിക്കുകയും സിന്റാക്സ് പിശകുകൾ തിരുത്തുകയും ചെയ്യുന്നു. മോഡൽ ലോക്കലായതിനാൽ, കമ്പനിയുടെ ബൗദ്ധിക സ്വത്തവകാശം മൂന്നാം കക്ഷിക്ക് ചോരുമോ എന്ന് മാർക്കസ് ആശങ്കപ്പെടേണ്ടതില്ല. ചെറിയ മോഡലിന്റെ കാര്യക്ഷമത ഇതാണ്. ഇത് വേഗതയുള്ളതും സ്വകാര്യവുമാണ്, കൂടാതെ കോഡിംഗിന്റെ ആവർത്തന സ്വഭാവത്തിന് തികച്ചും അനുയോജ്യവുമാണ്. ഇന്റർനെറ്റുമായി ബന്ധിപ്പിക്കാതെ തന്നെ അദ്ദേഹം തന്റെ ജോലിയുടെ എൺപത് ശതമാനവും കൈകാര്യം ചെയ്യുന്നു.
ഉച്ചകഴിഞ്ഞ്, മാർക്കസ് ഒരു തടസ്സം നേരിടുന്നു. സങ്കീർണ്ണമായ ഡാറ്റ മൈഗ്രേഷനുകളും ഉയർന്ന തലത്തിലുള്ള സെക്യൂരിറ്റി പ്രോട്ടോക്കോളുകളും ഉൾപ്പെടുന്ന ഒരു പുതിയ സിസ്റ്റം ആർക്കിടെക്ചർ അദ്ദേഹം രൂപകൽപ്പന ചെയ്യേണ്ടതുണ്ട്. ഇവിടെയാണ് വിപണി വിഭജനം ദൃശ്യമാകുന്നത്. അദ്ദേഹത്തിന്റെ ലോക്കൽ മോഡലിന് ഈ നിർണ്ണായക ആർക്കിടെക്ചറൽ തീരുമാനങ്ങൾ എടുക്കാൻ ആവശ്യമായ ശക്തിയില്ല. മാർക്കസ് ഒരു ഫ്രോണ്ടിയർ മോഡലിലേക്ക് മാറുന്നു. അദ്ദേഹം തന്റെ നിർദ്ദിഷ്ട ആവശ്യകതകൾ ഒരു വലിയ റീസണിംഗ് എൻജിന്റെ സുരക്ഷിതമായ ക്ലൗഡ് ഇൻസ്റ്റൻസിലേക്ക് അപ്ലോഡ് ചെയ്യുന്നു. ഓരോ ക്വറിക്കും കൂടുതൽ ചെലവാകുന്ന ഈ സിസ്റ്റം, ആയിരക്കണക്കിന് സാധ്യതയുള്ള പരാജയ പോയിന്റുകൾ വിശകലനം ചെയ്യുകയും ശക്തമായ ഒരു പ്ലാൻ നിർദ്ദേശിക്കുകയും ചെയ്യുന്നു. മാർക്കസ് മുപ്പത് മിനിറ്റ് ഡീപ് വർക്കിനായി ചെലവേറിയ, ഉയർന്ന ഊർജ്ജം ആവശ്യമുള്ള മോഡൽ ഉപയോഗിക്കുന്നു, തുടർന്ന് നടപ്പിലാക്കുന്നതിനായി ലോക്കൽ മോഡലിലേക്ക് തിരികെ മാറുന്നു. ലീഗൽ സർവീസസ് മുതൽ മെഡിക്കൽ ഗവേഷണം വരെയുള്ള എല്ലാ മേഖലകളിലും ഈ ഹൈബ്രിഡ് വർക്ക്ഫ്ലോ സ്റ്റാൻഡേർഡ് ആയി മാറുകയാണ്.
മെഡിക്കൽ രംഗത്ത്, ഒരു ഡോക്ടർ കൺസൾട്ടേഷനിടെ രോഗിയുടെ കുറിപ്പുകൾ സംഗ്രഹിക്കാൻ ഒരു ലോക്കൽ മോഡൽ ഉപയോഗിച്ചേക്കാം. ഇത് സെൻസിറ്റീവായ ആരോഗ്യ ഡാറ്റ ക്ലിനിക്കിന്റെ സ്വകാര്യ നെറ്റ്വർക്കിനുള്ളിൽ തന്നെ തുടരുന്നുവെന്ന് ഉറപ്പാക്കുന്നു. എന്നിരുന്നാലും, അതേ ഡോക്ടർക്ക് രോഗിയുടെ അപൂർവ്വമായ ലക്ഷണങ്ങളെ ഏറ്റവും പുതിയ ആഗോള ഓങ്കോളജി ഗവേഷണവുമായി താരതമ്യം ചെയ്യണമെങ്കിൽ, അവർ ഒരു ഫ്രോണ്ടിയർ മോഡലിനെ ആശ്രയിക്കും. വേഗതയും ആഴവും തമ്മിലുള്ള സന്തുലിതാവസ്ഥ നിലനിർത്താൻ ഈ വിഭജനം സഹായിക്കുന്നു. ദൈനംദിന ജീവിതത്തിൽ ഭീമൻ മോഡലുകൾ എത്രത്തോളം ആവശ്യമാണെന്ന് ആളുകൾ പലപ്പോഴും പെരുപ്പിച്ചു കാണിക്കാറുണ്ട്, അതേസമയം ചെറിയ മോഡലുകൾ എത്രത്തോളം മെച്ചപ്പെട്ടുവെന്ന് കുറച്ചുകാണുകയും ചെയ്യുന്നു. വലിയ മോഡലുകളെ വലുതാക്കുന്നതിനേക്കാൾ ചെറിയ മോഡലുകളെ സ്മാർട്ടാക്കുന്നതിലാണ് 2026-ലെ ഏറ്റവും ശ്രദ്ധേയമായ നേട്ടങ്ങൾ വന്നിട്ടുള്ളതെന്നതാണ് യാഥാർത്ഥ്യം. ഈ ട്രെൻഡ് AI-യെ ഒരു ഭാവികാല അത്ഭുതമായിട്ടല്ല, മറിച്ച് വൈദ്യുതി അല്ലെങ്കിൽ ഹൈ-സ്പീഡ് ഇന്റർനെറ്റ് പോലെ ഒരു സാധാരണ യൂട്ടിലിറ്റിയായി മാറ്റുന്നു.
ഉള്ളടക്കം ഗവേഷണം ചെയ്യാനും എഴുതാനും എഡിറ്റ് ചെയ്യാനും വിവർത്തനം ചെയ്യാനും BotNews.today AI ടൂളുകൾ ഉപയോഗിക്കുന്നു. വിവരങ്ങൾ ഉപയോഗപ്രദവും വ്യക്തവും വിശ്വസനീയവുമാക്കാൻ ഞങ്ങളുടെ ടീം ഈ പ്രക്രിയ അവലോകനം ചെയ്യുകയും മേൽനോട്ടം വഹിക്കുകയും ചെയ്യുന്നു.
ഞങ്ങൾ ഉൾപ്പെടുത്തണമെന്ന് നിങ്ങൾ കരുതുന്ന ഒരു AI സ്റ്റോറിയോ, ടൂളോ, ട്രെൻഡോ, ചോദ്യമോ നിങ്ങളുടെ പക്കലുണ്ടോ? നിങ്ങളുടെ ലേഖന ആശയം ഞങ്ങൾക്ക് അയയ്ക്കുക — അത് കേൾക്കാൻ ഞങ്ങൾ ആഗ്രഹിക്കുന്നു.
സിന്തറ്റിക് ലോജിക്കിന്റെ മറഞ്ഞിരിക്കുന്ന നികുതി
വിഭജിക്കപ്പെട്ട ഈ വിപണിയിലേക്ക് നമ്മൾ കൂടുതൽ നീങ്ങുമ്പോൾ, ഈ സാങ്കേതികവിദ്യയുടെ ദീർഘകാല ചെലവുകളെക്കുറിച്ച് ബുദ്ധിമുട്ടുള്ള ചോദ്യങ്ങൾ ചോദിക്കേണ്ടതുണ്ട്. ഫ്രോണ്ടിയർ മോഡലുകളുടെ പാരിസ്ഥിതിക ആഘാതമാണ് ഒരു പ്രധാന ആശങ്ക. ചെറിയ മോഡലുകൾ കാര്യക്ഷമമാണെങ്കിലും, ഭീമൻ സിസ്റ്റങ്ങൾ വലിയ അളവിൽ വെള്ളവും വൈദ്യുതിയും ഉപയോഗിക്കുന്നത് തുടരുന്നു. നമ്മൾ സുസ്ഥിരമായ ഒരു സിസ്റ്റമാണോ നിർമ്മിക്കുന്നത്, അതോ വേഗത്തിലുള്ള സോഫ്റ്റ്വെയറിനായി നമ്മുടെ പാരിസ്ഥിതിക ഭാവി പണയപ്പെടുത്തുകയാണോ? ഡാറ്റാ പ്രൊവനൻസിനെക്കുറിച്ചുള്ള ചോദ്യവുമുണ്ട്. മോഡലുകൾ കൂടുതൽ സ്പെഷ്യലൈസ്ഡ് ആകുമ്പോൾ, ഉയർന്ന നിലവാരമുള്ള ഡാറ്റയ്ക്കുള്ള ആവശ്യം വർദ്ധിക്കുന്നു. ഇത് ഡാറ്റ ഒരു ചരക്ക് പോലെ വാങ്ങുകയും വിൽക്കുകയും ചെയ്യുന്ന രഹസ്യ വിപണിയിലേക്ക് നയിച്ചു. ഈ സിസ്റ്റങ്ങളെ പരിശീലിപ്പിക്കുന്ന വിവരങ്ങളുടെ യഥാർത്ഥ ഉടമ ആരാണ്? ഒരു മോഡൽ ഇന്റർനെറ്റിലെ കൂട്ടായ അറിവിൽ പരിശീലിപ്പിക്കപ്പെട്ടതാണെങ്കിൽ, ആ മോഡലിന്റെ നേട്ടങ്ങൾ ഒരു കോർപ്പറേഷന് മാത്രമുള്ളതാണോ?
ലോജിക് സൈലോകളുടെ അപകടസാധ്യതയും നമ്മൾ പരിഗണിക്കണം. ഒരു കമ്പനി പൂർണ്ണമായും സ്വന്തം ഡാറ്റയിൽ പരിശീലിപ്പിച്ച ഒരു ചെറിയ, ലോക്കൽ മോഡലിനെ ആശ്രയിക്കുകയാണെങ്കിൽ, അതിന് നവീകരിക്കാനുള്ള കഴിവ് നഷ്ടപ്പെടുമോ? ഈ സ്പെഷ്യലൈസ്ഡ് സിസ്റ്റങ്ങൾ ചിന്തയുടെ എക്കോ ചേമ്പറുകൾ സൃഷ്ടിക്കുമെന്ന അപകടമുണ്ട്, അവിടെ AI കമ്പനിക്ക് ഇതിനകം അറിയാവുന്ന കാര്യങ്ങൾ മാത്രം ശക്തിപ്പെടുത്തുന്നു. കൂടാതെ, ഫ്രോണ്ടിയർ മോഡലുകൾ താങ്ങാൻ കഴിയുന്നവരും അല്ലാത്തവരും തമ്മിലുള്ള വിഭജനം വിവര അസമത്വത്തിന്റെ ഒരു പുതിയ തലം സൃഷ്ടിച്ചേക്കാം. MIT Technology Review അനുസരിച്ച്, ഏറ്റവും നൂതനമായ സിസ്റ്റങ്ങളെ പരിശീലിപ്പിക്കുന്നതിനുള്ള ചെലവ് ഓരോ മാസവും ഇരട്ടിയാകുന്നു. ഏറ്റവും സമ്പന്നരായ രാജ്യങ്ങൾക്കും കോർപ്പറേഷനുകൾക്കും മാത്രം മെഷീൻ റീസണിംഗിന്റെ ഉയർന്ന തലങ്ങളിലേക്ക് പ്രവേശനം ലഭിക്കുന്ന ഒരു ഭാവിയിലേക്ക് ഇത് നയിച്ചേക്കാം. ലോക്കൽ AI-യുടെ സൗകര്യം ആഗോള അറിവിന്റെ വിഭജനത്തിന് മൂല്യമുള്ളതാണോ എന്ന് നമ്മൾ ചോദിക്കേണ്ടതുണ്ട്.
സിലിക്കൺ അണ്ടർ ദി ഹുഡ്
പവർ യൂസർമാർക്കായി, വിപണിയിലെ വിഭജനം സാങ്കേതിക പരിമിതികളും ഡിപ്ലോയ്മെന്റ് തന്ത്രങ്ങളും കൊണ്ട് നിർവചിക്കപ്പെടുന്നു. ലോക്കൽ ഇൻഫറൻസിലേക്കുള്ള മാറ്റമാണ് ഏറ്റവും പ്രധാനപ്പെട്ട മാറ്റം. vLLM, llama.cpp തുടങ്ങിയ ടൂളുകൾ മുമ്പ് കരുത്ത് കുറഞ്ഞതെന്ന് കരുതിയിരുന്ന ഹാർഡ്വെയറിൽ സങ്കീർണ്ണമായ മോഡലുകൾ പ്രവർത്തിപ്പിക്കുന്നത് സാധ്യമാക്കി. മെമ്മറി ലാഭിക്കുന്നതിനായി മോഡലിന്റെ വെയ്റ്റുകളുടെ കൃത്യത കുറയ്ക്കുന്ന ക്വാന്റൈസേഷൻ എന്ന പ്രക്രിയയിലൂടെയാണ് ഇത് കൈവരിക്കുന്നത്. യഥാർത്ഥത്തിൽ 40GB VRAM ആവശ്യമായിരുന്ന ഒരു മോഡൽ ഇപ്പോൾ കൃത്യതയിൽ കാര്യമായ കുറവില്ലാതെ 12GB-യിൽ പ്രവർത്തിപ്പിക്കാം. ലോക്കൽ എൻവയോൺമെന്റുകൾക്കായി മോഡലുകളുടെ 4-ബിറ്റ് അല്ലെങ്കിൽ 8-ബിറ്റ് ക്വാന്റൈസ്ഡ് പതിപ്പുകൾക്ക് മുൻഗണന നൽകുന്ന ഡെവലപ്പർമാർക്കായി ഇത് വർക്ക്ഫ്ലോ മാറ്റിമറിച്ചു. ശ്രദ്ധ ഇപ്പോൾ റോ പാരാമീറ്റർ കൗണ്ടിൽ നിന്ന് കൺസ്യൂമർ ഹാർഡ്വെയറിലെ ടോക്കൺസ്-പെർ-സെക്കൻഡ് പ്രകടനത്തിലേക്ക് മാറിയിരിക്കുന്നു.
API പരിധികളും റേറ്റ് ത്രോട്ട്ലിംഗും കമ്പനികൾ തങ്ങളുടെ മോഡലുകൾ തിരഞ്ഞെടുക്കുന്നതിൽ ഒരു പ്രധാന ഘടകമായി മാറിയിരിക്കുന്നു. ഫ്രോണ്ടിയർ പ്രൊവൈഡർമാർ കൂടുതൽ കഴിവുള്ള മോഡലുകൾ ഉയർന്ന പണം നൽകുന്ന എന്റർപ്രൈസ് ക്ലയന്റുകൾക്കായി മാറ്റിവെക്കുന്ന ടിയേർഡ് ആക്സസിലേക്ക് നീങ്ങുകയാണ്. ഇത് ചെറിയ സ്റ്റാർട്ടപ്പുകളെ ലോക്കൽ-ഫസ്റ്റ് തന്ത്രം സ്വീകരിക്കാൻ പ്രേരിപ്പിച്ചു. അവർ തങ്ങളുടെ പ്രോസസ്സിംഗിന്റെ ഭൂരിഭാഗവും ലോക്കൽ മോഡലുകൾ ഉപയോഗിക്കുന്നു, കൂടാതെ അത്യാവശ്യ ഘട്ടങ്ങളിൽ മാത്രം ചെലവേറിയ API-കൾ ഉപയോഗിക്കുന്നു. പ്രോംപ്റ്റിന്റെ ബുദ്ധിമുട്ട് അടിസ്ഥാനമാക്കി ഏറ്റവും കാര്യക്ഷമമായ മോഡലിലേക്ക് ടാസ്ക്കുകൾ റൂട്ട് ചെയ്യാൻ കഴിയുന്ന സങ്കീർണ്ണമായ ഓർക്കസ്ട്രേഷൻ ലെയർ ഇതിന് ആവശ്യമാണ്. ലോക്കൽ സ്റ്റോറേജും തിരിച്ചുവരികയാണ്. ക്ലൗഡ്-ബേസ്ഡ് വെക്റ്റർ ഡാറ്റാബേസുകളെ ആശ്രയിക്കുന്നതിന് പകരം, പല ഉപയോക്താക്കളും ഇപ്പോൾ ലോക്കൽ RAG (Retrieval-Augmented Generation) സിസ്റ്റങ്ങൾ പ്രവർത്തിപ്പിക്കുന്നു. ഇത് അവരുടെ സ്വന്തം രേഖകളിലൂടെ തിരയാനും ആ ഡാറ്റ മൂന്നാം കക്ഷിക്ക് അയക്കാതെ തന്നെ മോഡലുകൾക്ക് സന്ദർഭം നൽകാനും അവരെ അനുവദിക്കുന്നു. വിപണിയുടെ ഗീക്ക് വിഭാഗം ഇപ്പോൾ ആർക്കാണ് ഏറ്റവും വലിയ മോഡലുള്ളതെന്നല്ല, ആർക്കാണ് ഏറ്റവും കാര്യക്ഷമമായ സ്റ്റാക്കുള്ളതെന്നാണ് നോക്കുന്നത്.
തിരഞ്ഞെടുപ്പിന്റെ പുതിയ ലോജിക്
LLM വിപണിയിലെ വിഭജനം പക്വതയുടെ ലക്ഷണമാണ്. എല്ലാ പുതിയ മോഡലുകളെയും അന്ധമായി സ്വാഗതം ചെയ്തിരുന്ന ഹണിമൂൺ ഘട്ടം നമ്മൾ പിന്നിട്ടു. ഇന്ന്, ഉപയോക്താക്കൾ കൂടുതൽ സംശയമുള്ളവരും കൂടുതൽ പ്രായോഗികരുമാണ്. ഒരു മോഡൽ അവരുടെ സമയം ലാഭിക്കുമോ എന്നും അത് അവരുടെ സ്വകാര്യത സംരക്ഷിക്കുമോ എന്നും അവർ അറിയാൻ ആഗ്രഹിക്കുന്നു. കൂറ്റൻ ക്ലൗഡ് എൻജിനുകളും ലളിതമായ ലോക്കൽ മോഡലുകളും തമ്മിലുള്ള വ്യത്യാസം ഈ ആവശ്യങ്ങളോടുള്ള പ്രതികരണമാണ്. ഇന്റലിജൻസ് എന്നത് ഒരൊറ്റ കാര്യമല്ല, മറിച്ച് ശരിയായ പരിസ്ഥിതിയുമായി പൊരുത്തപ്പെടേണ്ട കഴിവുകളുടെ ഒരു സ്പെക്ട്രമാണെന്ന തിരിച്ചറിവാണിത്. ഈ വിഭജനത്തെ നാവിഗേറ്റ് ചെയ്യാൻ കഴിയുന്നവരായിരിക്കും ഏറ്റവും വിജയകരമായ കമ്പനികൾ; തന്ത്രങ്ങൾക്കായി ഭീമന്മാരെയും നിർവ്വഹണത്തിനായി ചെറിയ മോഡലുകളെയും അവർ ഉപയോഗിക്കും. ഈ രണ്ട് തരം മോഡലുകൾ തമ്മിലുള്ള വിടവ് വർദ്ധിച്ചുകൊണ്ടേയിരിക്കുമോ അതോ പുതിയൊരു ആർക്കിടെക്ചറൽ മുന്നേറ്റം അവയെ ഒടുവിൽ ഒന്നിപ്പിക്കുമോ എന്നതാണ് ഇപ്പോഴും ബാക്കിയുള്ള ചോദ്യം. ഇപ്പോൾ, വിപണി അതിന്റെ വശങ്ങൾ തിരഞ്ഞെടുക്കുകയാണ്, സ്പെഷ്യലൈസ്ഡ് മോഡലുകളുടെ കാലഘട്ടം ശരിക്കും എത്തിക്കഴിഞ്ഞു.
ایڈیٹر کا نوٹ: ہم نے یہ سائٹ ایک کثیر لسانی AI خبروں اور گائیڈز کے مرکز کے طور پر ان لوگوں کے لیے بنائی ہے جو کمپیوٹر گیکس نہیں ہیں، لیکن پھر بھی مصنوعی ذہانت کو سمجھنا چاہتے ہیں، اسے زیادہ اعتماد کے ساتھ استعمال کرنا چاہتے ہیں، اور اس مستقبل کی پیروی کرنا چاہتے ہیں جو پہلے ہی آ رہا ہے۔
ഒരു പിശകോ തിരുത്തേണ്ട എന്തെങ്കിലും കണ്ടെത്തിയോ? ഞങ്ങളെ അറിയിക്കുക.