DeepSeek, Perplexity: AI രംഗത്തെ പുതിയ വെല്ലുവിളികൾ
ഏറ്റവും ചിലവേറിയ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് കുത്തകകളുടെ കാലം അവസാനിക്കുകയാണ്. കഴിഞ്ഞ രണ്ട് വർഷമായി, ഉയർന്ന നിലവാരമുള്ള പ്രകടനത്തിന് കോടിക്കണക്കിന് ഡോളറിന്റെ കമ്പ്യൂട്ടിംഗും വൻതോതിലുള്ള ഊർജ്ജ ഉപഭോഗവും ആവശ്യമാണെന്നായിരുന്നു വ്യവസായ മേഖലയിലെ ധാരണ. എന്നാൽ, കാര്യക്ഷമതയ്ക്ക് വൻതോതിലുള്ള വിഭവങ്ങളേക്കാൾ കരുത്തുണ്ടെന്ന് DeepSeek-ഉം Perplexity-യും ഇപ്പോൾ തെളിയിക്കുന്നു. വ്യവസായത്തിലെ മുൻനിര കമ്പനികൾക്ക് തുല്യമായ പ്രകടനം വളരെ കുറഞ്ഞ പരിശീലന ചിലവിൽ നൽകിക്കൊണ്ട് DeepSeek വിപണിയെ ഞെട്ടിച്ചു. അതേസമയം, പരമ്പരാഗത ലിങ്കുകളുടെ പട്ടികയ്ക്ക് പകരം നേരിട്ടുള്ളതും കൃത്യമായ ഉറവിടങ്ങളുള്ളതുമായ ഉത്തരങ്ങൾ നൽകിക്കൊണ്ട് Perplexity ഇന്റർനെറ്റ് ഉപയോഗരീതിയെ തന്നെ മാറ്റിമറിക്കുന്നു. ഈ മാറ്റം പുതിയ ടൂളുകളെക്കുറിച്ചുള്ളത് മാത്രമല്ല, ഇന്റലിജൻസിന്റെ സാമ്പത്തിക ശാസ്ത്രത്തിൽ വന്ന അടിസ്ഥാനപരമായ മാറ്റത്തെക്കുറിച്ചാണ്. ഒരു മോഡൽ എത്ര വലുതായിരിക്കണം എന്നതിനേക്കാൾ, അത് പ്രവർത്തിപ്പിക്കാൻ എത്ര കുറഞ്ഞ ചിലവ് വരും എന്നതിലാണ് ഇപ്പോൾ ശ്രദ്ധ. ഈ വെല്ലുവിളികൾ ശക്തി പ്രാപിക്കുമ്പോൾ, ഹൈപ്പ് (hype) എന്നതിനേക്കാൾ ഉപയുക്തതയ്ക്ക് മുൻഗണന നൽകുന്ന, കാര്യക്ഷമമായ എതിരാളികളുടെ മുന്നിൽ തങ്ങളുടെ ലാഭകരമായ ബിസിനസ്സ് മോഡലുകൾ സംരക്ഷിക്കാൻ വമ്പൻ കമ്പനികൾ നിർബന്ധിതരാകുന്നു.
ഇന്റലിജൻസ് വിപണിയിലെ കാര്യക്ഷമതയുടെ ഞെട്ടൽ
AI ലോകത്തെ ഉൽപ്പന്ന യാഥാർത്ഥ്യത്തിൽ ഒരു മാറ്റം DeepSeek കൊണ്ടുവരുന്നു. പല കമ്പനികളും കഴിയുന്നത്ര വലിയ ന്യൂറൽ നെറ്റ്വർക്കുകൾ നിർമ്മിക്കാൻ ശ്രദ്ധിക്കുമ്പോൾ, ഈ ടീം ആർക്കിടെക്ചറൽ ഒപ്റ്റിമൈസേഷനിലാണ് ശ്രദ്ധ കേന്ദ്രീകരിച്ചത്. അവരുടെ DeepSeek-V3 മോഡൽ ‘Mixture of Experts’ എന്ന സമീപനമാണ് ഉപയോഗിക്കുന്നത്, ഇത് ഏതൊരു ജോലിക്കും മൊത്തം പാരാമീറ്ററുകളുടെ ഒരു ചെറിയ ഭാഗം മാത്രമേ സജീവമാക്കുന്നുള്ളൂ. ഇത് ഓരോ വാക്ക് നിർമ്മിക്കുമ്പോഴും ആവശ്യമായ കമ്പ്യൂട്ടേഷണൽ പവർ ഗണ്യമായി കുറച്ചുകൊണ്ട് ഉയർന്ന പ്രകടനം നിലനിർത്താൻ മോഡലിനെ സഹായിക്കുന്നു. ആറ് ദശലക്ഷം ഡോളറിൽ താഴെ മാത്രം ചിലവിൽ പരിശീലനം നേടിയെന്നതാണ് ഈ കമ്പനിയെക്കുറിച്ചുള്ള പ്രധാന ചർച്ച. ഏറ്റവും സമ്പന്നരായ രാജ്യങ്ങൾക്കും കോർപ്പറേഷനുകൾക്കും മാത്രമേ മികച്ച മോഡലുകൾ നിർമ്മിക്കാൻ കഴിയൂ എന്ന ധാരണയെ ഈ കണക്ക് ചോദ്യം ചെയ്യുന്നു. ഉയർന്ന തലത്തിലുള്ള മെഷീൻ ലേണിംഗിലേക്കുള്ള പ്രവേശന തടസ്സം മുമ്പ് കരുതിയതിലും കുറവാണെന്ന് ഇത് സൂചിപ്പിക്കുന്നു.
Perplexity ഉപയോക്തൃ ഇന്റർഫേസിന്റെ കാഴ്ചപ്പാടിൽ നിന്നാണ് ഈ പ്രശ്നത്തെ സമീപിക്കുന്നത്. ഇതൊരു പരമ്പരാഗത സെർച്ച് എഞ്ചിനേക്കാൾ ഉപരി ഒരു ‘ആൻസർ എഞ്ചിൻ’ ആണ്. നിലവിലുള്ള ലാർജ് ലാംഗ്വേജ് മോഡലുകൾ ഉപയോഗിച്ച് തത്സമയ വെബ് സ്കാൻ ചെയ്യുകയും, വിവരങ്ങൾ ശേഖരിച്ച് അടിക്കുറിപ്പുകളോട് കൂടി ഒരു ഖണ്ഡികയായി അവതരിപ്പിക്കുകയും ചെയ്യുന്നു. സാധാരണ AI മോഡലുകളുടെ പ്രധാന ദൗർബല്യമായ, കാലഹരണപ്പെട്ടതോ തെറ്റായതോ ആയ വിവരങ്ങൾ നൽകുന്ന പ്രവണതയെ ഈ ഡിസൈൻ മറികടക്കുന്നു. തത്സമയ വെബ് ഡാറ്റ ഉപയോഗിക്കുന്നതിലൂടെ, ഒരു സാധാരണ ചാറ്റ് ബോട്ടിനേക്കാൾ പ്രൊഫഷണൽ ഗവേഷണത്തിന് കൂടുതൽ വിശ്വസനീയമായ ഒരു ടൂൾ Perplexity സൃഷ്ടിച്ചു. ഈ ഉൽപ്പന്നം മോഡൽ മാത്രമല്ല, അതിനെ ചുറ്റിപ്പറ്റിയുള്ള വിവരശേഖരണവും സൈറ്റേഷനും കൂടിയാണ്. ഫലങ്ങളുടെ ഒന്നിലധികം പേജുകളിൽ ക്ലിക്ക് ചെയ്യുന്ന ഉപയോക്താക്കളിൽ നിന്നുള്ള പരസ്യ വരുമാനത്തെ ആശ്രയിക്കുന്ന പരമ്പരാഗത സെർച്ച് പ്രൊവൈഡർമാർക്ക് ഇത് വലിയ സമ്മർദ്ദമുണ്ടാക്കുന്നു.
ഉള്ളടക്കം ഗവേഷണം ചെയ്യാനും എഴുതാനും എഡിറ്റ് ചെയ്യാനും വിവർത്തനം ചെയ്യാനും BotNews.today AI ടൂളുകൾ ഉപയോഗിക്കുന്നു. വിവരങ്ങൾ ഉപയോഗപ്രദവും വ്യക്തവും വിശ്വസനീയവുമാക്കാൻ ഞങ്ങളുടെ ടീം ഈ പ്രക്രിയ അവലോകനം ചെയ്യുകയും മേൽനോട്ടം വഹിക്കുകയും ചെയ്യുന്നു.
ചീപ്പ് കമ്പ്യൂട്ടിംഗിന്റെ ജിയോപൊളിറ്റിക്സ്
ഈ വെല്ലുവിളികളുടെ ആഗോള സ്വാധീനം ഉയർന്ന പ്രകടനശേഷിയുള്ള ഇൻഫറൻസിന്റെ ജനാധിപത്യവൽക്കരണത്തിലാണ്. ഒരു മോഡൽ പ്രവർത്തിപ്പിക്കുന്നതിനുള്ള ചിലവ് തൊണ്ണൂറ് ശതമാനം കുറയുമ്പോൾ, അത് ദൈനംദിന സോഫ്റ്റ്വെയറുകളിൽ സംയോജിപ്പിക്കാനുള്ള സാധ്യത വർദ്ധിക്കുന്നു. മുമ്പ് ഉയർന്ന വില കാരണം ടോപ്പ് ടിയർ API-കൾ ഉപയോഗിക്കാൻ കഴിയാതിരുന്ന വളർന്നുവരുന്ന വിപണികളിലെ ഡെവലപ്പർമാർക്ക് ഇപ്പോൾ സങ്കീർണ്ണമായ ആപ്ലിക്കേഷനുകൾ നിർമ്മിക്കാൻ കഴിയും. ഇത് മുഴുവൻ വ്യവസായത്തിന്റെയും ശ്രദ്ധാകേന്ദ്രം മാറ്റുന്നു. ഏറ്റവും കാര്യക്ഷമമായ മോഡലുകൾ സിലിക്കൺ വാലിക്ക് പുറത്ത് നിന്നാണ് വരുന്നതെങ്കിൽ, വൻകിട സെർവർ ഫാമുകളുടെ തന്ത്രപരമായ മേധാവിത്വം കുറയാൻ തുടങ്ങുന്നു. മോഡൽ പരമാധികാരത്തെക്കുറിച്ചും, രാജ്യങ്ങൾ ഏതാനും കേന്ദ്രീകൃത പ്രൊവൈഡറുകളെ ആശ്രയിക്കണോ അതോ സ്വന്തം കാര്യക്ഷമമായ ആർക്കിടെക്ചറുകളിൽ നിക്ഷേപിക്കണോ എന്നതിനെക്കുറിച്ചും ഇത് ചർച്ചകൾക്ക് വഴിയൊരുക്കുന്നു. ഇത് വ്യവസായത്തെ ‘വിന്നർ ടേക്ക് ഓൾ’ എന്നതിൽ നിന്ന് കൂടുതൽ വിഭജിക്കപ്പെട്ടതും മത്സരാധിഷ്ഠിതവുമായ വിപണിയിലേക്ക് മാറ്റുന്നതിനാൽ ശ്രദ്ധിക്കേണ്ട ഒരു സിഗ്നലാണ്.
എന്റർപ്രൈസ് ഉപഭോക്താക്കൾ ഈ മാറ്റം അവരുടെ ലാഭത്തിൽ അനുഭവിക്കാൻ തുടങ്ങിയിട്ടുണ്ട്. കുറഞ്ഞ ചിലവിലുള്ള ഇൻഫറൻസ് എന്ന ആശയം കമ്പനികൾ തങ്ങളുടെ ദീർഘകാല സാങ്കേതിക പദ്ധതികൾ എങ്ങനെ ആസൂത്രണം ചെയ്യണം എന്ന് മാറ്റുന്നു. DeepSeek പോലുള്ള ഒരു മോഡലിന് കൂടുതൽ ചിലവേറിയ എതിരാളിയുടെ എൺപത് ശതമാനം ഉപയുക്തത പത്ത് ശതമാനം വിലയ്ക്ക് നൽകാൻ കഴിയുമെങ്കിൽ, മിക്ക സാധാരണ ജോലികൾക്കും കൂടുതൽ ചിലവേറിയ ഓപ്ഷന്റെ ബിസിനസ്സ് പ്രസക്തി ഇല്ലാതാകുന്നു. ഇത് ഒരു ടയേർഡ് വിപണി സൃഷ്ടിക്കുന്നു, അവിടെ ഏറ്റവും ചിലവേറിയ മോഡലുകൾ സങ്കീർണ്ണമായ കാര്യങ്ങൾക്കും, ബാക്കി ജോലികൾ കാര്യക്ഷമമായ വെല്ലുവിളികൾക്കും ഉപയോഗിക്കുന്നു. ഈ സാമ്പത്തിക യാഥാർത്ഥ്യം പരസ്യ ലോകത്തെയും ബാധിക്കുന്നുണ്ട്. പരസ്യങ്ങൾ ഗവേഷണ പ്രക്രിയയിൽ നിന്ന് ശ്രദ്ധ തിരിക്കുന്നതിന് പകരം അതിൽ തന്നെ സംയോജിപ്പിക്കുന്ന ഒരു മോഡലിലാണ് Perplexity പരീക്ഷണം നടത്തുന്നത്. ആളുകൾ ഹോംപേജുകൾ സന്ദർശിക്കാത്തതോ സെർച്ച് ഫലങ്ങളിലൂടെ സ്ക്രോൾ ചെയ്യാത്തതോ ആയ കാലത്ത് ബ്രാൻഡുകൾ ഉപഭോക്താക്കളിലേക്ക് എങ്ങനെ എത്തുന്നു എന്ന് ഇത് പുനർനിർവചിച്ചേക്കാം. ഒരു API തിരഞ്ഞെടുക്കുന്ന സോഫ്റ്റ്വെയർ എഞ്ചിനീയർ മുതൽ തൽക്ഷണ ഉത്തരങ്ങളുടെ ലോകത്ത് പ്രേക്ഷകരെ കണ്ടെത്താൻ ശ്രമിക്കുന്ന മാർക്കറ്റിംഗ് എക്സിക്യൂട്ടീവ് വരെ എല്ലാവരും ഇതിന്റെ സ്വാധീനം അനുഭവിക്കുന്നു.
ആൻസർ എഞ്ചിനുകൾക്കൊപ്പമൊരു ചൊവ്വാഴ്ച
യഥാർത്ഥ ലോകത്തെ സ്വാധീനം മനസ്സിലാക്കാൻ, സാറാ എന്ന ഫിനാൻഷ്യൽ അനലിസ്റ്റിന്റെ ജീവിതത്തിലെ ഒരു ദിവസം പരിഗണിക്കുക. മുൻകാലങ്ങളിൽ, വിപണിയിലെ ചലനങ്ങളും വാർത്തകളും പരിശോധിക്കാൻ പത്ത് വ്യത്യസ്ത ടാബുകൾ തുറന്നാണ് സാറാ തന്റെ പ്രഭാതം ആരംഭിച്ചിരുന്നത്. ഡാറ്റ ക്രോഡീകരിച്ച് ഒരു ബ്രീഫ് തയ്യാറാക്കാൻ അവൾ മണിക്കൂറുകൾ ചിലവഴിച്ചിരുന്നു. ഇന്ന്, അവൾ ഒരു ആൻസർ എഞ്ചിൻ ഉപയോഗിച്ച് ഒരേസമയം ഒന്നിലധികം ഉറവിടങ്ങളിൽ നിന്ന് പ്രത്യേക ഡാറ്റ പോയിന്റുകൾ അന്വേഷിക്കുന്നു. മൂന്ന് വ്യത്യസ്ത ക്വാർട്ടർലി റിപ്പോർട്ടുകൾ താരതമ്യം ചെയ്യാൻ അവൾ ആവശ്യപ്പെടുകയും നിമിഷങ്ങൾക്കുള്ളിൽ സൈറ്റേഷനുകളോട് കൂടിയ സംഗ്രഹം ലഭിക്കുകയും ചെയ്യുന്നു. സിസ്റ്റം നേരിട്ട് ഉറവിടത്തിൽ നിന്ന് വിവരങ്ങൾ എടുക്കുന്നതിനാൽ ലഭിച്ച ഡാറ്റ കൃത്യമാണ്. വിവരങ്ങൾ കണ്ടെത്താൻ അവൾ ഇപ്പോൾ സമയം ചിലവഴിക്കുന്നില്ല. അത് പരിശോധിക്കാനും തീരുമാനങ്ങൾ എടുക്കാനും അവൾ സമയം ചിലവഴിക്കുന്നു. ഇതാണ് സെർച്ച് ഡിസ്ട്രിബ്യൂഷൻ കഥ. ഇന്റർഫേസ് ഗവേഷകനായി മാറി, സാറാ എഡിറ്ററായി മാറി. അവളുടെ ജോലി വേഗത്തിലായി, എന്നാൽ എഞ്ചിൻ നൽകുന്ന സൈറ്റേഷനുകളുടെ കൃത്യതയെ അവൾ കൂടുതൽ ആശ്രയിക്കുന്നു.
ദിവസത്തിന്റെ അവസാനം, ഡാറ്റ എൻട്രി ജോലികൾ ഓട്ടോമേറ്റ് ചെയ്യാൻ സാറയ്ക്ക് ഒരു കസ്റ്റം സ്ക്രിപ്റ്റ് എഴുതണം. പ്രീമിയം ചിലവ് വരുന്ന ഒരു ജനറൽ പർപ്പസ് അസിസ്റ്റന്റിന് പകരം, DeepSeek പോലുള്ള ഒരു വെല്ലുവിളിയുടെ സ്പെഷ്യലൈസ്ഡ് കോഡിംഗ് മോഡൽ അവൾ ഉപയോഗിക്കുന്നു. മോഡൽ തൽക്ഷണം കോഡ് നൽകുന്നു, ഇൻഫറൻസ് ചിലവ് വളരെ കുറവായതിനാൽ, ബജറ്റിനെക്കുറിച്ച് ആശങ്കപ്പെടാതെ ദിവസം മുഴുവൻ ആയിരക്കണക്കിന് ചെറിയ ജോലികൾക്കായി ഇത് ഉപയോഗിക്കാൻ അവളുടെ കമ്പനി അനുവദിക്കുന്നു. മോഡൽ വിപണി മാറുന്നത് ഇങ്ങനെയാണ്. ഇതൊരു വിലയേറിയ വിഭവത്തിന് പകരം ഒരു ബാക്ക്ഗ്രൗണ്ട് യൂട്ടിലിറ്റിയായി മാറുകയാണ്. സാറാ മൂന്ന് ദിവസമായി ഒരു സാധാരണ സെർച്ച് ബാർ ഉപയോഗിച്ചിട്ടില്ലെന്ന് തിരിച്ചറിയുമ്പോൾ പരമ്പരാഗത സെർച്ച് രീതിയിലുള്ള സമ്മർദ്ദം വ്യക്തമാകുന്നു. ഘടനാപരമായ ഒരു ഡോക്യുമെന്റ് ലഭിക്കുമ്പോൾ ലിങ്കുകളുടെ പട്ടികയുടെ ആവശ്യമില്ല. അവളുടെ ദിനചര്യയിലുണ്ടായ മാറ്റം താഴെ പറയുന്ന പോയിന്റുകൾ വ്യക്തമാക്കുന്നു:
- സാറാ മാനുവൽ വാർത്താ ശേഖരണത്തിന് പകരം തത്സമയം അപ്ഡേറ്റ് ചെയ്യുന്ന ഓട്ടോമേറ്റഡ് സൈറ്റഡ് സംഗ്രഹങ്ങൾ ഉപയോഗിക്കുന്നു.
- മുമ്പ് ഓട്ടോമേറ്റ് ചെയ്യാൻ വളരെ ചിലവേറിയതായിരുന്ന ആവർത്തന കോഡിംഗ് ജോലികൾക്കായി അവൾ കുറഞ്ഞ ചിലവിലുള്ള മോഡലുകൾ ഉപയോഗിക്കുന്നു.
- നേരിട്ടുള്ള ഉത്തരങ്ങളിൽ കൂടുതൽ മൂല്യം കണ്ടെത്തുന്നതിനാൽ പരമ്പരാഗത പരസ്യ പിന്തുണയുള്ള സെർച്ച് എഞ്ചിനുകളെ ആശ്രയിക്കുന്നത് പൂജ്യത്തിലേക്ക് താഴുന്നു.
- ലാഭിച്ച സമയം ഡാറ്റ വേട്ടയ്ക്ക് പകരം ഉയർന്ന തലത്തിലുള്ള തന്ത്രങ്ങളിലും ക്ലയന്റ് ബന്ധങ്ങളിലും ശ്രദ്ധ കേന്ദ്രീകരിക്കാൻ അവളെ സഹായിക്കുന്നു.
സൗജന്യ ഇന്റലിജൻസിന്റെ മറഞ്ഞിരിക്കുന്ന വില
ഈ കാര്യക്ഷമതയ്ക്ക് പകരമായി നമ്മൾ എന്താണ് നൽകുന്നത് എന്ന് ചോദിക്കാൻ സോക്രട്ടിക് സംശയം നമ്മോട് ആവശ്യപ്പെടുന്നു. ഒരു മോഡൽ പരിശീലിപ്പിക്കാനും പ്രവർത്തിപ്പിക്കാനും ഗണ്യമായി ചിലവ് കുറവാണെങ്കിൽ, ആ ലാഭം എവിടെ നിന്നാണ് വന്നത്? കൂടുതൽ ചിലവേറിയ മോഡലുകളെപ്പോലെ തന്നെ ഈ കാര്യക്ഷമമായ മോഡലുകൾ പരിശീലിപ്പിക്കാൻ ഉപയോഗിച്ച ഡാറ്റയും കൃത്യമായ പരിശോധനയ്ക്ക് വിധേയമാക്കിയതാണോ എന്ന് നമ്മൾ ചോദിക്കണം. വില കുറയ്ക്കാനുള്ള മത്സരം ഡാറ്റാ സ്വകാര്യതയിലും ബൗദ്ധിക സ്വത്തവകാശത്തിലും വിട്ടുവീഴ്ചകൾക്ക് കാരണമാകുമോ എന്ന ഭയമുണ്ട്. ഒരു കമ്പനി അതിന്റെ മോഡലിന് അധികം ചാർജ് ചെയ്യുന്നില്ലെങ്കിൽ, ഉപയോക്താക്കൾ നൽകുന്ന ഡാറ്റ അവർ മോണിറ്റൈസ് ചെയ്യുന്നുണ്ടോ? ആൻസർ എഞ്ചിൻ മോഡലിന്റെ മറഞ്ഞിരിക്കുന്ന ചിലവും നമ്മൾ പരിഗണിക്കണം. Perplexity ഒരു വെബ്സൈറ്റിനെ സംഗ്രഹിക്കുമ്പോൾ, ആ വെബ്സൈറ്റിന് ഒരു സന്ദർശകനെ നഷ്ടപ്പെടുന്നു. യഥാർത്ഥ ഉള്ളടക്കം സൃഷ്ടിച്ചവർക്ക് പ്രതിഫലം ലഭിക്കുന്നില്ലെങ്കിൽ, ഈ എഞ്ചിനുകൾ ആശ്രയിക്കുന്ന വിവരങ്ങൾ തന്നെ കാലക്രമേണ അപ്രത്യക്ഷമായേക്കാം. വായനക്കാർ യഥാർത്ഥ ഉറവിടം സന്ദർശിക്കുന്നില്ലെങ്കിൽ 2026-ലെ ജേണലിസത്തിനും ഗവേഷണത്തിനും ആര് ഫണ്ട് നൽകും?
ഈ ലളിതമായ ആർക്കിടെക്ചറുകളുടെ വിശ്വാസ്യതയെക്കുറിച്ചുള്ളതാണ് മറ്റൊരു പ്രയാസകരമായ ചോദ്യം. ‘Mixture of Experts’ സമീപനം കണ്ടെത്താൻ പ്രയാസമുള്ള പുതിയ തരം പിശകുകൾ കൊണ്ടുവരുന്നുണ്ടോ? വേഗതയ്ക്ക് വേണ്ടി നമ്മൾ ആഴം ബലികഴിക്കുകയാണോ എന്ന് ചോദിക്കണം. യഥാർത്ഥ സന്ദർഭം പരിശോധിക്കാതെ സംഗ്രഹിച്ച സൈറ്റേഷനുകളെ ഉപയോക്താക്കൾ അമിതമായി ആശ്രയിക്കാൻ സാധ്യതയുണ്ട്. ഇത് സങ്കീർണ്ണമായ വിഷയങ്ങളെക്കുറിച്ചുള്ള ഉപരിപ്ലവമായ ധാരണയിലേക്ക് നയിച്ചേക്കാം. പരിശീലന ചിലവിനെക്കുറിച്ചുള്ള അവകാശവാദങ്ങളെയും നമ്മൾ സംശയിക്കണം. ഈ കണക്കുകൾ പൂർണ്ണമായും സുതാര്യമാണോ, അതോ മനുഷ്യ അധ്വാനത്തിന്റെ ചിലവും ഹാർഡ്വെയറിന്റെ പാരിസ്ഥിതിക ആഘാതവും അവ ഒഴിവാക്കുന്നുണ്ടോ? വിലകുറഞ്ഞ ഇന്റലിജൻസിന്റെ ലോകത്തേക്ക് നീങ്ങുമ്പോൾ, നമ്മൾ ജീവിതത്തിലേക്ക് സംയോജിപ്പിക്കുന്ന സിസ്റ്റങ്ങളുടെ ഗുണനിലവാരത്തെക്കുറിച്ചും ധാർമ്മികതയെക്കുറിച്ചും ജാഗ്രത പാലിക്കണം. ഒരു പുതിയ ഉൽപ്പന്നം പുറത്തിറങ്ങുമ്പോഴുണ്ടാകുന്ന ബഹളം പലപ്പോഴും അതിന്റെ ദീർഘകാല പ്രത്യാഘാതങ്ങളെ മറച്ചുവെച്ചേക്കാം.
പുതിയ വെല്ലുവിളികളുടെ ഉള്ളറകൾ
പവർ യൂസർമാരെ സംബന്ധിച്ചിടത്തോളം, ഈ വെല്ലുവിളികളുടെ ആകർഷണം അവയുടെ സാങ്കേതിക വഴക്കവും ഇന്റഗ്രേഷൻ കഴിവുകളുമാണ്. DeepSeek-V3, FP8 പ്രിസിഷനായി ഒപ്റ്റിമൈസ് ചെയ്യുന്ന ഒരു പരിശീലന ചട്ടക്കൂടാണ് ഉപയോഗിക്കുന്നത്, ഇത് കൃത്യതയിൽ വലിയ നഷ്ടമില്ലാതെ വേഗത്തിലുള്ള കമ്പ്യൂട്ടേഷൻ അനുവദിക്കുന്നു. അവരുടെ ചിലവ് കാര്യക്ഷമത വിശദീകരിക്കാൻ സഹായിക്കുന്ന ഒരു പ്രധാന സാങ്കേതിക നാഴികക്കല്ലാണിത്. അവരുടെ ‘Multi-head Latent Attention’ മെക്കാനിസം ഇൻഫറൻസ് സമയത്ത് മോഡലിന്റെ മെമ്മറി ഉപയോഗം കുറയ്ക്കുന്നു, ഇത് സ്വന്തം ഹാർഡ്വെയറിൽ ഈ മോഡലുകൾ ഹോസ്റ്റ് ചെയ്യാൻ ആഗ്രഹിക്കുന്ന ഡെവലപ്പർമാർക്ക് നിർണ്ണായക ഘടകമാണ്. ഈ പുതിയ മോഡലുകളിൽ പലതും ഓപ്പൺ വെയിറ്റുകളോടെയാണ് പുറത്തിറങ്ങുന്നത്, അതായത് അവ പ്രാദേശികമായോ അല്ലെങ്കിൽ സ്വകാര്യ ക്ലൗഡ് ഇൻസ്റ്റൻസുകളിലോ പ്രവർത്തിപ്പിക്കാം. മൂന്നാം കക്ഷി API-കളിലേക്ക് സെൻസിറ്റീവ് ഡാറ്റ അയക്കാൻ കഴിയാത്ത എന്റർപ്രൈസുകൾക്ക് ഇതൊരു വലിയ നേട്ടമാണ്. നിയമ, മെഡിക്കൽ, അല്ലെങ്കിൽ സാമ്പത്തിക മേഖലകളിലെ പ്രത്യേക ആവശ്യങ്ങൾക്കായി ഈ മോഡലുകളെ ഫൈൻ ട്യൂൺ ചെയ്യാനുള്ള കഴിവ് അവയുടെ മൂല്യം വർദ്ധിപ്പിക്കുന്നു.
ഞങ്ങൾ ഉൾപ്പെടുത്തണമെന്ന് നിങ്ങൾ കരുതുന്ന ഒരു AI സ്റ്റോറിയോ, ടൂളോ, ട്രെൻഡോ, ചോദ്യമോ നിങ്ങളുടെ പക്കലുണ്ടോ? നിങ്ങളുടെ ലേഖന ആശയം ഞങ്ങൾക്ക് അയയ്ക്കുക — അത് കേൾക്കാൻ ഞങ്ങൾ ആഗ്രഹിക്കുന്നു.ഡെവലപ്പർമാർക്ക് സ്വന്തം ആപ്ലിക്കേഷനുകളിൽ നേരിട്ട് സെർച്ച് കഴിവുകൾ നിർമ്മിക്കാൻ അനുവദിക്കുന്ന API വഴി Perplexity വ്യത്യസ്തമായ സാങ്കേതിക മൂല്യം നൽകുന്നു. ഇത് പ്രത്യേക സെർച്ച് ഇൻഡക്സിന്റെയും ലാംഗ്വേജ് മോഡലിന്റെയും ആവശ്യം ഒഴിവാക്കുന്നു. സിസ്റ്റം ഗ്രൗണ്ടിംഗും സൈറ്റേഷനും സ്വയമേവ കൈകാര്യം ചെയ്യുന്നു. എന്നിരുന്നാലും, പരിഗണിക്കേണ്ട പരിധികളുണ്ട്. API റേറ്റ് ലിമിറ്റുകളും തത്സമയ വെബ് സെർച്ചിംഗിന്റെ ലേറ്റൻസിയും വലിയ ആപ്ലിക്കേഷനുകൾക്ക് തടസ്സമായേക്കാം. സെർച്ചിന്റെ വേഗതയും വിശകലനത്തിന്റെ ആഴവും തമ്മിലുള്ള സന്തുലിതാവസ്ഥ ഉപയോക്താക്കൾ കൈകാര്യം ചെയ്യണം. വിവരങ്ങൾ എവിടെ നിന്നാണ് വന്നതെന്ന് ഓഡിറ്റ് ട്രയൽ സൂക്ഷിക്കേണ്ട പവർ യൂസർമാർക്ക് ഈ സെർച്ച് ഫലങ്ങളുടെ ലോക്കൽ സ്റ്റോറേജും മറ്റൊരു പരിഗണനയാണ്. ഈ ടൂളുകൾക്ക് മത്സരത്തിൽ മുൻതൂക്കം നൽകുന്ന സാങ്കേതിക ഘടകങ്ങൾ താഴെ പറയുന്നവയാണ്:
- ലോങ്ങ് കോണ്ടക്സ്റ്റ് ജോലികളിൽ KV കാഷെ മെമ്മറി ഉപയോഗം കുറയ്ക്കാൻ ‘Multi-head Latent Attention’ ഉപയോഗിക്കുന്നു.
- ആധുനിക GPU ഹാർഡ്വെയറിന്റെ ശേഷി പരമാവധി പ്രയോജനപ്പെടുത്താൻ FP8 പരിശീലനത്തിനും ഇൻഫറൻസിനും പിന്തുണ.
- ആയിരക്കണക്കിന് കൺകറന്റ് വെബ് ക്വറികൾ കൈകാര്യം ചെയ്യാൻ കഴിയുന്ന തത്സമയ RAG പൈപ്പ്ലൈനുകളുടെ സംയോജനം.
- സുരക്ഷിതമായ പരിതസ്ഥിതികളിൽ ലോക്കൽ ഡിപ്ലോയ്മെന്റിനായി ഓപ്പൺ വെയിറ്റുകളുടെ ലഭ്യത.
തിരഞ്ഞെടുത്ത ഇന്റലിജൻസിന്റെ ഭാവി
DeepSeek-ന്റെയും Perplexity-യുടെയും ഉയർച്ച കൂടുതൽ പക്വമായ AI വിപണിയുടെ തുടക്കത്തെ അടയാളപ്പെടുത്തുന്നു. സംസാരിക്കാൻ കഴിയുന്ന മോഡലുകളുടെ പുതുമയിൽ നിന്ന് മാറി, കാര്യക്ഷമമായി പ്രവർത്തിക്കാൻ കഴിയുന്ന മോഡലുകളുടെ ഉപയുക്തതയിലേക്ക് നമ്മൾ നീങ്ങുകയാണ്. ഉയർന്ന നിലവാരമുള്ള ഫലങ്ങൾ സുസ്ഥിരമായ വിലയിൽ നൽകാൻ കഴിയുന്ന പ്രൊവൈഡർമാരിലേക്ക് ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു. ഇത് നിലവിലെ 2026-ന് വേണ്ടിയുള്ള ഒരു ട്രെൻഡ് മാത്രമല്ല, ഡിജിറ്റൽ സേവനങ്ങൾ നമ്മൾ എങ്ങനെ നിർമ്മിക്കുകയും ഉപയോഗിക്കുകയും ചെയ്യുന്നു എന്നതിലെ ദീർഘകാല മാറ്റമാണ്. ഈ വെല്ലുവിളികൾ തങ്ങളുടെ ഉൽപ്പന്നങ്ങൾ മെച്ചപ്പെടുത്തുമ്പോൾ പരമ്പരാഗത സെർച്ച്, ഉയർന്ന ചിലവിലുള്ള മോഡൽ പ്രൊവൈഡർമാർക്ക് മേലുള്ള സമ്മർദ്ദം വർദ്ധിക്കുകയേയുള്ളൂ. ഉപയോക്താവിനെ സംബന്ധിച്ചിടത്തോളം, ഇതിനർത്ഥം കൂടുതൽ തിരഞ്ഞെടുപ്പുകളും മികച്ച ടൂളുകളും എന്നാണ്. വ്യവസായത്തെ സംബന്ധിച്ചിടത്തോളം, ബ്രൂട്ട് ഫോഴ്സ് കമ്പ്യൂട്ടേഷനേക്കാൾ എഞ്ചിനീയറിംഗ് മികവിലേക്ക് വീണ്ടും ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു എന്നാണ്. ഹൈപ്പ് സൈക്കിളിലെ ബഹളവും ടെക് സമ്പദ്വ്യവസ്ഥയിലെ യഥാർത്ഥ ഘടനാപരമായ മാറ്റവും തമ്മിലുള്ള വ്യത്യാസം തിരിച്ചറിയാൻ കഴിയുന്നവരായിരിക്കും യഥാർത്ഥ വിജയികൾ.
Redaktørens merknad: Vi opprettet dette nettstedet som et flerspråklig knutepunkt for AI-nyheter og guider for folk som ikke er datanerder, men som likevel ønsker å forstå kunstig intelligens, bruke den med større selvtillit og følge fremtiden som allerede er her.
ഒരു പിശകോ തിരുത്തേണ്ട എന്തെങ്കിലും കണ്ടെത്തിയോ? ഞങ്ങളെ അറിയിക്കുക.