இன்றைய டாப் AI மாடல்களுக்கு இடையிலான முக்கிய வித்தியாசங்கள்
லீடர்போர்டுகளைப் (leaderboards) பார்ப்பதை நிறுத்துங்கள். உங்கள் பிசினஸ் அல்லது சொந்த புராஜெக்டுகளுக்கு எந்த செயற்கை நுண்ணறிவு (AI) மாடலைப் பயன்படுத்துவது என்று நீங்கள் யோசித்துக் கொண்டிருந்தால், இந்த பெஞ்ச்மார்க்ஸ் பெரும்பாலும் உங்களுக்கு உதவாது. ஒரு மேக்ஸ் டெஸ்டில் சில புள்ளிகள் அதிகமாக எடுக்கும் மாடல், உங்கள் பிராண்டின் தனித்துவமான ஸ்டைலைப் பிடிப்பதிலோ அல்லது ஒரு சிக்கலான கோடிங்கை கையாளுவதிலோ சொதப்பலாம். ஒரு நிறுவனமே எல்லாத் துறையிலும் முதலிடத்தில் இருந்த காலம் முடிந்துவிட்டது. இன்றைய சூழலில், நாம் எதைத் தேர்ந்தெடுக்கிறோம் என்பது நாம் எதை விட்டுக் கொடுக்கிறோம் என்பதைப் பொறுத்தது. வேகம், செலவு, மெமரி மற்றும் ஒரு பிரச்சனையை அந்த மாடல் எப்படி அணுகுகிறது என்பதைப் பொறுத்தே உங்கள் தேர்வு இருக்க வேண்டும். சான் பிரான்சிஸ்கோவில் இருக்கும் ஒரு டெவலப்பருக்குத் தேவையான அதே மாடல், லண்டனில் இருக்கும் ஒரு கிரியேட்டிவ் ஏஜென்சிக்கோ அல்லது சிங்கப்பூரில் இருக்கும் ஒரு லாஜிஸ்டிக்ஸ் நிறுவனத்திற்கோ சரியாக இருக்காது. இந்த கைடு வெறும் விளம்பரங்களைத் தாண்டி, தற்போதைய மார்க்கெட்டின் எதார்த்தமான நிலையைப் பற்றிப் பேசுகிறது.
தற்போதைய மார்க்கெட்டை நான்கு முக்கிய பிளேயர்கள் ஆதிக்கம் செலுத்துகிறார்கள், அவர்கள் ஒவ்வொருவரும் ஒரு தனித்துவமான ஸ்டைலைக் கொண்டுள்ளனர். OpenAI-ன் GPT-4o இப்போதும் முன்னணியில் இருக்கிறது. இது ஒரு மல்டிமோடல் அசிஸ்டென்ட் போல வடிவமைக்கப்பட்டுள்ளது; இதனால் பார்க்கவும், கேட்கவும், நிகழ்நேரத்தில் பேசவும் முடியும். இது ஒரு ஆல்-ரவுண்டர் போல எல்லா வேலைகளையும் தரமாகச் செய்யும். Anthropic நிறுவனம் Claude 3.5 Sonnet மூலம் ஒரு வித்தியாசமான பாதையைத் தேர்ந்தெடுத்துள்ளது. இது நுணுக்கமான விஷயங்கள், கோடிங் திறன் மற்றும் மனிதர்கள் எழுதுவது போன்ற இயல்பான நடை ஆகியவற்றில் அதிக கவனம் செலுத்துகிறது. கூகுளின் Gemini 1.5 Pro அதன் பிரம்மாண்டமான கான்டெக்ஸ்ட் விண்டோ (context window) மூலம் தனித்து நிற்கிறது, இது பல மணிநேர வீடியோக்கள் அல்லது ஆயிரக்கணக்கான வரிகள் கொண்ட கோடிங்கை ஒரே நேரத்தில் அலச உதவும். இறுதியாக, மெட்டாவின் Llama 3, ஓபன் வெயிட் (open weight) உலகில் ஒரு ஜாம்பவான். இது நிறுவனங்கள் தங்கள் டேட்டாவை மூன்றாம் தரப்பு சர்வருக்கு அனுப்பாமல், சொந்த ஹார்டுவேரிலேயே சக்திவாய்ந்த சிஸ்டம்களை இயக்க அனுமதிக்கிறது. இந்த மாடல்களைப் பயன்படுத்தப் பயன்படுத்தத்தான் அவற்றின் தனித்தன்மை புரியும். எங்களின் விரிவான AI ரிவியூக்களில் இவை பெஞ்ச்மார்க்குகளில் எப்படிச் செயல்படுகின்றன என்பதை நீங்கள் பார்க்கலாம்.
இந்த நான்கில் ஒன்றைத் தேர்ந்தெடுக்க அவற்றின் பலத்தைப் புரிந்துகொள்வது அவசியம். மொபைல் பயனர்களுக்கும், அன்றாட வேலைகளுக்கு ஒரு நம்பகமான “சுவிஸ் ஆர்மி நைஃப்” (Swiss Army knife) தேவைப்படுபவர்களுக்கும் GPT-4o சிறந்தது. சிக்கலான இன்ஸ்ட்ரக்ஷன்களைக் குழப்பமில்லாமல் பின்பற்றுவதால், சாப்ட்வேர் இன்ஜினியர்களின் ஃபேவரைட்டாக Claude 3.5 Sonnet மாறியுள்ளது. பெரிய அளவிலான டேட்டா அல்லது நீண்ட டாக்குமெண்ட்களை ஆராய வேண்டிய ஆராய்ச்சியாளர்களுக்கு Gemini 1.5 Pro தான் சரியான டூல். பிரைவசிக்கு முக்கியத்துவம் கொடுப்பவர்களுக்கும், API சந்தா செலவுகளைத் தவிர்க்க விரும்புபவர்களுக்கும் Llama 3 சிறந்த தேர்வு. இந்த மாடல்கள் வெறும் அவுட்புட்டில் மட்டும் வேறுபடவில்லை, அவற்றின் அடிப்படை கட்டமைப்பு மற்றும் அவை பயிற்சி அளிக்கப்பட்ட டேட்டாவிலும் வேறுபடுகின்றன. இது லாஜிக், கிரியேட்டிவிட்டி மற்றும் பாதுகாப்பு கட்டுப்பாடுகளை அவை கையாளும் விதத்தில் மாற்றங்களை ஏற்படுத்துகிறது.
- GPT-4o: வாய்ஸ் இன்டராக்ஷன் மற்றும் பொதுவான வேலைகளுக்குச் சிறந்தது.
- Claude 3.5 Sonnet: கோடிங், கிரியேட்டிவ் ரைட்டிங் மற்றும் நுணுக்கமான விவாதங்களுக்குச் சிறந்தது.
- Gemini 1.5 Pro: புத்தகங்கள் அல்லது நீண்ட வீடியோக்களை ஆராயும் நீண்ட கான்டெக்ஸ்ட் வேலைகளுக்குச் சிறந்தது.
- Llama 3: லோக்கல் பயன்பாடு மற்றும் டேட்டா பாதுகாப்பிற்குச் சிறந்தது.
இந்த மாடல்களின் தாக்கம் உலகம் முழுவதும் ஒரே மாதிரியாக இல்லை. இந்த நிறுவனங்களின் தலைமையகங்கள் அமெரிக்காவில் இருந்தாலும், பயனர்கள் உலகம் முழுவதும் உள்ளனர். இது மொழி மற்றும் கலாச்சார நுணுக்கங்களில் சில சிக்கல்களை உருவாக்குகிறது. பெரும்பாலான மாடல்கள் ஆங்கில மொழி டேட்டாவைக் கொண்டே பயிற்சி அளிக்கப்படுகின்றன, இது அவற்றின் ஆலோசனைகளில் மேற்கத்திய நாடுகளின் சார்புநிலையை (Western bias) ஏற்படுத்தலாம். ஜப்பான் அல்லது பிரேசிலில் உள்ள ஒரு நிறுவனத்திற்கு, கலிபோர்னியா லேப்பில் லாஜிக் புதிரில் வென்ற மாடலை விட, அவர்களின் தாய்மொழியை இயல்பாகக் கையாளும் மாடலே “பெஸ்ட்”. இணைய வசதி குறைவாக உள்ள பகுதிகளில் லேட்டன்சி (latency) ஒரு பெரிய தடையாக இருக்கலாம், இதனால் பெரிய மாடல்களை விட சிறிய மற்றும் வேகமான மாடல்கள் அங்கு ஈர்க்கக்கூடியதாக இருக்கும்.
செலவு என்பது கவனிக்கப்பட வேண்டிய மற்றொரு உலகளாவிய காரணியாகும். ஒரு API காலின் விலை அமெரிக்க டாலர்களில் குறைவாகத் தோன்றலாம், ஆனால் வளர்ந்து வரும் பொருளாதாரத்தில் உள்ள ஒரு ஸ்டார்ட்அப் நிறுவனத்திற்கு அந்தச் செலவு விரைவில் சுமையாக மாறும். இங்குதான் Llama 3 போன்ற ஓபன் வெயிட் மாடல்கள் பெரிய மாற்றத்தை ஏற்படுத்துகின்றன. லோக்கல் ஹோஸ்டிங் மூலம், சர்வதேச பேமெண்ட்களின் தேவையை இவை நீக்குகின்றன மற்றும் கிளவுட் மாடல்களால் வழங்க முடியாத நிலைத்தன்மையை வழங்குகின்றன. அரசாங்கங்களும் இதைக் கவனிக்கத் தொடங்கியுள்ளன, சில நாடுகள் தங்கள் டேட்டா மற்றும் கலாச்சார பாரம்பரியம் வெளிநாட்டு நிறுவனங்களின் கட்டுப்பாட்டில் இருக்கக்கூடாது என்பதற்காக “சாவரின் AI” (sovereign AI) என்பதை வலியுறுத்துகின்றன. மாடலைத் தேர்ந்தெடுப்பது என்பது இப்போது தொழில்நுட்ப முடிவு மட்டுமல்ல, அது ஒரு அரசியல் மற்றும் பொருளாதார முடிவாகவும் மாறி வருகிறது.
இதை நடைமுறையில் பார்க்க, ஒரு கிரியேட்டிவ் புரொபஷனலின் ஒரு நாளைக் கற்பனை செய்து பாருங்கள். காலையில், அவர்கள் பயணத்தின் போது ஒரு மீட்டிங்கை டிரான்ஸ்கிரைப் செய்யவும், அதன் முக்கிய அம்சங்களைச் சுருக்கவும் தங்கள் போனில் GPT-4o-வைப் பயன்படுத்தலாம். மதியத்திற்குள், அவர்கள் ஒரு புதிய வெப் அப்ளிகேஷனில் வேலை செய்யத் தொடங்கும்போது Claude 3.5 Sonnet-க்கு மாறுகிறார்கள், ஏனெனில் இது லேட்டஸ்ட் ரியாக்ட் (React) லைப்ரரிகளை மற்ற மாடல்களை விட நன்றாகப் புரிந்து கொள்கிறது. இது சுத்தமான கோடிங்கை எழுதுவதால், பிழைகளைத் திருத்தும் நேரம் மிச்சமாகிறது. மாலையில், 500 பக்கங்கள் கொண்ட ஒரு டாக்குமெண்ட்டை ஆராய வேண்டியிருக்கும் போது, அவர்கள் அதை Gemini 1.5 Pro-வில் பதிவேற்றுகிறார்கள், அது சில நொடிகளில் அதில் உள்ள முக்கியமான விஷயங்களைக் கண்டுபிடித்துத் தருகிறது.
BotNews.today ஆனது உள்ளடக்கத்தை ஆராய்ச்சி செய்யவும், எழுதவும், திருத்தவும் மற்றும் மொழிபெயர்க்கவும் AI கருவிகளைப் பயன்படுத்துகிறது. தகவலை பயனுள்ளதாகவும், தெளிவானதாகவும், நம்பகமானதாகவும் வைத்திருக்க எங்கள் குழு செயல்முறையை மதிப்பாய்வு செய்து மேற்பார்வையிடுகிறது.
எல்லாவற்றையும் ஒரே AI அசிஸ்டென்ட் செய்துவிடும் என்ற விளம்பர வாக்குறுதிக்கு இது முரணாக இருக்கிறது. நிஜ உலகில், பயனர்கள் தங்கள் வேலையை முடிக்கப் பல சந்தாக்களையும் (subscriptions) இன்டர்ஃபேஸ்களையும் கையாள வேண்டிய கட்டாயத்தில் உள்ளனர். ஒரு மார்க்கெட்டிங் மேனேஜர் ஹெட்லைன்களை யோசிக்க ஒரு மாடலையும், கஸ்டமர் டேட்டாவை ஆராய மற்றொரு மாடலையும் பயன்படுத்தலாம். இந்தச் சிதறல் ஒருவித மன அழுத்தத்தை உருவாக்குகிறது. எந்த மாடலில் எந்த ஃபைல் இருக்கிறது, எது எந்த வேலைக்குச் சிறந்தது என்பதை நீங்கள் நினைவில் கொள்ள வேண்டும். பல பயனர்களுக்கு, அவுட்புட்டின் நம்பகத்தன்மைதான் மிக முக்கியம். ஒரு மாடல் தவறான தகவலை (hallucination) அளித்தால், அதைச் சரிபார்க்கவே அதிக நேரம் எடுக்கும். கஸ்டமர் சர்வீஸ் பாட்களில் (bots) இந்த டூல்களைப் பயன்படுத்தும் நிறுவனங்களுக்கு ஆபத்து அதிகம். ஒரு தவறான பதில் பிஆர் (PR) சிக்கலையோ அல்லது வாடிக்கையாளர் இழப்பையோ ஏற்படுத்தலாம்.
இந்தத் தொழில்நுட்பத்தின் மறைமுகச் செலவுகள் குறித்து நாம் கடினமான கேள்விகளைக் கேட்க வேண்டும். இந்த டேட்டா சென்டர்களை இயக்கத் தேவையான மின்சாரம் மற்றும் தண்ணீருக்கான விலையை உண்மையில் யார் கொடுக்கிறார்கள்? பயனர் ஒரு கேள்விக்குச் சில காசுகள் மட்டுமே கொடுத்தாலும், சுற்றுச்சூழல் ரீதியான பாதிப்பு அதிகமாக உள்ளது. டேட்டா உரிமையைப் பற்றிய கேள்வியும் உள்ளது. உங்கள் நிறுவனத்தின் ரகசிய டாக்குமெண்ட்டை கிளவுட் மாடலில் அப்லோட் செய்யும்போது, அந்த டேட்டா எங்கே போகிறது என்று உங்களுக்குத் தெரியுமா? பல நிறுவனங்கள் டேட்டாவைத் தங்கள் பயிற்சிக்கு பயன்படுத்துவதில்லை என்று கூறினாலும், டெக் ஹிஸ்டரியைப் பார்த்தால் பல பாலிசிகள் சிக்கலான விதிமுறைகளுக்குள் மறைக்கப்பட்டிருப்பதை அறியலாம். ஒரு நிறுவனம் திடீரென விலையை உயர்த்தினால் அல்லது API-யை மூடினால் உங்கள் பிசினஸ் என்னவாகும்? ஒரு சில நிறுவனங்களின் மீது நாம் வைக்கும் இந்த அதீத நம்பிக்கை ஒரு பெரிய ரிஸ்க் ஆகும்.
நாங்கள் கவர் செய்ய வேண்டும் என்று நீங்கள் நினைக்கும் AI கதை, கருவி, போக்கு அல்லது கேள்வி உங்களிடம் உள்ளதா? உங்கள் கட்டுரை யோசனையை எங்களுக்கு அனுப்பவும் — அதைக் கேட்க நாங்கள் விரும்புகிறோம்.பவர் யூசர்கள் மற்றும் டெவலப்பர்களுக்கு, தேர்வு என்பது பெரும்பாலும் தொழில்நுட்ப வசதிகளைப் பொறுத்தே அமைகிறது. API லிமிட்கள் ஒரு பெரிய தலைவலி. OpenAI மற்றும் Anthropic நிறுவனங்கள் கடுமையான கட்டுப்பாடுகளைக் கொண்டுள்ளன. கூகுளின் Gemini தற்போது தாராளமாக இருந்தாலும், அது எப்போது வேண்டுமானாலும் மாறலாம். லோக்கல் ஸ்டோரேஜ் பிரச்சனையும் உள்ளது. உங்கள் ஆப் ஆஃப்லைனில் அல்லது அதிக பாதுகாப்புடன் செயல்பட வேண்டும் என்றால், நீங்கள் Llama 3 அல்லது Mistral போன்ற மாடல்களைத்தான் பயன்படுத்த வேண்டும். இதற்கு NVIDIA போன்ற நிறுவனங்களின் உயர்தர GPU-க்களில் அதிக முதலீடு செய்ய வேண்டியிருக்கும். கிளவுட் API-ன் எளிமைக்கும், லோக்கல் செட்டப்பின் கட்டுப்பாட்டிற்கும் இடையே ஒரு பெரிய போட்டி நிலவுகிறது. பெரும்பாலான பவர் யூசர்கள் ஒரு ஹைப்ரிட் (hybrid) முறையையே சிறந்ததாகக் கருதுகிறார்கள்.
வொர்க்ஃபுளோ இன்டகிரேஷன் (Workflow integration) என்பது அடுத்த பெரிய சவால். ஒரு பிரவுசரில் மாடலுடன் சேட் செய்வது ஒருபுறம் இருந்தாலும், அந்த மாடல் உங்கள் கோட் எடிட்டர் அல்லது புராஜெக்ட் மேனேஜ்மென்ட் டூலுக்குள் இருப்பது வேறு விஷயம். உங்கள் நிறுவனம் ஏற்கனவே கூகுள் வொர்க்ஸ்பேஸைப் பயன்படுத்துகிறது என்றால், Gemini தான் இயல்பான தேர்வு. நீங்கள் கிட்ஹப் (GitHub) பயன்படுத்தும் டெவலப்பர் என்றால், கோபைலட் (Copilot) உடன் இணைந்த GPT-4o தான் டிஃபால்ட். பழைய காலத்து “சுவர் எழுப்பப்பட்ட தோட்டங்கள்” (walled gardens) இப்போது AI மாடல்களைச் சுற்றி மீண்டும் உருவாக்கப்படுவதைப் பார்க்கிறோம். இது சிறிய மாடல்கள் சந்தையில் நுழைவதைக் கடினமாக்குகிறது. மாடல்கள் புத்திசாலியாக மாறினாலும், வேலை நடக்கும் இடத்தைக் கட்டுப்படுத்துவது யார் என்பதில்தான் உண்மையான போட்டி இருக்கிறது.
சுருக்கமாகச் சொன்னால், இங்கு “சிறந்த” மாடல் என்று எதுவும் இல்லை, உங்கள் தேவைக்கு எது சிறந்தது என்பதுதான் முக்கியம். மனித உணர்வுகளுடன் எழுதும் ஒரு பார்ட்னர் வேண்டுமென்றால் Claude-ஐத் தேர்ந்தெடுங்கள். உங்கள் கேமரா மூலம் உலகைப் பார்க்கும் ஒரு மொபைல் அசிஸ்டென்ட் வேண்டுமென்றால் GPT-4o-வைத் தேர்ந்தெடுங்கள். பெரிய டாக்குமெண்ட்களைக் கையாள Gemini-யைத் தவிர வேறு வழியில்லை. உங்கள் சொந்த மெஷின்களில் டேட்டாவை வைத்திருக்க வேண்டும் என்றால் Llama 3 தான் உங்கள் சாய்ஸ். மார்க்கெட் மிக வேகமாக வளர்வதால் ஏற்படும் குழப்பம் இது. பெஞ்ச்மார்க்குகளைத் துரத்துவதை நிறுத்திவிட்டு, உங்கள் அன்றாடப் பிரச்சனைகளை வைத்து இந்த டூல்களைச் சோதிக்கத் தொடங்குங்கள். விலை, வேகம் மற்றும் ஸ்டைலில் உள்ள வித்தியாசங்கள் உண்மையானவை, நிறுவனங்கள் தங்களுக்குச் சிறந்தவற்றில் கவனம் செலுத்தத் தொடங்கும்போது இந்த வித்தியாசங்கள் இன்னும் அதிகமாகும்.
ஆசிரியரின் குறிப்பு: கணினித் துறையில் நிபுணர்கள் அல்லாதவர்கள், ஆனால் செயற்கை நுண்ணறிவைப் புரிந்துகொள்ளவும், அதை அதிக நம்பிக்கையுடன் பயன்படுத்தவும், ஏற்கனவே வந்துகொண்டிருக்கும் எதிர்காலத்தைப் பின்தொடரவும் விரும்பும் மக்களுக்காக, பலமொழி AI செய்திகள் மற்றும் வழிகாட்டல் மையமாக இந்த தளத்தை நாங்கள் உருவாக்கினோம்.
ஒரு பிழையைக் கண்டறிந்தீர்களா அல்லது திருத்தப்பட வேண்டிய ஒன்று இருக்கிறதா? எங்களுக்குத் தெரியப்படுத்துங்கள்.