அனைவரும் மேற்கோள் காட்டும் ஆராய்ச்சியாளர்கள் — அவர்கள் ஏன் முக்கியம்?
நவீன தர்க்கத்தின் மறைமுகக் கலைஞர்கள்
செயற்கை நுண்ணறிவு (AI) குறித்த பொதுவான விவாதங்கள் பெரும்பாலும் ஒரு சில பிரபலமான CEO-க்கள் மற்றும் பில்லியனர் முதலீட்டாளர்களைச் சுற்றியே அமைகின்றன. இவர்களே மனிதகுலத்தின் எதிர்காலம் மற்றும் பொருளாதாரம் குறித்து அதிரடியான கணிப்புகளைக் கூறி செய்திகளில் ஆதிக்கம் செலுத்துகிறார்கள். ஆனால், இந்தத் துறையின் உண்மையான திசையைத் தீர்மானிப்பது, செய்திகளில் அதிகம் இடம்பெறாத, அமைதியாகச் செயல்படும் ஒரு சிறிய ஆராய்ச்சியாளர் குழுதான். இவர்களே ஒவ்வொரு பெரிய லேபும் இறுதியில் ஏற்றுக்கொள்ளும் அடிப்படை ஆய்வுக் கட்டுரைகளை எழுதுகிறார்கள். இவர்களின் செல்வாக்கு சமூக ஊடகப் பின்தொடர்பவர்களின் எண்ணிக்கையில் அல்ல, மாறாக இவர்களின் ஆய்வுக் கட்டுரைகளின் மேற்கோள்கள் மற்றும் தொழில்நுட்பத் துறையில் இவர்கள் கொண்டுவரும் கட்டமைப்பு மாற்றங்களில்தான் அளவிடப்படுகிறது. ஒரு குறிப்பிட்ட ஆராய்ச்சியாளர் டிரான்ஸ்பார்மர் திறன் அல்லது நியூரல் ஸ்கேலிங் விதிகள் குறித்து ஒரு முக்கிய கண்டுபிடிப்பை வெளியிட்டால், சில வாரங்களிலேயே ஒட்டுமொத்த துறையும் அதன் கவனத்தை மாற்றிக்கொள்கிறது. தற்போதைய காலத்தின் மார்க்கெட்டிங் விளம்பரங்களுக்கு அப்பால் என்ன நடக்கிறது என்பதைப் புரிந்துகொள்ள, இந்த நபர்கள் யார், எப்படிச் செயல்படுகிறார்கள் என்பதைத் தெரிந்துகொள்வது அவசியம்.
இந்தத் துறையில் பிரபலத்திற்கும் செல்வாக்கிற்கும் இடையே உள்ள வேறுபாடு மிகத் தெளிவானது. ஒரு பிரபலம் புதிய தயாரிப்பை அறிவிக்கலாம், ஆனால் ஒரு செல்வாக்குமிக்க ஆராய்ச்சியாளர் அந்தத் தயாரிப்பைச் சாத்தியமாக்கும் கணித ஆதாரத்தை வழங்குகிறார். இந்த வேறுபாடு முக்கியமானது, ஏனெனில் ஆராய்ச்சியாளர்களே தொழில்நுட்ப ரீதியாக எது சாத்தியம் என்பதற்கான நிகழ்ச்சி நிரலை அமைக்கிறார்கள். இயந்திரத்தின் பகுத்தறிவு எல்லைகளையும், கணக்கீட்டுச் செலவுகளையும் அவர்களே தீர்மானிக்கிறார்கள். அடுத்த மூன்று ஆண்டுகளில் மென்பொருள் எப்படி இருக்கும் என்று நீங்கள் அறிய விரும்பினால், பெரிய நிறுவனங்களின் பத்திரிகைச் செய்திகளைப் பார்க்காதீர்கள். அடுத்த தலைமுறை தர்க்கம் நிகழ்நேரத்தில் விவாதிக்கப்படும் ப்ரீ-பிரிண்ட் சர்வர்களைப் பாருங்கள். அங்கேதான் உண்மையான அதிகாரம் உள்ளது.
ஆய்வுக் கட்டுரைகள் எப்படித் தயாரிப்பு யதார்த்தமாக மாறுகின்றன?
ஒரு தத்துவார்த்தக் கட்டுரையிலிருந்து உங்கள் ஸ்மார்ட்போனில் உள்ள ஒரு ஆப் வரை செல்லும் பாதை முன்பை விட இப்போது மிகக் குறுகியதாகிவிட்டது. கடந்த தசாப்தங்களில், கணினி அறிவியலில் ஒரு பெரிய கண்டுபிடிப்பு வணிக ரீதியான பயன்பாட்டிற்கு வர பத்து ஆண்டுகள் ஆகலாம். இன்று, அந்த இடைவெளி சில மாதங்களாகக் குறைந்துவிட்டது. arxiv.org போன்ற தளங்களில் ஆராய்ச்சி முடிவுகள் தினமும் பகிரப்படுவதால் இந்த வேகம் அதிகரித்துள்ளது. Google DeepMind அல்லது Anthropic போன்ற ஆய்வகங்களில் உள்ள ஒரு ஆராய்ச்சியாளர், ஒரு மாடலில் நீண்டகால நினைவகத்தை (long-term memory) கையாள அதிக திறன் கொண்ட வழியைக் கண்டறிந்தால், அந்தத் தகவல் பெரும்பாலும் உள் அறிக்கைகளில் மை காய்வதற்கு முன்பே பொதுவெளியில் கிடைத்துவிடுகிறது. இது ஒரு தனித்துவமான சூழலை உருவாக்குகிறது, அங்கு அறையில் மிகவும் அமைதியாக இருப்பவர்கள் பில்லியன் கணக்கான டாலர் வென்ச்சர் கேபிடல் முதலீட்டை வழிநடத்துகிறார்கள்.
இந்தச் சூழலில் செல்வாக்கு என்பது மறுஉருவாக்கம் மற்றும் பயன்பாட்டின் அடிப்படையில் கட்டமைக்கப்படுகிறது. மற்ற ஆராய்ச்சியாளர்கள் ஒரு கட்டுரையின் குறியீட்டை (code) எடுத்து, அதன் மேல் சிறந்த ஒன்றை உருவாக்க முடிந்தால், அந்தக் கட்டுரை செல்வாக்கு மிக்கதாகக் கருதப்படுகிறது. இதனால்தான் ஒவ்வொரு முக்கியமான AI ப்ராஜெக்ட்டின் குறிப்புகளிலும் சில பெயர்கள் மீண்டும் மீண்டும் வருகின்றன. இந்த ஆராய்ச்சியாளர்கள் எதையும் விற்க முயலவில்லை. ஒரு மாடலுக்குத் தேவையான ஆற்றலைக் குறைப்பது அல்லது ஒரு சிஸ்டத்தை எப்படி நேர்மையாக மாற்றுவது போன்ற குறிப்பிட்ட சிக்கல்களைத் தீர்க்கவே அவர்கள் முயல்கிறார்கள். இவர்களின் பணிதான் இந்தத் துறையின் அடித்தளம். இவர்களின் பங்களிப்பு இல்லையென்றால், இன்று நாம் பயன்படுத்தும் பெரிய மாடல்கள் இயங்குவதற்கு அதிக செலவு பிடிப்பதாகவும், நம்ப முடியாத அளவுக்குத் தவறானவையாகவும் இருந்திருக்கும். இவர்களே உலகிற்குத் தேவையான பாதுகாப்பு அரண்களையும் என்ஜின்களையும் வழங்குகிறார்கள்.
கல்விசார் ஆர்வத்திலிருந்து தொழில்துறை சக்தியாக மாறிய இந்த மாற்றம், ஆராய்ச்சியின் தன்மையையே மாற்றிவிட்டது. அதிகம் மேற்கோள் காட்டப்படும் பல ஆராய்ச்சியாளர்கள் பல்கலைக்கழகங்களிலிருந்து தனியார் ஆய்வகங்களுக்கு மாறிவிட்டனர், அங்கு அவர்களுக்கு மிகப்பெரிய கம்ப்யூட் வளங்கள் கிடைக்கின்றன. இந்த இடப்பெயர்வு செல்வாக்கை ஒரு சில முக்கிய இடங்களில் மையப்படுத்தியுள்ளது. நிறுவனங்களின் பெயர்கள் பிரபலமாக இருந்தாலும், உள்ளே இருக்கும் குறிப்பிட்ட குழுக்களே கடின உழைப்பைச் செய்கின்றன. எந்த ஆர்க்கிடெக்சர்களைத் தொடர வேண்டும், எதைக் கைவிட வேண்டும் என்பதை அவர்களே தீர்மானிக்கிறார்கள். இந்தத் திறமை குவிப்பு, சில டஜன் நபர்கள் எதிர்காலத்தின் அறிவுசார் உள்கட்டமைப்பை வடிவமைக்கிறார்கள் என்பதையே காட்டுகிறது. தரவுத் தொகுப்புகள் (data sets) மற்றும் அல்காரிதம் முன்னுரிமைகள் குறித்த அவர்களின் தேர்வுகள், வரும் தசாப்தங்களில் தொழில்நுட்பத்தைப் பயன்படுத்தும் ஒவ்வொரு பயனரையும் பாதிக்கும்.
அறிவுசார் மூலதனத்தில் உலகளாவிய மாற்றம்
இந்த ஆராய்ச்சியாளர்களின் தாக்கம் சிலிக்கான் வேலிக்கு அப்பால் பரவியுள்ளது. அரசாங்கங்களும் சர்வதேச அமைப்புகளும் இப்போது உயர்தர AI திறமையாளர்களின் நகர்வை தேசிய பாதுகாப்பு மற்றும் பொருளாதாரக் கொள்கையின் ஒரு பகுதியாகக் கண்காணிக்கின்றன. அதிக தாக்கத்தை ஏற்படுத்தும் ஆய்வுக் கட்டுரைகளை எழுதியவர்களை ஈர்க்கும் மற்றும் தக்கவைக்கும் ஒரு நாட்டின் திறன், அதன் எதிர்காலப் போட்டித்தன்மையின் முக்கிய அறிகுறியாகும். ஏனெனில், இந்த நபர்களால் உருவாக்கப்பட்ட தர்க்கமே லாஜிஸ்டிக்ஸ் முதல் ஹெல்த்கேர் வரை தேசிய தொழில்துறைகளின் திறனைத் தீர்மானிக்கிறது. ஒரு ஆராய்ச்சியாளர் புரோட்டீன் ஃபோல்டிங் அல்லது வானிலை கணிப்புக்கு ஒரு புதிய முறையை உருவாக்கும்போது, அவர்கள் அறிவியலை மட்டும் முன்னேற்றுவதில்லை. அந்த ஆராய்ச்சியை முதலில் செயல்படுத்தும் எந்தவொரு நிறுவனத்திற்கும் அவர்கள் போட்டி நன்மையை வழங்குகிறார்கள். இது அறிவுசார் மூலதனத்திற்கான உலகளாவிய போட்டியை உருவாக்கியுள்ளது, இது பௌதிக வளங்களுக்கான போட்டியைப் போலவே தீவிரமானது.
மிகவும் செல்வாக்குமிக்க பணி சர்வதேச அளவில் ஒத்துழைப்புடன் நடக்கும் அதே வேளையில், அதன் செயலாக்கம் உள்ளூர் மட்டத்தில் இருப்பதை நாம் காண்கிறோம். மாண்ட்ரியலில் உள்ள ஒரு ஆராய்ச்சியாளர் லண்டனில் உள்ள ஒரு குழுவுடன் இணைந்து ஒரு கட்டுரையை உருவாக்கலாம், அதை டோக்கியோவில் உள்ள ஒரு ஸ்டார்ட்அப் பயன்படுத்தலாம். இந்த ஒன்றோடொன்று இணைந்திருத்தல் ஒரு குறிப்பிட்ட முன்னேற்றத்தின் தோற்றத்தைக் கண்டறிவதைக் கடினமாக்குகிறது, ஆனால் முக்கிய ஆசிரியர்களின் செல்வாக்கு தெளிவாகவே உள்ளது. அவர்களே இந்தத் துறையின் சொல்லகராதியை வரையறுக்கிறார்கள். அவர்கள் பாராமீட்டர்-எஃபிஷியண்ட் ஃபைன்-டியூனிங் (parameter-efficient fine-tuning) அல்லது கான்ஸ்டிடியூஷனல் AI (constitutional AI) போன்ற விஷயங்களைப் பேசும்போது, அந்தச் சொற்கள் ஒட்டுமொத்த உலகளாவிய சமூகத்திற்கும் தரநிலையாக மாறுகின்றன. இந்த பகிரப்பட்ட மொழி விரைவான முன்னேற்றத்தை அனுமதிக்கிறது, ஆனால் சில கருத்துகளுக்கு முன்னுரிமை அளிக்கப்படும் ஒரு மோனோகல்ச்சரையும் உருவாக்குகிறது.
வெவ்வேறு பிராந்தியங்கள் எப்படி நிபுணத்துவம் பெறுகின்றன என்பதிலும் உலகளாவிய தாக்கம் காணப்படுகிறது. சில ஆராய்ச்சி மையங்கள் இந்த சிஸ்டங்களின் நெறிமுறைகள் மற்றும் பாதுகாப்பில் கவனம் செலுத்துகின்றன, மற்றவை செயல்திறன் மற்றும் அளவீட்டிற்கு முன்னுரிமை அளிக்கின்றன. இந்த மையங்களை வழிநடத்தும் ஆராய்ச்சியாளர்கள் அந்தந்த பிராந்தியங்களின் அறிவுசார் பாதுகாவலர்களாகச் செயல்படுகிறார்கள். அவர்கள் உள்ளூர் விதிமுறைகளைச் செல்வாக்கு செலுத்துகிறார்கள் மற்றும் பிராந்திய டெக் ஜாம்பவான்களின் முதலீடுகளை வழிநடத்துகிறார்கள். அதிக நாடுகள் தங்கள் சொந்த இறையாண்மை கொண்ட AI திறன்களை உருவாக்க முயற்சிக்கும்போது, அவர்களால் தொழில்நுட்பத்தை மட்டும் வாங்க முடியாது என்பதை உணர்கிறார்கள். அவர்களுக்கு அடிப்படை தர்க்கத்தைப் புரிந்துகொண்ட நபர்கள் தேவை. இது அதிகம் மேற்கோள் காட்டப்படும் ஆராய்ச்சியாளர்களை உலகப் பொருளாதாரத்தின் சக்திவாய்ந்த நபர்களாக மாற்றியுள்ளது, அவர்கள் ஒரு போர்டு ரூமிற்குள் நுழையவில்லை என்றாலும் அல்லது தொலைக்காட்சி நேர்காணல் கொடுக்கவில்லை என்றாலும் கூட.
சுருக்கமான கணிதத்திலிருந்து அன்றாட வேலைப்பாய்வுகள் வரை
இந்தச் செல்வாக்கு சராசரி நபரை எப்படிப் பாதிக்கிறது என்பதைப் பார்க்க, சாரா என்ற மார்க்கெட்டிங் மேலாளரின் ஒரு நாளைக் கவனியுங்கள். சாரா தனது காலையை ஒரு டஜன் நீண்ட அறிக்கைகளைச் சுருக்க ஒரு AI கருவியைப் பயன்படுத்தித் தொடங்குகிறார். அந்தச் சுருக்கங்களின் துல்லியம் மென்பொருளில் உள்ள பிராண்ட் பெயரின் விளைவு அல்ல. இது ஸ்பார்ஸ் அட்டென்ஷன் மெக்கானிசம் (sparse attention mechanisms) குறித்த ஆராய்ச்சியின் விளைவாகும், இது ஆயிரக்கணக்கான சொற்களை இழக்காமல் செயலாக்க மாடலுக்கு உதவியது. அவர் கேள்விப்படாத ஒரு ஆராய்ச்சியாளர் மூன்று ஆண்டுகளுக்கு முன்பு ஒரு குறிப்பிட்ட கணிதத் தடையைத் தீர்த்தார், அதனால்தான் சாரா ஒவ்வொரு காலையிலும் இரண்டு மணிநேரத்தைச் சேமிக்கிறார். இது உயர்மட்ட ஆராய்ச்சியின் உறுதியான, அன்றாட விளைவு. இது ஒரு சுருக்கமான கருத்து அல்ல. இது சாரா தனது வேலையைச் செய்யும் விதத்தை மாற்றும் ஒரு கருவி.
நாளின் பிற்பகுதியில், சாரா ஒரு சோஷியல் மீடியா பிரச்சாரத்திற்காகப் படங்களை உருவாக்க ஒரு ஜெனரேட்டிவ் கருவியைப் பயன்படுத்துகிறார். அந்தப் படங்களின் வேகம் மற்றும் தரம் டிஃப்யூஷன் மாடல்கள் (diffusion models) மற்றும் லேட்டண்ட் ஸ்பேஸ்கள் (latent spaces) குறித்த பணியின் நேரடி விளைவாகும். இந்த முறைகளை முன்னோடியாகக் கொண்ட ஆராய்ச்சியாளர்கள் ஒரு மார்க்கெட்டிங் கருவியை உருவாக்க முயலவில்லை. அவர்கள் தரவுகளின் அடிப்படை வடிவவியலில் (geometry of data) ஆர்வமாக இருந்தனர். இருப்பினும், இந்த சிஸ்டங்களைப் பயன்படுத்தும் ஒவ்வொரு படைப்பாளியும் இப்போது அவர்களின் செல்வாக்கை உணர்கிறார்கள். சாரா இதிலிருந்து பயனடைய கணிதத்தைப் புரிந்துகொள்ள வேண்டிய அவசியமில்லை, ஆனால் கணிதமே அவர் எதைச் செய்ய முடியும், எதைச் செய்ய முடியாது என்பதைத் தீர்மானிக்கிறது. ஆராய்ச்சியாளர்கள் ஒரு வகை பட உருவாக்கத்திற்கு மற்றொன்றை விட முன்னுரிமை அளிக்க முடிவு செய்தால், சாராவின் படைப்பாற்றல் விருப்பங்கள் மாறியிருக்கும். ஆராய்ச்சியாளர்கள் அவரது படைப்புச் செயல்பாட்டில் அமைதியான பங்காளிகள்.
மதியத்திற்குள், சாரா நிறுவனத்தின் இணையதளத்தைப் புதுப்பிக்க ஒரு கோடிங் அசிஸ்டண்டைப் பயன்படுத்துகிறார். இந்த அசிஸ்டண்ட் பெரிய அளவிலான கோட் ப்ரீ-ட்ரெய்னிங் (code pre-training) குறித்த ஆராய்ச்சியால் இயக்கப்படுகிறது. இயந்திரம் அவரது நோக்கத்தைப் புரிந்துகொண்டு செயல்பாட்டு குறியீட்டை வழங்கும் திறன், இயற்கை மொழியை புரோகிராமிங் தொடரியல் (programming syntax) உடன் எவ்வாறு மேப் செய்வது என்பதைக் கண்டறிந்த ஆராய்ச்சியாளர்களின் பணிக்கு ஒரு சான்றாகும். ஒவ்வொரு முறையும் அசிஸ்டண்ட் சரியான குறியீட்டு வரியைப் பரிந்துரைக்கும்போது, அது பல ஆண்டுகளுக்கு முன்பு ஒரு ஆய்வகத்தில் உருவாக்கப்பட்ட தர்க்கத்தைப் பயன்படுத்துகிறது. சாராவின் உற்பத்தித்திறன் அந்த ஆராய்ச்சியின் தரத்தின் நேரடி பிரதிபலிப்பாகும். ஆராய்ச்சி குறைபாடுடையதாக இருந்தால், அவரது குறியீடு பிழையாக இருக்கும். ஆராய்ச்சி பாரபட்சமாக இருந்தால், அவரது இணையதளத்தில் அணுகல் சிக்கல்கள் இருக்கலாம். இயந்திரம் பரிந்துரைக்கும் ஒவ்வொரு வரியிலும் ஆராய்ச்சியாளரின் செல்வாக்கு பொதிந்துள்ளது.
இந்தச் சூழல் ஒவ்வொரு துறையிலும் நடக்கிறது. மருத்துவர்கள் கம்ப்யூட்டர் விஷன் ஆராய்ச்சியில் கட்டமைக்கப்பட்ட கண்டறியும் கருவிகளைப் பயன்படுத்துகிறார்கள். லாஜிஸ்டிக்ஸ் நிறுவனங்கள் ரீஇன்போர்ஸ்மென்ட் லேர்னிங் (reinforcement learning) மூலம் கட்டமைக்கப்பட்ட ரூட் ஆப்டிமைசேஷனைப் பயன்படுத்துகின்றன. நாம் நுகரும் பொழுதுபோக்கு கூட இந்த அமைதியான கட்டிடக் கலைஞர்களால் வடிவமைக்கப்பட்ட அல்காரிதம்களால் வடிவமைக்கப்படுகிறது. இந்தச் செல்வாக்கு ஊடுருவி மற்றும் கண்ணுக்குத் தெரியாதது. நாம் இடைமுகம் மற்றும் பிராண்டில் கவனம் செலுத்துகிறோம், ஆனால் உண்மையான மதிப்பு தர்க்கத்தில்தான் உள்ளது. அந்தத் தர்க்கம் எப்படிச் செயல்பட வேண்டும், அது எதை மதிக்க வேண்டும், அதன் வரம்புகள் என்னவாக இருக்க வேண்டும் என்பதைத் தீர்மானித்தவர்கள் ஆராய்ச்சியாளர்களே. அவர்களே சாரா வாழும் உலகத்தை, ஒரு நேரத்தில் ஒரு கட்டுரை வீதம், உண்மையிலேயே வடிவமைக்கிறார்கள்.
BotNews.today ஆனது உள்ளடக்கத்தை ஆராய்ச்சி செய்யவும், எழுதவும், திருத்தவும் மற்றும் மொழிபெயர்க்கவும் AI கருவிகளைப் பயன்படுத்துகிறது. தகவலை பயனுள்ளதாகவும், தெளிவானதாகவும், நம்பகமானதாகவும் வைத்திருக்க எங்கள் குழு செயல்முறையை மதிப்பாய்வு செய்து மேற்பார்வையிடுகிறது.
அல்காரிதமிக் அதிகாரத்தின் பதிலளிக்கப்படாத கேள்விகள்
ஒரு சிறிய குழு ஆராய்ச்சியாளர்களின் பணியை நாம் அதிகம் நம்பியிருப்பதால், இந்தச் செல்வாக்கின் செலவுகள் குறித்து கடினமான கேள்விகளைக் கேட்க வேண்டும். இந்தத் தத்துவங்களைச் சோதிக்கத் தேவையான மிகப்பெரிய கம்ப்யூட் சக்திக்காக உண்மையில் யார் பணம் செலுத்துகிறார்கள்? பெரும்பாலான உயர்மட்ட ஆராய்ச்சிகள் இப்போது பூமியில் உள்ள ஒரு சில பெரிய நிறுவனங்களால் நிதியளிக்கப்படுகின்றன. இந்த ஆராய்ச்சி பொது நலனுக்காக இயக்கப்படுகிறதா அல்லது தனியுரிம நன்மைகளை உருவாக்குவதற்காகவா என்ற கேள்வியை இது எழுப்புகிறது. மிகவும் செல்வாக்குமிக்க மூளைகள் அனைத்தும் மூடிய கதவுகளுக்குப் பின்னால் வேலை செய்தால், இந்தத் துறையை உருவாக்கிய திறந்த விசாரணை உணர்வுக்கு என்னவாகும்? இறுதி முடிவுகள் பகிரப்படும், ஆனால் முறைகள் மற்றும் தரவு மறைக்கப்படும் மிகவும் ரகசியமான ஆராய்ச்சியை நோக்கி நாம் நகர்கிறோம். இந்த வெளிப்படைத்தன்மை இல்லாமை ஒரு குறிப்பிடத்தக்க மறைமுகச் செலவாகும்.
தனியுரிமை மற்றும் தரவு உரிமை குறித்த கேள்வியும் உள்ளது. ஆராய்ச்சியாளர்களுக்கு அவர்களின் மாடல்களைப் பயிற்றுவிக்கவும் சரிபார்க்கவும் மிகப்பெரிய அளவிலான தரவு தேவைப்படுகிறது. இந்தத் தரவு எங்கிருந்து வருகிறது, அதைப் பயன்படுத்த யாருடைய அனுமதி பெறப்பட்டது? இந்தத் துறையில் உள்ள பல அடிப்படை ஆய்வுக் கட்டுரைகள், படைப்பாளர்களின் வெளிப்படையான ஒப்புதல் இல்லாமல் இணையத்திலிருந்து ஸ்கிராப் செய்யப்பட்ட தரவுத் தொகுப்புகளை நம்பியுள்ளன. இது ஆராய்ச்சியாளரின் செல்வாக்கு மில்லியன் கணக்கான மக்களின் ஊதியம் பெறாத உழைப்பின் மீது கட்டமைக்கப்பட்ட ஒரு சூழ்நிலையை உருவாக்குகிறது. இந்த சிஸ்டங்கள் அதிக சக்திவாய்ந்ததாக மாறும்போது, தரவுத் தேவைக்கும் தனியுரிமை உரிமைக்கும் இடையிலான மோதல் அதிகரிக்கும். இந்த ஆராய்ச்சியின் நன்மைகள் தனிநபர் டிஜிட்டல் உரிமைகளின் அரிப்பை விட அதிகமாக உள்ளதா என்று நாம் கேட்க வேண்டும்.
இறுதியாக, சுற்றுச்சூழல் தாக்கத்தை நாம் கருத்தில் கொள்ள வேண்டும். இந்தச் செல்வாக்குமிக்க கட்டுரைகளில் விவரிக்கப்பட்டுள்ள மாடல்களைப் பயிற்றுவிக்க மிகப்பெரிய அளவிலான மின்சாரம் தேவைப்படுகிறது. ஒரு ஆராய்ச்சித் திட்டம் ஒரு சிறிய நகரத்திற்குத் தேவையான மின்சாரத்தைப் பயன்படுத்தலாம். சில ஆராய்ச்சியாளர்கள் செயல்திறனில் கவனம் செலுத்தினாலும், பொதுவான போக்கு பெரிய மற்றும் அதிக வளங்களைச் சார்ந்த சிஸ்டங்களை நோக்கியே உள்ளது. இந்த முன்னேற்றங்களின் கார்பன் தடயத்திற்கு யார் பொறுப்பு? உலகம் மிகவும் நிலையான எதிர்காலத்தை நோக்கி நகரும்போது, தொழில்நுட்பத் துறை தனது மிகவும் மேம்பட்ட ஆராய்ச்சியின் மிகப்பெரிய ஆற்றல் நுகர்வை நியாயப்படுத்த வேண்டும். அறிவின் லாபம் கிரகத்திற்கு ஏற்படும் செலவுக்கு மதிப்புள்ளதா? ஆராய்ச்சியாளர்கள் தாங்களே தங்கள் வேலையில் இதைப் பற்றி உரையாற்றத் தொடங்கியுள்ளனர்.
பவர் யூசர்களுக்கான தொழில்நுட்ப கட்டமைப்புகள்
மேற்பரப்பு நிலைக்கு அப்பால் செல்ல விரும்புவோருக்கு, இந்த ஆராய்ச்சியின் தொழில்நுட்பச் செயலாக்கத்தைப் புரிந்துகொள்வது முக்கியம். பவர் யூசர்கள் கருவிகளை மட்டும் பயன்படுத்துவதில்லை. அவர்கள் LoRA (Low-Rank Adaptation) போன்ற அடிப்படை ஆர்க்கிடெக்சர்களைப் புரிந்துகொள்கிறார்கள் மற்றும் அவை எவ்வாறு திறமையான மாடல் டியூனிங்கிற்கு அனுமதிக்கின்றன என்பதை அறிவார்கள். மிகப்பெரிய பாராமீட்டர் எண்ணிக்கையிலான சிக்கலைத் தீர்க்க ஆராய்ச்சியாளர்களால் உருவாக்கப்பட்ட இந்த நுட்பங்கள், நுகர்வோர் தர வன்பொருளில் பெரிய மாடல்களைத் தனிப்பயனாக்க தனிநபர்களை அனுமதிக்கின்றன. ஆராய்ச்சி செல்வாக்கு தனிப்பட்ட பயனருக்கு எப்படிச் சென்றடைகிறது என்பதற்கு இது ஒரு சிறந்த எடுத்துக்காட்டு. LoRA-வின் பின்னால் உள்ள கணிதத்தைப் புரிந்துகொள்வதன் மூலம், ஒரு டெவலப்பர் ஒரு பெரிய சிஸ்டத்தைப் போலவே செயல்படும் ஒரு சிறப்பு கருவியை மிகக் குறைந்த செலவில் உருவாக்க முடியும்.
பவர் யூசர்களுக்கு மற்றொரு முக்கியமான பகுதி API வரம்புகள் மற்றும் இன்ஃபெரன்ஸ் ஆப்டிமைசேஷன் (inference optimization) பற்றிய ஆய்வு ஆகும். இன்றைய மிகவும் செல்வாக்குமிக்க ஆராய்ச்சி பெரும்பாலும் குறைந்தபட்ச கணக்கீட்டுடன் ஒரு மாடலில் இருந்து அதிகப்படியான பலனைப் பெறுவதில் கவனம் செலுத்துகிறது. இதில் குவாண்டிசேஷன் (quantization) போன்ற நுட்பங்கள் அடங்கும், அங்கு நினைவகத்தைச் சேமிக்கவும் செயலாக்கத்தை வேகப்படுத்தவும் மாடலின் எடைகளின் துல்லியம் குறைக்கப்படுகிறது. ஒரு அப்ளிகேஷனை உருவாக்கும் டெவலப்பருக்கு, இந்த ஆராய்ச்சி முன்னேற்றங்கள் வேகமான மற்றும் மலிவான தயாரிப்புக்கும், மெதுவான மற்றும் விலையுயர்ந்த தயாரிப்புக்கும் இடையிலான வித்தியாசமாகும். இந்தத் தலைப்புகளில் சமீபத்திய தொழில்துறை நுண்ணறிவுகளைப் பின்பற்றுவது, தொழில்முறை தர AI கருவிகளை உருவாக்க முயற்சிக்கும் எவருக்கும் அவசியம். இந்த ஆப்டிமைசேஷன்களுக்கான வரைபடங்களை ஆராய்ச்சியாளர்களே வழங்குகிறார்கள்.
உள்ளூர் சேமிப்பு மற்றும் தரவு இறையாண்மை ஆகியவை மேம்பட்ட ஆராய்ச்சியில் முக்கிய கருப்பொருள்களாக மாறி வருகின்றன. பயனர்கள் தனியுரிமை குறித்து அதிக அக்கறை காட்டுவதால், ஆராய்ச்சியாளர்கள் ஃபெடரேட்டட் லேர்னிங் (federated learning) மற்றும் ஆன்-டிவைஸ் ப்ராசஸிங் (on-device processing) முறைகளை உருவாக்கி வருகின்றனர். இது அந்தத் தரவு சாதனத்தை விட்டு வெளியேறாமலேயே பயனர் தரவிலிருந்து மாடல் கற்றுக்கொள்ள அனுமதிக்கிறது. பவர் யூசரைப் பொறுத்தவரை, இது விலையுயர்ந்த மற்றும் பாதுகாப்பற்ற கிளவுட் சேவைகளின் தேவையைத் தவிர்த்து, அதிநவீன AI வேலைப்பாய்வுகளை உள்ளூர் அளவில் இயக்கும் திறனைக் குறிக்கிறது. இந்த பரவலாக்கப்பட்ட மாடல்களுக்காக அழுத்தம் கொடுக்கும் ஆராய்ச்சியாளர்களின் செல்வாக்கை மிகைப்படுத்த முடியாது. அவர்கள் பயனர்கள் தங்கள் தரவின் மீதான கட்டுப்பாட்டை மீட்டெடுக்கவும், அதே நேரத்தில் இயந்திர நுண்ணறிவின் சமீபத்திய முன்னேற்றங்களால் பயனடையவும் தொழில்நுட்ப வழிகளை வழங்குகிறார்கள்.
ஆசிரியரின் குறிப்பு: கணினித் துறையில் நிபுணர்கள் அல்லாதவர்கள், ஆனால் செயற்கை நுண்ணறிவைப் புரிந்துகொள்ளவும், அதை அதிக நம்பிக்கையுடன் பயன்படுத்தவும், ஏற்கனவே வந்துகொண்டிருக்கும் எதிர்காலத்தைப் பின்தொடரவும் விரும்பும் மக்களுக்காக, பலமொழி AI செய்திகள் மற்றும் வழிகாட்டல் மையமாக இந்த தளத்தை நாங்கள் உருவாக்கினோம்.
நாங்கள் கவர் செய்ய வேண்டும் என்று நீங்கள் நினைக்கும் AI கதை, கருவி, போக்கு அல்லது கேள்வி உங்களிடம் உள்ளதா? உங்கள் கட்டுரை யோசனையை எங்களுக்கு அனுப்பவும் — அதைக் கேட்க நாங்கள் விரும்புகிறோம்.அறிவுசார் செல்வாக்கின் எதிர்காலம்
அனைவரும் மேற்கோள் காட்டும் ஆராய்ச்சியாளர்கள் வெறும் கல்விசார் நபர்கள் மட்டுமல்ல. அவர்கள் நவீன பொருளாதாரத்தின் முதன்மை நகர்த்திகள். அவர்களின் பணி நமது கருவிகளின் திறன்கள், நமது வணிகங்களின் செயல்திறன் மற்றும் நமது உலகளாவிய கொள்கையின் திசையைத் தீர்மானிக்கிறது. பொது மக்கள் இன்னும் துறையின் பிரபலமான முகங்களில் கவனம் செலுத்தும் அதே வேளையில், உண்மையான வேலை ஆய்வகங்களிலும் ப்ரீ-பிரிண்ட் சர்வர்களிலும் நடக்கிறது. இந்தச் செல்வாக்கு கட்டமைப்பு ரீதியானது, ஆழமானது மற்றும் பெரும்பாலும் கண்ணுக்குத் தெரியாதது. இது தர்க்கத்தின் கடுமையான பயன்பாடு மற்றும் புதிய யோசனைகளின் நிலையான சோதனையின் மீது கட்டமைக்கப்பட்டுள்ளது. நாம் முன்னோக்கிச் செல்லும்போது, இந்த ஆராய்ச்சியைப் புரிந்துகொள்பவர்களுக்கும் தயாரிப்புகளை மட்டும் பயன்படுத்துபவர்களுக்கும் இடையிலான இடைவெளி தொடர்ந்து விரிவடையும்.
தீர்க்கப்படாமல் இருக்கும் மையக் கேள்வி பொறுப்புக்கூறல் பற்றியது. ஒரு ஆராய்ச்சியாளரின் கட்டுரை முறையான பாரபட்சம் அல்லது பொருளாதாரச் சீர்குலைவை ஏற்படுத்தும் ஒரு சிஸ்டத்திற்கு வழிவகுத்தால், பொறுப்பு யாரிடம் உள்ளது? கணிதத்தை எழுதியவரிடமா, அதைச் செயல்படுத்திய நிறுவனத்திடமா அல்லது அதைக் கட்டுப்படுத்திய அரசாங்கத்திடமா? இந்த அமைதியான கட்டிடக் கலைஞர்களின் செல்வாக்கு வளரும்போது, தொழில்நுட்ப கண்டுபிடிப்புகளை சமூகப் பொறுப்புடன் இணைக்கும் ஒரு கட்டமைப்பின் தேவையும் அதிகரிக்கிறது. அறையில் மிக முக்கியமான நபர்கள் கணிதத்தை விளக்கக்கூடியவர்களே என்ற சகாப்தத்திற்குள் நாம் நுழைகிறோம், மேலும் அவர்களின் செல்வாக்கு அனைவரின் நன்மைக்காகவும் பயன்படுத்தப்படுவதை நாம் உறுதி செய்ய வேண்டும். தற்போதைய ஆண்டில் இந்த பாத்திரங்கள் எவ்வாறு உருவாகின்றன என்பது குறித்த விரிவான அறிவியல் பகுப்பாய்வை நீங்கள் காணலாம்.
ஒரு பிழையைக் கண்டறிந்தீர்களா அல்லது திருத்தப்பட வேண்டிய ஒன்று இருக்கிறதா? எங்களுக்குத் தெரியப்படுத்துங்கள்.