AI சிப் மாற்றத்தின் அடுத்த கட்டம்: வேகம், அளவு அல்லது செயல்திறன்?
வேகமான AI-க்கான போட்டி இப்போது வெறும் கிளாக் ஸ்பீட்களில் (clock speeds) இருந்து சிஸ்டம் ஆர்க்கிடெக்சர் (system architecture) சார்ந்த சிக்கலான போராக மாறியுள்ளது. சிலிக்கான் துண்டில் அதிக டிரான்சிஸ்டர்களை அடுக்குவது மட்டும் இப்போது போதாது. பிராசஸருக்கும் மெமரிக்கும் இடையே தரவு நகரும் வேகம் தான் பிராசஸரை விட முக்கியமானது என்ற நிலையைத் தொழில் துறை எட்டிவிட்டது. இந்த மாற்றம் தான் தற்போதைய ஹார்டுவேர் யுகத்தை வரையறுக்கிறது. ஒரு காலத்தில் சிப் வடிவமைப்பில் மட்டும் கவனம் செலுத்திய நிறுவனங்கள், இப்போது உலகளாவிய சப்ளை செயின் (supply chain) மற்றும் மேம்பட்ட பேக்கேஜிங் நுட்பங்களை நிர்வகிக்க வேண்டிய கட்டாயத்தில் உள்ளன. நெட்வொர்க்கிங் மற்றும் மெமரி ஆகியவை லாஜிக் கேட்களுக்கு இணையாக முக்கியத்துவம் பெறும் ஒரு முழுமையான சிஸ்டம் நோக்கிய நகர்வு இது. இந்த பரிணாமம் மென்பொருள் எப்படி எழுதப்படுகிறது மற்றும் அரசாங்கங்கள் தேசிய பாதுகாப்பை எப்படி பார்க்கின்றன என்பதை மாற்றுகிறது. தொழில்நுட்பம் எங்கே செல்கிறது என்பதைப் புரிந்துகொள்ள, சிப்களை விட அவற்றுக்கு இடையேயான இணைப்புகளைப் பாருங்கள். ஒரு பிளாட்ஃபார்மின் சக்தி, இந்த மாறுபட்ட பகுதிகளை ஒரே ஒருங்கிணைந்த யூனிட்டாக மாற்றும் திறனைப் பொறுத்தே அமைகிறது. ஹார்டுவேரின் இயற்பியல் வரம்புகளைப் புறக்கணிப்பவர்கள், லேட்டன்சி (latency) மற்றும் வெப்பத்தால் தங்கள் மென்பொருள் கனவுகள் முடங்குவதை உணர்வார்கள்.
மெமரி தடையை உடைக்க சிலிக்கான் அடுக்குதல்
தற்போதைய மாற்றத்தைப் புரிந்துகொள்ள, சிப்கள் எப்படி உருவாக்கப்படுகின்றன என்பதைப் பார்க்க வேண்டும். பல தசாப்தங்களாக, இந்தத் துறை தட்டையான வடிவமைப்பையே பின்பற்றியது. பிராசஸர் மற்றும் மெமரி தனித்தனியாக சர்க்யூட் போர்டில் இருந்தன. இன்று, அந்த தூரம் தான் செயல்திறனின் முதன்மை எதிரி. இதைத் தீர்க்க, உற்பத்தியாளர்கள் மேம்பட்ட பேக்கேஜிங் முறையைப் பயன்படுத்துகின்றனர். இதில் கூறுகளை ஒன்றன் மேல் ஒன்றாக அல்லது இன்டர்போசர் (interposer) எனப்படும் சிறப்புத் தளத்தில் அருகருகே அடுக்குகிறார்கள். ‘Chip on Wafer on Substrate’ என்று அழைக்கப்படும் இந்த நுட்பம், கற்பனை செய்ய முடியாத வேகத்தில் தரவுகளை நகர்த்த உதவுகிறது. இது சிறிய முன்னேற்றம் அல்ல; கணினிகளை உருவாக்கும் முறையில் ஏற்பட்ட அடிப்படை மாற்றம். **High Bandwidth Memory**-ஐ பிராசஸிங் கோர்களுக்கு அருகில் வைக்கும்போது, பெரிய லாங்குவேஜ் மாடல்களை (large language models) மெதுவாக்கும் போக்குவரத்து நெரிசல்களை நீக்குகிறீர்கள். இதனால்தான் NVIDIA போன்ற நிறுவனங்கள் ஆதிக்கம் செலுத்துகின்றன. அவர்கள் வெறும் சிப்பை மட்டும் விற்கவில்லை; மெமரி மற்றும் அதிவேக இன்டர்கனெக்ட்கள் (interconnects) அடங்கிய ஒருங்கிணைந்த பேக்கேஜை விற்கிறார்கள்.
மெமரியும் மாறிவிட்டது. நவீன AI-ன் தேவைகளை சாதாரண RAM-ஆல் ஈடுகட்ட முடியாது. தொழில் துறை இப்போது அதிக த்ரூபுட் (throughput) வழங்கும் சிறப்பு மெமரியை நோக்கி நகர்ந்துள்ளது. இது விலை உயர்ந்தது மற்றும் தயாரிப்பது கடினம், இது சப்ளை தட்டுப்பாட்டை உருவாக்குகிறது. ஒரு நிறுவனத்தால் இந்த மெமரியைப் பெற முடியாவிட்டால், அவர்களின் பிராசஸர்கள் பயனற்றவை. ஹார்டுவேர் கதை இப்போது ஒரு சிஸ்டம் கதையாகிவிட்டது. இரத்தத்தை எடுத்துச் செல்லும் நரம்புகளைப் பற்றிப் பேசாமல் மூளையைப் பற்றிப் பேச முடியாது. 2D-லிருந்து 3D கட்டமைப்பிற்கு மாறுவது சந்தையில் மிக முக்கியமான தொழில்நுட்ப சமிக்ஞையாகும். இது பழைய வடிவமைப்புகளை மேம்படுத்துபவர்களிடமிருந்து தீவிரமான நிறுவனங்களைப் பிரிக்கிறது. இந்த மாற்றத்திற்கு துல்லியமான உற்பத்தி வசதிகளில் பெரும் முதலீடு தேவை. TSMC போன்ற ஒரு சில நிறுவனங்களுக்கு மட்டுமே இதைச் செய்யும் திறன் உள்ளது.
AI-ன் புவிசார் அரசியல் உண்மை, இந்த சிப்கள் எங்கே தயாரிக்கப்படுகின்றன என்பதோடு தொடர்புடையது. பெரும்பாலான மேம்பட்ட உற்பத்தி தைவானின் சில சதுர மைல்களுக்குள் குவிந்துள்ளது. இந்த செறிவு உலகப் பொருளாதாரத்திற்கு ஒரு ஆபத்தாக உள்ளது. அங்கே உற்பத்தி நின்றால், ஒட்டுமொத்த தொழில்நுட்பத் துறையும் முடங்கிவிடும். அரசாங்கங்கள் உள்நாட்டு தொழிற்சாலைகளை உருவாக்க பில்லியன் கணக்கான டாலர்களைச் செலவிடுகின்றன, ஆனால் இவை முடிவடைய பல ஆண்டுகள் ஆகும். ஏற்றுமதி கட்டுப்பாடுகளும் முக்கிய காரணியாகியுள்ளன. அமெரிக்க அரசாங்கம் தனது தொழில்நுட்ப முன்னிலையைத் தக்கவைக்க, குறிப்பிட்ட நாடுகளுக்கு உயர் ரக AI சிப்களை விற்பனை செய்வதைத் தடை செய்துள்ளது. இது நிறுவனங்களை இந்த விதிகளுக்கு இணங்க தங்கள் ஹார்டுவேரை வடிவமைக்க கட்டாயப்படுத்தியுள்ளது. உலகளாவிய சந்தையின் இந்த பிளவு, நீங்கள் இருக்கும் இடமே நீங்கள் உருவாக்கக்கூடிய AI-ஐ தீர்மானிக்கும் நிலையை உருவாக்கியுள்ளது. இது இயற்பியல் எல்லைகள் டிஜிட்டல் சாத்தியங்களை வரையறுக்கும் உலகத்திற்குத் திரும்புவது போன்றது. ஹார்டுவேர் மற்றும் பிளாட்ஃபார்ம் சக்திக்கு இடையிலான தொடர்பு இப்போது தேசிய கொள்கையின் ஒரு விஷயமாகிவிட்டது. சமீபத்திய சிலிக்கான் வசதி இல்லாத நாடு மென்பொருள் யுகத்தில் போட்டியிட முடியாது. இதனால்தான் மூலப்பொருட்கள் முதல் முடிக்கப்பட்ட சிஸ்டம்கள் வரை சப்ளை செயினைக் கட்டுப்படுத்த இவ்வளவு தீவிரமான நகர்வுகள் நடக்கின்றன.
ஒரு டெவலப்பர் அல்லது சிறிய வணிகத்திற்கு, இந்த ஹார்டுவேர் மாற்றங்கள் உடனடி விளைவுகளை ஏற்படுத்துகின்றன. சாரா என்ற கிரியேட்டரை எடுத்துக்கொள்வோம். ஒரு வருடம் முன்பு, அவர் தனது AI கருவிகளை இயக்க கிளவுட் (cloud) வழங்குநர்களை மட்டுமே நம்பியிருந்தார். அதிக மாதாந்திர கட்டணம் செலுத்தி, தனது தரவு பயிற்சியளிக்கப் பயன்படுத்தப்படுமோ என்று கவலைப்பட்டார். இன்று, மேம்பட்ட சிப் வடிவமைப்புகள் மற்றும் சிறந்த லோக்கல் மெமரி ஒருங்கிணைப்புக்கு நன்றி, அவர் ஒரு சக்திவாய்ந்த மாடலை தனது ஒற்றை ஒர்க்ஸ்டேஷனிலேயே (workstation) இயக்க முடியும். அவர் காபி குடிக்கும்போதே, உள்ளூர் மெஷின் உயர் தெளிவுத்திறன் கொண்ட அசெட்களை (assets) உருவாக்குகிறது. வேறொரு மாநிலத்தில் உள்ள சர்வர் பதிலளிக்க அவர் காத்திருக்க வேண்டியதில்லை. ஹார்டுவேர் மிகவும் திறமையாக இருப்பதால், அவரது அலுவலகம் சூடாவதில்லை, மின்சாரக் கட்டணமும் கட்டுக்குள் உள்ளது. லோக்கல் கம்ப்யூட் (local compute) நோக்கிய இந்த மாற்றம், சிறந்த சிப் பேக்கேஜிங் மற்றும் மெமரி மேலாண்மையின் நேரடி விளைவாகும். இது கிரியேட்டர்களுக்கு அதிக சுதந்திரத்தையும் சிறந்த தனியுரிமையையும் வழங்குகிறது. இருப்பினும், இது ஒரு பிளவையும் உருவாக்குகிறது. சமீபத்திய ஹார்டுவேரை வாங்கக்கூடியவர்கள், பழைய சிஸ்டம்களில் இருப்பவர்களை விட அதிக உற்பத்தித் திறன் கொண்டவர்களாக இருக்கிறார்கள்.
இதன் தாக்கம் நிறுவனங்களின் பட்ஜெட் திட்டமிடலிலும் எதிரொலிக்கிறது. நடுத்தர நிறுவனங்கள் கிளவுட் ஒப்பந்தத்திற்கும், சொந்த ஹார்டுவேர் கிளஸ்டரை (cluster) உருவாக்குவதற்கும் இடையே தேர்வு செய்ய வேண்டியுள்ளது. இந்த முடிவு இப்போது வெறும் செலவு பற்றியது மட்டுமல்ல; இது கட்டுப்பாடு பற்றியது. ஹார்டுவேரை நீங்கள் சொந்தமாக வைத்திருக்கும்போது, ஸ்டேக்கையும் (stack) நீங்களே கட்டுப்படுத்துகிறீர்கள். நீங்கள் பெரிய டெக் நிறுவனங்களின் API வரம்புகளுக்கோ அல்லது சேவை விதிமுறைகளுக்கோ கட்டுப்பட்டவர் அல்ல. உங்கள் ஹார்டுவேரில் சிறப்பாக இயங்க உங்கள் மென்பொருளை மேம்படுத்தி, அதிகபட்ச செயல்திறனைப் பெறலாம். இது சிப் மாற்றத்தின் நடைமுறைப் பக்கம். இது AI-ஐ ஒரு தொலைதூர சேவையிலிருந்து உள்ளூர் பயன்பாடாக மாற்றுகிறது. ஆனால் இதற்கு சிறப்பு அறிவு தேவை. உயர் செயல்திறன் கொண்ட சிப்களின் கிளஸ்டரை நிர்வகிப்பது சாதாரண சர்வர் அறையை நிர்வகிப்பது போன்றதல்ல. சிக்கலான நெட்வொர்க்கிங் புரோட்டோகால்கள் மற்றும் லிக்விட் கூலிங் (liquid cooling) சிஸ்டம்களை கையாள வேண்டும். இதன் உண்மையான தாக்கம் மென்பொருள் குழுக்களிடையே ஹார்டுவேர் அறிவுக்கான புதிய தேவையை உருவாக்கியுள்ளது. கணினி யுகத்தின் ஆரம்ப நாட்களுக்குப் பிறகு, இந்த இரண்டு துறைகளும் இப்போது ஒன்றிணைகின்றன.
- பெரிய மாடல்களை உள்ளூரில் இயக்குவது நிகழ்நேர பயன்பாடுகளுக்கான லேட்டன்சியைக் குறைக்கிறது.
- மேம்பட்ட கூலிங் தேவைகள் நவீன டேட்டா சென்டர்களின் இயற்பியல் அமைப்பை மாற்றுகின்றன.
- ஹார்டுவேர் அளவிலான என்க்ரிப்ஷன் (encryption) முக்கியமான தரவுகளுக்கு புதிய பாதுகாப்பு அடுக்கை வழங்குகிறது.
- பிரத்யேக இன்டர்கனெக்ட்கள் நிறுவனங்களை ஒரே ஹார்டுவேர் ஈகோசிஸ்டத்திற்குள் (ecosystem) இருக்க கட்டாயப்படுத்துகின்றன.
- மொபைல் AI செயல்திறனுக்கு ஆற்றல் திறன் (energy efficiency) முதன்மை அளவீடாக மாறுகிறது.
இந்த ஹார்டுவேர் மோகத்தின் மறைமுகமான செலவுகள் என்ன என்று நாம் கேட்க வேண்டும். அதிக சக்திக்காக நாம் முயலும்போது, இந்த சிக்கலான சிஸ்டம்களை உருவாக்குவதால் ஏற்படும் சுற்றுச்சூழல் பாதிப்பை நாம் புறக்கணிக்கிறோமா? நவீன ஃபேப் (fab) தொழிற்சாலைகளை இயக்கத் தேவைப்படும் நீர் மற்றும் ஆற்றல் மலைக்க வைக்கிறது. ஹார்டுவேர் மட்டத்தில் தனியுரிமை குறித்த கேள்வியும் உள்ளது. சிலிக்கானிலேயே டெலிமெட்ரி (telemetry) இருந்தால், நமது தரவு பாதுகாப்பானது என்று எப்படி உறுதியாகச் சொல்ல முடியும்? அதிக கம்ப்யூட் எப்போதும் சிறந்தது என்று நாம் நினைக்கிறோம், ஆனால் நாம் தீர்க்கும் பிரச்சனைகளுக்கு இவ்வளவு சக்தி தேவையா என்று அரிதாகவே கேட்கிறோம். பணக்கார நாடுகள் மற்றும் நிறுவனங்கள் மட்டுமே வாழக்கூடிய ஒரு டிஜிட்டல் உலகத்தை நாம் உருவாக்குகிறோமா? உற்பத்தி சக்தியின் செறிவு ஒரு ஆபத்து, அதை நாம் வேகமான டோக்கன்களுக்காகப் புறக்கணிக்கிறோம். முறையான தோல்விக்கு ஆளாகக்கூடிய ஒரு ஹார்டுவேர் மோனோகல்ச்சரை (monoculture) உருவாக்குகிறோமா என்று நாம் சிந்திக்க வேண்டும். ஹார்டுவேர் தான் விதி, ஆனால் அந்த விதி மிகச்சிறிய குழுவினரால் எழுதப்படுகிறது.
BotNews.today ஆனது உள்ளடக்கத்தை ஆராய்ச்சி செய்யவும், எழுதவும், திருத்தவும் மற்றும் மொழிபெயர்க்கவும் AI கருவிகளைப் பயன்படுத்துகிறது. தகவலை பயனுள்ளதாகவும், தெளிவானதாகவும், நம்பகமானதாகவும் வைத்திருக்க எங்கள் குழு செயல்முறையை மதிப்பாய்வு செய்து மேற்பார்வையிடுகிறது.
பவர் யூசர்களுக்கு (power users), தொழில்நுட்ப விவரங்களே உண்மையான கதை. மென்பொருள் மற்றும் ஹார்டுவேரின் ஒருங்கிணைப்பு CUDA அல்லது ROCm போன்ற சிறப்பு லைப்ரரிகள் மூலம் நடக்கிறது. இவை வெறும் டிரைவர்கள் மட்டுமல்ல; இவைதான் கோட் (code) சிப்பில் உள்ள ஆயிரக்கணக்கான சிறிய கோர்களுடன் பேச உதவும் பாலம். பல வேலைகளுக்கு தற்போதைய தடையாக இருப்பது கிளவுட் வழங்குநர்கள் விதிக்கும் API வரம்புதான். லோக்கல் ஹார்டுவேருக்கு மாறுவதன் மூலம், பயனர்கள் இந்த வரம்புகளைத் தவிர்க்கலாம், ஆனால் லோக்கல் ஸ்டோரேஜ் மற்றும் மெமரி பேண்ட்வித் (bandwidth) கட்டுப்பாடுகளைச் சமாளிக்க வேண்டும். NVLink போன்ற இன்டர்கனெக்ட் வேகம், பல சிப்கள் எப்படி ஒன்றாகச் செயல்படுகின்றன என்பதைத் தீர்மானிக்கிறது. இன்டர்கனெக்ட் மெதுவாக இருந்தால், அதிக சிப்களைச் சேர்ப்பது பலனைத் தராது. இதனால்தான் சமீபத்திய AI ஹார்டுவேர் போக்குகள் பிராசஸிங்கிற்கு இணையாக நெட்வொர்க்கிங்கிலும் கவனம் செலுத்துகின்றன. தெர்மல் டிசைன் பவரையும் (thermal design power) கவனிக்க வேண்டும். அதிக வெப்பமடையும் சிப் அதன் செயல்திறனைக் குறைத்துக்கொள்ளும், இதனால் அதன் உச்ச வேகம் பயனற்றதாகிவிடும். மாடல் வெயிட்டுகள் (weights) மெமரிக்கு விரைவாக ஏற்றப்பட வேண்டும் என்பதால் லோக்கல் ஸ்டோரேஜ் வேகமும் முக்கியம். சந்தையின் கீக் (geek) பகுதி எளிய பெஞ்ச்மார்க்குகளில் இருந்து விலகி, சிஸ்டம் முழுமைக்குமான த்ரூபுட் அளவீடுகளை நோக்கி நகர்கிறது.
- உயர் ரக கிளஸ்டர்களில் இன்டர்கனெக்ட் பேண்ட்வித் இப்போது வினாடிக்கு பல டெராபைட்டுகளைத் தாண்டியுள்ளது.
- குவாண்டிசேஷன் (quantization) நுட்பங்கள் பெரிய மாடல்களை சிறிய மெமரி அளவில் பொருத்த உதவுகின்றன.
- யூனிஃபைட் மெமரி ஆர்க்கிடெக்சர் (unified memory architecture) CPU மற்றும் GPU ஒரே தரவுத் தொகுப்பைப் பகிர அனுமதிக்கிறது.
- குறிப்பிட்ட கணித செயல்பாடுகளுக்கான ஹார்டுவேர் ஆக்சிலரேட்டர்கள் (accelerators) நுகர்வோர் CPU-களில் தரநிலையாகி வருகின்றன.
- லோக்கல் API எண்ட் பாயிண்ட்கள் (endpoints) வெவ்வேறு மென்பொருள் கருவிகளுக்கு இடையே தடையற்ற ஒருங்கிணைப்பை அனுமதிக்கின்றன.
அடுத்த ஆண்டில் அர்த்தமுள்ள முன்னேற்றம் என்பது அதிக கிளாக் ஸ்பீட்களால் அளவிடப்படாது. அதற்குப் பதிலாக, ஆற்றல் திறன் மற்றும் மேம்பட்ட பேக்கேஜிங்கின் ஜனநாயகமயமாக்கலில் முன்னேற்றங்களை நாம் எதிர்பார்க்க வேண்டும். அதிக திறந்த இன்டர்கனெக்ட் தரநிலைகளை நோக்கி நகர்ந்தால், அது ஒரு முக்கியமான சமிக்ஞையாக இருக்கும். பயனர்கள் ஒரே வெண்டர் (vendor) ஸ்டேக்கில் சிக்கியிருக்க மாட்டார்கள் என்பதையே இது குறிக்கும். தரவுகளை நகர்த்தத் தேவைப்படும் ஆற்றலைக் குறைக்கும் ஆன்-சிப் நெட்வொர்க்கிங் வளர்ச்சியையும் நாம் கவனிக்க வேண்டும். உயர் செயல்திறன் கொண்ட AI, முதல் ஒரு சதவீத நிறுவனங்களுக்கு அப்பால் அனைவருக்கும் கிடைத்தால் அதுவே உண்மையான வெற்றி. நடைமுறைப் பங்குகள் அதிகம். டிஜிட்டல் உலகில் நாம் உருவாக்கும் அனைத்திற்கும் ஹார்டுவேர் தான் அடித்தளம். அந்த அடித்தளம் குவிந்து, விலை உயர்ந்ததாகவும், ஒளிவுமறைவுடனும் இருந்தால், தொழில்நுட்பத்தின் எதிர்காலமும் அப்படித்தான் இருக்கும். சிலிக்கானின் சக்தியை சந்தையில் இரைச்சலை உருவாக்க மட்டுமல்லாமல், அனைவருக்கும் உண்மையான பிரச்சனைகளைத் தீர்க்கப் பயன்படுத்தும் உலகத்தை நோக்கி நாம் நகர வேண்டும். இந்த மாற்றம் இப்போது நடக்கிறது, இதன் விளைவுகள் பல தசாப்தங்களுக்கு உணரப்படும்.
ஆசிரியரின் குறிப்பு: கணினித் துறையில் நிபுணர்கள் அல்லாதவர்கள், ஆனால் செயற்கை நுண்ணறிவைப் புரிந்துகொள்ளவும், அதை அதிக நம்பிக்கையுடன் பயன்படுத்தவும், ஏற்கனவே வந்துகொண்டிருக்கும் எதிர்காலத்தைப் பின்தொடரவும் விரும்பும் மக்களுக்காக, பலமொழி AI செய்திகள் மற்றும் வழிகாட்டல் மையமாக இந்த தளத்தை நாங்கள் உருவாக்கினோம்.
ஒரு பிழையைக் கண்டறிந்தீர்களா அல்லது திருத்தப்பட வேண்டிய ஒன்று இருக்கிறதா? எங்களுக்குத் தெரியப்படுத்துங்கள்.