AI-யை பற்றி 100 கட்டுரைகளை விட இந்த வீடியோ கிளிப்புகள் சிறப்பாக விளக்குகின்றன!
டெக்ஸ்ட் காலம் முடிந்தது, வீடியோ யுகம் ஆரம்பம்!
பல வருஷங்களாக AI என்றாலே சாட்போட்கள், எஸே ஜெனரேட்டர்கள் பற்றித்தான் பேசிட்டு இருந்தோம். ஆனா அந்த காலம் இப்போ மலையேறிடுச்சு! இப்போ ஹை-குவாலிட்டி வீடியோ ஜெனரேஷன் வந்தாச்சு. ஒரு பத்து செகண்ட் வீடியோ கிளிப், ஆயிரம் வார்த்தை பிராம்ப்டை (prompt) விட பவர்ஃபுல்லா இருக்கு. இது வெறும் சோஷியல் மீடியா ரீல்ஸ் கிடையாது; நாம எப்படி உண்மையை பார்க்கிறோம் என்பதையே இது மாத்தப்போகுது. ஒரு நியான் சிட்டியையோ இல்ல ஒரு போட்டோ-ரியலிஸ்டிக் விலங்கையோ வீடியோவில் பார்க்கும்போது, அது வெறும் பிக்சல்கள் (pixels) மட்டும் கிடையாது. ஒரு மெஷின் நம்ம உலகத்தோட பிசிக்ஸ் விதிகளை புரிஞ்சுகிட்டு உருவாக்குன மேஜிக் அது. இது வெறும் என்டர்டெயின்மென்ட் மட்டும் இல்ல, தகவல்களை நாம எப்படி நம்புறோம்ங்கற அடிப்படையையே மாத்துது. ஒரு அலையோட மூவ்மென்ட்டையோ இல்ல ஒரு மனுஷனோட முக பாவனையையோ ஒரு மெஷினால தத்ரூபமா கொண்டுவர முடியுதுன்னா, பழைய ஆதாரங்கள் எல்லாம் செல்லாம போயிடும். இனிமே நாம வீடியோக்களை வெறும் கன்டென்ட்டா மட்டும் பார்க்காம, டேட்டா பாயிண்ட்ஸா பார்க்க பழகிக்கணும்.
பிக்சல்கள் எப்படி நகரக் கற்றுக்கொள்கின்றன?
இந்த வீடியோக்களுக்கு பின்னாடி டிஃப்யூஷன் மாடல்கள் (diffusion models) மற்றும் டிரான்ஸ்பார்மர் ஆர்கிடெக்சர் (transformer architectures) இருக்கு. பழைய டூல்ஸ் மாதிரி இமேஜ்களை ஒட்ட வைக்காம, சோரா (Sora) அல்லது ரன்வே ஜென்-3 (Runway Gen-3) போன்ற மாடர்ன் சிஸ்டம்கள் வீடியோவை ஒரு சீக்வென்ஸா (sequence) பார்க்குது. ஒரு மரத்துக்கு பின்னாடி போற ஆப்ஜெக்ட், மறுபக்கம் வரும்போது அதே மாதிரி இருக்கறதுக்கு இதுதான் காரணம். போன வருஷம் நாம பார்த்த அந்த ஆட்டம் காணும் வீடியோக்களுக்கும் இதுக்கும் மலைக்கும் மடுவுக்கும் உள்ள வித்தியாசம் இருக்கு. இந்த மாடல்கள் பல கோடி வீடியோக்களை பார்த்து, வெளிச்சம் எப்படி விழும், கிராவிட்டி எப்படி வேலை செய்யும்னு எல்லாத்தையும் கத்துக்கிட்டு இருக்கு. ஒரு சின்ன டெக்ஸ்ட் டிஸ்கிரிப்ஷன் கொடுத்தா போதும், AI ஒரு புது உலகத்தையே உருவாக்கிடும். இதுதான் விஷுவல் கம்யூனிகேஷனோட புது லெவல். கற்பனைக்கும் நிஜமான வீடியோவுக்கும் நடுவுல இருந்த இடைவெளி இப்போ சில செகண்ட் பிராசஸிங் டைமா குறைஞ்சிடுச்சு. இந்த மாற்றத்தை புரிஞ்சிக்கிறது இப்போ ரொம்ப அவசியம்.
உலகளாவிய உண்மை நெருக்கடி
இந்த மாற்றத்தோட தாக்கம் ரொம்ப பெருசு. “கண்ணால் காண்பது மெய்” அப்படிங்கற காலம் போயி, இப்போ எதை நம்புறதுன்னே தெரியாத ஒரு காலத்துக்குள்ள நாம நுழையுறோம். ஜர்னலிஸ்ட்கள் மற்றும் அரசியல் ஆய்வாளர்கள் இப்போ ஒரு பெரிய சவாலை சந்திக்கிறாங்க. ஏன்னா, ரொம்ப கம்மியான செலவுல வீடியோ ஆதாரங்களை இப்போ உருவாக்க முடியும். இது வெறும் செய்திகளை மட்டும் பாதிக்காது, வரலாற்றை நாம எப்படி பார்க்கிறோம் என்பதையே மாத்திடும். மீடியா அறிவு கம்மியா இருக்குற இடங்கள்ல, ஒரு போலி AI வீடியோ பெரிய கலவரத்தையே உருவாக்கலாம். அதே சமயம், தப்பு செய்றவங்க நிஜமான வீடியோவை கூட “இது AI உருவாக்குனது” அப்படின்னு சொல்லி தப்பிச்சுக்க வாய்ப்பு இருக்கு (liar’s dividend). அதனால இனிமே வீடியோவோட குவாலிட்டியை வச்சு அது உண்மையா பொய்யான்னு முடிவு பண்ண முடியாது. மெட்டா-டேட்டா (metadata) மற்றும் டிஜிட்டல் கையெழுத்துக்களை வச்சுதான் இனிமே எதையும் உறுதி செய்ய முடியும். நாம இப்போ ஒரு நிரந்தர சந்தேகத்துடனேயே வாழ வேண்டிய கட்டாயத்துல இருக்கோம்.
BotNews.today ஆனது உள்ளடக்கத்தை ஆராய்ச்சி செய்யவும், எழுதவும், திருத்தவும் மற்றும் மொழிபெயர்க்கவும் AI கருவிகளைப் பயன்படுத்துகிறது. தகவலை பயனுள்ளதாகவும், தெளிவானதாகவும், நம்பகமானதாகவும் வைத்திருக்க எங்கள் குழு செயல்முறையை மதிப்பாய்வு செய்து மேற்பார்வையிடுகிறது.
கிரியேட்டர்களுக்கான புதிய ஒர்க்-ப்ளோ (Workflow)
ப்ரொபஷனல் மீடியா உலகத்துல இந்த கிளிப்புகள் ஏற்கனவே பெரிய மாற்றத்தை கொண்டு வந்துடுச்சு. உதாரணத்துக்கு சாரா என்ற ஒரு கிரியேட்டிவ் டைரக்டரை எடுத்துப்போம். முன்னாடி ஒரு ஐடியாவை கிளைன்ட்க்கு புரிய வைக்கிறதுக்கு ஸ்டாக் ஃபுட்டேஜ் தேடுறதுலயே அவங்களுக்கு பாதி நாள் போயிடும். ஆனா இப்போ, ஒரு வீடியோ மாடல் மூலமா அஞ்சு நிமிஷத்துல அஞ்சு விதமான கான்செப்ட்களை அவங்களால காட்ட முடியுது. இது ஷூட்டிங் போறதுக்கு முன்னாடியே ஒரு தெளிவை கொடுக்குது. இதனால சினிமா குரூவோட வேலை குறையாது, ஆனா வேலை செய்ற விதம் மாறும். ஆனா இதுல ஒரு சவாலும் இருக்கு, இப்போ எல்லாருமே உடனே ஹை-குவாலிட்டி அவுட்புட் எதிர்பார்க்க ஆரம்பிச்சுட்டாங்க. AI உடனே ஒரு 90 நிமிஷ படத்தை எடுத்துடும்னு நாம நினைக்கிறோம், ஆனா அதுக்கு இன்னும் காலம் இருக்கு. இப்போதைக்கு பேக்ரவுண்ட் வேலைகள், ஆர்க்கிடெக்சர் டிசைன் போன்ற சின்ன சின்ன விஷயங்கள்ல AI பெரிய மாற்றத்தை செஞ்சுட்டு இருக்கு. இது ஒரு சூப்பரான புரோட்டோடைப்பிங் டூல்.
- சினிமா மற்றும் விளம்பரங்களுக்கான ஸ்டோரிபோர்டிங்.
- ஆர்க்கிடெக்சர் டிசைன்களை வீடியோவாக மாற்றுதல்.
- பல்வேறு மொழிகளுக்கான எஜுகேஷனல் கன்டென்ட் உருவாக்குதல்.
- விஷுவல் எஃபெக்ட்ஸ்களுக்கான பேக்ரவுண்ட் பிளேட் ஜெனரேஷன்.
அன்லிமிடெட் வீடியோக்களின் மறைமுகமான விலை
இந்த டிரெண்ட்ல சில கசப்பான உண்மைகளும் இருக்கு. ஒரு பத்து செகண்ட் வீடியோவோட உண்மையான விலை என்ன? வெறும் சப்ஸ்கிரிப்ஷன் கட்டணம் மட்டும் இல்ல, இந்த மாடல்களை ரன் பண்ண தேவைப்படுற அதிகப்படியான மின்சாரம் மற்றும் டேட்டா சென்டர்களின் கார்பன் ஃபுட்பிரிண்ட் (carbon footprint) பற்றி யாரும் பேசுறது இல்ல. அப்புறம் பிரைவசி பிரச்சனை. பல கோடி வீடியோக்களை வச்சுதான் இந்த AI-க்கு ட்ரைனிங் கொடுத்திருக்காங்க. ஆனா அந்த வீடியோக்களை உருவாக்குனவங்ககிட்ட அனுமதி வாங்கவே இல்லை. இது எவ்ளோ தூரம் நியாயம்? அதுமட்டும் இல்லாம, இன்டர்நெட் முழுக்க AI வீடியோக்களா இருந்தா, நம்ம நிஜமான வரலாற்றை நாம மறந்துடுவோமா? இந்த மாடல்களை ஒரு சில நிறுவனங்கள் மட்டும் கட்டுப்படுத்துறது கலாச்சார ரீதியா எவ்ளோ பாதிப்பை உண்டாக்கும்? டெக்னாலஜி வேகமா வளர்ந்தாலும், அதை முறைப்படுத்த இன்னும் சரியான சட்டங்கள் வரல. நாம ஒரு பெரிய பரிசோதனையில இப்போ சிக்கிட்டு இருக்கோம்.
மோஷன் ஜெனரேஷனுக்கு பின்னாடி என்ன நடக்குது?
பவர் யூசர்களுக்கு (power users) இதோட டெக்னிக்கல் விஷயங்கள் ரொம்ப இன்ட்ரஸ்டிங்கா இருக்கும். மேலோட்டமா பார்க்க சிம்பிளா இருந்தாலும், ப்ரொபஷனலா இதைப் பயன்படுத்த லேட்டன்ட் ஸ்பேஸ் (latent space) பற்றி தெரிஞ்சிருக்கணும். இப்போதைக்கு API லிமிட்கள் கம்மியா இருக்கறதால, பெரிய வீடியோக்களை உருவாக்க “video-to-video” பிராம்ப்டிங் முறையை பயன்படுத்துறாங்க. அதுமட்டும் இல்லாம, ஒரு நாள் AI வீடியோ எக்ஸ்பெரிமென்ட் பண்ணாலே நூற்றுக்கணக்கான ஜிபி டேட்டா சேர்ந்துடும். இப்போ டெவலப்பர்கள் இந்த மாடல்களை நேரடியாக DaVinci Resolve அல்லது Adobe Premiere போன்ற டூல்களுக்குள்ள கொண்டு வர முயற்சி செய்றாங்க. இதனால எடிட்டிங் வேலை ரொம்ப ஈஸியாகும். அடுத்த கட்டமா, கிளவுட் உதவியே இல்லாம லோக்கல் ஹார்டுவேர்ல ரன் ஆகுற “world models” வரப்போகுது. இது பிரைவசிக்கு ரொம்ப நல்லது. இப்போதைக்கு டெக்னாலஜி இந்த மூணு விஷயங்கள்லதான் அதிக கவனம் செலுத்துது.
- தொடர்ச்சியான காட்சிகளில் ஒரே மாதிரியான தோற்றத்தை பராமரித்தல்.
- பிசிக்ஸ் பாராமீட்டர்களை பிராம்ப்ட் மூலமாகவே மாற்றுதல்.
- கன்ஸ்யூமர் GPU-க்களில் ரன் ஆகும் வகையில் VRAM தேவையை குறைத்தல்.
நாங்கள் கவர் செய்ய வேண்டும் என்று நீங்கள் நினைக்கும் AI கதை, கருவி, போக்கு அல்லது கேள்வி உங்களிடம் உள்ளதா? உங்கள் கட்டுரை யோசனையை எங்களுக்கு அனுப்பவும் — அதைக் கேட்க நாங்கள் விரும்புகிறோம்.
முடியாத பிரேம்
நாம இப்போ பார்க்குற வீடியோக்கள் வெறும் ஆரம்பம்தான். ஸ்டாட்டிக் இமேஜ்கள்ல இருந்து மோஷன் வீடியோக்களுக்கு வந்துட்டோம். அடுத்து முழுமையான இன்டராக்டிவ் உலகத்தையே உருவாக்க போறோம். AI வெறும் வீடியோவா மட்டும் இல்லாம, ஒரு உலகமாவே மாறப்போகுது. ஆனா ஒரு கேள்வி மட்டும் அப்படியே இருக்கு: AI நிஜமாவே பிசிக்ஸை புரிஞ்சுக்குதா இல்ல வெறும் டேட்டாவை காப்பி அடிக்குதா? 2026 முடியும்போது இந்த கேள்விகளுக்கான பதில் நமக்கு கிடைக்கலாம். AI ஒரு உதவியாளரா இருக்குமா இல்ல நம்ம விஷுவல் உலகத்தோட ராஜாவா மாறுமான்னு பொறுத்திருந்து பார்ப்போம்.
ஆசிரியரின் குறிப்பு: கணினித் துறையில் நிபுணர்கள் அல்லாதவர்கள், ஆனால் செயற்கை நுண்ணறிவைப் புரிந்துகொள்ளவும், அதை அதிக நம்பிக்கையுடன் பயன்படுத்தவும், ஏற்கனவே வந்துகொண்டிருக்கும் எதிர்காலத்தைப் பின்தொடரவும் விரும்பும் மக்களுக்காக, பலமொழி AI செய்திகள் மற்றும் வழிகாட்டல் மையமாக இந்த தளத்தை நாங்கள் உருவாக்கினோம்.
ஒரு பிழையைக் கண்டறிந்தீர்களா அல்லது திருத்தப்பட வேண்டிய ஒன்று இருக்கிறதா? எங்களுக்குத் தெரியப்படுத்துங்கள்.