இந்த மாதம் பார்க்க வேண்டிய 10 AI வீடியோக்கள்
நிலையான புகைப்படங்களிலிருந்து திரவத்தன்மை கொண்ட வீடியோக்களுக்கு மாறுவது, டிஜிட்டல் ஆதாரங்களை நாம் பார்க்கும் விதத்தில் ஒரு பெரிய மாற்றத்தைக் குறிக்கிறது. ஒரு ப்ராம்ப்ட் (prompt) மூலம் ஒற்றை பிரேமை உருவாக்கும் காலத்தை நாம் கடந்துவிட்டோம். இப்போது, இந்தத் துறை தற்காலிக நிலைத்தன்மை (temporal consistency) மற்றும் இயக்கத்தின் இயற்பியல் ஆகியவற்றில் கவனம் செலுத்துகிறது. இந்த பத்து வீடியோ கிளிப்கள் வெறும் தொழில்நுட்ப மைல்கற்கள் மட்டுமல்ல. இவை, ஒரு தருணத்தைப் படம்பிடிப்பதற்கும், அதை செயற்கையாக உருவாக்குவதற்கும் இடையிலான இடைவெளி முற்றிலும் மறையும் எதிர்காலத்திற்கான ஒரு ஜன்னலாகச் செயல்படுகின்றன. பல பார்வையாளர்கள் இன்னும் இந்த வீடியோக்களை வெறும் புதுமையாகவே பார்க்கிறார்கள். சிதைந்த கைகள் அல்லது மின்னும் பின்னணிகளைப் பார்த்துவிட்டு, இந்தத் தொழில்நுட்பத்தை ஒரு பொம்மை என்று ஒதுக்கிவிடுகிறார்கள். இது ஒரு தவறு. இந்த வீடியோக்களில் உள்ள முக்கிய அம்சம் படத்தின் முழுமை அல்ல, அதன் முன்னேற்றத்தின் வேகம். உலகத்தை கவனிப்பதன் மூலம் அதன் விதிகளைக் கற்றுக்கொள்ளும் மாடல்களின் நேரடி வெளியீட்டை நாம் பார்க்கிறோம். இந்த மாதம், சிறந்ததாகத் தோன்றும் கிளிப்கள் மிக முக்கியமானவை அல்ல. ஈர்ப்பு விசை, ஒளி மற்றும் மனித உடற்கூறியல் ஆகியவை காலப்போக்கில் எவ்வாறு தொடர்பு கொள்கின்றன என்பதைப் புரிந்துகொள்ளும் மென்பொருளை நிரூபிக்கும் வீடியோக்களே முக்கியமானவை. இதுவே ஒரு புதிய காட்சி மொழியின் அடித்தளம்.
தற்போதைய வீடியோ உருவாக்கம், காலத்தின் மூன்றாவது பரிமாணத்திற்கு விரிவுபடுத்தப்பட்ட டிஃப்யூஷன் மாடல்களை (diffusion models) நம்பியுள்ளது. ஒரு தட்டையான தளத்தில் ஒரு பிக்சல் (pixel) எங்கு இருக்க வேண்டும் என்று கணிப்பதற்குப் பதிலாக, இந்த சிஸ்டம்கள் அறுபது பிரேம்களில் அந்த பிக்சல் எவ்வாறு மாற வேண்டும் என்பதைக் கணிக்கின்றன. இதற்கு அதிகப்படியான கம்ப்யூட் (compute) மற்றும் தொடர்ச்சி குறித்த ஆழமான புரிதல் தேவை. ஒருவர் நடக்கும் கிளிப்பைப் பார்க்கும்போது, அவர்களின் சட்டையின் நிறம் மாறாமல் இருப்பதை உறுதிசெய்ய, மூன்று வினாடிகளுக்கு முன்பு அந்த நபர் எப்படி இருந்தார் என்பதை மாடல் நினைவில் வைத்திருக்க வேண்டும். இது டெம்போரல் கோஹரன்ஸ் (temporal coherence) என்று அழைக்கப்படுகிறது. செயற்கை ஊடகங்களில் இதுவே மிகக் கடினமான பிரச்சனை. இன்று நாம் பார்க்கும் பெரும்பாலான வீடியோக்கள் குறுகியவை, ஏனெனில் நீண்ட காலத்திற்கு இந்த நிலைத்தன்மையை பராமரிப்பது கணக்கீட்டு ரீதியாக விலை உயர்ந்தது. மாடல்கள் பெரும்பாலும் குறுக்குவழிகளைப் பயன்படுத்துகின்றன. செயலாக்க சக்தியைச் சேமிக்க அவை பின்னணியை மங்கலாக்கலாம் அல்லது சிக்கலான இயக்கத்தைச் எளிமைப்படுத்தலாம். இருப்பினும், சமீபத்திய வெளியீடுகள் கிளிப்பின் முழு கால அளவிலும் விவரங்களைப் பராமரிப்பதில் குறிப்பிடத்தக்க முன்னேற்றத்தைக் காட்டுகின்றன. அடிப்படை ஆர்க்கிடெக்சர்கள் (architectures) உயர்-பரிமாணத் தரவுகளைக் கையாள்வதில் அதிக திறன் பெற்று வருகின்றன என்பதை இது உணர்த்துகிறது.
இந்தத் தலைப்பைப் பற்றி பெரும்பாலான மக்கள் கொண்டுள்ள குழப்பம் என்னவென்றால், AI வீடியோவை