AI பயிற்சி: காப்புரிமைப் போர் ஏன்? எளிமையாகப் புரிந்துகொள்ளலாம்!
ஹேய் நண்பர்களே! சமீபகாலமா இன்டர்நெட்டில் சுத்திட்டு இருந்தீங்கன்னா, சில சூப்பரான விஷயங்களைப் பார்த்திருப்பீங்க! இப்போ AI ஒரு அட்டகாசமான பாட்டை எழுதலாம், வெப்சைட் கோட் பண்ண உதவலாம், ஏன்… விண்வெளியில சைக்கிள் ஓட்டும் பூனையின் படத்தையும் வரையலாம். கொஞ்சம் மேஜிக் மாதிரிதான் இருக்குல்ல? ஆனா, இந்த மேஜிக் பின்னாடி ஒரு பெரிய, முக்கியமான கேள்வி இருக்கு, அதைப் பத்திதான் எல்லாரும் பேசிக்கிட்டு இருக்காங்க. இந்த அறிவெல்லாம் எங்கிருந்து வருது? இந்த டூல்ஸை இவ்வளவு ஸ்மார்ட்டா ஆக்க, கம்பெனிகள் லட்சக்கணக்கான கட்டுரைகள், போட்டோக்கள், புத்தகங்களைப் பயன்படுத்திதான் பயிற்சி கொடுத்திருக்காங்க. இந்த கன்டென்ட் யாருக்குச் சொந்தம், அதை உருவாக்கினவங்களுக்குப் பணம் கிடைக்குமான்னு ஒரு பெரிய விவாதம் கிளம்பிருச்சு. இப்போ AI நியூஸ் மற்றும் அப்டேட்ஸ்-ஐ ஃபாலோ பண்றதுக்கு சரியான நேரம், ஏன்னா இன்டர்நெட்டை நாம எப்படிப் பயன்படுத்துறோம்ங்கற விதிகள் இப்போதான் மறுபடியும் எழுதப்பட்டுக்கிட்டு இருக்கு. முக்கியமான விஷயம் என்னன்னா, டெக் கம்பெனிகளும் கிரியேட்டர்ஸும் ஒண்ணா சேர்ந்து வேலை செய்ய ஒரு வழியைக் கண்டுபிடிக்க முயற்சி பண்ற ஒரு உலகத்தை நோக்கி நாம போய்க்கிட்டு இருக்கோம். இது ஒரு சூப்பரான மாற்றம், நாம தினமும் பயன்படுத்தும் டூல்ஸை இன்னும் சிறப்பா, நம்பகத்தன்மையுள்ளதா ஆக்க உதவும்.
ஒரு AI எப்படி கத்துக்குதுன்னு நீங்க யோசிக்கலாம். ஒரு பெரிய லைப்ரரில இருக்கிற ஒரு ஸ்டூடென்ட் மாதிரி இதை நினைச்சுப் பாருங்க. மனுஷங்க மாதிரி எழுதக் கத்துக்க, அந்த AI ஸ்டூடென்ட் அந்த லைப்ரரில இருக்கிற எல்லாத்தையும் படிக்கும். இதுல நியூஸ் ஸ்டோரிகள், ப்ளாக் போஸ்ட்கள், ஏன்… பப்ளிக் சோஷியல் மீடியா அப்டேட்ஸ் கூட அடங்கும். இந்த ப்ராசஸ்-ஐ பெரும்பாலும் training-ன்னு சொல்லுவாங்க. AI தான் படிச்சதை அப்படியே காப்பி பேஸ்ட் பண்ணாது. அதுக்கு பதிலா, அது பேட்டர்ன்ஸை (patterns) தேடும். ‘apple’ங்கிற வார்த்தை பெரும்பாலும் ‘juicy’ அல்லது ‘red’ங்கிற வார்த்தைக்கு பக்கத்துல வரும்னு கத்துக்கும். ஒரு சன்செட்ல பெரும்பாலும் ஆரஞ்சு, பிங்க் நிறங்கள் இருக்கும்னு கத்துக்கும். பில்லியன் கணக்கான உதாரணங்களைப் பார்த்து, அடுத்து என்ன வரணும்னு கணிக்கிறதுல அது ஒரு எக்ஸ்பர்ட் ஆகிடும். இப்படித்தான் அது ரொம்ப மனுஷத்தன்மை வாய்ந்த ஒரு புது விஷயத்தை உருவாக்குது. ரொம்ப காலமா, இது ஒரு சூப்பரான சயின்ஸ் ப்ராஜெக்ட்டா மட்டும்தான் பார்க்கப்பட்டுச்சு. ஆனா இப்போ இந்த டூல்ஸ் எல்லாம் பெரிய பிசினஸ் ஆகிடுச்சு. அந்த லைப்ரரில புத்தகங்களை எழுதினவங்களும், போட்டோ எடுத்தவங்களும் அவங்க வேலை எப்படிப் பயன்படுத்தப்படுதுன்னு சில நியாயமான கேள்விகளைக் கேட்க ஆரம்பிச்சிருக்காங்க.
ஒரு பிழையைக் கண்டறிந்தீர்களா அல்லது திருத்தப்பட வேண்டிய ஒன்று இருக்கிறதா? எங்களுக்குத் தெரியப்படுத்துங்கள்.ஒரு பொதுவான தவறான கருத்து என்னன்னா, AIங்கிறது திருடப்பட்ட வேலைகளின் ஒரு பெரிய டேட்டாபேஸ் (database) அப்படின்னு. அது அத்தனை சரியில்லை. AI ஒரிஜினல் ஃபைல்ஸை ஸ்டோர் பண்ணாது. அதுல இருந்து கத்துக்கிட்ட பேட்டர்ன்ஸைத்தான் ஸ்டோர் பண்ணும். ஆனா, இந்த தகவல்கள் முதல்ல எப்படிச் சேகரிக்கப்பட்டுச்சுங்கறதுலதான் பிரச்சனை வருது. இந்த நடைமுறைக்கு data scraping-ன்னு பேரு. வெப் முழுக்கப் பயணம் செஞ்சு, கிடைக்கிற எல்லா பப்ளிக் டேட்டாவையும் உறிஞ்சுற ஒரு பெரிய டிஜிட்டல் வேக்யூம் கிளீனரை கற்பனை செஞ்சு பாருங்க. ஆரம்ப காலத்துல இதை யாரும் பெருசா கண்டுக்கல. ஆனா சமீபத்துல விஷயங்கள் மாறிடுச்சு. ஃபேமஸ் எழுத்தாளர்கள்ல இருந்து பெரிய நியூஸ் அவுட்லெட்ஸ் வரைக்கும், கிரியேட்டிவ் உலகத்துல இருக்கிற பெரிய ஆட்கள், இந்த வேக்யூமிங் இலவசமா இருக்கக்கூடாதுன்னு சொல்ல ஆரம்பிச்சிருக்காங்க. அவங்க வேலைக்கு மதிப்பு இருக்குன்னும், ஒரு டெக் கம்பெனி அவங்க டேட்டாவை வெச்சு பயிற்சி பெற்ற ஒரு டூலைப் பயன்படுத்தி பணம் சம்பாதிக்கப் போகுதுன்னா, அவங்களுக்கும் ஒரு பங்கு கிடைக்கணும்னு வாதிடுறாங்க. இதுதான் இந்த விவாதத்தின் மையப்புள்ளி. இது புதுமையின் வேகம் மற்றும் அந்த புதுமைக்கான மூலப்பொருளை வழங்கும் மக்களின் உரிமைகளுக்கு இடையிலான ஒரு இழுபறிப் போர்.
AI மூளைக்கு யார் சொந்தக்காரர்? பெரிய கேள்வி இதுதான்!
இந்த விவாதம் உலகம் முழுக்க நடந்துக்கிட்டு இருக்கு, இது இன்டர்நெட்டின் எதிர்காலத்துக்கு ஒரு நல்ல செய்திதான். ஏன்? ஏன்னா, டிஜிட்டல் வேலைக்கு எப்படி மதிப்பு கொடுக்கிறதுன்னு நாம இப்போதான் கண்டுபிடிக்க ஆரம்பிச்சிருக்கோம். இது நவீன காலத்துக்கு ரொம்ப முக்கியம். அமெரிக்கா போன்ற இடங்கள்ல, கோர்ட்டுகள் **fair use** அப்படின்னு ஒண்ணைப் பார்க்குது. இது ஒரு சட்டப்பூர்வமான கருத்து. அதாவது, நீங்க ஒரு காப்புரிமை பெற்ற விஷயத்தை புதுசா மாத்தி, ஒரிஜினல் கிரியேட்டருக்கு எந்த பாதிப்பும் ஏற்படுத்தாம பயன்படுத்தலாம்னு சொல்லுது. டெக் கம்பெனிகள், AI பயிற்சிங்கிறது fair use-ன் உச்சகட்ட வடிவம்னு வாதிடுறாங்க. அவங்க ஒரிஜினல் டேட்டால இருந்து முற்றிலும் மாறுபட்ட ஒரு விஷயத்தை உருவாக்குறாங்கன்னு சொல்றாங்க. இன்னொரு பக்கம், ஒரு AI ஒரு குறிப்பிட்ட எழுத்தாளரின் ஸ்டைல்ல ஒரு கதையை எழுத முடிஞ்சா, அது அந்த எழுத்தாளரோட கண்டிப்பா போட்டி போடுதுன்னு கிரியேட்டர்ஸ் சொல்றாங்க. இது அமெரிக்கால மட்டும் நடக்கல. ஐரோப்பிய யூனியன் மற்றும் ஜப்பான் போன்ற நாடுகளும் அவங்களுக்கான விதிகளை உருவாக்கிட்டு இருக்காங்க. சிலர் AI கம்பெனிகளுக்கு ரொம்ப சப்போர்ட்டிவா இருந்து வளர்ச்சியை ஊக்குவிக்கிறாங்க, மத்தவங்க அவங்க உள்ளூர் கலைஞர்களையும், பத்திரிகையாளர்களையும் பாதுகாக்க சில கட்டுப்பாடுகளைப் போடுறாங்க.
இந்த முடிவுகளின் உலகளாவிய தாக்கம் ரொம்ப பெருசா இருக்கும். ஒவ்வொரு நாட்டுக்கும் வெவ்வேறு விதிகள் இருந்தா, எல்லா இடத்திலயும் செயல்படும் கம்பெனிகளுக்கு ரொம்ப குழப்பமா இருக்கும். அதனாலதான் பலரும் World Intellectual Property Organization-ஐப் பார்த்து, எல்லாரும் பின்பற்றக்கூடிய ஒரு ஸ்டாண்டர்டை உருவாக்க உதவுமாறு எதிர்பார்க்குறாங்க. இது வெறும் பெரிய வழக்குகள் பத்தி மட்டும் இல்ல. இது ஒரு நிலையான சிஸ்டத்தை உருவாக்குறது பத்தி. நாம இப்போவே சில சூப்பரான முன்னேற்றங்களைப் பார்த்துக்கிட்டு இருக்கோம். சில டெக் ஜாம்பவான்கள் பெரிய பப்ளிஷர்களோட லைசென்சிங் டீல்ஸ் (licensing deals) போட ஆரம்பிச்சிருக்காங்க. அதாவது, அவங்க மாடல்ஸ்க்கு பயிற்சி கொடுக்க ஹை-குவாலிட்டி டேட்டாவை பயன்படுத்தும் உரிமைக்காக பணம் செலுத்துறாங்க. இது ஜர்னலிசம் மற்றும் ஆர்ட்டை சப்போர்ட் பண்றதுக்கு ஒரு அருமையான வழியா இருக்கலாம், அதே சமயம் AI டெக்னாலஜி வேகமா முன்னேறவும் உதவும். சூப்பரான டெக்னாலஜிக்கும் நியாயமான ஊதியத்துக்கும் இடையில நாம தேர்வு செய்ய வேண்டியதில்லைன்னு இது காட்டுது. ரெண்டையுமே நாம பெறலாம்! லைசென்சிங் நோக்கி இந்த மாற்றம், ஒரு வருஷம் அல்லது ரெண்டு வருஷத்துக்கு முன்னாடி பெரும்பாலான கம்பெனிகள் கேட்காமலே கிடைச்ச எல்லாத்தையும் ஸ்க்ரேப் பண்ணினதுல இருந்து ஒரு பெரிய மாற்றம்.
டிஜிட்டல் வேக்யூம் கிளீனர் எப்படி வேலை செய்யுது?
ஒரு பிசினஸ்க்கு, இந்த சட்டப்பூர்வமான நிச்சயமற்ற தன்மை கொஞ்சம் தலைவலியா இருக்கலாம். AI பயன்படுத்தி ஒரு புது ஆப் உருவாக்கணும்னு நினைக்கிற ஒரு சின்ன கம்பெனினு கற்பனை செஞ்சு பாருங்க. நீங்க பயன்படுத்தும் AI சட்டப்பூர்வமா பயிற்சி பெற்றதான்னு தெரியலன்னா, அப்புறம் வழக்கு வரும்னு கவலைப்படலாம். இந்த நிச்சயமற்ற தன்மை விஷயங்களை மெதுவாக்கலாம். கம்பெனிகள் புது விஷயங்களை உருவாக்குறதுக்கு பதிலா காத்திருக்கலாம். அதனாலதான் தெளிவான விதிகள் ரொம்ப முக்கியம். விதிகள் தெளிவா இருக்கும்போது, பிசினஸ்கள் நம்பிக்கையோட முதலீடு செய்யலாம். சட்டத்தின் சரியான பக்கத்துல இருக்க என்ன செய்யணும்னு அவங்களுக்குத் துல்லியமா தெரியும். இது லைசென்ஸ் பெற்ற AI மாடல்ஸ்க்கு கொஞ்சம் அதிகமா பணம் கொடுக்க வேண்டியதா இருக்கலாம், ஆனா மன அமைதிக்கு அது மதிப்புள்ளது. இது பிசினஸ்கள் பெருமையா பயன்படுத்தக்கூடிய இன்னும் அதிகமான எத்திக்கல் AI டூல்ஸை உருவாக்கவும் ஊக்குவிக்குது. பழைய “வேகமா செயல்படு, விஷயங்களை உடை”ங்கிற கருத்தில இருந்து நாம விலகி வர்றோம். இப்போ, சரியான அனுமதிகள் இருக்கிறதை உறுதிப்படுத்திக்கிட்டு வேகமா செயல்படுவதுதான் இலக்கு. எல்லாரும் நம்பக்கூடிய ஒரு நீண்ட கால இண்டஸ்ட்ரியை உருவாக்குறதுக்கு இது ஒரு சிறந்த வழி.
ஏன் உலகம் முழுவதும் கோர்ட்டுகளைப் பார்த்துக்கிட்டு இருக்கு?
இது ஒரு உண்மையான நபரை எப்படிப் பாதிக்குதுன்னு பார்ப்போம். மைக்-ஐ சந்திப்போம். மைக் ஒரு சின்ன அட்வர்டைசிங் ஏஜென்சியை நடத்துறார். தன்னோட கிளைன்ட்ஸ்க்கு ஐடியாக்களை யோசிக்க AI-ஐ பயன்படுத்த அவர் ரொம்ப விரும்புறார். கடந்த காலத்துல, AI எங்கிருந்து ஐடியாக்களைப் பெறுதுன்னு அவர் பெருசா யோசிச்சதில்லை. ஆனா சமீபகாலமா, அவரோட கிளைன்ட்ஸ் கேள்விகள் கேட்க ஆரம்பிச்சிருக்காங்க. மைக் அவங்களுக்குக் கொடுக்கிற படங்கள் மற்றும் டெக்ஸ்ட் சட்ட சிக்கல்களை ஏற்படுத்தாதுன்னு அவங்க உறுதிப்படுத்திக்க விரும்பறாங்க. இண்டஸ்ட்ரில ஏற்பட்ட சமீபத்திய மாற்றங்கள்னால, மைக் இப்போ லைசென்ஸ் பெற்ற டேட்டால மட்டும் பயிற்சி பெற்ற AI டூல்ஸை பயன்படுத்தத் தேர்வு செய்யலாம். இது அவருக்கு ஒரு பெரிய வெற்றி. எல்லாமே 100 சதவீதம் சட்டப்பூர்வமானது மற்றும் எத்திக்கல் ஆனதுன்னு அவர் தன்னோட கிளைன்ட்ஸ்க்கு சொல்ல முடியும். இது அவருக்கு ஒரு போட்டித்தன்மையை கொடுக்குது. உலகத்தின் இன்னொரு பக்கம், எலினாங்கிற ஒரு எழுத்தாளர் இந்த நன்மைகளைப் பார்த்துக்கிட்டு இருக்காங்க. அவங்க ஒரு பெரிய AI கம்பெனியோட இப்பதான் ஒரு டீல் போட்ட ஒரு குழுவைச் சேர்ந்தவங்க. இப்போ, AI அவங்க வேலையைக் கத்துக்க பயன்படுத்தும் ஒவ்வொரு முறையும், அவங்களைப் போன்ற எழுத்தாளர்களுக்கான ஒரு ஃபண்ட்க்கு ஒரு சின்ன தொகை போகுது. டெக்னாலஜி உலகம் அவங்களைச் சுத்தி மாறிக்கிட்டே இருந்தாலும், அவங்க விரும்புறதைச் செய்ய இது உதவுது.
ஒரு நவீன கிரியேட்டரின் ஒரு நாள் வாழ்க்கை
எலினா அல்லது மைக் போன்ற ஒருவருக்கு இப்போ ஒரு வழக்கமான நாள் முன்னை விட அதிக தெளிவுடன் இருக்கு. எலினா காலையில தன்னோட டேஷ்போர்டை செக் பண்ணி, அவங்க கன்டென்ட் எப்படிப் பயன்படுத்தப்படுதுன்னு பார்க்குறாங்க. *opt-out* பண்ணவோ அல்லது லைசென்சிங் ப்ரோக்ராம்ல சேரவோ அவங்களுக்கு சாய்ஸ் இருந்ததால, அவங்க மதிக்கப்பட்டதா உணர்றாங்க. அதே சமயம், மைக் அங்கீகரிக்கப்பட்ட டேட்டால பயிற்சி பெற்ற ஒரு AI டூலைப் பயன்படுத்துறார், அதுல ஒரு தெளிவான பேட்ஜ் இருக்கு. AI கத்துக்க உதவிய கலைஞர்களை அவர் சப்போர்ட் பண்றார்னு தெரிஞ்சுக்கிட்டு, அவர் தன்னோட மதிய நேரத்தை ஒரு உள்ளூர் பேக்கரிக்காக ஒரு அழகான கேம்பெய்னை உருவாக்குறதுல செலவிடுறார். இதுதான் காப்புரிமைப் போரின் நிஜ உலகத் தாக்கம். இது வெறும் சூட் போட்ட வழக்கறிஞர்கள் பத்தி மட்டும் இல்ல. இன்டர்நெட்டை ஒரு வேடிக்கையான, சுவாரஸ்யமான இடமாக்குற மக்கள் அவங்க வேலையைத் தொடர்ந்து செய்ய முடியும்னு உறுதிப்படுத்துறது பத்தி. புதுமைக்கும் உரிமைக்கும் இடையிலான பதற்றம் இன்னும் இருக்கு, ஆனா அது ஒரு பயனுள்ள பதற்றமா மாறிக்கிட்டு இருக்கு. நாம வேற மாதிரி யோசிக்காத கிரியேட்டிவ் தீர்வுகளைக் கண்டுபிடிக்க இது நம்மைத் தூண்டுது.
இந்த சட்டப்பூர்வமான சரிபார்ப்புகளின் மறைக்கப்பட்ட செலவுகள் மற்றும் அது நம்ம விருப்பமான டூல்ஸை இன்னும் விலை உயர்ந்ததாக்குமான்னு ஒருத்தர் யோசிக்கலாம். இது கேட்க வேண்டிய ஒரு நியாயமான கேள்விதான். கம்பெனிகள் ஒவ்வொரு டேட்டாவுக்கும் பணம் கொடுக்க வேண்டியிருந்தா, அந்த செலவுகளை நம்ம மேல திணிப்பாங்களா? லைசென்ஸ்களுக்கு பணம் கொடுக்க அதிக பணம் உள்ள பெரிய டெக் கம்பெனிகளுக்கு இது ஒரு பெரிய அட்வான்டேஜை கொடுக்குமாங்கறதையும் நாம யோசிக்கணும். இது ஒரு சுவாரஸ்யமான புதிர், ஏன்னா AI எல்லாருக்கும் கிடைக்கக்கூடியதா இருக்கணும்னு நாம விரும்புறோம், பணக்காரர்களுக்கு மட்டும் இல்ல. நாம பிரைவசி பத்தியும் ஆர்வமா இருக்கணும். ஒரு AI பப்ளிக் டேட்டால பயிற்சி பெற்றிருந்தா, நம்ம தனிப்பட்ட தகவல்கள் எப்படி கையாளப்படுதுன்னு நாம எப்பவும் கேட்டுக்கிட்டே இருக்கணும். இதெல்லாம் கவலைப்பட வேண்டிய காரணங்கள் இல்ல, ஆனா நாம எல்லாரும் ஒண்ணா கத்துக்கும்போது கவனிக்க வேண்டிய நல்ல விஷயங்கள். ஆர்வமா இருக்கிறது, டெக்னாலஜி நீண்ட காலத்துக்கு எல்லாருக்கும் உதவியாகவும், நட்பாகவும் இருக்குன்னு உறுதிப்படுத்த நமக்கு உதவுது.
நாங்கள் கவர் செய்ய வேண்டும் என்று நீங்கள் நினைக்கும் AI கதை, கருவி, போக்கு அல்லது கேள்வி உங்களிடம் உள்ளதா? உங்கள் கட்டுரை யோசனையை எங்களுக்கு அனுப்பவும் — அதைக் கேட்க நாங்கள் விரும்புகிறோம்.சட்டப்பூர்வ இணக்கத்தின் தொழில்நுட்பப் பக்கம்
இப்போ, நுணுக்கமான விவரங்களுக்குள்ள போக விரும்புறவங்களுக்கு, இது தொழில்நுட்ப ரீதியா எப்படி வேலை செய்யுதுன்னு பார்ப்போம். டெவலப்பர்கள் காப்புரிமையைக் கையாள சில சூப்பரான வழிகளை உருவாக்கிட்டு இருக்காங்க. பெரிய ட்ரெண்ட்ஸ்ல ஒண்ணு, சின்ன, சிறப்பு வாய்ந்த மாடல்ஸைப் பயன்படுத்துறதுதான். எல்லாம் தெரிஞ்ச ஒரு பெரிய AI-க்கு பதிலா, கம்பெனிகள் ரொம்ப குறிப்பிட்ட, லைசென்ஸ் பெற்ற டேட்டாசெட்ஸ்கள்ல பயிற்சி பெற்ற சின்ன மாடல்ஸை உருவாக்குறாங்க. தகவல் எங்கிருந்து வந்துச்சுன்னு டிராக் பண்றதுக்கு இது ரொம்ப ஈஸியா இருக்கும். API லிமிட்ஸ் மற்றும் டேட்டா ப்ரோவெனன்ஸ் (data provenance) பத்தியும் நிறைய வேலைகள் நடந்துக்கிட்டு இருக்கு. ப்ரோவெனன்ஸ்ங்கிறது ஒரு டேட்டா எங்கிருந்து ஆரம்பிச்சுச்சுங்கற வரலாற்றைச் சொல்ற ஒரு ஸ்டைலான வார்த்தை. பிளாக்செயின் அல்லது மத்த டிஜிட்டல் சிக்னேச்சர்ஸைப் பயன்படுத்தி, ஒரு பயிற்சி டேட்டா அனுமதி பெற்று பயன்படுத்தப்பட்டுச்சுன்னு டெவலப்பர்கள் நிரூபிக்க முடியும். இது பல AI டீம்களின் வொர்க்ஃப்ளோவில் ஒரு ஸ்டாண்டர்ட் பகுதியா மாறிக்கிட்டு இருக்கு. இது கிரியேட்டர்ல இருந்து AI அவுட்புட் வரைக்கும் ஒரு வெளிப்படையான பைப்லைனை உருவாக்குறது பத்திதான்.
இன்னொரு சூப்பரான டெக்னாலஜி Retrieval-Augmented Generation-ன்னு சொல்லப்படுது. இது ஒரு AI பயிற்சி பெறும் போது கத்துக்கிட்டதை மட்டும் நம்பி இருக்காம, ஒரு குறிப்பிட்ட, நம்பகமான மூலத்திலிருந்து நிஜ நேரத்துல தகவல்களைத் தேடிப் பார்க்க ஒரு வழி. இது சட்டப்பூர்வமா இருக்க ரொம்ப நல்லது, ஏன்னா AI எந்த டாக்குமெண்ட்ஸைப் பார்க்க அனுமதிக்கப்படுதுன்னு கம்பெனி துல்லியமா கட்டுப்படுத்த முடியும். இது லோக்கல் ஸ்டோரேஜ்க்கும் உதவுது. பல பிசினஸ்கள் இப்போ அவங்க சொந்த சர்வர்ஸ்ல அவங்க சொந்த பிரைவேட் டேட்டாவைப் பயன்படுத்தி அவங்க சொந்த AI மாடல்ஸை இயக்கத் தேர்வு செய்யுறாங்க. இது முழு பப்ளிக் ஸ்க்ரேப்பிங் விவாதத்தையும் முழுசா தவிர்த்துடுது. அவங்க ஏற்கனவே பயன்படுத்த அனுமதி பெற்ற ஒரு பேஸ் மாடலைப் பயன்படுத்தி, அதுக்கு மேல அவங்க சொந்த சீக்ரெட் சாஸை சேர்க்கலாம். எல்லாவற்றையும் பாதுகாப்பாகவும் சரியாகவும் வெச்சுக்கிட்டு புதுமையா இருக்க இது ஒரு ரொம்ப ஸ்மார்ட்டான வழி. U.S. Copyright Office இந்த தொழில்நுட்ப முறைகள் பத்தி தன்னோட வழிகாட்டுதல்களை தொடர்ந்து அப்டேட் பண்ணிக்கிட்டே இருக்கு, அதனால அவங்க ரிப்போர்ட்ஸை தொடர்ந்து பார்க்குறது நல்லது.
BotNews.today ஆனது உள்ளடக்கத்தை ஆராய்ச்சி செய்யவும், எழுதவும், திருத்தவும் மற்றும் மொழிபெயர்க்கவும் AI கருவிகளைப் பயன்படுத்துகிறது. தகவலை பயனுள்ளதாகவும், தெளிவானதாகவும், நம்பகமானதாகவும் வைத்திருக்க எங்கள் குழு செயல்முறையை மதிப்பாய்வு செய்து மேற்பார்வையிடுகிறது.
synthetic data உலகத்திலயும் நிறைய வளர்ச்சியை நாம பார்த்துக்கிட்டு இருக்கோம். இது பயிற்சி நோக்கங்களுக்காகவே இன்னொரு AI-ஆல உருவாக்கப்பட்ட டேட்டா. ஒரு மெஷின் இதை உருவாக்கினதால, மனுஷ காப்புரிமைப் பிரச்சனைகள் பத்தி கவலைப்பட வேண்டியதில்லை! ஆனா, விஷயங்களை ஆரம்பிக்க உங்களுக்கு இன்னும் சில உண்மையான மனுஷ டேட்டா தேவை. உண்மையான மனுஷ கிரியேட்டிவிட்டிக்கும் synthetic data-வுக்கும் இடையிலான சமநிலை இப்போ ஆராய்ச்சியாளர்களுக்கு ஒரு முக்கிய கவனம். சிறந்த robots.txt ஃபைல்ஸ்க்காகவும் ஒரு பெரிய முயற்சி நடந்துக்கிட்டு இருக்கு. இவை வெப்சைட்களில் உள்ள சின்ன ஃபைல்ஸ், இது சர்ச் என்ஜின்களுக்கு எதைப் பார்க்கலாம், எதைப் பார்க்கக்கூடாதுன்னு சொல்லும். இந்த ஃபைல்ஸ்களின் புதிய வெர்ஷன்கள் AI ஸ்க்ரேப்பர்களுக்கு எதை பயன்படுத்த அனுமதிக்கப்படுதுன்னு துல்லியமா சொல்ல வடிவமைக்கப்பட்டுக்கிட்டு இருக்கு. இது ஒரு ரொம்ப மனுஷப் பிரச்சனைக்கான ஒரு தொழில்நுட்பத் தீர்வு, இது எல்லாருக்கும் ஒரு மரியாதையான இன்டர்நெட்டை உருவாக்க உதவுது. இந்த முன்னேற்றங்கள் பத்தி மேலும் தெரிஞ்சுக்க, இந்த ஐடியாஸ்க்கான ஒரு முக்கிய டெஸ்ட் கேஸான New York Times lawsuit பத்தின சமீபத்திய அப்டேட்ஸ்-ஐ நீங்க பார்க்கலாம்.
ஆசிரியரின் குறிப்பு: கணினித் துறையில் நிபுணர்கள் அல்லாதவர்கள், ஆனால் செயற்கை நுண்ணறிவைப் புரிந்துகொள்ளவும், அதை அதிக நம்பிக்கையுடன் பயன்படுத்தவும், ஏற்கனவே வந்துகொண்டிருக்கும் எதிர்காலத்தைப் பின்தொடரவும் விரும்பும் மக்களுக்காக, பலமொழி AI செய்திகள் மற்றும் வழிகாட்டல் மையமாக இந்த தளத்தை நாங்கள் உருவாக்கினோம்.
சுருக்கமா சொல்லணும்னா, AI உலகம் வளர்ந்துக்கிட்டு இருக்கு. எல்லாம் கொஞ்சம் குழப்பமா இருந்த கட்டத்தை கடந்து, எல்லாருக்கும் தெளிவான பாதைகள் இருக்கிற ஒரு காலத்துக்கு நாம போய்க்கிட்டு இருக்கோம். இந்த காப்புரிமை விவாதம், AI நம்ம சமூகத்தின் ஒரு நிரந்தரமான மற்றும் மதிக்கப்படும் பகுதியா மாறிக்கிட்டு இருக்குங்கறதுக்கான ஒரு அடையாளம். ஒரு கிரியேட்டரா இருப்பதன் அர்த்தம் என்ன, நாம உருவாக்குற விஷயங்களை எப்படிப் பாதுகாக்கலாம்னு இது நம்மை யோசிக்க வைக்குது. நீங்க ஒரு டெக் ரசிகரா இருந்தாலும், பிசினஸ் ஓனரா இருந்தாலும், அல்லது ஒரு கலைஞரா இருந்தாலும், இதெல்லாம் ரொம்ப பாசிட்டிவான விஷயங்கள். நாம பயன்படுத்தும் டூல்ஸ் நியாயம் மற்றும் மரியாதையின் அடிப்படையில உருவாக்கப்படும்னு அர்த்தம். நாம முன்னேறும்போது, இன்னும் வேகமா வேலை செய்யவும், இன்னும் கிரியேட்டிவா இருக்கவும் உதவும் அற்புதமான கண்டுபிடிப்புகளை நாம பார்ப்போம். டெக்னாலஜிக்கு ஒரு பிரகாசமான, சன்னி எதிர்காலம் இருக்கு, நாம எல்லாரும் இந்த பயணத்தின் ஒரு பகுதி. ஆர்வமா இருங்க, தொடர்ந்து ஆராய்ங்க, ஏன்னா சிறந்தவை இன்னும் வர இருக்கு!