AI tréning és a szerzői jog: Miért forr a levegő?
Na, helló! Ha mostanában a neten lógtál, valószínűleg láttál már néhány elképesztő dolgot. Az AI ma már képes fülbemászó dalt írni, segít weboldalt kódolni, vagy akár egy bicikliző macskát is fest az űrben. Kicsit olyan, mint a varázslat, nem igaz? Ám e varázslat mögött ott lapul egy óriási és nagyon fontos kérdés, amiről mindenki beszél. Honnan jön mindez a tudás? Ahhoz, hogy ezek az eszközök ilyen okosak legyenek, a cégeknek cikkek, fotók és könyvek millióival kellett betanítaniuk őket. Ez egy hatalmas beszélgetést indított el arról, hogy kié is ez a tartalom, és vajon a készítőinek jár-e érte fizetség. Izgalmas időszak ez az AI hírek és frissítések követésére, mert ahogy beszélgetünk, épp most írják újra az internet használatának szabályait. A lényeg az, hogy egy olyan világ felé tartunk, ahol a tech cégek és az alkotók igyekeznek megtalálni a közös hangot, hogy mindenki jól járjon. Ez egy izgalmas változás, ami segít abban, hogy a mindennap használt eszközeink még jobbak és megbízhatóbbak legyenek in .
Talán azon tűdődsz, hogyan is tanul meg egy AI mindent, amit tud. Képzeld el, mint egy diákot egy óriási könyvtárban. Ahhoz, hogy emberként tudjon írni, az AI diák szinte mindent elolvas abban a könyvtárban. Ez magában foglalja a híreket, blogposztokat, sőt még a nyilvános közösségi média posztokat is. Ezt a folyamatot gyakran hívják tréningnek. Az AI nem csak másolja és beilleszti, amit olvas. Ehelyett mintázatokat keres. Megtanulja, hogy az ‘alma’ szó gyakran szerepel a ‘lédús’ vagy ‘piros’ szavak közelében. Megtanulja, hogy egy naplemente általában narancssárga és rózsaszín árnyalatokban pompázik. Milliárdnyi példa áttekintésével szakértővé válik abban, hogy megjósolja, mi következzen. Így hoz létre valami újat, ami nagyon emberinek tűnik. Sokáig ez csak egy menő tudományos projektnek számított. De most, hogy ezek az eszközök komoly üzletté váltak, azok az emberek, akik a könyvtárban lévő könyveket írták és fotókat készítettek, elkezdenek jogos kérdéseket feltenni arról, hogyan használják fel a munkájukat.
Hibát talált, vagy valami javításra szorul? Tudassa velünk.Gyakori tévhit, hogy az AI csupán egy hatalmas adatbázis lopott munkákból. Ez nem teljesen igaz. Az AI nem tárolja az eredeti fájlokat. A belőlük tanult mintázatokat tárolja. A feszültség azonban abból fakad, hogyan is gyűjtötték össze ezeket az információkat. Ezt a gyakorlatot data scrapingnek hívják. Képzelj el egy óriási digitális porszívót, ami bejárja a webet, és felszippant minden nyilvános adatot, amit csak talál. A kezdetekben ezt többnyire figyelmen kívül hagyták. De mostanában a dolgok megváltoztak. A kreatív világ nagy nevei, a híres szerzőktől a nagy hírügynökségekig, elkezdték mondani, hogy ez a ‘porszívózás’ nem lehet ingyenes. Azt állítják, hogy a munkájuknak értéke van, és ha egy tech cég pénzt fog keresni az adataikon képzett eszközzel, akkor nekik is jár egy szelet a tortából. Ez a vita lényege. Ez egy kötélhúzás az innováció sebessége és azoknak a jogai között, akik az innovációhoz szükséges alapanyagot biztosítják.
A nagy kérdés: Kié az AI agya?
Ez a beszélgetés az egész világon zajlik, és valójában remek hír az internet jövője szempontjából. Miért? Mert ez azt jelenti, hogy végre rájövünk, hogyan értékeljük a digitális munkát oly módon, ami a modern korban is értelmes. Az olyan helyeken, mint az Egyesült Államok, a bíróságok valami olyasmit vizsgálnak, amit fair use-nak hívnak. Ez egy jogi elképzelés, ami szerint engedély nélkül is felhasználhatsz szerzői joggal védett anyagot, ha valami újjá alakítod, és nem ártasz az eredeti alkotónak. A tech cégek azzal érvelnek, hogy az AI tréning a fair use végső formája. Azt mondják, valami teljesen mást hoznak létre, mint az eredeti adat. A másik oldalon az alkotók azt mondják, hogy ha egy AI képes egy adott szerző stílusában történetet írni, akkor az egyértelműen versenyez azzal a szerzővel. Ez nem csak az USA-ban történik. Az Európai Unió és olyan országok, mint Japán, szintén saját szabályokat hoznak. Néhányan nagyon barátságosak az AI cégekkel, hogy ösztönözzék a növekedést, míg mások korlátokat állítanak fel, hogy megvédjék helyi művészeiket és újságíróikat.
Ezeknek a döntéseknek globális hatása óriási lesz. Ha minden országnak más szabályai vannak, az nagyon zavaró lehet a mindenhol működő cégek számára. Ezért sokan a Szellemi Tulajdon Világszervezetéhez fordulnak, hogy segítsenek létrehozni egy olyan szabványt, amit mindenki követhet. Ez nem csak a nagy perekről szól. Hanem egy fenntartható rendszer létrehozásáról. Már látunk is izgalmas előrelépéseket. Néhány tech óriás elkezdett licencszerződéseket kötni nagy kiadókkal. Ez azt jelenti, hogy fizetnek azért a jogért, hogy magas minőségű adatokat használhassanak modelljeik tréningezésére. Ez egy fantasztikus módja lehet az újságírás és a művészet támogatásának, miközben az AI technológia továbbra is gyors ütemben fejlődhet. Ez azt mutatja, hogy nem kell választanunk a menő tech és a tisztességes fizetés között. Lehet mindkettőnk! Ez a licencelés felé való elmozdulás nagy változás ahhoz képest, ami egy-két éve volt, amikor a legtöbb cég csak lekaparta, amit talált, anélkül, hogy megkérdezte volna.
Hogyan működik a digitális porszívó?
Egy vállalkozás számára ez a jogi bizonytalanság elég nagy fejfájást okozhat. Képzeld el, hogy egy kis cég vagy, ami új appot szeretne építeni AI segítségével. Ha nem tudod, hogy az általad használt AI legálisan lett-e tréningezve, aggódhatsz, hogy később beperelnek. Ez a bizonytalanság lelassíthatja a dolgokat. A cégek talán inkább kivárnak, ahelyett, hogy új dolgokat építenének. Ezért olyan fontosak a világos szabályok. Ha a szabályok egyértelműek, a vállalkozások magabiztosan fektethetnek be. Pontosan tudni fogják, mit kell tenniük, hogy a törvényes keretek között maradjanak. Ez azt jelentheti, hogy kicsit többet kell fizetni a licencelt AI modellekért, de a nyugalom megéri. Emellett ösztönzi etikusabb AI eszközök létrehozását, amelyeket a vállalkozások büszkén használhatnak. Látjuk, hogy eltávolodunk a régi ‘gyorsan mozogni és dolgokat tönkretenni’ elvétől. Most a cél az, hogy gyorsan haladjunk, miközben gondoskodunk a megfelelő engedélyekről. Ez sokkal jobb módja egy hosszú távú iparág felépítésének, amiben mindenki megbízhat.
Miért figyeli az egész világ a bíróságokat?
Nézzük meg, hogyan érinti ez egy igazi embert. Ismerd meg Mike-ot. Mike egy kis reklámügynökséget vezet. Imádja az AI-t használni, hogy ötleteket gyűjtsön ügyfeleinek. Korábban sosem gondolkodott azon, honnan szerzi az AI az ötleteit. De mostanában az ügyfelei kérdezősködnek. Biztosak akarnak lenni abban, hogy a képek és szövegek, amiket Mike ad nekik, nem okoznak jogi problémát. Az iparágban történt friss változások miatt Mike most már választhat olyan AI eszközöket, amelyek csak licencelt adatokon tréningeznek. Ez óriási győzelem számára. Elmondhatja ügyfeleinek, hogy minden 100 százalékban legális és etikus. Ez versenyelőnyt biztosít neki. A világ másik felén egy Elena nevű író is látja az előnyöket. Ő egy olyan csoporthoz tartozik, amely épp most írt alá egy megállapodást egy nagy AI céggel. Mostantól minden alkalommal, amikor az AI felhasználja a munkáját a tanuláshoz, egy kis összeg egy alapba kerül az olyan írók számára, mint ő. Ez segít neki abban, hogy továbbra is azt csinálja, amit szeret, miközben a technológia világa folyamatosan változik körülötte.
Egy modern alkotó egy napja
Egy Elena vagy Mike-hoz hasonló ember tipikus napja most sokkal tisztább, mint korábban. Elena a reggelt azzal kezdi, hogy megnézi a dashboardját, hogyan használják fel a tartalmát. Tiszteletben érzi magát, mert választhatott, hogy *kilép* vagy csatlakozik a licencprogramhoz. Eközben Mike egy olyan AI eszközt használ, amelyen egyértelmű jelzés van, hogy engedélyezett adatokon tréningezték. Délutánját egy gyönyörű kampány létrehozásával tölti egy helyi pékség számára, tudva, hogy támogatja azokat a művészeket, akiknek a munkája segítette az AI-t a tanulásban. Ez a szerzői jogi háború valós hatása. Nem csak az öltönyös ügyvédekről szól. Hanem arról, hogy azok az emberek, akik szórakoztató és érdekes hellyé teszik az internetet, továbbra is végezhessék a munkájukat. Az innováció és a tulajdonjog közötti feszültség továbbra is megvan, de egyre inkább produktív feszültséggé válik. Arra ösztönöz minket, hogy olyan kreatív megoldásokat találjunk, amelyekre egyébként nem is gondoltunk volna.
Felmerülhet a kérdés, hogy mi az összes jogi ellenőrzés rejtett költsége, és vajon drágábbá teszi-e kedvenc eszközeinket. Ez egy nagyon jogos kérdés. Ha a cégeknek minden egyes adatdarabért fizetniük kell, vajon áthárítják-e ezeket a költségeket ránk? Azt is meg kell gondolnunk, hogy ez vajon hatalmas előnyt biztosít-e a legnagyobb tech cégeknek, akiknek a legtöbb pénzük van licencekért fizetni. Ez egy érdekes feladvány, mert szeretnénk, ha az AI mindenki számára elérhető maradna, nem csak a gazdagoknak. A magánélet védelmével kapcsolatban is kíváncsinak kell maradnunk. Ha egy AI nyilvános adatokon tréningezik, mindig fel kell tennünk a kérdést, hogyan kezelik személyes adatainkat. Ezek nem okok az aggodalomra, de nagyszerű dolgok, amikre érdemes odafigyelni, miközben együtt tanulunk. A kíváncsiság segít abban, hogy a technológia hosszú távon is hasznos és barátságos maradjon mindenki számára.
Van egy AI-történet, eszköz, trend vagy kérdés, amiről úgy gondolja, hogy foglalkoznunk kellene vele? Küldje el nekünk cikkötletét — szívesen meghallgatnánk.A jogi megfelelés technikai oldala
Most pedig azoknak, akik szeretik a részleteket, beszéljünk arról, hogyan működik ez technikai szinten. A fejlesztők igazán okos módszereket építenek a szerzői jog kezelésére. Az egyik legnagyobb trend a kisebb, specializált modellek használata. Ahelyett, hogy egyetlen óriási AI mindent tudna, a cégek kisebbeket építenek, amelyeket nagyon specifikus, licencelt dataseteken tréningeznek. Ez sokkal könnyebbé teszi annak nyomon követését, honnan származik az információ. Sok munka folyik az API limitekkel és az adatok eredetével (provenance) kapcsolatban is. A provenance csak egy divatos szó arra, hogy honnan indult egy adatdarab története. Blockchain vagy más digitális aláírások használatával a fejlesztők bizonyítani tudják, hogy egy tréning adatdarabot engedéllyel használtak. Ez egyre inkább a workflow standard részévé válik sok AI csapat számára in . Az egész arról szól, hogy egy átlátható pipeline-t építsünk az alkotótól az AI kimenetéig.
Egy másik menő tech dolog a Retrieval-Augmented Generation. Ez egy olyan módja annak, hogy az AI valós időben keressen információt egy specifikus, megbízható forrásból, ahelyett, hogy csak arra támaszkodna, amit a tréning során tanult. Ez nagyszerű a jogi megfelelés szempontjából, mert a cég pontosan szabályozhatja, mely dokumentumokat nézhet meg az AI. Segít a helyi tárolásban is. Sok vállalkozás most már úgy dönt, hogy saját AI modelljeit saját szerverein futtatja, saját privát adatait használva. Ez teljesen elkerüli a nyilvános scraping vitát. Használhatnak egy alapmodellt, ami már engedélyezett a használatra, majd hozzáadhatják a saját titkos receptjüket. Ez egy nagyon okos módja annak, hogy innovatívak maradjanak, miközben mindent biztonságban tartanak. Az U.S. Copyright Office folyamatosan frissíti iránymutatásait ezekről a technikai módszerekről, szóval érdemes figyelemmel kísérni a jelentéseiket.
A BotNews.today mesterséges intelligencia eszközöket használ a tartalom kutatására, írására, szerkesztésére és fordítására. Csapatunk felülvizsgálja és felügyeli a folyamatot, hogy az információ hasznos, világos és megbízható maradjon.
A szintetikus adatok világában is nagy növekedést látunk. Ez olyan adat, amit egy másik AI hoz létre kifejezetten tréning célokra. Mivel egy gép készítette, nincs emberi szerzői jogi probléma, ami miatt aggódni kellene! Azonban még mindig szükséged van valamennyi valódi emberi adatra, hogy beinduljon a dolog. A valódi emberi kreativitás és a szintetikus adatok közötti egyensúly jelenleg a kutatók fő fókuszában áll. Emellett nagy hangsúlyt fektetnek a jobb robots.txt fájlokra is. Ezek azok a kis fájlok a weboldalakon, amelyek megmondják a keresőmotoroknak, mit nézhetnek meg és mit nem. Ezeknek a fájloknak új verzióit úgy tervezik, hogy pontosan megmondják az AI scrapereknek, mit használhatnak. Ez egy technikai megoldás egy nagyon emberi problémára, és segít egy udvariasabb és tisztelettudóbb internet felépítésében mindenki számára. Ezekről a fejleményekről bővebben a New York Times perével kapcsolatos legfrissebb hírekben olvashatsz, ami egy fontos tesztügy ezekre az ötletekre.
A szerkesztő megjegyzése: Ezt az oldalt többnyelvű AI hírek és útmutatók központjaként hoztuk létre olyan emberek számára, akik nem számítógépes zsenik, de mégis szeretnék megérteni a mesterséges intelligenciát, magabiztosabban használni, és követni a már megérkező jövőt.
A lényeg az, hogy az AI világa felnő. Túllépünk azon a fázison, ahol minden egy kicsit rendetlen volt, és egy olyan időszakba lépünk, ahol mindenki számára világos utak vannak. Ez a szerzői jogi beszélgetés annak a jele, hogy az AI társadalmunk állandó és elismert részévé válik. Elgondolkodtat minket azon, mit jelent alkotónak lenni, és hogyan védhetjük meg az általunk létrehozott dolgokat. Akár tech rajongó, vállalkozó vagy művész vagy, mindez nagyon pozitív. Ez azt jelenti, hogy az általunk használt eszközök a méltányosság és a tisztelet alapjaira épülnek majd. Ahogy haladunk előre, még több csodálatos találmányt fogunk látni, amelyek segítenek gyorsabban dolgozni és kreatívabbnak lenni. Fényes és napos jövő vár a technológiára, és mindannyian részesei vagyunk az utazásnak. Maradj kíváncsi és folytasd a felfedezést, mert a java még csak most jön!