Rat oko autorskih prava i AI treninga: Objašnjeno jednostavno
E, zdravo! Ako ste u poslednje vreme visili na internetu, verovatno ste videli neke prilično neverovatne stvari. AI sada može da napiše zaraznu pesmu, pomogne vam da iskodirate sajt, pa čak i da naslika mačku kako vozi bicikl u svemiru. Malo je kao magija, zar ne? Ali iza te magije krije se jedno veliko i veoma važno pitanje o kojem svi pričaju. Odakle dolazi svo to znanje? Da bi ovi alati postali tako pametni, kompanije su morale da ih uče koristeći milione članaka, fotografija i knjiga. To je pokrenulo ogromnu raspravu o tome ko je vlasnik tog sadržaja i da li bi ljudi koji su ga kreirali trebalo da budu plaćeni. Živahno je vreme za praćenje najnovijih AI vesti i ažuriranja, jer se pravila o tome kako koristimo internet bukvalno prepisuju dok pričamo. Glavni zaključak je da idemo ka svetu gde tech kompanije i kreatori pokušavaju da pronađu način da rade zajedno, tako da svi pobede. To je uzbudljiva promena koja će pomoći da alati koje svakodnevno koristimo postanu još bolji i pouzdaniji.
Možda se pitate kako AI zapravo uči da radi to što radi. Zamislite to kao studenta u ogromnoj biblioteci. Da bi naučio da piše kao čovek, taj AI student pročita skoro sve u toj biblioteci. To uključuje vesti, blog postove, pa čak i javne objave na društvenim mrežama. Ovaj proces se često naziva „trening“ (training). AI ne samo da kopira i lepi ono što pročita. Umesto toga, traži obrasce. Uči da se reč „jabuka“ često pojavljuje blizu reči „sočna“ ili „crvena“. Uči da zalazak sunca obično ima nijanse narandžaste i roze. Gledajući milijarde primera, postaje ekspert u predviđanju šta bi trebalo da dođe sledeće. Tako stvara nešto novo što deluje vrlo ljudski. Dugo se ovo smatralo samo kul naučnim projektom. Ali sada kada su ovi alati postali veliki biznisi, ljudi koji su pisali knjige i slikali fotografije u toj biblioteci počinju da postavljaju neka fer pitanja o tome kako se njihov rad koristi.
Пронашли сте грешку или нешто што треба исправити? Јавите нам.Česta zabluda je da je AI samo gigantska baza podataka ukradenog rada. To baš i nije tačno. AI ne skladišti originalne fajlove. Skladišti obrasce koje je naučila iz njih. Međutim, tenzija nastaje zbog toga kako su te informacije uopšte prikupljene. Ova praksa je poznata kao „data scraping“. Zamislite džinovski digitalni usisivač koji putuje internetom i usisava svaki delić javnih podataka koje pronađe. U ranim danima, ovo je uglavnom bilo ignorisano. Ali nedavno su se stvari promenile. Velika imena u kreativnom svetu, od poznatih autora do velikih novinskih kuća, počela su da govore da ovo „usisavanje“ ne bi trebalo da bude besplatno. Tvrde da njihov rad ima vrednost i da ako tech kompanija namerava da zarađuje koristeći alat obučen na njihovim podacima, trebalo bi da dobiju deo kolača. Ovo je srž debate. To je natezanje između brzine inovacija i prava ljudi koji obezbeđuju sirov materijal za te inovacije.
Veliko pitanje: Ko je vlasnik AI mozga?
Ovaj razgovor se dešava širom sveta, i to je zapravo sjajna vest za budućnost interneta. Zašto? Zato što to znači da konačno shvatamo kako da vrednujemo digitalni rad na način koji ima smisla za moderno doba. Na mestima kao što su Sjedinjene Države, sudovi razmatraju nešto što se zove fair use (poštena upotreba). Ovo je pravna ideja koja kaže da možete koristiti materijal zaštićen autorskim pravima bez dozvole ako ga menjate u nešto novo i ne štetite originalnom kreatoru. Tech kompanije tvrde da je AI trening ultimativni oblik „fair use-a“. Kažu da stvaraju nešto potpuno drugačije od originalnih podataka. Sa druge strane, kreatori kažu da ako AI može da napiše priču u stilu određenog autora, to se definitivno takmiči sa tim autorom. Ovo se ne dešava samo u SAD-u. Evropska unija i zemlje poput Japana takođe prave svoja pravila. Neki su vrlo prijateljski nastrojeni prema AI kompanijama kako bi podstakli rast, dok drugi postavljaju zaštitne ograde da bi zaštitili svoje lokalne umetnike i novinare.
Globalni uticaj ovih odluka biće ogroman. Ako svaka zemlja ima različita pravila, to bi moglo postati vrlo zbunjujuće za kompanije koje posluju svuda. Zato mnogi ljudi gledaju ka Svetskoj organizaciji za intelektualnu svojinu da pomogne u stvaranju standarda koji svi mogu da prate. Ovo nije samo o velikim tužbama. Radi se o stvaranju održivog sistema. Već vidimo uzbudljiv napredak. Neki tech giganti su počeli da potpisuju ugovore o licenciranju sa velikim izdavačima. To znači da plaćaju za pravo da koriste visokokvalitetne podatke za trening svojih modela. Ovo bi mogao biti fantastičan način da se podrži novinarstvo i umetnost, a da se istovremeno AI tehnologija brzo razvija. Pokazuje da ne moramo da biramo između kul tehnologije i poštene plate. Možemo imati oboje! Ovaj prelazak na licenciranje je velika promena u odnosu na pre samo godinu ili dve, kada je većina kompanija samo „skrejpovala“ (scraped) šta god je mogla da nađe, bez pitanja.
Kako radi digitalni usisivač
Za biznis, ova pravna neizvesnost može biti prava glavobolja. Zamislite da ste mala kompanija koja želi da napravi novu „app“ (aplikaciju) koristeći AI. Ako ne znate da li je AI koju koristite legalno trenirana, možda ćete se brinuti da ćete kasnije biti tuženi. Ova neizvesnost može usporiti stvari. Kompanije bi mogle da čekaju sa strane umesto da grade nove stvari. Zato su jasna pravila toliko važna. Kada su pravila jasna, biznisi mogu da investiraju sa poverenjem. Znaće tačno šta treba da urade da bi ostali na pravoj strani zakona. To bi moglo značiti plaćanje malo više za licencirane AI modele, ali mir je vredan toga. Takođe podstiče stvaranje etičnijih AI alata koje biznisi mogu ponosno da koriste. Vidimo odmak od stare ideje „krećemo se brzo i razbijamo stvari“. Sada je cilj kretati se brzo, ali se pobrinuti da imate sve potrebne dozvole. Ovo je mnogo bolji način za izgradnju dugoročne industrije kojoj svi mogu verovati.
Zašto ceo svet gleda sudove
Hajde da vidimo kako ovo utiče na stvarnu osobu. Upoznajte Majkla. Majkl vodi malu reklamnu agenciju. Obožava da koristi AI da mu pomogne da „brainstormuje“ ideje za svoje klijente. U prošlosti, nikada nije zaista razmišljao odakle AI dobija svoje ideje. Ali u poslednje vreme, njegovi klijenti postavljaju pitanja. Žele da budu sigurni da slike i tekst koje im Majkl daje neće izazvati pravne probleme. Zbog nedavnih promena u industriji, Majkl sada može da izabere da koristi AI alate koji se treniraju samo na licenciranim podacima. Ovo je ogromna pobeda za njega. Može da kaže svojim klijentima da je sve 100 posto legalno i etično. To mu daje konkurentsku prednost. Na drugoj strani sveta, spisateljica po imenu Elena takođe vidi prednosti. Ona pripada grupi koja je upravo potpisala ugovor sa velikom AI kompanijom. Sada, svaki put kada AI koristi njen rad za učenje, mala količina novca ide u fond za pisce poput nje. To joj pomaže da nastavi da radi ono što voli dok se svet tehnologije menja oko nje.
Dan u životu modernog kreatora
Tipičan dan za nekoga poput Elene ili Majkla sada je ispunjen mnogo većom jasnoćom nego ranije. Elena počinje jutro proveravajući svoj „dashboard“ (kontrolnu tablu) da vidi kako se njen sadržaj koristi. Oseća se poštovano jer je imala izbor da se *opt-outuje* (isključi) ili da se pridruži programu licenciranja. U međuvremenu, Majkl koristi AI alat koji ima jasnu oznaku da je treniran na autorizovanim podacima. Popodne provodi kreirajući prelepu kampanju za lokalnu pekaru, znajući da podržava umetnike čiji je rad pomogao AI da uči. Ovo je stvarni uticaj rata oko autorskih prava. Nije samo o advokatima u odelima. Radi se o tome da se osigura da ljudi koji čine internet zabavnim i zanimljivim mestom mogu da nastave da rade svoj posao. Tenzija između inovacija i vlasništva je i dalje prisutna, ali postaje produktivna tenzija. Gura nas da pronađemo kreativna rešenja koja možda inače ne bismo smislili.
Neko bi se mogao zapitati o skrivenim troškovima svih ovih pravnih provera i da li će to naše omiljene alate učiniti skupljima. To je vrlo fer pitanje. Ako kompanije moraju da plaćaju za svaki delić podataka, da li će te troškove preneti na nas? Takođe moramo razmisliti o tome da li će ovo dati ogromnu prednost najvećim tech kompanijama koje imaju najviše novca za plaćanje licenci. To je zanimljiva zagonetka za rešavanje jer želimo da AI ostane dostupan svima, a ne samo bogatima. Takođe moramo ostati znatiželjni u vezi sa privatnošću. Ako se AI trenira na javnim podacima, uvek bi trebalo da se pitamo kako se postupa sa našim ličnim informacijama. Ovo nisu razlozi za brigu, ali su sjajne stvari na koje treba obratiti pažnju dok svi zajedno učimo. Biti radoznao pomaže nam da osiguramo da tehnologija ostane korisna i prijateljska za sve na duge staze.
Имате причу о вештачкој интелигенцији, алат, тренд или питање које мислите да бисмо требали да покријемо? Пошаљите нам своју идеју за чланак — волели бисмо да је чујемо.Tehnička strana pravne usklađenosti
E sad, za one koji vole da ulaze u sitne detalje, hajde da pričamo o tome kako ovo funkcioniše na tehničkom nivou. Developeri grade neke zaista pametne načine za rešavanje autorskih prava. Jedan od najvećih trendova je korišćenje manjih, specijalizovanih modela. Umesto jednog gigantskog AI-ja koji zna sve, kompanije grade manje koji su trenirani na vrlo specifičnim, licenciranim „datasetovima“ (skupovima podataka). To znatno olakšava praćenje odakle su informacije došle. Takođe vidimo mnogo rada na API limitima i „data provenance-u“. „Provenance“ je samo fensi reč za istoriju odakle je deo podataka potekao. Korišćenjem „blockchain-a“ ili drugih digitalnih potpisa, developeri mogu dokazati da je deo podataka za trening korišćen uz dozvolu. Ovo postaje standardni deo „workflow-a“ (radnog toka) za mnoge AI timove. Sve je u izgradnji transparentnog „pipeline-a“ (procesa) od kreatora do AI izlaza.
Još jedna kul „tech“ stvar je „Retrieval-Augmented Generation“. Ovo je način da AI pretražuje informacije u realnom vremenu iz specifičnog, pouzdanog izvora umesto da se samo oslanja na ono što je naučila tokom treninga. Ovo je sjajno za ostanak u legalnim okvirima jer kompanija može precizno kontrolisati koje dokumente AI sme da pregleda. Takođe pomaže kod lokalnog skladištenja. Mnogi biznisi sada biraju da pokreću sopstvene AI modele na sopstvenim serverima koristeći sopstvene privatne podatke. Ovo u potpunosti izbegava celu debatu o javnom „scraping-u“. Mogu da koriste osnovni model koji je već odobren za upotrebu, a zatim dodaju svoj tajni „sos“ na vrh. Ovo je vrlo pametan način da ostanete inovativni, a da sve bude sigurno i bezbedno. U.S. Copyright Office stalno ažurira svoja uputstva o ovim tehničkim metodama, tako da je dobra ideja pratiti njihove izveštaje.
BotNews.today користи АИ алате за истраживање, писање, уређивање и превођење садржаја. Наш тим прегледа и надгледа процес како би информације биле корисне, јасне и поуздане.
Takođe vidimo veliki rast u svetu sintetičkih podataka. To su podaci koje je kreirao drugi AI specifično za potrebe treninga. Pošto ih je mašina napravila, nema ljudskih problema sa autorskim pravima oko kojih bi se brinuli! Međutim, i dalje vam je potrebno malo pravih ljudskih podataka da bi se stvari pokrenule. Balans između korišćenja prave ljudske kreativnosti i sintetičkih podataka je glavni fokus istraživača trenutno. Takođe postoji veliki pritisak za bolje „robots.txt“ fajlove. To su mali fajlovi na veb sajtovima koji govore pretraživačima šta smeju, a šta ne smeju da gledaju. Nove verzije ovih fajlova se dizajniraju da AI „scraperima“ (sakupljačima podataka) tačno kažu šta smeju da koriste. To je tehničko rešenje za vrlo ljudski problem, i pomaže u izgradnji pristojnijeg i poštovanijeg interneta za sve. Za više o ovim dešavanjima, možete proveriti najnovije vesti o tužbi New York Timesa, što je veliki testni slučaj za ove ideje.
Napomena urednika: Kreirali smo ovaj sajt kao višejezični centar za vesti i vodiče o veštačkoj inteligenciji za ljude koji nisu kompjuterski genijalci, ali ipak žele da razumeju veštačku inteligenciju, koriste je sa više samopouzdanja i prate budućnost koja već stiže.
Zaključak je da svet AI-ja odrasta. Prolazimo fazu gde je sve bilo pomalo neuredno i ulazimo u vreme gde postoje jasni putevi za sve. Ovaj razgovor o autorskim pravima je znak da AI postaje trajan i poštovan deo našeg društva. Tera nas da razmišljamo o tome šta znači biti kreator i kako možemo zaštititi stvari koje stvaramo. Bilo da ste tech fan, vlasnik biznisa ili umetnik, sve ovo je vrlo pozitivno. To znači da će alati koje koristimo biti izgrađeni na temelju pravednosti i poštovanja. Kako budemo napredovali, videćemo još neverovatnijih izuma koji nam pomažu da radimo brže i budemo kreativniji. To je svetla i sunčana budućnost za tehnologiju, i svi smo deo tog putovanja. Nastavite da budete radoznali i da istražujete, jer najbolje tek dolazi!