Deepfakes u [godina]: Koliko je problem postao ozbiljan?
E, zdravo! [godina] je, a svet tehnologije juri brže od veverice na kafi po sunčanom jutru. Možda se sećaš kad su deepfakes bili samo smešni video klipovi glumaca koji menjaju lica u starim filmovima ili blesave meme na društvenim mrežama. Ali, evo nas danas, i stvari su postale mnogo ličnije i zanimljivije za sve nas. Glavna fora ove godine je što se fokus prebacio sa onoga što vidimo na ono što čujemo. Kloniranje glasa je postalo prava zvezda šoua i zbog čega se naš digitalni život oseća malo više kao špijunski film. Ali, bez brige, nije sve tako strašno. Razumevanje kako ovi alati funkcionišu je prvi korak ka tome da ostaneš bezbedan i snalažljiv. Vidimo ogroman trud platformi da stvari ostanu iskrene, dok kreatori pronalaze načine da ovu tehnologiju koriste za dobro. Divlje je vreme za biti online, ali svi učimo zajedno. Cilj je da sve bude zabavno i pristupačno, tako da možeš o ovome da pričaš uz kafu sa prijateljima, a da se ne osećaš kao da ti treba diploma iz računarskih nauka. Svet se menja, ali i mi se menjamo sa njim.
Zamislite moderne deepfakes kao digitalnog papagaja koji je previše dobar u svom poslu. Nekad davno, trebao ti je ogroman kompjuter i nedelje rada da napraviš lažni video koji bi izgledao stvarno. Sada to možeš da uradiš na telefonu dok čekaš da ti tost iskoči iz tostera u kuhinji. Prava magija u [godina] je način na koji ovi alati barataju zvukom. Koristeći samo nekoliko sekundi nečijeg govora, mogu da kreiraju savršenu kopiju tog glasa. To je kao da imaš vokalnog dublera koji se nikad ne umori niti ostane bez daha. Zato se problem sada čini težim nego pre samo godinu dana. Više nije reč o zrnastim video snimcima koji izgledaju malo čudno po ivicama ili imaju neobično osvetljenje. Reč je o telefonskom pozivu od prijatelja koji zvuči baš kao oni. Ova tehnologija koristi nešto što se zove neuralne mreže da bi mapirala sitne navike u načinu na koji govorimo. Hvata način na koji pravimo pauze ili kako nam glas ide gore na kraju pitanja. Zaista je impresivna stvar sa tehničke tačke gledišta, čak i ako nas s vremena na vreme natera da se dvaput zamislimo.
Пронашли сте грешку или нешто што треба исправити? Јавите нам.Prijateljski glas na drugoj strani
Zamislite svet u kojem vam omiljenu knjigu čita glas koji zvuči baš kao voljena osoba koja živi daleko. To je vrsta potencijala o kojoj govorimo kada pričamo o kloniranju glasa. Radi se o imitiranju suštine osobe kroz njene zvučne talase. Ovaj prelazak na audio je ono što čini da se trenutna era oseća toliko drugačije od vizuelnih deepfakes-a iz prošlosti. Intimnije je i mnogo teže uočiti golim okom ili uhom. Nekad smo tražili greške u videu, ali sada moramo da slušamo stvari koje nisu tu. Alati su postali toliko uglađeni da se „uncanny valley“ (jeziva dolina), gde stvari izgledaju ili zvuče skoro ljudski, ali ne baš potpuno, prelazi svakog dana. Zbog toga je ovo sjajno vreme da naučimo kako su ovi sistemi izgrađeni, kako bismo cenili umeće, a istovremeno bili svesni trikova. Sve je u pronalaženju ravnoteže između divljenja nauci i pametnog pristupa našoj bezbednosti.
Ovo je globalna priča jer dotiče sve, od velikih izbora do malih porodičnih ćaskanja u svakoj zemlji. U političkom svetu, vidimo promenu u načinu na koji kampanje funkcionišu. Umesto samo velikih TV reklama, šalju se hiljade malih, personalizovanih glasovnih poruka biračima. Zbog toga politička manipulacija deluje mnogo direktnije i teže ju je pratiti nego ikada ranije. Velike organizacije poput Reutersa neprestano izveštavaju o tome kako se ovi alati koriste za uticanje na javno mnjenje u realnom vremenu širom različitih kontinenata. Platforme poput YouTube-a i Mete naporno rade na označavanju ovog sadržaja, kako bismo znali šta je stvarno, a šta je generisano kompjuterom. Sjajna je vest što to shvataju ozbiljno, jer pomaže da internet ostane mesto kojem možemo verovati. Ljudi u svakom kutku sveta shvataju da videti ili čuti više ne znači uvek verovati. Ovo je zapravo dovelo do kul nove ere medijske pismenosti, gde svi postajemo mali detektivi na svoj način. Učimo da postavljamo više pitanja i tražimo izvore, što je ionako odlična navika.
Zašto ceo svet sluša
Razlika između onoga što ljudi misle da se dešava i stvarnosti je jedan od najzanimljivijih delova [godina]. Mnogi precenjuju koliko je lako lažirati video poziv uživo sa savršenim kvalitetom na duže staze. Misle da svaki Zoom poziv može biti lažan, ali to je i dalje prilično teško savršeno izvesti. S druge strane, često potcenjuju koliko je lako lažirati jednostavnu glasovnu poruku ili kratak telefonski poziv. Ovaj jaz je mesto gde se trenutno dešava većina akcije. Fascinantno je vreme za globalnu komunikaciju dok zajedno gradimo nova pravila igre. Vlade takođe uvode nove smernice kako bi zaštitile građane od prevare i krađe identiteta. Za više novosti o tome kako tehnologija menja naš svet, možeš proveriti botnews.today za najnovije priče i savete. Vidimo svet koji je povezaniji nego ikada, a to znači da moramo da pazimo jedni na druge u digitalnom prostoru. Što više delimo ono što znamo, to naša globalna zajednica postaje jača. Radi se o izgradnji kulture radoznalosti i brige.
Hajde da pogledamo jedan dan u životu nekoga ko živi u ovom brzom svetu. Zamislite da ste na poslu i dobijete brzu glasovnu poruku od šefa. Glas je savršen, a ton baš kako treba. Traže od vas da brzo odobrite malu uplatu za novog dobavljača, za koju kažu da je upravo stigla u kancelariju. U prošlosti biste možda samo kliknuli ‘ok’ bez razmišljanja, jer prepoznajete glas. Ali danas, zastanete na sekund da to proverite preko drugog kanala, jer ste tehnološki pismeni i znate kako stvari stoje. Ova vrsta praktične prevare je mnogo češća od filmskih deepfakes-a svetskih lidera. Radi se o malim, svakodnevnim interakcijama koje održavaju naš svet u pokretu. Drugi primer je način na koji se korisnička podrška menja nabolje. Neke kompanije koriste ove glasove da pruže prijateljsku i brzu pomoć non-stop. Oseća se lično i korisno, umesto da pričate sa nespretnim robotom od pre deset godina. Realnost je da za svakog ko pokušava da napravi smicalicu, postoje desetine developera koji pokušavaju da olakšaju život svima. Vidimo alate koji pomažu ljudima koji su izgubili glas da ponovo progovore koristeći svoj originalni zvuk, što je jednostavno predivno.
Jutarnje iznenađenje u utorak
Ovu pozitivnu upotrebu tehnologije prate grupe poput FBI-ja kako bi osigurale da, dok tehnologija raste, loši akteri budu pod kontrolom. Čak je i MIT Technology Review istakao kako ovi alati postaju deo naših svakodnevnih kreativnih workflow-a. Priča o deepfakes-ima nije samo o trikovima, već o tome kako se prilagođavamo i rastemo kao društvo. To je priča o ljudskoj otpornosti i našoj sposobnosti da gradimo bolje alate za bolje sutra. Pronalazimo načine da koristimo sintetičke medije za stvaranje umetnosti i muzike koji nikada ranije nisu bili mogući. Zamislite film u kojem glumci mogu savršeno da govore svaki jezik jer su njihovi glasovi mapirani na nove reči. To je vrsta uzbudljive budućnosti ka kojoj idemo. Čini da se svet oseća manjim i povezanijim kada svi možemo tako jasno da razumemo jedni druge. Ključ je da nastavimo razgovor i ostanemo uzbuđeni zbog mogućnosti, dok držimo oči otvorene. To je putovanje na kojem smo svi zajedno, a pogled je svakim danom sve bolji.
Da li ima stvari o kojima bi trebalo da budemo znatiželjni dok ulazimo u ovu novu eru? Apsolutno. Moramo se zapitati o skrivenim troškovima sve ove procesorske moći i šta to znači za našu privatnost dugoročno. Iako je tehnologija zabavna, ona se oslanja na ogromne količine podataka koje često dajemo bez mnogo razmišljanja. Vredi se zapitati kako se čuvaju naši lični glasovni otisci i ko zaista poseduje digitalnu verziju naših glasnih žica. Ovo nisu mračne brige, već pametna pitanja koja nam pomažu da postavimo bolje granice za budućnost. Želimo da budemo sigurni da, kako ovi alati postaju bolji, tako postaju i sigurniji za korišćenje svima, bez obzira na njihove tehnološke veštine. Postavljanjem ovih pitanja sada, pomažemo u oblikovanju budućnosti koja je fer i transparentna za sve uključene. Sve je to deo odgovornog građanina u digitalnom svetu koji nikada ne spava.
Имате питање, сугестију или идеју за чланак? Контактирајте нас.Novi zvuk interneta
A sada, za moje prijatelje koji vole da zagrebu ispod površine i vide kako sve ovo funkcioniše ‘ispod haube’. Workflow za kreiranje ovih ‘asetova’ prešao je sa velikih server farmi na lokalno skladištenje. High-end laptopovi sada mogu da pokreću ove modele lokalno, što je ogroman dobitak za privatnost i brzinu. API limiti su i dalje aktuelni za najuglađenije cloud servise, ali open source zajednica ih brzo sustiže. Vidimo bolju integraciju sa standardnim kreativnim softverom, tako da klonirani glas možeš da ubaciš direktno u video editor kao da je samo još jedan audio track. Latency je toliko opao da je konverzija glasa u realnom vremenu sada realnost. To znači da možeš da govoriš u mikrofon i da tvoj glas izađe kao potpuno druga osoba, skoro bez ikakvog kašnjenja. Sve je u načinu na koji ovi modeli barataju packet loss-om i jitterom da bi zvuk ostao gladak i prirodan. Većinu teškog posla obavljaju optimizovani transformatori koji se fokusiraju na najvažnije delove zvučnog talasa. To omogućava mnogo manju veličinu fajla, dok kvalitet ostaje dovoljno visok da prevari čak i trenirano uho.
Имате причу о вештачкој интелигенцији, алат, тренд или питање које мислите да бисмо требали да покријемо? Пошаљите нам своју идеју за чланак — волели бисмо да је чујемо.Takođe, vidimo prelazak na decentralizovano skladištenje za ove modele, što ih čini pristupačnijim developerima svuda. Integracija ovih alata u postojeće ‘pipelines’ olakšava malim timovima da proizvode visokokvalitetan sadržaj koji je nekada zahtevao ceo studio i ogroman budžet. To je predivan deo inženjeringa koji složenu matematiku pretvara u nešto što možemo čuti i razumeti. Kada pogledamo tehničku stranu, jasno je da je fokus na tome da stvari budu brže i efikasnije svakog dana. Snaga ovih sistema leži u njihovoj sposobnosti da uče iz vrlo malo podataka. Ovo je ogromna promena u odnosu na pre samo nekoliko godina, kada su vam bili potrebni sati snimanja da biste dobili pristojan rezultat. Sada algoritmi mogu da pokupe jedinstveni timbar i visinu glasa za nekoliko sekundi. To je dokaz koliko je mašinsko učenje napredovalo u vrlo kratkom vremenskom periodu. Za one od nas koji vole opremu i kod, to je igralište beskrajnih mogućnosti. Vidimo nove frameworke koji omogućavaju još veću kontrolu nad emocionalnim tonom generisanog govora, što dodaje još jedan sloj realizma celom iskustvu.
BotNews.today користи АИ алате за истраживање, писање, уређивање и превођење садржаја. Наш тим прегледа и надгледа процес како би информације биле корисне, јасне и поуздане.
Ispod haube modernog imitatora
Još jedna oblast gde tehnologija postaje zaista pametna je faza detekcije. Inženjeri grade digitalne vodene žigove koji su ugrađeni direktno u audio fajlove. Ovi vodeni žigovi su nevidljivi ljudskom uhu, ali ih softver lako može uočiti. Ovo stvara neku vrstu digitalnog traga za svaki kreirani medijski sadržaj. To je pametan način da se stvari održe transparentnim, a da se ne pokvari zabava kreatorima. Takođe, vidimo uspon ličnih verifikacionih ključeva, gde možeš dokazati da je glasovna poruka zaista došla od tebe. To je kao da imaš digitalni potpis za svoj glas. Ovakva inovacija je ono što održava ravnotežu moći u korist korisnika. Tech zajednica radi non-stop kako bi ostala korak ispred. To je konstantan ciklus stvaranja i zaštite koji pokreće celu industriju napred. Razumevanjem ovih specifikacija, možemo videti da budućnost nije samo u pravljenju boljih lažnjaka, već u stvaranju sigurnijeg i proverljivijeg interneta za sve.
Napomena urednika: Kreirali smo ovaj sajt kao višejezični centar za vesti i vodiče o veštačkoj inteligenciji za ljude koji nisu kompjuterski genijalci, ali ipak žele da razumeju veštačku inteligenciju, koriste je sa više samopouzdanja i prate budućnost koja već stiže.
Svet deepfakes-a u [godina] je definitivno složeniji nego što je bio, ali je i mnogo uzbudljiviji. Učimo da budemo pametniji potrošači medija, a alati za zaštitu rastu jednako brzo kao i alati za stvaranje. Sve je u tome da ostanemo informisani i zadržimo optimističan pogled na to kako možemo koristiti ove bitove i bajtove da bismo poboljšali naše živote i učinili ih povezanijima. Budućnost je svetla i puna glasova koji zvuče baš kao mi, samo možda malo korisniji i dostupniji kada nam zatrebaju. Gradimo svet u kojem nam tehnologija služi i pomaže nam da izrazimo svoju kreativnost na načine koje nikada nismo smatrali mogućim. Zato, nastavite da slušate, postavljate pitanja i, što je najvažnije, zabavljajte se sa svim neverovatnim stvarima koje digitalni svet nudi. Tek smo na početku ovog neverovatnog putovanja zajedno i jedva čekam da vidim šta sledi.