10 tekoälyvideota, jotka kannattaa katsoa tässä kuussa
Siirtymä staattisista kuvista sulavaan videoon merkitsee muutosta siinä, miten hahmotamme digitaalista todistusaineistoa. Olemme jättämässä taaksemme aikakauden, jolloin kehotteesta syntyi vain yksi ruutu. Nyt ala keskittyy ajalliseen johdonmukaisuuteen ja liikkeen fysiikkaan. Nämä kymmenen videota edustavat muutakin kuin teknisiä virstanpylväitä. Ne toimivat ikkunana tulevaisuuteen, jossa raja tallennetun hetken ja synteettisen luomuksen välillä katoaa kokonaan. Monet katsojat pitävät näitä videoita yhä vain uutuudenviehätyksenä. He katsovat vääristyneitä raajoja tai väreileviä taustoja ja sivuuttavat teknologian leluna. Tämä on virhe. Näiden videoiden olennainen viesti ei ole kuvan täydellisyys, vaan sen kehityksen nopeus. Näemme mallien raakaa tuotosta, jotka oppivat maailmamme säännöt tarkkailemalla sitä. Tässä kuussa tärkeimmät pätkät eivät ole niitä, jotka näyttävät parhailta. Ne ovat niitä, jotka todistavat ohjelmiston ymmärtävän, miten painovoima, valo ja ihmisen anatomia vuorovaikuttavat ajan myötä. Tämä on uuden visuaalisen kielen perusta.
Nykyinen videogenerointi perustuu diffuusiomalleihin, jotka on laajennettu ajan kolmanteen ulottuvuuteen. Sen sijaan, että ennustettaisiin vain, minne pikselin pitäisi mennä tasaisella pinnalla, nämä järjestelmät ennustavat, miten pikselin tulisi muuttua kuudenkymmenen ruudun aikana. Tämä vaatii valtavasti laskentatehoa ja syvää ymmärrystä jatkuvuudesta. Kun katsot videota kävelevästä ihmisestä, mallin on muistettava, miltä henkilö näytti kolme sekuntia sitten, jotta paidan väri ei muutu. Tätä kutsutaan ajalliseksi koherenssiksi. Se on synteettisen median vaikein ongelma. Useimmat nykyään näkemämme videot ovat lyhyitä, koska tämän koherenssin ylläpitäminen pitkään on laskennallisesti kallista. Mallit ottavat usein oikopolkuja. Ne saattavat sumentaa taustan tai yksinkertaistaa monimutkaista liikettä säästääkseen prosessointitehoa. Uusimmat julkaisut osoittavat kuitenkin merkittävää harppausta yksityiskohtien säilyttämisessä koko leikkeen keston ajan. Tämä viittaa siihen, että taustalla olevat arkkitehtuurit muuttuvat tehokkaammiksi korkealuokkaisen datan käsittelyssä.
Suurin osa ihmisistä sekoittaa tämän aiheen ajatukseen, että tekoäly