Video 10 za AI Zinazostahili Kutazamwa Mwezi Huu
Mabadiliko kutoka picha tuli kwenda kwenye video za majimaji yanaashiria mabadiliko katika jinsi tunavyoona ushahidi wa kidijitali. Tunatoka katika enzi ambapo prompt ilitoa fremu moja tu. Sasa, sekta hii inazingatia uthabiti wa muda na fizikia ya mwendo. Klipu hizi kumi zinawakilisha zaidi ya hatua muhimu za kiufundi. Zinafanya kazi kama dirisha la siku zijazo ambapo kizuizi kati ya wakati uliokamatwa na ule uliosanisiwa kinatoweka kabisa. Watazamaji wengi bado wanachukulia video hizi kama mambo mapya tu. Wanatazama viungo vilivyopinda au asili zinazometa na kupuuza teknolojia hii kama toy. Hili ni kosa. Ishara katika video hizi si ukamilifu wa picha bali ni kasi ya uboreshaji wake. Tunaona matokeo mabichi ya modeli zinazojifunza sheria za ulimwengu wetu kwa kuitazama. Mwezi huu, klipu muhimu zaidi si zile zinazoonekana bora zaidi. Ni zile zinazothibitisha kuwa programu inaelewa jinsi mvuto, mwanga, na anatomia ya binadamu inavyoingiliana kwa muda. Hii ndiyo msingi wa lugha mpya ya kuona.
Hali ya sasa ya utengenezaji wa video inategemea diffusion models ambazo zimepanuliwa hadi kwenye mwelekeo wa tatu wa wakati. Badala ya kutabiri tu mahali ambapo pixel inapaswa kwenda kwenye ndege tambarare, mifumo hii inatabiri jinsi pixel hiyo inapaswa kubadilika katika fremu sitini. Hii inahitaji kiasi kikubwa cha compute na uelewa wa kina wa mwendelezo. Unapotazama klipu ya mtu akitembea, modeli lazima ikumbuke jinsi mtu huyo alivyokuwa anaonekana sekunde tatu zilizopita ili kuhakikisha rangi ya shati lake haibadiliki. Hii inaitwa temporal coherence. Hili ndilo tatizo gumu zaidi katika synthetic media. Video nyingi tunazoona leo ni fupi kwa sababu kudumisha mwendelezo huu kwa muda mrefu ni ghali kwa kompyuta. Modeli mara nyingi huchukua njia za mkato. Wanaweza kufifisha usuli au kurahisisha mwendo mgumu ili kuokoa nguvu ya kuchakata. Hata hivyo, kundi la hivi karibuni la releases linaonyesha kuruka kwa kiasi kikubwa katika kudumisha maelezo katika muda wote wa klipu. Hii inapendekeza kuwa usanifu wa msingi unakuwa bora zaidi katika kushughulikia data ya high-dimensional.
Mkanganyiko ambao watu wengi huleta kwenye mada hii ni wazo kwamba AI inafanya