ਉਹ ਕਲਿੱਪ ਜੋ AI ਨੂੰ 100 ਹੌਟ ਟੇਕਸ ਨਾਲੋਂ ਬਿਹਤਰ ਸਮਝਾਉਂਦੇ ਹਨ
ਟੈਕਸਟ ਯੁੱਗ ਦਾ ਅੰਤ
ਸਾਲਾਂ ਤੋਂ, ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਬਾਰੇ ਚਰਚਾ ਟੈਕਸਟ ‘ਤੇ ਕੇਂਦਰਿਤ ਸੀ। ਅਸੀਂ ਚੈਟਬੋਟਸ, ਲੇਖ ਜਨਰੇਟਰਾਂ, ਅਤੇ ਆਟੋਮੇਟਿਡ ਪ੍ਰੋਜ਼ ਦੇ ਨੈਤਿਕਤਾ ਬਾਰੇ ਬਹਿਸ ਕਰਦੇ ਸੀ। ਉਹ ਸਮਾਂ ਖਤਮ ਹੋ ਗਿਆ ਹੈ। ਹਾਈ-ਫਿਡੇਲਿਟੀ ਵੀਡੀਓ ਜਨਰੇਸ਼ਨ ਦੇ ਆਉਣ ਨਾਲ ਟੀਚਾ ਬਦਲ ਗਿਆ ਹੈ ਕਿ ਇੱਕ ਐਲਗੋਰਿਦਮ ਕੀ ਕਹਿ ਸਕਦਾ ਹੈ ਤੋਂ ਲੈ ਕੇ ਇਹ ਕੀ ਦਿਖਾ ਸਕਦਾ ਹੈ। ਇੱਕ ਦਸ-ਸਕਿੰਟ ਦੀ ਕਲਿੱਪ ਹੁਣ ਹਜ਼ਾਰਾਂ ਸ਼ਬਦਾਂ ਦੇ ਪ੍ਰੋਂਪਟ ਨਾਲੋਂ ਜ਼ਿਆਦਾ ਭਾਰ ਰੱਖਦੀ ਹੈ। ਇਹ ਵਿਜ਼ੂਅਲ ਆਰਟੀਫੈਕਟ ਹੁਣ ਸਿਰਫ਼ ਸੋਸ਼ਲ ਮੀਡੀਆ ‘ਤੇ ਸ਼ੇਅਰ ਕਰਨ ਲਈ ਕੂਲ ਡੈਮੋ ਨਹੀਂ ਹਨ। ਉਹ ਇਸ ਗੱਲ ਦਾ ਮੁੱਖ ਸਬੂਤ ਹਨ ਕਿ ਇਨਸਾਨ ਅਸਲੀਅਤ ਨੂੰ ਕਿਵੇਂ ਬਣਾਉਂਦੇ ਹਨ। ਜਦੋਂ ਅਸੀਂ ਨੀਓਨ-ਲਾਈਟ ਸ਼ਹਿਰ ਜਾਂ ਫੋਟੋਰਿਅਲਿਸਟਿਕ ਜੀਵ ਦੀ ਕਲਿੱਪ ਦੇਖਦੇ ਹਾਂ, ਤਾਂ ਅਸੀਂ ਸਿਰਫ਼ ਪਿਕਸਲ ਨਹੀਂ ਦੇਖ ਰਹੇ ਹੁੰਦੇ। ਅਸੀਂ ਆਪਣੀ ਦੁਨੀਆ ਦੇ ਭੌਤਿਕ ਨਿਯਮਾਂ ਨੂੰ ਇੱਕ ਲੇਟੈਂਟ ਸਪੇਸ ਵਿੱਚ ਮੈਪ ਕਰਨ ਲਈ ਕੀਤੇ ਗਏ ਵਿਸ਼ਾਲ ਕੰਪਿਊਟੇਸ਼ਨਲ ਯਤਨਾਂ ਦਾ ਨਤੀਜਾ ਦੇਖ ਰਹੇ ਹੁੰਦੇ ਹਾਂ। ਇਹ ਤਬਦੀਲੀ ਮਨੋਰੰਜਨ ਬਾਰੇ ਨਹੀਂ ਹੈ। ਇਹ ਉਸ ਬੁਨਿਆਦੀ ਤਰੀਕੇ ਬਾਰੇ ਹੈ ਜਿਸ ਨਾਲ ਅਸੀਂ ਇੱਕ ਗਲੋਬਲ ਸਮਾਜ ਵਿੱਚ ਜਾਣਕਾਰੀ ਦੀ ਪੁਸ਼ਟੀ ਕਰਦੇ ਹਾਂ। ਜੇਕਰ ਇੱਕ ਮਸ਼ੀਨ ਲਹਿਰਾਂ ਦੇ ਟਕਰਾਉਣ ਜਾਂ ਮਨੁੱਖੀ ਚਿਹਰੇ ਦੀਆਂ ਗੁੰਝਲਦਾਰ ਮਾਸਪੇਸ਼ੀਆਂ ਦੀਆਂ ਹਰਕਤਾਂ ਦੀ ਨਕਲ ਕਰ ਸਕਦੀ ਹੈ, ਤਾਂ ਸਬੂਤਾਂ ਦੇ ਪੁਰਾਣੇ ਨਿਯਮ ਖਤਮ ਹੋ ਜਾਂਦੇ ਹਨ। ਸਾਨੂੰ ਹੁਣ ਇਹਨਾਂ ਕਲਿੱਪਾਂ ਨੂੰ ਸਿਰਫ਼ ਕੰਟੈਂਟ ਦੀ ਬਜਾਏ ਡੇਟਾ ਪੁਆਇੰਟਾਂ ਵਜੋਂ ਪੜ੍ਹਨਾ ਸਿੱਖਣਾ ਚਾਹੀਦਾ ਹੈ।
ਪਿਕਸਲ ਕਿਵੇਂ ਹਿੱਲਣਾ ਸਿੱਖਦੇ ਹਨ
ਇਹਨਾਂ ਕਲਿੱਪਾਂ ਦੇ ਪਿੱਛੇ ਦੀ ਟੈਕਨਾਲੋਜੀ ਡਿਫਿਊਜ਼ਨ ਮਾਡਲਾਂ ਅਤੇ ਟ੍ਰਾਂਸਫਾਰਮਰ ਆਰਕੀਟੈਕਚਰ ਦੇ ਸੁਮੇਲ ‘ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ। ਸ਼ੁਰੂਆਤੀ ਵੀਡੀਓ ਟੂਲਸ ਦੇ ਉਲਟ ਜੋ ਸਿਰਫ਼ ਚਿੱਤਰਾਂ ਨੂੰ ਜੋੜਦੇ ਸਨ, ਸੋਰਾ (Sora) ਜਾਂ ਰਨਵੇਅ Gen-3 (Runway Gen-3) ਵਰਗੇ ਆਧੁਨਿਕ ਸਿਸਟਮ ਵੀਡੀਓ ਨੂੰ ਸਪੇਸ ਅਤੇ ਸਮੇਂ ਵਿੱਚ ਪੈਚਾਂ ਦੀ ਇੱਕ ਲੜੀ ਵਜੋਂ ਦੇਖਦੇ ਹਨ। ਉਹ ਸਿਰਫ਼ ਅਗਲੇ ਫਰੇਮ ਦੀ ਭਵਿੱਖਬਾਣੀ ਨਹੀਂ ਕਰਦੇ। ਉਹ ਪੂਰੀ ਕਲਿੱਪ ਦੌਰਾਨ ਵਸਤੂਆਂ ਵਿਚਕਾਰ ਸਬੰਧ ਨੂੰ ਸਮਝਦੇ ਹਨ। ਇਹ ਟੈਂਪੋਰਲ ਕੰਸਿਸਟੈਂਸੀ (temporal consistency) ਲਈ ਸਹਾਇਕ ਹੈ, ਜਿੱਥੇ ਇੱਕ ਦਰੱਖਤ ਦੇ ਪਿੱਛੇ ਜਾਣ ਵਾਲੀ ਵਸਤੂ ਦੂਜੇ ਪਾਸੇ ਬਿਲਕੁਲ ਉਹੀ ਦਿਖਾਈ ਦਿੰਦੀ ਹੈ। ਇਹ ਇੱਕ ਸਾਲ ਪਹਿਲਾਂ ਦੇਖੇ ਗਏ ਝਟਕੇਦਾਰ, ਭਰਮ ਵਾਲੇ ਵੀਡੀਓਜ਼ ਤੋਂ ਇੱਕ ਵੱਡੀ ਛਾਲ ਹੈ। ਇਹ ਮਾਡਲ ਵੀਡੀਓ ਅਤੇ ਚਿੱਤਰਾਂ ਦੇ ਵਿਸ਼ਾਲ ਡੇਟਾਸੈਟਾਂ ‘ਤੇ ਟ੍ਰੇਨ ਕੀਤੇ ਗਏ ਹਨ, ਜੋ ਗਿੱਲੇ ਫੁੱਟਪਾਥ ‘ਤੇ ਰੌਸ਼ਨੀ ਦੇ ਪ੍ਰਤੀਬਿੰਬ ਤੋਂ ਲੈ ਕੇ ਗੁਰੂਤਾਕਰਸ਼ਣ ਕਿਸੇ ਡਿੱਗਦੀ ਵਸਤੂ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਭਾਵਿਤ ਕਰਦਾ ਹੈ, ਤੱਕ ਸਭ ਕੁਝ ਸਿੱਖਦੇ ਹਨ। ਇਸ ਜਾਣਕਾਰੀ ਨੂੰ ਇੱਕ ਗਣਿਤਿਕ ਮਾਡਲ ਵਿੱਚ ਕੰਪ੍ਰੈਸ ਕਰਕੇ, AI ਫਿਰ ਇੱਕ ਸਧਾਰਨ ਟੈਕਸਟ ਵਰਣਨ ਦੇ ਆਧਾਰ ‘ਤੇ ਸਕ੍ਰੈਚ ਤੋਂ ਨਵੇਂ ਦ੍ਰਿਸ਼ ਬਣਾ ਸਕਦਾ ਹੈ। ਨਤੀਜਾ ਇੱਕ ਅਜਿਹੀ ਦੁਨੀਆ ਵਿੱਚ ਇੱਕ ਸਿੰਥੈਟਿਕ ਵਿੰਡੋ ਹੈ ਜੋ ਸਾਡੀ ਆਪਣੀ ਦੁਨੀਆ ਵਾਂਗ ਦਿਖਾਈ ਦਿੰਦੀ ਹੈ ਅਤੇ ਵਿਵਹਾਰ ਕਰਦੀ ਹੈ ਪਰ ਸਿਰਫ ਇੱਕ ਨਿਊਰਲ ਨੈਟਵਰਕ ਦੇ ਵੇਟਸ ਵਿੱਚ ਮੌਜੂਦ ਹੈ। ਇਹ ਵਿਜ਼ੂਅਲ ਕਮਿਊਨੀਕੇਸ਼ਨ ਲਈ ਨਵਾਂ ਬੇਸਲਾਈਨ ਹੈ। ਇਹ ਇੱਕ ਅਜਿਹੀ ਦੁਨੀਆ ਹੈ ਜਿੱਥੇ ਕਲਪਨਾ ਅਤੇ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਫੁਟੇਜ ਵਿਚਕਾਰ ਰੁਕਾਵਟ ਨੂੰ ਕੁਝ ਸਕਿੰਟਾਂ ਦੇ ਪ੍ਰੋਸੈਸਿੰਗ ਸਮੇਂ ਤੱਕ ਘਟਾ ਦਿੱਤਾ ਗਿਆ ਹੈ। ਇਸ ਪ੍ਰਕਿਰਿਆ ਨੂੰ ਸਮਝਣਾ ਹਰ ਉਸ ਵਿਅਕਤੀ ਲਈ ਜ਼ਰੂਰੀ ਹੈ ਜੋ ਬਦਲਾਅ ਦੀ ਮੌਜੂਦਾ ਰਫਤਾਰ ਨਾਲ ਜੁੜੇ ਰਹਿਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਿਹਾ ਹੈ।
ਗਲੋਬਲ ਸੱਚ ਦਾ ਸੰਕਟ
ਇਸ ਤਬਦੀਲੀ ਦਾ ਗਲੋਬਲ ਪ੍ਰਭਾਵ ਤੁਰੰਤ ਅਤੇ ਡੂੰਘਾ ਹੈ। ਅਜਿਹੇ ਯੁੱਗ ਵਿੱਚ ਜਿੱਥੇ