AI ਦੇ ਮੌਜੂਦਾ ਹਾਈਪ ਨੂੰ ਜੱਜ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ ਇਹ ਜ਼ਰੂਰ ਦੇਖੋ

ਸਿੰਥੈਟਿਕ ਵੀਡੀਓਜ਼ ਦਾ ਮੌਜੂਦਾ ਹੜ੍ਹ ਕਿਸੇ ਮੁਕੰਮਲ ਟੈਕਨਾਲੋਜੀ ਦੀ ਨਿਸ਼ਾਨੀ ਨਹੀਂ ਹੈ। ਇਹ ਇੱਕ ਹਾਈ-ਸਪੀਡ ਟੈਸਟ ਹੈ ਕਿ ਮਸ਼ੀਨਾਂ ਭੌਤਿਕ ਅਸਲੀਅਤ ਨੂੰ ਕਿਵੇਂ ਸਮਝਦੀਆਂ ਹਨ। ਜ਼ਿਆਦਾਤਰ ਲੋਕ ਇੱਕ ਜਨਰੇਟ ਕੀਤੀ ਕਲਿੱਪ ਨੂੰ ਦੇਖਦੇ ਹਨ ਅਤੇ ਪੁੱਛਦੇ ਹਨ ਕਿ ਕੀ ਇਹ ਅਸਲੀ ਲੱਗਦੀ ਹੈ। ਦੋਸਤੋ, ਇਹ ਗਲਤ ਸਵਾਲ ਹੈ। ਸਹੀ ਸਵਾਲ ਇਹ ਹੈ ਕਿ ਕੀ ਪਿਕਸਲ ਕਾਰਨ ਅਤੇ ਪ੍ਰਭਾਵ (cause and effect) ਦੀ ਸਮਝ ਦਿਖਾਉਂਦੇ ਹਨ? ਜਦੋਂ ਕਿਸੇ ਹਾਈ-ਐਂਡ ਮਾਡਲ ਵਿੱਚ ਡਿਜੀਟਲ ਕੱਚ ਟੁੱਟਦਾ ਹੈ, ਤਾਂ ਕੀ ਤਰਲ ਪਦਾਰਥ ਗੁਰੂਤਾਕਰਸ਼ਣ (gravity) ਦੇ ਅਨੁਸਾਰ ਡਿੱਗਦਾ ਹੈ ਜਾਂ ਫਰਸ਼ ਵਿੱਚ ਗਾਇਬ ਹੋ ਜਾਂਦਾ ਹੈ? ਇਹੀ ਫਰਕ ਇੱਕ ਸਹੀ ਸਿਗਨਲ ਅਤੇ ਉਸ ਸ਼ੋਰ (noise) ਵਿਚਕਾਰ ਹੈ ਜੋ ਸਿਰਫ਼ ਨਵਾਂ ਹੋਣ ਕਰਕੇ ਮਹੱਤਵਪੂਰਨ ਲੱਗਦਾ ਹੈ। ਅਸੀਂ ਸਧਾਰਨ ਚਿੱਤਰ ਬਣਾਉਣ ਦੇ ਦੌਰ ਤੋਂ ਅੱਗੇ ਵਧ ਰਹੇ ਹਾਂ, ਜਿੱਥੇ ਵੀਡੀਓ ਇੱਕ ਮਾਡਲ ਦੇ ਅੰਦਰੂਨੀ ਤਰਕ ਦੇ **ਵਿਜ਼ੂਅਲ ਸਬੂਤ** ਵਜੋਂ ਕੰਮ ਕਰਦੀ ਹੈ। ਜੇਕਰ ਤਰਕ ਸਹੀ ਹੈ, ਤਾਂ ਟੂਲ ਕੰਮ ਦਾ ਹੈ। ਜੇਕਰ ਤਰਕ ਫੇਲ੍ਹ ਹੁੰਦਾ ਹੈ, ਤਾਂ ਉਹ ਕਲਿੱਪ ਸਿਰਫ਼ ਇੱਕ ਵਧੀਆ ਹੈਲੂਸੀਨੇਸ਼ਨ (hallucination) ਹੈ। ਇਸ ਬਦਲਾਅ ਨੂੰ ਸਮਝਣਾ ਹੀ ਮਾਰਕੀਟਿੰਗ ਦੇ ਚੱਕਰਾਂ ਵਿੱਚ ਫਸੇ ਬਿਨਾਂ ਇੰਡਸਟਰੀ ਦੀ ਮੌਜੂਦਾ ਸਥਿਤੀ ਨੂੰ ਸਹੀ ਤਰ੍ਹਾਂ ਜੱਜ ਕਰਨ ਦਾ ਇੱਕੋ ਇੱਕ ਤਰੀਕਾ ਹੈ।

ਮੋਸ਼ਨ ਦੀ ਲੈਟੈਂਟ ਜਿਓਮੈਟਰੀ ਨੂੰ ਸਮਝਣਾ

ਹਾਲ ਹੀ ਵਿੱਚ ਕੀ ਬਦਲਿਆ ਹੈ, ਇਹ ਸਮਝਣ ਲਈ ਤੁਹਾਨੂੰ ਇਹ ਦੇਖਣਾ ਪਵੇਗਾ ਕਿ ਇਹ ਮਾਡਲ ਕਿਵੇਂ ਬਣੇ ਹਨ। ਪੁਰਾਣੇ ਸਿਸਟਮ ਚਿੱਤਰਾਂ ਨੂੰ ਇੱਕ ਫਲਿੱਪਬੁੱਕ ਵਾਂਗ ਜੋੜਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੇ ਸਨ। ਆਧੁਨਿਕ ਸਿਸਟਮ, ਜਿਵੇਂ ਕਿ ਨਵੀਨਤਮ OpenAI Sora research ਵਿੱਚ ਚਰਚਾ ਕੀਤੀ ਗਈ ਹੈ, ਡਿਫਿਊਜ਼ਨ ਮਾਡਲਾਂ ਅਤੇ ਟ੍ਰਾਂਸਫਾਰਮਰਸ ਦੇ ਸੁਮੇਲ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ। ਉਹ ਸਿਰਫ਼ ਫਰੇਮ ਨਹੀਂ ਬਣਾਉਂਦੇ। ਉਹ ਇੱਕ ਲੈਟੈਂਟ ਸਪੇਸ (latent space) ਦਾ ਨਕਸ਼ਾ ਤਿਆਰ ਕਰਦੇ ਹਨ ਜਿੱਥੇ ਹਰ ਬਿੰਦੂ ਇੱਕ ਸੰਭਵ ਵਿਜ਼ੂਅਲ ਸਥਿਤੀ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਮਸ਼ੀਨ ਫਿਰ ਇਹਨਾਂ ਬਿੰਦੂਆਂ ਵਿਚਕਾਰ ਸਭ ਤੋਂ ਸੰਭਾਵਿਤ ਰਸਤੇ ਦੀ ਗਣਨਾ ਕਰਦੀ ਹੈ। ਇਹੀ ਕਾਰਨ ਹੈ ਕਿ ਇੱਕ ਆਧੁਨਿਕ AI ਵੀਡੀਓ ਪੁਰਾਣੀਆਂ ਝਟਕੇਦਾਰ ਕਲਿੱਪਾਂ ਨਾਲੋਂ ਜ਼ਿਆਦਾ ਨਿਰਵਿਘਨ (fluid) ਮਹਿਸੂਸ ਹੁੰਦੀ ਹੈ। ਮਾਡਲ ਇਹ ਅੰਦਾਜ਼ਾ ਨਹੀਂ ਲਗਾ ਰਿਹਾ ਕਿ ਕੋਈ ਵਿਅਕਤੀ ਕਿਹੋ ਜਿਹਾ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ; ਇਹ ਭਵਿੱਖਬਾਣੀ ਕਰ ਰਿਹਾ ਹੈ ਕਿ ਜਦੋਂ ਉਹ ਵਿਅਕਤੀ 3D ਸਪੇਸ ਵਿੱਚ ਹਿੱਲਦਾ ਹੈ ਤਾਂ ਰੌਸ਼ਨੀ ਕਿਸੇ ਸਤਹ ਤੋਂ ਕਿਵੇਂ ਟਕਰਾਉਣੀ ਚਾਹੀਦੀ ਹੈ। ਇਹ ਪੁਰਾਣੇ ਸਟੈਟਿਕ ਇਮੇਜ ਜਨਰੇਟਰਾਂ ਤੋਂ ਇੱਕ ਬਹੁਤ ਵੱਡਾ ਬਦਲਾਅ ਹੈ।

ਬਹੁਤ ਸਾਰੇ ਪਾਠਕਾਂ ਨੂੰ ਇਹ ਭੁਲੇਖਾ ਹੈ ਕਿ AI ਵੀਡੀਓ ਇੱਕ ਵੀਡੀਓ ਐਡੀਟਰ ਹੈ। ਅਸਲ ਵਿੱਚ ਇਹ ਨਹੀਂ ਹੈ। ਇਹ ਇੱਕ ਵਰਲਡ ਸਿਮੂਲੇਟਰ (world simulator) ਹੈ। ਜਦੋਂ ਤੁਸੀਂ ਇਸਨੂੰ ਇੱਕ ਪ੍ਰੋਂਪਟ ਦਿੰਦੇ ਹੋ, ਤਾਂ ਇਹ ਮੈਚ ਲੱਭਣ ਲਈ ਕਲਿੱਪਾਂ ਦੇ ਡੇਟਾਬੇਸ ਦੀ ਖੋਜ ਨਹੀਂ ਕਰਦਾ। ਇਹ ਸਕ੍ਰੈਚ ਤੋਂ ਇੱਕ ਸੀਨ ਬਣਾਉਣ ਲਈ ਟ੍ਰੇਨਿੰਗ ਦੌਰਾਨ ਸਿੱਖੇ ਗਏ ਗਣਿਤਿਕ ਵੇਟਸ (weights) ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇਸ ਟ੍ਰੇਨਿੰਗ ਵਿੱਚ ਹਾਲੀਵੁੱਡ ਫਿਲਮਾਂ ਤੋਂ ਲੈ ਕੇ ਸ਼ੁਕੀਨ ਫੋਨ ਰਿਕਾਰਡਿੰਗਾਂ ਤੱਕ ਅਰਬਾਂ ਘੰਟਿਆਂ ਦੀ ਫੁਟੇਜ ਸ਼ਾਮਲ ਹੁੰਦੀ ਹੈ। ਮਾਡਲ ਸਿੱਖਦਾ ਹੈ ਕਿ ਜਦੋਂ ਇੱਕ ਗੇਂਦ ਕੰਧ ਨਾਲ ਟਕਰਾਉਂਦੀ ਹੈ, ਤਾਂ ਉਸਨੂੰ ਉਛਲਣਾ ਚਾਹੀਦਾ ਹੈ। ਇਹ ਸਿੱਖਦਾ ਹੈ ਕਿ ਸੂਰਜ ਡੁੱਬਣ ਦੇ ਨਾਲ ਪਰਛਾਵੇਂ ਲੰਬੇ ਹੋਣੇ ਚਾਹੀਦੇ ਹਨ। ਹਾਲਾਂਕਿ, ਇਹ ਅਜੇ ਵੀ ਸਿਰਫ਼ ਅੰਕੜਾ ਅਨੁਮਾਨ ਹਨ। ਮਸ਼ੀਨ ਨੂੰ ਇਹ ਨਹੀਂ ਪਤਾ ਕਿ ਗੇਂਦ ਕੀ ਹੁੰਦੀ ਹੈ। ਇਹ ਸਿਰਫ਼ ਇੰਨਾ ਜਾਣਦੀ ਹੈ ਕਿ ਇਸਦੇ ਟ੍ਰੇਨਿੰਗ ਡੇਟਾ ਵਿੱਚ, ਕੁਝ ਪਿਕਸਲ ਪੈਟਰਨ ਆਮ ਤੌਰ ‘ਤੇ ਦੂਜੇ ਪਿਕਸਲ ਪੈਟਰਨਾਂ ਦੇ ਪਿੱਛੇ ਚੱਲਦੇ ਹਨ। ਇਹੀ ਕਾਰਨ ਹੈ ਕਿ ਇਹ ਟੈਕਨਾਲੋਜੀ ਇੰਨੀ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਲੱਗਦੀ ਹੈ ਪਰ ਫਿਰ ਵੀ ਅਜਿਹੀਆਂ ਅਜੀਬ ਗਲਤੀਆਂ ਕਰਦੀ ਹੈ ਜੋ ਇੱਕ ਮਨੁੱਖੀ ਬੱਚਾ ਕਦੇ ਨਹੀਂ ਕਰੇਗਾ।

ਸਿੰਥੈਟਿਕ ਦ੍ਰਿਸ਼ਟੀ ਦਾ ਭੂ-ਰਾਜਨੀਤਿਕ ਪ੍ਰਭਾਵ

ਇਸ ਟੈਕਨਾਲੋਜੀ ਦਾ ਪ੍ਰਭਾਵ ਮਨੋਰੰਜਨ ਉਦਯੋਗ ਤੋਂ ਕਿਤੇ ਜ਼ਿਆਦਾ ਦੂਰ ਤੱਕ ਫੈਲਿਆ ਹੋਇਆ ਹੈ। ਗਲੋਬਲ ਪੱਧਰ ‘ਤੇ, ਜ਼ੀਰੋ ਵਾਧੂ ਲਾਗਤ ‘ਤੇ ਹਾਈ-ਫਿਡੇਲਿਟੀ ਵੀਡੀਓ ਬਣਾਉਣ ਦੀ ਸਮਰੱਥਾ ਸਾਡੇ ਜਾਣਕਾਰੀ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਦੇ ਤਰੀਕੇ ਨੂੰ ਬਦਲ ਦਿੰਦੀ ਹੈ। ਵਿਕਾਸਸ਼ੀਲ ਲੋਕਤੰਤਰੀ ਸੰਸਥਾਵਾਂ ਵਾਲੇ ਦੇਸ਼ਾਂ ਵਿੱਚ, ਜਨਤਕ ਰਾਏ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰਨ ਲਈ ਪਹਿਲਾਂ ਹੀ ਸਿੰਥੈਟਿਕ ਵੀਡੀਓ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਜਾ ਰਹੀ ਹੈ। ਇਹ ਭਵਿੱਖ ਦੀ ਕੋਈ ਕਾਲਪਨਿਕ ਸਮੱਸਿਆ ਨਹੀਂ ਹੈ; ਇਹ ਇੱਕ ਮੌਜੂਦਾ ਹਕੀਕਤ ਹੈ ਜਿਸ ਲਈ ਇੱਕ ਨਵੀਂ ਕਿਸਮ ਦੀ ਡਿਜੀਟਲ ਸਾਖਰਤਾ (digital literacy) ਦੀ ਲੋੜ ਹੈ। ਅਸੀਂ ਹੁਣ ਕਿਸੇ ਰਿਕਾਰਡਿੰਗ ਦੀ ਸੱਚਾਈ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਲਈ ਸਿਰਫ਼ ਆਪਣੀਆਂ ਅੱਖਾਂ ‘ਤੇ ਭਰੋਸਾ ਨਹੀਂ ਕਰ ਸਕਦੇ। ਇਸ ਦੀ ਬਜਾਏ, ਸਾਨੂੰ ਇਹ ਪੁਸ਼ਟੀ ਕਰਨ ਲਈ ਤਕਨੀਕੀ ਨੁਕਸਾਂ ਅਤੇ ਪ੍ਰੋਵੇਨੈਂਸ ਮੈਟਾਡੇਟਾ (provenance metadata) ਦੀ ਭਾਲ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ ਕਿ ਕਲਿੱਪ ਅਸਲੀ ਹੈ। ਇਹ ਬਦਲਾਅ ਸੋਸ਼ਲ ਮੀਡੀਆ ਪਲੇਟਫਾਰਮਾਂ ਅਤੇ ਨਿਊਜ਼ ਸੰਸਥਾਵਾਂ ‘ਤੇ ਅਗਲੇ ਵੱਡੇ ਚੋਣ ਚੱਕਰ ਤੋਂ ਪਹਿਲਾਂ ਮਜ਼ਬੂਤ ਵੈਰੀਫਿਕੇਸ਼ਨ ਸਿਸਟਮ ਲਾਗੂ ਕਰਨ ਦਾ ਭਾਰੀ ਬੋਝ ਪਾਉਂਦਾ ਹੈ।

ਇਸ ਟੈਕਨਾਲੋਜੀ ਨੂੰ ਵਿਕਸਤ ਕਰਨ ਅਤੇ ਵਰਤਣ ਦੇ ਤਰੀਕੇ ਵਿੱਚ ਇੱਕ ਵੱਡਾ ਆਰਥਿਕ ਪਾੜਾ ਵੀ ਹੈ। ਇਹਨਾਂ ਮਾਡਲਾਂ ਨੂੰ ਟ੍ਰੇਨ ਕਰਨ ਲਈ ਲੋੜੀਂਦੀ ਜ਼ਿਆਦਾਤਰ ਕੰਪਿਊਟ ਪਾਵਰ ਅਮਰੀਕਾ ਅਤੇ ਚੀਨ ਦੀਆਂ ਕੁਝ ਕੰਪਨੀਆਂ ਵਿੱਚ ਕੇਂਦਰਿਤ ਹੈ। ਇਹ ਇੱਕ ਅਜਿਹੀ ਸਥਿਤੀ ਪੈਦਾ ਕਰਦਾ ਹੈ ਜਿੱਥੇ ਦੁਨੀਆ ਦੀ ਵਿਜ਼ੂਅਲ ਭਾਸ਼ਾ ਨੂੰ ਕੁਝ ਇੰਜੀਨੀਅਰਿੰਗ ਟੀਮਾਂ ਦੇ ਸੱਭਿਆਚਾਰਕ ਪੱਖਪਾਤ ਰਾਹੀਂ ਫਿਲਟਰ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ। ਜੇਕਰ ਕੋਈ ਮਾਡਲ ਮੁੱਖ ਤੌਰ ‘ਤੇ ਪੱਛਮੀ ਮੀਡੀਆ ‘ਤੇ ਟ੍ਰੇਨ ਕੀਤਾ ਗਿਆ ਹੈ, ਤਾਂ ਇਹ ਦੂਜੇ ਖੇਤਰਾਂ ਦੇ ਆਰਕੀਟੈਕਚਰ, ਪਹਿਰਾਵੇ ਜਾਂ ਸਮਾਜਿਕ ਨਿਯਮਾਂ ਨੂੰ ਸਹੀ ਤਰ੍ਹਾਂ ਪੇਸ਼ ਕਰਨ ਵਿੱਚ ਮੁਸ਼ਕਲ ਮਹਿਸੂਸ ਕਰ ਸਕਦਾ ਹੈ। ਇਹੀ ਕਾਰਨ ਹੈ ਕਿ ਇਹਨਾਂ ਟੂਲਸ ਦੇ ਵਿਕਾਸ ਵਿੱਚ ਵਿਸ਼ਵਵਿਆਪੀ ਭਾਗੀਦਾਰੀ ਜ਼ਰੂਰੀ ਹੈ। ਇਸ ਤੋਂ ਬਿਨਾਂ, ਅਸੀਂ ਸਿੰਥੈਟਿਕ ਸਮੱਗਰੀ ਦਾ ਇੱਕ ਅਜਿਹਾ ਸੱਭਿਆਚਾਰ ਪੈਦਾ ਕਰਨ ਦਾ ਜੋਖਮ ਲੈਂਦੇ ਹਾਂ ਜੋ ਮਨੁੱਖੀ ਅਨੁਭਵ ਦੀ ਵਿਭਿੰਨਤਾ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰਦਾ ਹੈ। ਤੁਸੀਂ ਸਾਡੀ ਟੀਮ ਦੇ ਨਵੀਨਤਮ AI ਉਦਯੋਗ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਇਹਨਾਂ ਵਿਕਾਸਾਂ ਬਾਰੇ ਹੋਰ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹੋ।

ਇੰਸਟੈਂਟ ਇਟਰੇਸ਼ਨ ਦੇ ਯੁੱਗ ਵਿੱਚ ਪ੍ਰੋਡਕਸ਼ਨ ਪਾਈਪਲਾਈਨਾਂ

ਪ੍ਰੋਫੈਸ਼ਨਲ ਸੈਟਿੰਗ ਵਿੱਚ, ਇੱਕ ਕ੍ਰਿਏਟਿਵ ਡਾਇਰੈਕਟਰ ਦੀ ਜ਼ਿੰਦਗੀ ਕਾਫ਼ੀ ਬਦਲ ਗਈ ਹੈ। ਸਾਰਾਹ ਦੀ ਉਦਾਹਰਣ ਲਓ, ਜੋ ਇੱਕ ਮੱਧਮ ਆਕਾਰ ਦੀ ਐਡਵਰਟਾਈਜ਼ਿੰਗ ਏਜੰਸੀ ਵਿੱਚ ਲੀਡ ਹੈ। ਦੋ ਸਾਲ ਪਹਿਲਾਂ, ਜੇਕਰ ਉਹ ਕਾਰ ਦੇ ਇਸ਼ਤਿਹਾਰ ਲਈ ਕੋਈ ਕੰਸੈਪਟ ਪੇਸ਼ ਕਰਨਾ ਚਾਹੁੰਦੀ ਸੀ, ਤਾਂ ਉਹ ਸਟਾਕ ਫੁਟੇਜ ਲੱਭਣ ਜਾਂ ਸਟੋਰੀਬੋਰਡ ਬਣਾਉਣ ਲਈ ਇੱਕ ਇਲਸਟ੍ਰੇਟਰ ਨੂੰ ਹਾਇਰ ਕਰਨ ਵਿੱਚ ਕਈ ਦਿਨ ਬਿਤਾਉਂਦੀ ਸੀ। ਅੱਜ, ਉਹ ਮਿੰਟਾਂ ਵਿੱਚ ਹਾਈ-ਫਿਡੇਲਿਟੀ “ਮੂਡ ਫਿਲਮਾਂ” ਤਿਆਰ ਕਰਨ ਲਈ Runway ਜਾਂ Luma ਵਰਗੇ ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਦੀ ਹੈ। ਉਹ ਇੱਕ ਕਲਾਇੰਟ ਨੂੰ ਬਿਲਕੁਲ ਦਿਖਾ ਸਕਦੀ ਹੈ ਕਿ ਕਿਸੇ ਖਾਸ ਸ਼ਹਿਰ ਵਿੱਚ ਸ਼ਾਮ ਵੇਲੇ ਕਾਰ ‘ਤੇ ਰੌਸ਼ਨੀ ਕਿਵੇਂ ਪਵੇਗੀ। ਇਹ ਫਾਈਨਲ ਸ਼ੂਟ ਦੀ ਜਗ੍ਹਾ ਨਹੀਂ ਲੈਂਦਾ, ਪਰ ਇਹ ਉਸ ਅੰਦਾਜ਼ੇ ਨੂੰ ਖਤਮ ਕਰ ਦਿੰਦਾ ਹੈ ਜੋ ਪਹਿਲਾਂ ਮਹਿੰਗੀਆਂ ਗਲਤੀਆਂ ਦਾ ਕਾਰਨ ਬਣਦਾ ਸੀ। ਸਾਰਾਹ ਹੁਣ ਸਿਰਫ਼ ਲੋਕਾਂ ਦੀ ਮੈਨੇਜਰ ਨਹੀਂ ਹੈ; ਉਹ ਮਸ਼ੀਨ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੇ ਵਿਕਲਪਾਂ ਦੀ ਕਿਊਰੇਟਰ (curator) ਹੈ।

BotNews.today ਸਮੱਗਰੀ ਦੀ ਖੋਜ, ਲਿਖਣ, ਸੰਪਾਦਨ ਅਤੇ ਅਨੁਵਾਦ ਕਰਨ ਲਈ AI ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਸਾਡੀ ਟੀਮ ਜਾਣਕਾਰੀ ਨੂੰ ਉਪਯੋਗੀ, ਸਪਸ਼ਟ ਅਤੇ ਭਰੋਸੇਮੰਦ ਰੱਖਣ ਲਈ ਪ੍ਰਕਿਰਿਆ ਦੀ ਸਮੀਖਿਆ ਅਤੇ ਨਿਗਰਾਨੀ ਕਰਦੀ ਹੈ।

ਇਹ ਉਸਨੂੰ ਉਸ ਰਫ਼ਤਾਰ ਨਾਲ ਵਿਚਾਰਾਂ ‘ਤੇ ਕੰਮ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ ਜੋ ਪਹਿਲਾਂ ਅਸੰਭਵ ਸੀ। ਉਹ ਦੁਪਹਿਰ ਦੇ ਖਾਣੇ ਤੋਂ ਪਹਿਲਾਂ ਪੰਜਾਹ ਵੱਖ-ਵੱਖ ਲਾਈਟਿੰਗ ਸੈੱਟਅੱਪਾਂ ਦੀ ਜਾਂਚ ਕਰ ਸਕਦੀ ਹੈ ਅਤੇ ਆਪਣੀ ਟੀਮ ਨੂੰ ਸਭ ਤੋਂ ਵਧੀਆ ਤਿੰਨ ਪੇਸ਼ ਕਰ ਸਕਦੀ ਹੈ।

ਵਰਕਫਲੋ ਆਮ ਤੌਰ ‘ਤੇ ਸੁਧਾਰ ਦੇ ਇੱਕ ਖਾਸ ਪੈਟਰਨ ਦੀ ਪਾਲਣਾ ਕਰਦਾ ਹੈ। ਸਾਰਾਹ ਆਮ ਰਚਨਾ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਇੱਕ ਟੈਕਸਟ ਪ੍ਰੋਂਪਟ ਨਾਲ ਸ਼ੁਰੂਆਤ ਕਰਦੀ ਹੈ। ਫਿਰ ਉਹ ਸ਼ਾਟਸ ਵਿੱਚ ਇਕਸਾਰਤਾ ਬਣਾਈ ਰੱਖਣ ਲਈ ਇਮੇਜ-ਟੂ-ਵੀਡੀਓ ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਦੀ ਹੈ। ਅੰਤ ਵਿੱਚ, ਉਹ ਖਾਸ ਗਲਤੀਆਂ ਨੂੰ ਠੀਕ ਕਰਨ ਲਈ ਰੀਜਨਲ ਪ੍ਰੋਂਪਟਿੰਗ (regional prompting) ਦੀ ਵਰਤੋਂ ਕਰਦੀ ਹੈ, ਜਿਵੇਂ ਕਿ ਇੱਕ ਫਲਿੱਕਰ ਕਰਦਾ ਲੋਗੋ ਜਾਂ ਵਿਗੜਿਆ ਹੋਇਆ ਹੱਥ। ਇਹ ਪ੍ਰਕਿਰਿਆ ਸਿਰਫ਼ ਇੱਕ ਬਟਨ ਕਲਿੱਕ ਕਰਨ ਜਿੰਨੀ ਸੌਖੀ ਨਹੀਂ ਹੈ। ਇਸ ਲਈ ਮਾਡਲ ਨੂੰ ਗਾਈਡ ਕਰਨ ਦੀ ਡੂੰਘੀ ਸਮਝ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਹੁਣ ਹੁਨਰ ਡਰਾਇੰਗ ਬਣਾਉਣ ਵਿੱਚ ਨਹੀਂ, ਬਲਕਿ ਹਦਾਇਤਾਂ ਦੀ ਸ਼ੁੱਧਤਾ ਵਿੱਚ ਹੈ। ਪੇਸ਼ੇਵਰ ਇਸੇ ਸਿਗਨਲ ਨੂੰ ਫਾਲੋ ਕਰ ਰਹੇ ਹਨ। ਉਹ ਇਹ ਨਹੀਂ ਚਾਹੁੰਦੇ ਕਿ AI ਉਹਨਾਂ ਦਾ ਕੰਮ ਕਰੇ; ਉਹ ਚਾਹੁੰਦੇ ਹਨ ਕਿ ਇਹ ਦੁਹਰਾਉਣ ਵਾਲੇ ਕੰਮਾਂ ਨੂੰ ਸੰਭਾਲੇ ਤਾਂ ਜੋ ਉਹ ਉੱਚ-ਪੱਧਰੀ ਰਚਨਾਤਮਕ ਫੈਸਲਿਆਂ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰ ਸਕਣ। ਉਹ ਉਤਪਾਦ ਜੋ ਇਸ ਦਲੀਲ ਨੂੰ ਸੱਚ ਸਾਬਤ ਕਰਦੇ ਹਨ, ਉਹ ਹਨ ਜੋ ਸਭ ਤੋਂ ਵੱਧ ਕੰਟਰੋਲ ਪੇਸ਼ ਕਰਦੇ ਹਨ, ਨਾ ਕਿ ਸਿਰਫ਼ ਵਧੀਆ ਦਿਖਣ ਵਾਲੀ ਆਉਟਪੁੱਟ।

ਡੌਲੀ ਅਤੇ ਪੈਨ ਵਰਗੀਆਂ ਖਾਸ ਕੈਮਰਾ ਮੂਵਮੈਂਟਸ ਲਈ ਪ੍ਰੋਂਪਟ ਇੰਜੀਨੀਅਰਿੰਗ।
ਵੱਖ-ਵੱਖ ਸੀਨਾਂ ਵਿੱਚ ਪਾਤਰਾਂ ਦੀ ਇਕਸਾਰਤਾ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਸੀਡ ਨੰਬਰਾਂ (seed numbers) ਦੀ ਵਰਤੋਂ ਕਰਨਾ।
ਸਿੰਥੈਟਿਕ ਕਲਿੱਪਾਂ ਨੂੰ Premiere ਜਾਂ Resolve ਵਰਗੇ ਰਵਾਇਤੀ ਐਡੀਟਿੰਗ ਸੌਫਟਵੇਅਰ ਵਿੱਚ ਜੋੜਨਾ।
ਵਿਸ਼ੇਸ਼ AI ਐਨਹਾਂਸਮੈਂਟ ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਘੱਟ-ਰੈਜ਼ੋਲਿਊਸ਼ਨ ਵਾਲੀਆਂ ਜਨਰੇਸ਼ਨਾਂ ਨੂੰ ਅੱਪਸਕੇਲ ਕਰਨਾ।
ਕਿਸੇ ਖਾਸ ਬ੍ਰਾਂਡ ਦੇ ਸੁਹਜ ਨਾਲ ਮੇਲ ਕਰਨ ਲਈ ਸਟਾਈਲ ਟ੍ਰਾਂਸਫਰ ਲਾਗੂ ਕਰਨਾ।

ਬੇਅੰਤ ਚਿੱਤਰਾਂ ਦਾ ਨੈਤਿਕ ਕਰਜ਼ਾ

ਜਿਵੇਂ ਕਿ ਅਸੀਂ ਇਹਨਾਂ ਟੂਲਸ ਨੂੰ ਅਪਣਾਉਂਦੇ ਹਾਂ, ਸਾਨੂੰ ਲੁਕੀਆਂ ਹੋਈਆਂ ਲਾਗਤਾਂ ਬਾਰੇ ਮੁਸ਼ਕਲ ਸਵਾਲ ਪੁੱਛਣੇ ਚਾਹੀਦੇ ਹਨ। ਪਹਿਲਾ ਵਾਤਾਵਰਣ ‘ਤੇ ਪ੍ਰਭਾਵ ਹੈ। ਇੱਕ ਸਿੰਗਲ ਵੱਡੇ ਪੱਧਰ ਦੇ ਵੀਡੀਓ ਮਾਡਲ ਨੂੰ ਟ੍ਰੇਨ ਕਰਨ ਲਈ ਮਹੀਨਿਆਂ ਤੱਕ ਚੱਲਣ ਵਾਲੇ ਹਜ਼ਾਰਾਂ ਹਾਈ-ਐਂਡ GPUs ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਹ ਬਹੁਤ ਜ਼ਿਆਦਾ ਬਿਜਲੀ ਦੀ ਖਪਤ ਕਰਦਾ ਹੈ ਅਤੇ ਡੇਟਾ ਸੈਂਟਰਾਂ ਨੂੰ ਠੰਡਾ ਕਰਨ ਲਈ ਲੱਖਾਂ ਗੈਲਨ ਪਾਣੀ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਸ ਵਾਤਾਵਰਣ ਦੇ ਕਰਜ਼ੇ ਦਾ ਭੁਗਤਾਨ ਕੌਣ ਕਰਦਾ ਹੈ? ਹਾਲਾਂਕਿ ਕੰਪਨੀਆਂ ਅਕਸਰ ਦਾਅਵਾ ਕਰਦੀਆਂ ਹਨ ਕਿ ਉਹ ਕਾਰਬਨ ਨਿਊਟਰਲ ਹਨ, ਪਰ ਊਰਜਾ ਦੀ ਮੰਗ ਦਾ ਪੈਮਾਨਾ ਸਥਾਨਕ ਪਾਵਰ ਗਰਿੱਡਾਂ ਲਈ ਇੱਕ ਚੁਣੌਤੀ ਹੈ। ਸਾਨੂੰ ਉਹਨਾਂ ਵਿਅਕਤੀਆਂ ਦੀ ਪ੍ਰਾਈਵੇਸੀ ‘ਤੇ ਵੀ ਵਿਚਾਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਦੇ ਡੇਟਾ ਦੀ ਵਰਤੋਂ ਟ੍ਰੇਨਿੰਗ ਲਈ ਕੀਤੀ ਗਈ ਸੀ। ਇਹਨਾਂ ਵਿੱਚੋਂ ਜ਼ਿਆਦਾਤਰ ਮਾਡਲ ਜਨਤਕ ਇੰਟਰਨੈੱਟ ਨੂੰ ਸਕ੍ਰੈਪ ਕਰਕੇ ਬਣਾਏ ਗਏ ਸਨ। ਕੀ ਕਿਸੇ ਵਿਅਕਤੀ ਦਾ ਆਪਣੀ ਦਿੱਖ ‘ਤੇ ਅਧਿਕਾਰ ਹੈ ਜੇਕਰ ਇਸਨੂੰ ਅਰਬਾਂ ਗਣਿਤਿਕ ਪੈਰਾਮੀਟਰਾਂ ਵਿੱਚ ਬਦਲ ਦਿੱਤਾ ਗਿਆ ਹੈ?

ਕੀ ਤੁਹਾਡੇ ਕੋਲ ਕੋਈ AI ਕਹਾਣੀ, ਟੂਲ, ਰੁਝਾਨ ਜਾਂ ਸਵਾਲ ਹੈ ਜੋ ਤੁਹਾਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ ਸਾਨੂੰ ਕਵਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ? ਸਾਨੂੰ ਆਪਣਾ ਲੇਖ ਦਾ ਵਿਚਾਰ ਭੇਜੋ — ਅਸੀਂ ਇਸਨੂੰ ਸੁਣਨਾ ਪਸੰਦ ਕਰਾਂਗੇ।

ਮਾਡਲ ਕੋਲੈਪਸ (model collapse) ਦਾ ਖਤਰਾ ਵੀ ਹੈ। ਜੇਕਰ ਇੰਟਰਨੈੱਟ AI ਦੁਆਰਾ ਤਿਆਰ ਵੀਡੀਓਜ਼ ਨਾਲ ਭਰ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਭਵਿੱਖ ਦੇ ਮਾਡਲਾਂ ਨੂੰ ਮੌਜੂਦਾ ਮਾਡਲਾਂ ਦੀ ਆਉਟਪੁੱਟ ‘ਤੇ ਟ੍ਰੇਨ ਕੀਤਾ ਜਾਵੇਗਾ। ਇਹ ਇੱਕ ਫੀਡਬੈਕ ਲੂਪ ਬਣਾਉਂਦਾ ਹੈ ਜਿੱਥੇ ਗਲਤੀਆਂ ਵਧ ਜਾਂਦੀਆਂ ਹਨ ਅਤੇ ਮੂਲ ਮਨੁੱਖੀ ਰਚਨਾਤਮਕਤਾ ਘਟ ਜਾਂਦੀ ਹੈ। ਅਸੀਂ ਇੱਕ ਅਜਿਹੇ ਬਿੰਦੂ ‘ਤੇ ਪਹੁੰਚ ਸਕਦੇ ਹਾਂ ਜਿੱਥੇ ਮਸ਼ੀਨਾਂ ਭੌਤਿਕ ਸੰਸਾਰ ਤੋਂ ਕਿਸੇ ਨਵੇਂ ਇਨਪੁਟ ਦੇ ਬਿਨਾਂ ਸਿਰਫ਼ ਉਹੀ ਪੁਰਾਣੇ ਤਰੀਕਿਆਂ ਨੂੰ ਰੀਮਿਕਸ ਕਰ ਰਹੀਆਂ ਹੋਣਗੀਆਂ। ਇਹ ਅਮਲ ਵਿੱਚ “ਡੇਡ ਇੰਟਰਨੈੱਟ” (dead internet) ਥਿਊਰੀ ਹੈ। ਜੇਕਰ ਅਸੀਂ ਮਨੁੱਖੀ ਸਿਗਨਲ ਅਤੇ ਮਸ਼ੀਨ ਦੀ ਗੂੰਜ ਵਿੱਚ ਫਰਕ ਨਹੀਂ ਕਰ ਸਕਦੇ, ਤਾਂ ਵਿਜ਼ੂਅਲ ਜਾਣਕਾਰੀ ਦੀ ਕੀਮਤ ਜ਼ੀਰੋ ਹੋ ਜਾਂਦੀ ਹੈ। ਸਾਨੂੰ ਹੁਣੇ ਫੈਸਲਾ ਕਰਨਾ ਪਵੇਗਾ ਕਿ ਅਸੀਂ ਕਿਸ ਤਰ੍ਹਾਂ ਦੇ ਡਿਜੀਟਲ ਵਾਤਾਵਰਣ ਵਿੱਚ ਰਹਿਣਾ ਚਾਹੁੰਦੇ ਹਾਂ ਇਸ ਤੋਂ ਪਹਿਲਾਂ ਕਿ ਸ਼ੋਰ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹੋ ਜਾਵੇ। ਕੀ ਤੁਰੰਤ ਸਮੱਗਰੀ ਦੀ ਸਹੂਲਤ ਪ੍ਰਮਾਣਿਤ ਹਕੀਕਤ ਦੇ ਨੁਕਸਾਨ ਦੇ ਯੋਗ ਹੈ?

ਆਰਕੀਟੈਕਚਰ ਅਤੇ ਲੋਕਲ ਕੰਪਿਊਟ ਦੀਆਂ ਸੀਮਾਵਾਂ

ਪਾਵਰ ਯੂਜ਼ਰ ਲਈ, ਫੋਕਸ ਕਲਾਉਡ-ਅਧਾਰਤ ਖਿਡੌਣਿਆਂ ਤੋਂ ਲੋਕਲ ਵਰਕਫਲੋ ਏਕੀਕਰਣ ਵੱਲ ਤਬਦੀਲ ਹੋ ਗਿਆ ਹੈ। ਜ਼ਿਆਦਾਤਰ ਹਾਈ-ਐਂਡ ਵੀਡੀਓ ਮਾਡਲ ਵਰਤਮਾਨ ਵਿੱਚ ਭਾਰੀ VRAM ਲੋੜਾਂ ਕਾਰਨ ਵੱਡੇ ਸਰਵਰ ਕਲੱਸਟਰਾਂ ‘ਤੇ ਚੱਲਦੇ ਹਨ। ਇੱਕ ਸਟੈਂਡਰਡ ਡਿਫਿਊਜ਼ਨ ਟ੍ਰਾਂਸਫਾਰਮਰ (DiT) ਆਰਕੀਟੈਕਚਰ ਨੂੰ ਅਕਸਰ ਇੱਕ ਵਾਜਬ ਸਮੇਂ ਵਿੱਚ ਸਿੰਗਲ 1080p ਕਲਿੱਪ ਬਣਾਉਣ ਲਈ 80GB ਤੋਂ ਵੱਧ ਮੈਮੋਰੀ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਹਾਲਾਂਕਿ, ਕਮਿਊਨਿਟੀ ਕੁਆਂਟਾਈਜ਼ੇਸ਼ਨ (quantization) ਅਤੇ ਮਾਡਲ ਡਿਸਟਿਲੇਸ਼ਨ ਵਿੱਚ ਤਰੱਕੀ ਕਰ ਰਹੀ ਹੈ। ਇਹ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ NVIDIA 4090 ਵਰਗੇ ਕੰਜ਼ਿਊਮਰ ਹਾਰਡਵੇਅਰ ‘ਤੇ ਇਹਨਾਂ ਮਾਡਲਾਂ ਦੇ ਛੋਟੇ ਸੰਸਕਰਣ ਚਲਾਉਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ। ਹਾਲਾਂਕਿ ਕੁਆਲਿਟੀ ਘੱਟ ਹੈ, ਪਰ ਪ੍ਰਤੀ-ਮਿੰਟ API ਫੀਸਾਂ ਦਾ ਭੁਗਤਾਨ ਕੀਤੇ ਬਿਨਾਂ ਕੰਮ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਸੁਤੰਤਰ ਕ੍ਰਿਏਟਰਾਂ ਲਈ ਇੱਕ ਵੱਡਾ ਫਾਇਦਾ ਹੈ। ਤੁਸੀਂ NVIDIA Research ਅਤੇ ਸਮਾਨ ਸੰਸਥਾਵਾਂ ਵਿੱਚ ਇਹਨਾਂ ਸੁਧਾਰਾਂ ਦੇ ਪਿੱਛੇ ਦੀ ਖੋਜ ਦੇਖ ਸਕਦੇ ਹੋ।

ਵਰਕਫਲੋ ਏਕੀਕਰਣ ਮੌਜੂਦਾ ਸਮੇਂ ਵਿੱਚ ਸਭ ਤੋਂ ਵੱਡੀ ਰੁਕਾਵਟ ਹੈ। ਜ਼ਿਆਦਾਤਰ ਪੇਸ਼ੇਵਰ ਵੈੱਬ ਇੰਟਰਫੇਸ ਦੀ ਵਰਤੋਂ ਨਹੀਂ ਕਰਨਾ ਚਾਹੁੰਦੇ। ਉਹ ਆਪਣੇ ਮੌਜੂਦਾ ਟੂਲਸ ਲਈ ਪਲੱਗਇਨ ਚਾਹੁੰਦੇ ਹਨ। ਅਸੀਂ ComfyUI ਅਤੇ ਹੋਰ ਨੋਡ-ਬੇਸਡ ਇੰਟਰਫੇਸਾਂ ਦਾ ਉਭਾਰ ਦੇਖ ਰਹੇ ਹਾਂ ਜੋ ਗੁੰਝਲਦਾਰ, ਦੁਹਰਾਉਣ ਯੋਗ ਪਾਈਪਲਾਈਨਾਂ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੇ ਹਨ। ਇਹ ਸਿਸਟਮ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਕਈ ਮਾਡਲਾਂ ਨੂੰ ਇਕੱਠੇ ਜੋੜਨ ਦਿੰਦੇ ਹਨ। ਉਦਾਹਰਨ ਲਈ, ਇੱਕ ਮਾਡਲ ਮੋਸ਼ਨ ਨੂੰ ਸੰਭਾਲਦਾ ਹੈ, ਦੂਜਾ ਟੈਕਸਟਚਰ ਨੂੰ, ਅਤੇ ਤੀਜਾ ਲਾਈਟਿੰਗ ਨੂੰ। ਇਹ ਮਾਡਿਊਲਰ ਪਹੁੰਚ ਇੱਕ ਸਿੰਗਲ “ਬਲੈਕ ਬਾਕਸ” ਪ੍ਰੋਂਪਟ ਨਾਲੋਂ ਕਿਤੇ ਜ਼ਿਆਦਾ ਸ਼ਕਤੀਸ਼ਾਲੀ ਹੈ। ਇਹ API ਸੀਮਾਵਾਂ ਦੇ ਬਿਹਤਰ ਪ੍ਰਬੰਧਨ ਦੀ ਵੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ। ਫੁੱਲ ਜਨਰੇਸ਼ਨ ‘ਤੇ ਕ੍ਰੈਡਿਟ ਬਰਬਾਦ ਕਰਨ ਦੀ ਬਜਾਏ, ਇੱਕ ਉਪਭੋਗਤਾ ਲੋਕਲ ਤੌਰ ‘ਤੇ ਘੱਟ-ਰੈਜ਼ੋਲਿਊਸ਼ਨ ਵਾਲਾ ਪ੍ਰੀਵਿਊ ਬਣਾ ਸਕਦਾ ਹੈ ਅਤੇ ਸਿਰਫ਼ ਅੱਪਸਕੇਲਿੰਗ ਲਈ ਫਾਈਨਲ ਵਰਜ਼ਨ ਕਲਾਉਡ ‘ਤੇ ਭੇਜ ਸਕਦਾ ਹੈ। ਇਹ ਹਾਈਬ੍ਰਿਡ ਪਹੁੰਚ ਪ੍ਰੋਫੈਸ਼ਨਲ AI ਵੀਡੀਓ ਪ੍ਰੋਡਕਸ਼ਨ ਦਾ ਭਵਿੱਖ ਹੈ।

ਵੀਡੀਓ ਮਾਡਲਾਂ ਦੇ ਲੋਕਲ 8-ਬਿਟ ਕੁਆਂਟਾਈਜ਼ੇਸ਼ਨ ਲਈ VRAM ਲੋੜਾਂ।
ਕਲਾਉਡ APIs ਤੋਂ ਹਾਈ-ਬਿਟਰੇਟ ਵੀਡੀਓ ਸਟ੍ਰੀਮ ਕਰਨ ਵੇਲੇ ਲੇਟੈਂਸੀ (latency) ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ।
ਹਾਈ-ਫਿਡੇਲਿਟੀ ਲੈਟੈਂਟ ਡੇਟਾਸੈਟਸ ਅਤੇ ਚੈੱਕਪੁਆਇੰਟਾਂ ਲਈ ਸਟੋਰੇਜ ਦੀਆਂ ਮੰਗਾਂ।
ਮੋਸ਼ਨ ਸਟਾਈਲ ਨੂੰ ਫਾਈਨ-ਟਿਊਨ ਕਰਨ ਵਿੱਚ LoRA (Low-Rank Adaptation) ਦੀ ਭੂਮਿਕਾ।
3D ਵਾਤਾਵਰਣ ਏਕੀਕਰਣ ਲਈ OpenUSD ਨਾਲ ਅਨੁਕੂਲਤਾ।

ਸਾਰਥਕ ਤਰੱਕੀ ਦਾ ਪੈਮਾਨਾ

ਅਗਲੇ ਇੱਕ ਸਾਲ ਵਿੱਚ, ਤਰੱਕੀ ਦਾ ਪੈਮਾਨਾ ਇਹ ਨਹੀਂ ਹੋਵੇਗਾ ਕਿ ਵੀਡੀਓ ਕਿੰਨੀ ਸੁੰਦਰ ਦਿਖਾਈ ਦਿੰਦੀ ਹੈ। ਇਹ ਟੈਂਪੋਰਲ ਕੰਸਿਸਟੈਂਸੀ (temporal consistency) ਹੋਵੇਗੀ। ਜੇਕਰ ਕੋਈ ਪਾਤਰ ਦਰੱਖਤ ਦੇ ਪਿੱਛੇ ਜਾ ਸਕਦਾ ਹੈ ਅਤੇ ਉਸੇ ਕੱਪੜਿਆਂ ਅਤੇ ਉਸੇ ਚਿਹਰੇ ਦੇ ਨੈਣ-ਨਕਸ਼ਾਂ ਨਾਲ ਦੂਜੇ ਪਾਸੇ ਤੋਂ ਬਾਹਰ ਆ ਸਕਦਾ ਹੈ, ਤਾਂ ਟੈਕਨਾਲੋਜੀ ਪਰਿਪੱਕਤਾ ਦੇ ਇੱਕ ਨਵੇਂ ਪੱਧਰ ‘ਤੇ ਪਹੁੰਚ ਗਈ ਹੈ। ਅਸੀਂ ਉਸ “ਡ੍ਰੀਮ ਲੌਜਿਕ” (dream logic) ਦੇ ਅੰਤ ਦੀ ਤਲਾਸ਼ ਕਰ ਰਹੇ ਹਾਂ ਜਿੱਥੇ ਚੀਜ਼ਾਂ ਬਿਨਾਂ ਕਿਸੇ ਕਾਰਨ ਦੇ ਇੱਕ ਦੂਜੇ ਵਿੱਚ ਬਦਲ ਜਾਂਦੀਆਂ ਹਨ। ਸਾਰਥਕ ਤਰੱਕੀ ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਮਸ਼ੀਨ ਇੱਕ ਮਨੁੱਖੀ ਕੈਮਰਾ ਕਰੂ ਵਾਂਗ ਹੀ ਸ਼ੁੱਧਤਾ ਨਾਲ ਸਕ੍ਰਿਪਟ ਦੀ ਪਾਲਣਾ ਕਰ ਸਕਦੀ ਹੈ। ਇਹ ਵਿਸ਼ਾ ਵਿਕਸਿਤ ਹੁੰਦਾ ਰਹੇਗਾ ਕਿਉਂਕਿ ਅਸੀਂ ਅਜੇ ਵੀ ਇਹ ਪਤਾ ਲਗਾ ਰਹੇ ਹਾਂ ਕਿ ਇਹਨਾਂ ਮਾਡਲਾਂ ਨੂੰ ਸਮੇਂ ਅਤੇ ਸਥਿਰਤਾ ਦਾ ਅਹਿਸਾਸ ਕਿਵੇਂ ਕਰਵਾਉਣਾ ਹੈ। ਖੁੱਲ੍ਹਾ ਸਵਾਲ ਅਜੇ ਵੀ ਬਾਕੀ ਹੈ: ਕੀ ਕੋਈ ਮਸ਼ੀਨ ਕਦੇ ਕਿਸੇ ਪਲ ਦੀ ਅਹਿਮੀਅਤ ਨੂੰ ਸੱਚਮੁੱਚ ਸਮਝ ਸਕਦੀ ਹੈ, ਜਾਂ ਕੀ ਇਹ ਹਮੇਸ਼ਾ ਪਿਕਸਲ ਦੀ *ਪ੍ਰਮਾਣਿਤ ਤਰੱਕੀ* ਦੀ ਮਾਸਟਰ ਹੀ ਰਹੇਗੀ? ਸਿਰਫ਼ ਸਮਾਂ ਹੀ ਦੱਸੇਗਾ ਕਿ ਅਸੀਂ ਕ੍ਰਿਏਟਰਾਂ ਲਈ ਇੱਕ ਟੂਲ ਬਣਾ ਰਹੇ ਹਾਂ ਜਾਂ ਉਹਨਾਂ ਦਾ ਬਦਲ।

সম্পাদকের মন্তব্য: আমরা এই সাইটটি একটি বহুভাষিক এআই সংবাদ এবং নির্দেশিকা কেন্দ্র হিসাবে তৈরি করেছি তাদের জন্য যারা কম্পিউটার বিশেষজ্ঞ নন, কিন্তু তবুও কৃত্রিম বুদ্ধিমত্তা বুঝতে চান, এটিকে আরও আত্মবিশ্বাসের সাথে ব্যবহার করতে চান এবং যে ভবিষ্যত ইতিমধ্যেই আসছে, তা অনুসরণ করতে চান।

ਕੋਈ ਗਲਤੀ ਮਿਲੀ ਜਾਂ ਕੁਝ ਠੀਕ ਕਰਨ ਦੀ ਲੋੜ ਹੈ? ਸਾਨੂੰ ਦੱਸੋ।

Frequently Asked Questions

ਪਾਠਕ “ਡੈਮੋ” ਲੇਖਾਂ ਨੂੰ ਅਮਲ ਵਿੱਚ ਕਿਵੇਂ ਵਰਤ ਸਕਦੇ ਹਨ?

AI ਟੂਲਸ ਦੇ ਅਸਲ-ਸੰਸਾਰ ਪ੍ਰਦਰਸ਼ਨਾਂ, ਪ੍ਰਯੋਗਾਂ ਅਤੇ ਵਿਜ਼ੂਅਲ ਸਬੂਤਾਂ ਦੀ ਖੋਜ ਕਰੋ। ਜਾਣੋ ਕਿ AI ਟੈਕਨਾਲੋਜੀ ਅਸਲ ਹਾਲਾਤਾਂ ਵਿੱਚ ਕਿਵੇਂ ਕੰਮ ਕਰਦੀ ਹੈ। ਟੂਲਾਂ ਦੀ ਤੁਲਨਾ ਕਰਨ, ਖਤਰੇ ਸਮਝਣ, ਵਧੀਆ ਸਵਾਲ ਪੁੱਛਣ ਅਤੇ ਸਮਾਂ ਜਾਂ ਪੈਸਾ ਖਰਚਣ ਤੋਂ ਪਹਿਲਾਂ ਕੀ ਧਿਆਨ ਦੇਣ ਯੋਗ ਹੈ ਇਹ ਫੈਸਲਾ ਕਰਨ ਲਈ ਇਹ ਲੇਖ ਵਰਤੋ।

“ਇੰਟਰਵਿਊ” ਕਿਸ ਲਈ ਸਭ ਤੋਂ ਲਾਭਕਾਰੀ ਹੈ?

ਉੱਘੇ AI ਸੰਸਥਾਪਕਾਂ ਅਤੇ ਖੋਜਕਰਤਾਵਾਂ ਨਾਲ ਇੰਟਰਵਿਊ, ਮੁੱਖ ਨੁਕਤੇ ਅਤੇ ਵਿਹਾਰਕ ਵਿਸ਼ਲੇਸ਼ਣ ਦੇਖੋ। ਇਹ ਸਮੱਗਰੀ ਆਮ ਪਾਠਕਾਂ, ਛੋਟੀਆਂ ਟੀਮਾਂ, creators, ਕਾਰੋਬਾਰੀ ਮਾਲਕਾਂ, marketers, ਵਿਦਿਆਰਥੀਆਂ ਅਤੇ hype ਤੋਂ ਬਿਨਾਂ ਸਪਸ਼ਟ AI ਸੰਦਰਭ ਚਾਹੁਣ ਵਾਲਿਆਂ ਲਈ ਲਿਖੀ ਗਈ ਹੈ।