ਅੱਜ ਦੇ ਸਮੇਂ ਦਾ ਸਭ ਤੋਂ ਖਤਰਨਾਕ ਡੀਪਫੇਕ ਰੁਝਾਨ
ਵਿਜ਼ੂਅਲ ਡੀਪਫੇਕ ਦਾ ਦੌਰ ਸਿਰਫ਼ ਇੱਕ ਭਟਕਾਅ ਸੀ। ਜਦੋਂ ਲੋਕ ਵਿਸ਼ਵ ਨੇਤਾਵਾਂ ਦੀਆਂ ਜਾਅਲੀ ਵੀਡੀਓਜ਼ ਨੂੰ ਲੈ ਕੇ ਚਿੰਤਤ ਸਨ, ਉਦੋਂ ਇੱਕ ਕਿਤੇ ਜ਼ਿਆਦਾ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਅਤੇ ਅਦਿੱਖ ਖਤਰਾ ਚੁੱਪਚਾਪ ਪੈਦਾ ਹੋ ਰਿਹਾ ਸੀ। ਆਡੀਓ ਸਿੰਥੇਸਿਸ ਹੁਣ ਉੱਚ-ਮੁੱਲ ਦੀ ਧੋਖਾਧੜੀ ਅਤੇ ਰਾਜਨੀਤਿਕ ਅਸਥਿਰਤਾ ਲਈ ਮੁੱਖ ਸਾਧਨ ਬਣ ਗਿਆ ਹੈ। ਇਹ ਹੁਣ ਕਿਸੇ ਚਿਹਰੇ ਦੇ ਹਿੱਲਣ ਦੇ ਅਜੀਬ ਅਨੁਭਵ ਬਾਰੇ ਨਹੀਂ ਹੈ। ਇਹ ਕਿਸੇ ਪਰਿਵਾਰਕ ਮੈਂਬਰ ਦੀ ਜਾਣੀ-ਪਛਾਣੀ ਆਵਾਜ਼ ਜਾਂ ਕਿਸੇ ਸੀਈਓ ਦੇ ਅਧਿਕਾਰਤ ਲਹਿਜੇ ਬਾਰੇ ਹੈ। ਇਹ ਤਬਦੀਲੀ ਮਹੱਤਵਪੂਰਨ ਹੈ ਕਿਉਂਕਿ ਆਡੀਓ ਨੂੰ ਵੀਡੀਓ ਨਾਲੋਂ ਘੱਟ ਬੈਂਡਵਿਡਥ, ਘੱਟ ਪ੍ਰੋਸੈਸਿੰਗ ਪਾਵਰ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਅਤੇ ਇਹ ਵਧੇਰੇ ਭਾਵਨਾਤਮਕ ਭਾਰ ਰੱਖਦਾ ਹੈ। ਇੱਕ ਅਜਿਹੀ ਦੁਨੀਆ ਵਿੱਚ ਜਿੱਥੇ ਅਸੀਂ ਵੌਇਸ ਬਾਇਓਮੈਟ੍ਰਿਕਸ ਜਾਂ ਤੇਜ਼ ਫ਼ੋਨ ਕਾਲਾਂ ਰਾਹੀਂ ਆਪਣੀ ਪਛਾਣ ਦੀ ਪੁਸ਼ਟੀ ਕਰਦੇ ਹਾਂ, ਤਿੰਨ ਸਕਿੰਟਾਂ ਦੀ ਸਮੱਗਰੀ ਨਾਲ ਕਿਸੇ ਇਨਸਾਨ ਦੀ ਆਵਾਜ਼ ਨੂੰ ਕਲੋਨ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਨੇ ਆਧੁਨਿਕ ਸੰਚਾਰ ਪ੍ਰਣਾਲੀ ਦੇ ਬੁਨਿਆਦੀ ਭਰੋਸੇ ਨੂੰ ਤੋੜ ਦਿੱਤਾ ਹੈ। ਅਸੀਂ ਸਿਨੇਮੈਟਿਕ ਚਾਲਾਂ ਤੋਂ ਦੂਰ ਹੋ ਕੇ ਵਿਹਾਰਕ, ਉੱਚ-ਦਾਅ ਵਾਲੀ ਧੋਖਾਧੜੀ ਵੱਲ ਵਧ ਰਹੇ ਹਾਂ ਜੋ ਕਾਰਪੋਰੇਸ਼ਨਾਂ ਦੀਆਂ ਜੇਬਾਂ ਅਤੇ ਆਮ ਲੋਕਾਂ ਦੇ ਨਰਵਸ ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਉਂਦੀ ਹੈ। ਇਹ ਸਮੱਸਿਆ ਇੱਕ ਸਾਲ ਪਹਿਲਾਂ ਨਾਲੋਂ ਹੁਣ ਵਧੇਰੇ ਗੰਭੀਰ ਲੱਗਦੀ ਹੈ ਕਿਉਂਕਿ ਟੂਲਸ ਪ੍ਰਯੋਗਾਤਮਕ ਲੈਬਾਂ ਤੋਂ ਨਿਕਲ ਕੇ ਆਸਾਨ ਕਲਾਊਡ ਇੰਟਰਫੇਸਾਂ ਤੱਕ ਪਹੁੰਚ ਗਏ ਹਨ।
ਸਿੰਥੈਟਿਕ ਪਛਾਣ ਦੀ ਮਕੈਨਿਕਸ
ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੀ ਵੌਇਸ ਕਲੋਨਿੰਗ ਲਈ ਤਕਨੀਕੀ ਰੁਕਾਵਟ ਖਤਮ ਹੋ ਗਈ ਹੈ। ਪਹਿਲਾਂ, ਇੱਕ ਯਕੀਨੀ ਵੋਕਲ ਰਿਪਲੀਕਾ ਬਣਾਉਣ ਲਈ ਘੰਟਿਆਂਬੱਧੀ ਸਟੂਡੀਓ-ਗੁਣਵੱਤਾ ਦੀ ਰਿਕਾਰਡਿੰਗ ਅਤੇ ਕਾਫ਼ੀ ਕੰਪਿਊਟ ਸਮੇਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਸੀ। ਅੱਜ, ਇੱਕ ਧੋਖੇਬਾਜ਼ ਕਿਸੇ ਵਿਅਕਤੀ ਦੀ ਆਵਾਜ਼ ਨੂੰ ਇੱਕ ਛੋਟੀ ਸੋਸ਼ਲ ਮੀਡੀਆ ਕਲਿੱਪ ਜਾਂ ਰਿਕਾਰਡ ਕੀਤੇ ਵੈਬਿਨਾਰ ਤੋਂ ਚੋਰੀ ਕਰ ਸਕਦਾ ਹੈ। ਆਧੁਨਿਕ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਜ਼ੀਰੋ-ਸ਼ਾਟ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ ਨਾਮਕ ਪ੍ਰਕਿਰਿਆ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ। ਇਹ ਇੱਕ ਮਾਡਲ ਨੂੰ ਕਿਸੇ ਵਿਅਕਤੀ ‘ਤੇ ਦਿਨਾਂ ਤੱਕ ਸਿਖਲਾਈ ਦਿੱਤੇ ਬਿਨਾਂ ਉਸਦੇ ਲਹਿਜੇ, ਪਿੱਚ ਅਤੇ ਭਾਵਨਾਤਮਕ ਉਤਰਾਅ-ਚੜ੍ਹਾਅ ਨੂੰ ਅਪਣਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਨਤੀਜਾ ਇੱਕ ਡਿਜੀਟਲ ਭੂਤ ਹੈ ਜੋ ਅਸਲ ਸਮੇਂ ਵਿੱਚ ਕੁਝ ਵੀ ਕਹਿ ਸਕਦਾ ਹੈ। ਇਹ ਸਿਰਫ਼ ਇੱਕ ਰਿਕਾਰਡਿੰਗ ਨਹੀਂ ਹੈ। ਇਹ ਇੱਕ ਲਾਈਵ, ਇੰਟਰਐਕਟਿਵ ਟੂਲ ਹੈ ਜੋ ਦੋ-ਪੱਖੀ ਗੱਲਬਾਤ ਵਿੱਚ ਹਿੱਸਾ ਲੈ ਸਕਦਾ ਹੈ। ਜਦੋਂ ਵੱਡੇ ਲੈਂਗੂਏਜ ਮਾਡਲਾਂ ਨਾਲ ਜੋੜਿਆ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਇਹ ਕਲੋਨ ਨਿਸ਼ਾਨਾ ਵਿਅਕਤੀ ਦੀਆਂ ਖਾਸ ਸ਼ਬਦਾਵਲੀ ਅਤੇ ਬੋਲਣ ਦੀਆਂ ਆਦਤਾਂ ਦੀ ਨਕਲ ਵੀ ਕਰ ਸਕਦੇ ਹਨ। ਇਹ ਧੋਖਾਧੜੀ ਨੂੰ ਕਿਸੇ ਅਣਜਾਣ ਸਰੋਤੇ ਲਈ ਲਗਭਗ ਅਸੰਭਵ ਬਣਾ ਦਿੰਦਾ ਹੈ ਜੋ ਇਹ ਮੰਨਦਾ ਹੈ ਕਿ ਉਹ ਕਿਸੇ ਜਾਣਕਾਰ ਨਾਲ ਰੁਟੀਨ ਗੱਲਬਾਤ ਕਰ ਰਿਹਾ ਹੈ।
ਜਨਤਕ ਧਾਰਨਾ ਅਕਸਰ ਇਸ ਹਕੀਕਤ ਤੋਂ ਪਿੱਛੇ ਰਹਿ ਜਾਂਦੀ ਹੈ। ਬਹੁਤ ਸਾਰੇ ਲੋਕ ਅਜੇ ਵੀ ਮੰਨਦੇ ਹਨ ਕਿ ਡੀਪਫੇਕ ਨੂੰ ਗਲਤੀਆਂ ਜਾਂ ਰੋਬੋਟਿਕ ਆਵਾਜ਼ਾਂ ਕਾਰਨ ਪਛਾਣਨਾ ਆਸਾਨ ਹੈ। ਇਹ ਇੱਕ ਖਤਰਨਾਕ ਗਲਤਫਹਿਮੀ ਹੈ। ਆਡੀਓ ਮਾਡਲਾਂ ਦੀ ਨਵੀਨਤਮ ਪੀੜ੍ਹੀ ਬਾਕੀ ਬਚੀਆਂ ਕਮੀਆਂ ਨੂੰ ਲੁਕਾਉਣ ਲਈ ਖਰਾਬ ਸੈਲੂਲਰ ਕਨੈਕਸ਼ਨ ਜਾਂ ਭੀੜ-ਭੜੱਕੇ ਵਾਲੇ ਕਮਰੇ ਦੀ ਆਵਾਜ਼ ਨੂੰ ਸਿਮੂਲੇਟ ਕਰ ਸਕਦੀ ਹੈ। ਸਿੰਥੈਟਿਕ ਆਡੀਓ ਦੀ ਗੁਣਵੱਤਾ ਨੂੰ ਜਾਣਬੁੱਝ ਕੇ ਘਟਾ ਕੇ, ਹਮਲਾਵਰ ਇਸਨੂੰ ਵਧੇਰੇ ਪ੍ਰਮਾਣਿਕ ਮਹਿਸੂਸ ਕਰਵਾਉਂਦੇ ਹਨ। ਇਹ ਮੌਜੂਦਾ ਸੰਕਟ ਦਾ ਮੂਲ ਹੈ। ਅਸੀਂ AI ਦੇ ਸੰਕੇਤ ਵਜੋਂ ਸੰਪੂਰਨਤਾ ਦੀ ਭਾਲ ਕਰ ਰਹੇ ਹਾਂ, ਪਰ ਸਭ ਤੋਂ ਖਤਰਨਾਕ ਫੇਕ ਉਹ ਹਨ ਜੋ ਅਪੂਰਣਤਾ ਨੂੰ ਅਪਣਾਉਂਦੇ ਹਨ। ਉਦਯੋਗ ਉਸ ਗਤੀ ਨਾਲ ਅੱਗੇ ਵਧ ਰਿਹਾ ਹੈ ਜਿਸਦਾ ਮੁਕਾਬਲਾ ਨੀਤੀ ਨਹੀਂ ਕਰ ਸਕਦੀ। ਜਦੋਂ ਕਿ ਖੋਜਕਰਤਾ ਵਾਟਰਮਾਰਕਿੰਗ ਤਕਨੀਕਾਂ ਵਿਕਸਿਤ ਕਰ ਰਹੇ ਹਨ, ਓਪਨ-ਸੋਰਸ ਕਮਿਊਨਿਟੀ ਅਜਿਹੇ ਮਾਡਲ ਜਾਰੀ ਕਰ ਰਹੀ ਹੈ ਜੋ ਸਥਾਨਕ ਤੌਰ ‘ਤੇ ਚਲਾਏ ਜਾ ਸਕਦੇ ਹਨ, ਕਿਸੇ ਵੀ ਸੁਰੱਖਿਆ ਫਿਲਟਰ ਜਾਂ ਨੈਤਿਕ ਰੁਕਾਵਟਾਂ ਨੂੰ ਬਾਈਪਾਸ ਕਰਦੇ ਹੋਏ। ਜਨਤਾ ਕੀ ਉਮੀਦ ਕਰਦੀ ਹੈ ਅਤੇ ਤਕਨਾਲੋਜੀ ਕੀ ਕਰ ਸਕਦੀ ਹੈ, ਇਸ ਵਿਚਕਾਰ ਇਹ ਅੰਤਰ ਉਹ ਮੁੱਖ ਪਾੜਾ ਹੈ ਜਿਸਦਾ ਅਪਰਾਧੀ ਹੁਣ ਉੱਚ ਕੁਸ਼ਲਤਾ ਨਾਲ ਫਾਇਦਾ ਉਠਾ ਰਹੇ ਹਨ।
ਕਲਾਊਡ-ਅਧਾਰਿਤ ਧੋਖਾਧੜੀ ਦੀ ਭੂ-ਰਾਜਨੀਤੀ
ਇਸ ਤਕਨਾਲੋਜੀ ‘ਤੇ ਸ਼ਕਤੀ ਕੁਝ ਖਾਸ ਹੱਥਾਂ ਵਿੱਚ ਕੇਂਦਰਿਤ ਹੈ। ਜ਼ਿਆਦਾਤਰ ਪ੍ਰਮੁੱਖ ਆਡੀਓ ਸਿੰਥੇਸਿਸ ਪਲੇਟਫਾਰਮ ਸੰਯੁਕਤ ਰਾਜ ਵਿੱਚ ਅਧਾਰਤ ਹਨ, ਜੋ ਸਿਲੀਕਾਨ ਵੈਲੀ ਦੁਆਰਾ ਪ੍ਰਦਾਨ ਕੀਤੀ ਗਈ ਵਿਸ਼ਾਲ ਪੂੰਜੀ ਅਤੇ ਕਲਾਊਡ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ‘ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹਨ। ਇਹ ਇੱਕ ਵਿਲੱਖਣ ਤਣਾਅ ਪੈਦਾ ਕਰਦਾ ਹੈ। ਜਦੋਂ ਕਿ ਅਮਰੀਕੀ ਸਰਕਾਰ AI ਸੁਰੱਖਿਆ ਲਈ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ ਤਿਆਰ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੀ ਹੈ, ਇਹਨਾਂ ਕੰਪਨੀਆਂ ਦੀ ਉਦਯੋਗਿਕ ਗਤੀ ਇੱਕ ਗਲੋਬਲ ਮਾਰਕੀਟ ਦੁਆਰਾ ਚਲਾਈ ਜਾਂਦੀ ਹੈ ਜੋ ਵਧੇਰੇ ਯਥਾਰਥਵਾਦ ਅਤੇ ਘੱਟ ਲੇਟੈਂਸੀ ਦੀ ਮੰਗ ਕਰਦੀ ਹੈ। ਐਮਾਜ਼ਾਨ, ਮਾਈਕ੍ਰੋਸਾਫਟ ਅਤੇ ਗੂਗਲ ਵਰਗੀਆਂ ਕੰਪਨੀਆਂ ਦੁਆਰਾ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਕਲਾਊਡ ਕੰਟਰੋਲ ਮਤਲਬ ਹੈ ਕਿ ਉਹ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਦੁਨੀਆ ਦੇ ਸਭ ਤੋਂ ਸ਼ਕਤੀਸ਼ਾਲੀ ਧੋਖਾਧੜੀ ਦੇ ਸਾਧਨਾਂ ਦੇ ਗੇਟਕੀਪਰ ਹਨ। ਹਾਲਾਂਕਿ, ਇਹ ਪਲੇਟਫਾਰਮ ਦੁਰਵਰਤੋਂ ਲਈ ਮੁੱਖ ਨਿਸ਼ਾਨੇ ਵੀ ਹਨ। ਇੱਕ ਦੇਸ਼ ਵਿੱਚ ਇੱਕ ਧੋਖੇਬਾਜ਼ ਕਿਸੇ ਦੂਜੇ ਦੇਸ਼ ਵਿੱਚ ਪੀੜਤ ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਉਣ ਲਈ ਅਮਰੀਕਾ-ਅਧਾਰਿਤ ਕਲਾਊਡ ਸੇਵਾ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਅਧਿਕਾਰ ਖੇਤਰ ਨੂੰ ਲਾਗੂ ਕਰਨਾ ਇੱਕ ਸੁਪਨਾ ਬਣ ਜਾਂਦਾ ਹੈ। ਇਹਨਾਂ ਟੈਕ ਦਿੱਗਜਾਂ ਦੀ ਪੂੰਜੀ ਦੀ ਡੂੰਘਾਈ ਉਹਨਾਂ ਨੂੰ ਅਜਿਹੇ ਮਾਡਲ ਬਣਾਉਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੀ ਹੈ ਜੋ ਕਿਸੇ ਵੀ ਛੋਟੇ ਦੇਸ਼ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੇ ਗਏ ਕਿਸੇ ਵੀ ਚੀਜ਼ ਨਾਲੋਂ ਕਿਤੇ ਬਿਹਤਰ ਹਨ, ਫਿਰ ਵੀ ਉਹਨਾਂ ਕੋਲ ਆਪਣੇ ਸਰਵਰਾਂ ‘ਤੇ ਪੈਦਾ ਹੋਏ ਹਰ ਆਡੀਓ ਦੀ ਪੁਲਿਸਿੰਗ ਕਰਨ ਦਾ ਕਾਨੂੰਨੀ ਆਦੇਸ਼ ਨਹੀਂ ਹੈ।
ਰਾਜਨੀਤਿਕ ਹੇਰਾਫੇਰੀ ਇਸ ਤਕਨਾਲੋਜੀ ਲਈ ਅਗਲੀ ਸਰਹੱਦ ਹੈ। ਅਸੀਂ ਵਿਆਪਕ ਗਲਤ ਜਾਣਕਾਰੀ ਮੁਹਿੰਮਾਂ ਤੋਂ ਹਾਈਪਰ-ਟਾਰਗੇਟਡ ਹਮਲਿਆਂ ਵੱਲ ਤਬਦੀਲੀ ਦੇਖ ਰਹੇ ਹਾਂ। ਇੱਕ ਸਥਾਨਕ ਚੋਣ ਦੀ ਕਲਪਨਾ ਕਰੋ ਜਿੱਥੇ ਵੋਟਰਾਂ ਨੂੰ ਵੋਟਿੰਗ ਵਾਲੀ ਸਵੇਰ ਨੂੰ ਇੱਕ ਉਮੀਦਵਾਰ ਦੀ ਆਵਾਜ਼ ਵਿੱਚ ਕਾਲ ਆਉਂਦੀ ਹੈ, ਜੋ ਉਹਨਾਂ ਨੂੰ ਦੱਸਦੀ ਹੈ ਕਿ ਪੋਲਿੰਗ ਸਥਾਨ ਬਦਲ ਗਿਆ ਹੈ। ਇਸ ਲਈ ਵਾਇਰਲ ਵੀਡੀਓ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਇਸ ਲਈ ਸਿਰਫ਼ ਇੱਕ ਫ਼ੋਨ ਸੂਚੀ ਅਤੇ ਥੋੜ੍ਹੇ ਜਿਹੇ ਸਰਵਰ ਸਮੇਂ ਦੀ ਲੋੜ ਹੈ। ਇਹਨਾਂ ਹਮਲਿਆਂ ਦੀ ਗਤੀ ਉਹਨਾਂ ਨੂੰ ਖਾਸ ਤੌਰ ‘ਤੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਬਣਾਉਂਦੀ ਹੈ। ਜਦੋਂ ਤੱਕ ਕੋਈ ਮੁਹਿੰਮ ਸੁਧਾਰ ਜਾਰੀ ਕਰ ਸਕਦੀ ਹੈ, ਨੁਕਸਾਨ ਹੋ ਚੁੱਕਾ ਹੁੰਦਾ ਹੈ। ਇਹੀ ਕਾਰਨ ਹੈ ਕਿ ਇਹ ਸਮੱਸਿਆ ਪਿਛਲੇ ਚੱਕਰਾਂ ਨਾਲੋਂ ਵਧੇਰੇ ਜ਼ਰੂਰੀ ਲੱਗਦੀ ਹੈ। ਵੱਡੇ ਪੱਧਰ ‘ਤੇ ਵਿਅਕਤੀਗਤ ਧੋਖਾਧੜੀ ਲਈ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਪੂਰੀ ਤਰ੍ਹਾਂ ਕਾਰਜਸ਼ੀਲ ਹੈ। ਫੈਡਰਲ ਟਰੇਡ ਕਮਿਸ਼ਨ ਦੇ ਅਨੁਸਾਰ, ਆਵਾਜ਼ ਨਾਲ ਸਬੰਧਤ ਧੋਖਾਧੜੀ ਵਿੱਚ ਵਾਧਾ ਪਹਿਲਾਂ ਹੀ ਖਪਤਕਾਰਾਂ ਨੂੰ ਸਾਲਾਨਾ ਕਰੋੜਾਂ ਡਾਲਰਾਂ ਦਾ ਨੁਕਸਾਨ ਪਹੁੰਚਾ ਰਿਹਾ ਹੈ। ਨੀਤੀਗਤ ਪ੍ਰਤੀਕਿਰਿਆ ਅਧਿਐਨ ਅਤੇ ਬਹਿਸ ਦੇ ਚੱਕਰ ਵਿੱਚ ਫਸੀ ਹੋਈ ਹੈ ਜਦੋਂ ਕਿ ਉਦਯੋਗਿਕ ਹਕੀਕਤ ਬਹੁਤ ਤੇਜ਼ ਰਫ਼ਤਾਰ ਨਾਲ ਅੱਗੇ ਵਧ ਰਹੀ ਹੈ। ਇਹ ਡਿਸਕਨੈਕਟ ਸਿਰਫ਼ ਇੱਕ ਨੌਕਰਸ਼ਾਹੀ ਦੀ ਅਸਫਲਤਾ ਨਹੀਂ ਹੈ। ਇਹ ਕਾਨੂੰਨ ਦੀ ਗਤੀ ਅਤੇ ਸਾਫਟਵੇਅਰ ਦੀ ਗਤੀ ਵਿਚਕਾਰ ਇੱਕ ਬੁਨਿਆਦੀ ਬੇਮੇਲਤਾ ਹੈ।
ਭਵਿੱਖ ਦੇ ਦਫਤਰ ਵਿੱਚ ਇੱਕ ਮੰਗਲਵਾਰ ਦੀ ਸਵੇਰ
ਸਾਰਾਹ ਨਾਮ ਦੀ ਇੱਕ ਕਾਰਪੋਰੇਟ ਖਜ਼ਾਨਚੀ ਦੇ ਜੀਵਨ ਵਿੱਚ ਇੱਕ ਦਿਨ ‘ਤੇ ਵਿਚਾਰ ਕਰੋ। ਇਹ ਇੱਕ ਵਿਅਸਤ ਮੰਗਲਵਾਰ ਦੀ ਸਵੇਰ ਹੈ। ਉਸਨੂੰ ਸੀਈਓ ਦਾ ਫ਼ੋਨ ਆਉਂਦਾ ਹੈ, ਜਿਸਦੀ ਆਵਾਜ਼ ਬੇਮਿਸਾਲ ਹੈ। ਉਹ ਤਣਾਅ ਵਿੱਚ ਲੱਗਦਾ ਹੈ ਅਤੇ ਦੱਸਦਾ ਹੈ ਕਿ ਉਹ ਇੱਕ ਰੌਲੇ-ਰੱਪੇ ਵਾਲੇ ਹਵਾਈ ਅੱਡੇ ‘ਤੇ ਹੈ। ਉਸਨੂੰ ਇੱਕ ਸੌਦੇ ਨੂੰ ਸੁਰੱਖਿਅਤ ਕਰਨ ਲਈ ਇੱਕ ਜ਼ਰੂਰੀ ਵਾਇਰ ਟ੍ਰਾਂਸਫਰ ਦੀ ਲੋੜ ਹੈ ਜੋ ਮਹੀਨਿਆਂ ਤੋਂ ਚੱਲ ਰਿਹਾ ਹੈ। ਉਹ ਪ੍ਰੋਜੈਕਟ ਦੇ ਖਾਸ ਨਾਮ ਅਤੇ ਸ਼ਾਮਲ ਕਾਨੂੰਨੀ ਫਰਮ ਦਾ ਜ਼ਿਕਰ ਕਰਦਾ ਹੈ। ਸਾਰਾਹ, ਮਦਦਗਾਰ ਬਣਨ ਦੀ ਇੱਛਾ ਨਾਲ, ਪ੍ਰਕਿਰਿਆ ਸ਼ੁਰੂ ਕਰਦੀ ਹੈ। ਦੂਜੇ ਪਾਸੇ ਦੀ ਆਵਾਜ਼ ਉਸਦੇ ਸਵਾਲਾਂ ਦਾ ਅਸਲ ਸਮੇਂ ਵਿੱਚ ਜਵਾਬ ਦਿੰਦੀ ਹੈ, ਇੱਥੋਂ ਤੱਕ ਕਿ ਟਰਮੀਨਲ ‘ਤੇ ਖਰਾਬ ਕੌਫੀ ਬਾਰੇ ਮਜ਼ਾਕ ਵੀ ਕਰਦੀ ਹੈ। ਇਹ ਕੋਈ ਰਿਕਾਰਡਿੰਗ ਨਹੀਂ ਹੈ। ਇਹ ਇੱਕ ਹਮਲਾਵਰ ਦੁਆਰਾ ਨਿਯੰਤਰਿਤ ਇੱਕ ਲਾਈਵ ਸਿੰਥੈਟਿਕ ਆਵਾਜ਼ ਹੈ ਜਿਸਨੇ ਕੰਪਨੀ ਦੀ ਅੰਦਰੂਨੀ ਭਾਸ਼ਾ ਦੀ ਖੋਜ ਕਰਨ ਵਿੱਚ ਹਫ਼ਤੇ ਬਿਤਾਏ ਹਨ। ਸਾਰਾਹ ਟ੍ਰਾਂਸਫਰ ਪੂਰਾ ਕਰਦੀ ਹੈ। ਸਿਰਫ਼ ਘੰਟਿਆਂ ਬਾਅਦ, ਜਦੋਂ ਉਹ ਇੱਕ ਫਾਲੋ-ਅਪ ਈਮੇਲ ਭੇਜਦੀ ਹੈ, ਤਾਂ ਉਸਨੂੰ ਅਹਿਸਾਸ ਹੁੰਦਾ ਹੈ ਕਿ ਸੀਈਓ ਅਸਲ ਵਿੱਚ ਪੂਰੇ ਸਮੇਂ ਲਈ ਇੱਕ ਬੋਰਡ ਮੀਟਿੰਗ ਵਿੱਚ ਸੀ। ਪੈਸੇ ਗਾਇਬ ਹਨ, ਖਾਤਿਆਂ ਦੀ ਇੱਕ ਲੜੀ ਰਾਹੀਂ ਭੇਜੇ ਗਏ ਹਨ ਜੋ ਮਿੰਟਾਂ ਵਿੱਚ ਗਾਇਬ ਹੋ ਜਾਂਦੇ ਹਨ। ਇਹ ਦ੍ਰਿਸ਼ ਹੁਣ ਇੱਕ ਸਿਧਾਂਤਕ ਅਭਿਆਸ ਨਹੀਂ ਹੈ। ਇਹ ਦੁਨੀਆ ਭਰ ਦੇ ਕਾਰੋਬਾਰਾਂ ਲਈ ਇੱਕ ਅਕਸਰ ਵਾਪਰਦੀ ਹਕੀਕਤ ਹੈ।
BotNews.today ਸਮੱਗਰੀ ਦੀ ਖੋਜ, ਲਿਖਣ, ਸੰਪਾਦਨ ਅਤੇ ਅਨੁਵਾਦ ਕਰਨ ਲਈ AI ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਸਾਡੀ ਟੀਮ ਜਾਣਕਾਰੀ ਨੂੰ ਉਪਯੋਗੀ, ਸਪਸ਼ਟ ਅਤੇ ਭਰੋਸੇਮੰਦ ਰੱਖਣ ਲਈ ਪ੍ਰਕਿਰਿਆ ਦੀ ਸਮੀਖਿਆ ਅਤੇ ਨਿਗਰਾਨੀ ਕਰਦੀ ਹੈ।
ਇਸ ਕਿਸਮ ਦੀ ਧੋਖਾਧੜੀ ਰਵਾਇਤੀ ਫਿਸ਼ਿੰਗ ਨਾਲੋਂ ਵਧੇਰੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਹੈ ਕਿਉਂਕਿ ਇਹ ਸਾਡੇ ਕੁਦਰਤੀ ਸ਼ੱਕ ਨੂੰ ਬਾਈਪਾਸ ਕਰਦੀ ਹੈ। ਅਸੀਂ ਈਮੇਲਾਂ ਵਿੱਚ ਟਾਈਪੋ ਲੱਭਣ ਲਈ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਹਾਂ, ਪਰ ਅਸੀਂ ਅਜੇ ਕਿਸੇ ਲੰਬੇ ਸਮੇਂ ਦੇ ਸਹਿਕਰਮੀ ਦੀ ਆਵਾਜ਼ ‘ਤੇ ਸ਼ੱਕ ਕਰਨ ਲਈ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਨਹੀਂ ਹਾਂ। ਫ਼ੋਨ ਕਾਲ ਦਾ ਭਾਵਨਾਤਮਕ ਦਬਾਅ ਵੀ ਸਾਡੀ ਆਲੋਚਨਾਤਮਕ ਸੋਚਣ ਦੀ ਸਮਰੱਥਾ ਨੂੰ ਸੀਮਤ ਕਰਦਾ ਹੈ। ਇੱਕ ਸੁਰੱਖਿਆ ਵਿਸ਼ਲੇਸ਼ਕ ਲਈ, ਦਿਨ ਹੁਣ ਸਿਰਫ਼ ਫਾਇਰਵਾਲਾਂ ਦੀ ਨਿਗਰਾਨੀ ਕਰਨ ਦੀ ਬਜਾਏ ਸੰਚਾਰ ਪੈਟਰਨਾਂ ਵਿੱਚ ਵਿਗਾੜਾਂ ਦੀ ਭਾਲ ਵਿੱਚ ਬਿਤਾਇਆ ਜਾਂਦਾ ਹੈ। ਉਹਨਾਂ ਨੂੰ ਨਵੇਂ ਪ੍ਰੋਟੋਕੋਲ ਲਾਗੂ ਕਰਨੇ ਪੈਂਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ “ਚੈਲੇਂਜ-ਰਿਸਪੌਂਸ” ਵਾਕਾਂਸ਼ ਜੋ ਕਦੇ ਵੀ ਡਿਜੀਟਲ ਰੂਪ ਵਿੱਚ ਸਾਂਝੇ ਨਹੀਂ ਕੀਤੇ ਜਾਂਦੇ ਹਨ। ਇੱਕ ਸੁਰੱਖਿਆ ਟੀਮ ਆਪਣੀ ਸਵੇਰ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਬਾਰੇ ਨਵੀਨਤਮ ਜਾਣਕਾਰੀ ਦੀ ਸਮੀਖਿਆ ਕਰਨ ਵਿੱਚ ਬਿਤਾ ਸਕਦੀ ਹੈ ਤਾਂ ਜੋ ਹਮਲਿਆਂ ਦੀ ਅਗਲੀ ਲਹਿਰ ਤੋਂ ਅੱਗੇ ਰਹਿ ਸਕੇ। ਉਹ ਹੁਣ ਸਿਰਫ਼ ਹੈਕਰਾਂ ਨਾਲ ਨਹੀਂ ਲੜ ਰਹੇ ਹਨ। ਉਹ ਉਸ ਮਨੋਵਿਗਿਆਨਕ ਨਿਸ਼ਚਿਤਤਾ ਨਾਲ ਲੜ ਰਹੇ ਹਨ ਜੋ ਸਾਡੇ ਕੰਨ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ। ਹਕੀਕਤ ਇਹ ਹੈ ਕਿ ਮਨੁੱਖੀ ਆਵਾਜ਼ ਹੁਣ ਇੱਕ ਸੁਰੱਖਿਅਤ ਪ੍ਰਮਾਣ ਪੱਤਰ ਨਹੀਂ ਰਹੀ। ਇਹ ਅਹਿਸਾਸ ਇਸ ਗੱਲ ‘ਤੇ ਮੁੜ ਵਿਚਾਰ ਕਰਨ ਲਈ ਮਜਬੂਰ ਕਰ ਰਿਹਾ ਹੈ ਕਿ ਕਾਰਪੋਰੇਟ ਵਾਤਾਵਰਣ ਵਿੱਚ ਵਿਸ਼ਵਾਸ ਕਿਵੇਂ ਸਥਾਪਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਇਸ ਤਬਦੀਲੀ ਦੀ ਕੀਮਤ ਸਿਰਫ਼ ਵਿੱਤੀ ਨਹੀਂ ਹੈ। ਇਹ ਉਸ ਆਮ, ਉੱਚ-ਭਰੋਸੇ ਵਾਲੇ ਸੰਚਾਰ ਦਾ ਨੁਕਸਾਨ ਹੈ ਜੋ ਸੰਸਥਾਵਾਂ ਨੂੰ ਕੁਸ਼ਲਤਾ ਨਾਲ ਕੰਮ ਕਰਨ ਲਈ ਮਜਬੂਰ ਕਰਦਾ ਹੈ। ਹਰ ਕਾਲ ਹੁਣ ਸ਼ੱਕ ਦਾ ਇੱਕ ਲੁਕਿਆ ਹੋਇਆ ਟੈਕਸ ਰੱਖਦੀ ਹੈ।
ਇੱਕ ਸਿੰਥੈਟਿਕ ਯੁੱਗ ਲਈ ਸਖ਼ਤ ਸਵਾਲ
ਸਾਨੂੰ ਇਸ ਤਕਨਾਲੋਜੀ ਦੇ ਮੌਜੂਦਾ ਰਾਹ ‘ਤੇ ਸੁਕਰਾਤੀ ਸ਼ੱਕ ਦਾ ਪੱਧਰ ਲਾਗੂ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ। ਜੇਕਰ ਕਿਸੇ ਵੀ ਆਵਾਜ਼ ਨੂੰ ਕਲੋਨ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ, ਤਾਂ ਜਨਤਕ ਸ਼ਖਸੀਅਤ ਨੂੰ ਬਣਾਈ ਰੱਖਣ ਦੀ ਲੁਕਵੀਂ ਕੀਮਤ ਕੀ ਹੈ? ਅਸੀਂ ਅਸਲ ਵਿੱਚ ਹਰ ਜਨਤਕ ਬੁਲਾਰੇ, ਕਾਰਜਕਾਰੀ ਅਤੇ ਪ੍ਰਭਾਵਕ ਨੂੰ ਦੱਸ ਰਹੇ ਹਾਂ ਕਿ ਉਹਨਾਂ ਦੀ ਵੋਕਲ ਪਛਾਣ ਹੁਣ ਜਨਤਕ ਜਾਇਦਾਦ ਹੈ। ਬਚਾਅ ਦੇ ਕੰਪਿਊਟ ਖਰਚਿਆਂ ਲਈ ਕੌਣ ਜ਼ਿੰਮੇਵਾਰ ਹੈ? ਜੇਕਰ ਕੰਪਨੀਆਂ ਨੂੰ ਇਹ ਪੁਸ਼ਟੀ ਕਰਨ ਲਈ ਲੱਖਾਂ ਖਰਚ ਕਰਨੇ ਪੈਂਦੇ ਹਨ ਕਿ ਉਹਨਾਂ ਦੇ ਕਰਮਚਾਰੀ ਉਹ ਹਨ ਜੋ ਉਹ ਕਹਿੰਦੇ ਹਨ, ਤਾਂ ਇਹ ਵਿਸ਼ਵ ਅਰਥਚਾਰੇ ‘ਤੇ ਸਿੱਧਾ ਅਸਰ ਹੈ। ਸਾਨੂੰ “ਝੂਠੇ ਦੇ ਲਾਭਅੰਸ਼” ਬਾਰੇ ਵੀ ਪੁੱਛਣਾ ਪਵੇਗਾ। ਇਹ ਉਹ ਵਰਤਾਰਾ ਹੈ ਜਿੱਥੇ ਇੱਕ ਅਸਲ ਰਿਕਾਰਡਿੰਗ ਵਿੱਚ ਫੜਿਆ ਗਿਆ ਵਿਅਕਤੀ ਸਿਰਫ਼ ਇਹ ਦਾਅਵਾ ਕਰ ਸਕਦਾ ਹੈ ਕਿ ਇਹ ਇੱਕ ਡੀਪਫੇਕ ਸੀ। ਇਹ ਇੱਕ ਅਜਿਹੀ ਦੁਨੀਆ ਬਣਾਉਂਦਾ ਹੈ ਜਿੱਥੇ ਕੋਈ ਵੀ ਸਬੂਤ ਨਿਸ਼ਚਿਤ ਨਹੀਂ ਹੁੰਦਾ। ਇੱਕ ਕਾਨੂੰਨੀ ਪ੍ਰਣਾਲੀ ਕਿਵੇਂ ਕੰਮ ਕਰਦੀ ਹੈ ਜਦੋਂ ਸਬੂਤ ਦਾ ਮੁੱਖ ਰੂਪ—ਗਵਾਹ ਦੀ ਰਿਕਾਰਡਿੰਗ—ਨੂੰ ਸਿੰਥੈਟਿਕ ਉਤਪਾਦ ਵਜੋਂ ਖਾਰਜ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ? ਅਸੀਂ ਇੱਕ ਅਜਿਹੀ ਹਕੀਕਤ ਵੱਲ ਵਧ ਰਹੇ ਹਾਂ ਜਿੱਥੇ ਸੱਚਾਈ ਸਿਰਫ਼ ਲੁਕੀ ਹੋਈ ਨਹੀਂ, ਸਗੋਂ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਅਪ੍ਰਮਾਣਿਤ ਹੈ। ਕੀ ਜਨਰੇਟਿਵ ਆਡੀਓ ਦੀ ਸਹੂਲਤ ਆਡੀਟੋਰੀ ਸਬੂਤਾਂ ਦੇ ਕੁੱਲ ਵਿਨਾਸ਼ ਦੇ ਯੋਗ ਹੈ? ਇਹ ਦੂਰ ਦੇ ਭਵਿੱਖ ਲਈ ਸਵਾਲ ਨਹੀਂ ਹਨ। ਇਹ ਲਈ ਸਵਾਲ ਹਨ। ਅਸੀਂ ਇਹ ਵੀ ਦੇਖ ਰਹੇ ਹਾਂ ਕਿ ਸੁਰੱਖਿਆ ਦਾ ਖਰਚਾ ਕੌਣ ਉਠਾ ਸਕਦਾ ਹੈ। ਵੱਡੀਆਂ ਕਾਰਪੋਰੇਸ਼ਨਾਂ ਮਹਿੰਗੇ ਵੈਰੀਫਿਕੇਸ਼ਨ ਟੂਲ ਖਰੀਦ ਸਕਦੀਆਂ ਹਨ, ਪਰ ਉਸ ਆਮ ਵਿਅਕਤੀ ਦਾ ਕੀ ਜਿਸਦੇ ਬਜ਼ੁਰਗ ਮਾਤਾ-ਪਿਤਾ ਨੂੰ ਵੌਇਸ-ਕਲੋਨਡ ਅਗਵਾ ਘੁਟਾਲੇ ਦੁਆਰਾ ਨਿਸ਼ਾਨਾ ਬਣਾਇਆ ਜਾਂਦਾ ਹੈ? ਗੋਪਨੀਯਤਾ ਦਾ ਪਾੜਾ ਵਧ ਰਿਹਾ ਹੈ, ਅਤੇ ਸਭ ਤੋਂ ਕਮਜ਼ੋਰ ਉਹ ਹਨ ਜੋ ਬਿਨਾਂ ਕਿਸੇ ਢਾਲ ਦੇ ਰਹਿ ਗਏ ਹਨ।
ਕੀ ਤੁਹਾਡੇ ਕੋਲ ਕੋਈ AI ਕਹਾਣੀ, ਟੂਲ, ਰੁਝਾਨ ਜਾਂ ਸਵਾਲ ਹੈ ਜੋ ਤੁਹਾਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ ਸਾਨੂੰ ਕਵਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ? ਸਾਨੂੰ ਆਪਣਾ ਲੇਖ ਦਾ ਵਿਚਾਰ ਭੇਜੋ — ਅਸੀਂ ਇਸਨੂੰ ਸੁਣਨਾ ਪਸੰਦ ਕਰਾਂਗੇ।
ਡੀਪਫੇਕ ਪ੍ਰਣਾਲੀਆਂ ਦੀ ਲੇਟੈਂਸੀ ਅਤੇ ਤਰਕ
ਇਹ ਸਮਝਣ ਲਈ ਕਿ ਇਸਨੂੰ ਰੋਕਣਾ ਇੰਨਾ ਮੁਸ਼ਕਲ ਕਿਉਂ ਹੈ, ਸਾਨੂੰ ਇਹਨਾਂ ਪ੍ਰਣਾਲੀਆਂ ਦੀਆਂ ਪਾਵਰ ਯੂਜ਼ਰ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਦੇਖਣਾ ਪਵੇਗਾ। ਜ਼ਿਆਦਾਤਰ ਆਧੁਨਿਕ ਵੌਇਸ ਕਲੋਨਿੰਗ ਟੂਲ ਇੱਕ API-ਅਧਾਰਿਤ ਆਰਕੀਟੈਕਚਰ ‘ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹਨ। OpenAI ਜਾਂ ElevenLabs ਵਰਗੀਆਂ ਸੇਵਾਵਾਂ ਬਹੁਤ ਘੱਟ ਲੇਟੈਂਸੀ ਦੇ ਨਾਲ ਉੱਚ-ਵਫ਼ਾਦਾਰੀ ਆਉਟਪੁੱਟ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੀਆਂ ਹਨ। ਅਸੀਂ 500 ਮਿਲੀਸਕਿੰਟ ਤੋਂ ਇੱਕ ਸਕਿੰਟ ਦੀ ਦੇਰੀ ਬਾਰੇ ਗੱਲ ਕਰ ਰਹੇ ਹਾਂ। ਇਹ ਇੱਕ ਕੁਦਰਤੀ ਗੱਲਬਾਤ ਲਈ ਕਾਫ਼ੀ ਤੇਜ਼ ਹੈ। ਉਹਨਾਂ ਲਈ ਜੋ ਪ੍ਰਬੰਧਿਤ ਸੇਵਾ ਦੀਆਂ ਪਾਬੰਦੀਆਂ ਤੋਂ ਬਚਣਾ ਚਾਹੁੰਦੇ ਹਨ, ਮਾਡਲ ਵੇਟਸ ਦੀ ਸਥਾਨਕ ਸਟੋਰੇਜ ਤਰਜੀਹੀ ਰਸਤਾ ਹੈ। 12GB VRAM ਵਾਲਾ ਇੱਕ ਮਿਆਰੀ ਕੰਜ਼ਿਊਮਰ GPU ਹੁਣ ਇੱਕ ਵਧੀਆ RVC (ਰਿਟ੍ਰੀਵਲ-ਅਧਾਰਿਤ ਵੌਇਸ ਕਨਵਰਜ਼ਨ) ਮਾਡਲ ਚਲਾ ਸਕਦਾ ਹੈ। ਇਹ ਇੱਕ ਹਮਲਾਵਰ ਨੂੰ ਸਥਾਨਕ ਤੌਰ ‘ਤੇ ਆਡੀਓ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ, ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦੇ ਹੋਏ ਕਿ ਉਹਨਾਂ ਦੀਆਂ ਗਤੀਵਿਧੀਆਂ ਨੂੰ ਕਦੇ ਵੀ ਤੀਜੀ-ਧਿਰ ਪ੍ਰਦਾਤਾ ਦੁਆਰਾ ਲੌਗ ਨਹੀਂ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਵਰਕਫਲੋ ਏਕੀਕਰਣ ਵੀ ਸਹਿਜ ਹੁੰਦਾ ਜਾ ਰਿਹਾ ਹੈ। ਧੋਖੇਬਾਜ਼ ਆਪਣੇ ਸਿੰਥੈਟਿਕ ਆਡੀਓ ਨੂੰ ਸਿੱਧੇ ਇੱਕ ਵਰਚੁਅਲ ਮਾਈਕ੍ਰੋਫੋਨ ਵਿੱਚ ਪਾਈਪ ਕਰ ਸਕਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਇਹ ਜ਼ੂਮ, ਟੀਮਾਂ, ਜਾਂ VoIP ਗੇਟਵੇ ਰਾਹੀਂ ਇੱਕ ਮਿਆਰੀ ਫ਼ੋਨ ਲਾਈਨ ਲਈ ਇੱਕ ਜਾਇਜ਼ ਇਨਪੁਟ ਵਜੋਂ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ।
ਇਹਨਾਂ ਪ੍ਰਣਾਲੀਆਂ ‘ਤੇ ਸੀਮਾਵਾਂ ਜ਼ਿਆਦਾਤਰ ਕੰਪਿਊਟ ਪਾਵਰ ਦੀ ਬਜਾਏ ਡੇਟਾ ਦੀ ਗੁਣਵੱਤਾ ਨਾਲ ਸਬੰਧਤ ਹਨ। ਇੱਕ ਮਾਡਲ ਸਿਰਫ਼ ਰੈਫਰੈਂਸ ਆਡੀਓ ਜਿੰਨਾ ਹੀ ਵਧੀਆ ਹੁੰਦਾ ਹੈ। ਹਾਲਾਂਕਿ, ਇੰਟਰਨੈਟ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਵੋਕਲ ਡੇਟਾ ਦਾ ਇੱਕ ਵਿਸ਼ਾਲ ਭੰਡਾਰ ਹੈ। ਡਿਵੈਲਪਰਾਂ ਲਈ, ਚੁਣੌਤੀ ਇਨਫਰੈਂਸ ਸਪੀਡ ਦਾ ਪ੍ਰਬੰਧਨ ਕਰਨਾ ਹੈ। ਜੇਕਰ ਲੇਟੈਂਸੀ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹੈ, ਤਾਂ ਗੱਲਬਾਤ “ਬੰਦ” ਮਹਿਸੂਸ ਹੁੰਦੀ ਹੈ। ਪਾਵਰ ਯੂਜ਼ਰਸ ਵਰਤਮਾਨ ਵਿੱਚ ਛੋਟੇ, ਕੁਆਂਟਾਈਜ਼ਡ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਆਪਣੇ ਸਟੈਕ ਨੂੰ ਅਨੁਕੂਲਿਤ ਕਰ ਰਹੇ ਹਨ ਜੋ ਜਵਾਬਦੇਹੀ ਵਿੱਚ ਵੱਡੇ ਲਾਭ ਲਈ ਵਫ਼ਾਦਾਰੀ ਦਾ ਇੱਕ ਛੋਟਾ ਜਿਹਾ ਹਿੱਸਾ ਕੁਰਬਾਨ ਕਰਦੇ ਹਨ। ਉਹ ਆਮ ਨਿਸ਼ਾਨਿਆਂ ਦੀਆਂ ਪਹਿਲਾਂ ਤੋਂ ਗਣਨਾ ਕੀਤੀਆਂ ਵੋਕਲ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਸਟੋਰ ਕਰਨ ਲਈ ਸਥਾਨਕ ਡੇਟਾਬੇਸ ਦੀ ਵਰਤੋਂ ਵੀ ਕਰ ਰਹੇ ਹਨ। ਤਕਨੀਕੀ ਸੂਝ-ਬੂਝ ਦੇ ਇਸ ਪੱਧਰ ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਬਚਾਅ ਵੀ ਬਰਾਬਰ ਸਵੈਚਾਲਿਤ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਮੈਨੂਅਲ ਪੁਸ਼ਟੀ ਬਹੁਤ ਹੌਲੀ ਹੈ। ਅਸੀਂ ਇੱਕ ਅਜਿਹੇ ਪੜਾਅ ਵਿੱਚ ਦਾਖਲ ਹੋ ਰਹੇ ਹਾਂ ਜਿੱਥੇ AI-ਸੰਚਾਲਿਤ “ਸਰੋਤਿਆਂ” ਨੂੰ ਅਸਲ ਸਮੇਂ ਵਿੱਚ ਆਡੀਓ ਦੀ ਸਪੈਕਟ੍ਰਲ ਇਕਸਾਰਤਾ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਲਈ ਸਾਡੀਆਂ ਫ਼ੋਨ ਲਾਈਨਾਂ ‘ਤੇ ਬੈਠਣਾ ਪਵੇਗਾ। ਇਹ ਗੋਪਨੀਯਤਾ ਦੀਆਂ ਚਿੰਤਾਵਾਂ ਦਾ ਇੱਕ ਨਵਾਂ ਸਮੂਹ ਪੈਦਾ ਕਰਦਾ ਹੈ। ਸਾਨੂੰ ਫੇਕ ਤੋਂ ਬਚਾਉਣ ਲਈ, ਕੀ ਸਾਨੂੰ ਇੱਕ ਐਲਗੋਰਿਦਮ ਨੂੰ ਸਾਡੇ ਦੁਆਰਾ ਕਹੇ ਗਏ ਹਰ ਸ਼ਬਦ ਨੂੰ ਸੁਣਨ ਦੇਣਾ ਪਵੇਗਾ? ਸੁਰੱਖਿਆ ਅਤੇ ਗੋਪਨੀਯਤਾ ਵਿਚਕਾਰ ਵਪਾਰ-ਬੰਦ ਕਦੇ ਵੀ ਇੰਨਾ ਸ਼ਾਬਦਿਕ ਨਹੀਂ ਰਿਹਾ ਹੈ।
- ਰੀਅਲ-ਟਾਈਮ ਵੌਇਸ ਕਲੋਨਿੰਗ ਲਈ ਔਸਤ ਲੇਟੈਂਸੀ ਪਿਛਲੇ ਬਾਰਾਂ ਮਹੀਨਿਆਂ ਵਿੱਚ 800 ਮਿਲੀਸਕਿੰਟ ਤੋਂ ਹੇਠਾਂ ਆ ਗਈ ਹੈ।
- ਵੌਇਸ ਕਨਵਰਜ਼ਨ ਲਈ ਓਪਨ-ਸੋਰਸ ਰਿਪੋਜ਼ਟਰੀਆਂ ਵਿੱਚ ਮੌਜੂਦਾ ਚੱਕਰ ਦੀ ਸ਼ੁਰੂਆਤ ਤੋਂ ਬਾਅਦ ਯੋਗਦਾਨਾਂ ਵਿੱਚ 300 ਪ੍ਰਤੀਸ਼ਤ ਦਾ ਵਾਧਾ ਦੇਖਿਆ ਗਿਆ ਹੈ।
ਨਵੇਂ ਖਤਰੇ ਦੀ ਹਕੀਕਤ
ਡੀਪਫੇਕ ਵਿੱਚ ਸਭ ਤੋਂ ਖਤਰਨਾਕ ਰੁਝਾਨ ਆਮ ਚੀਜ਼ਾਂ ਵੱਲ ਵਧਣਾ ਹੈ। ਇਹ ਉੱਚ-ਬਜਟ ਵਾਲੀ ਫਿਲਮ ਜਾਂ ਵਾਇਰਲ ਪੈਰੋਡੀ ਨਹੀਂ ਹੈ ਜਿਸ ਬਾਰੇ ਸਾਨੂੰ ਚਿੰਤਾ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ। ਇਹ ਸ਼ਾਂਤ, ਪੇਸ਼ੇਵਰ ਅਤੇ ਬਹੁਤ ਹੀ ਯਕੀਨੀ ਆਡੀਓ ਹੈ ਜੋ ਇੱਕ ਮਿਆਰੀ ਫ਼ੋਨ ਕਾਲ ਰਾਹੀਂ ਆਉਂਦਾ ਹੈ। ਇਸ ਤਕਨਾਲੋਜੀ ਨੇ ਸਾਡੀ ਪਛਾਣ ਦੇ ਸਭ ਤੋਂ ਮਨੁੱਖੀ ਹਿੱਸੇ: ਸਾਡੀ ਆਵਾਜ਼ ਨੂੰ ਸਫਲਤਾਪੂਰਵਕ ਹਥਿਆਰ ਬਣਾਇਆ ਹੈ। ਜਿਵੇਂ ਕਿ ਅਸੀਂ ਰਾਇਟਰਜ਼ ਦੀਆਂ ਰਿਪੋਰਟਾਂ ਵਿੱਚ ਦੇਖਿਆ ਹੈ, ਇਸ ਸਮੱਸਿਆ ਦਾ ਪੈਮਾਨਾ ਵਿਸ਼ਵਵਿਆਪੀ ਹੈ ਅਤੇ ਹੱਲ ਵਰਤਮਾਨ ਵਿੱਚ ਖੰਡਿਤ ਹਨ। ਅਸੀਂ ਇੱਕ ਅਜਿਹੇ ਦੌਰ ਵਿੱਚੋਂ ਲੰਘ ਰਹੇ ਹਾਂ ਜਿੱਥੇ AI ਵਿਕਾਸ ਦੀ ਉਦਯੋਗਿਕ ਗਤੀ ਨੇ ਹਕੀਕਤ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਦੀ ਸਾਡੀ ਸਮਾਜਿਕ ਅਤੇ ਕਾਨੂੰਨੀ ਯੋਗਤਾ ਨੂੰ ਪਿੱਛੇ ਛੱਡ ਦਿੱਤਾ ਹੈ। ਅੱਗੇ ਦਾ ਰਸਤਾ ਸਿਰਫ਼ ਬਿਹਤਰ ਸਾਫਟਵੇਅਰ ਨਾਲੋਂ ਵੱਧ ਮੰਗਦਾ ਹੈ। ਇਸ ਲਈ ਇੱਕ ਡਿਜੀਟਲ ਸੰਸਾਰ ਵਿੱਚ ਵਿਸ਼ਵਾਸ ਤੱਕ ਪਹੁੰਚਣ ਦੇ ਤਰੀਕੇ ਵਿੱਚ ਇੱਕ ਬੁਨਿਆਦੀ ਤਬਦੀਲੀ ਦੀ ਲੋੜ ਹੈ। ਅਸੀਂ ਹੁਣ ਇਹ ਨਹੀਂ ਮੰਨ ਸਕਦੇ ਕਿ ਸੁਣਨਾ ਹੀ ਵਿਸ਼ਵਾਸ ਕਰਨਾ ਹੈ। ਵੋਕਲ ਫਿੰਗਰਪ੍ਰਿੰਟ ਟੁੱਟ ਗਿਆ ਹੈ ਅਤੇ ਮੁਰੰਮਤ ਦੀ ਪ੍ਰਕਿਰਿਆ ਲੰਬੀ, ਮਹਿੰਗੀ ਅਤੇ ਤਕਨੀਕੀ ਤੌਰ ‘ਤੇ ਮੰਗ ਵਾਲੀ ਹੋਵੇਗੀ। ਸਾਨੂੰ ਹਰ ਅਪ੍ਰਮਾਣਿਤ ਬੇਨਤੀ ‘ਤੇ ਸ਼ੱਕ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ, ਭਾਵੇਂ ਆਵਾਜ਼ ਕਿੰਨੀ ਵੀ ਜਾਣੀ-ਪਛਾਣੀ ਕਿਉਂ ਨਾ ਲੱਗੇ। ਇਸ ਨਵੇਂ ਸਿੰਥੈਟਿਕ ਵਾਤਾਵਰਣ ਵਿੱਚ ਗਲਤੀ ਦੀ ਕੀਮਤ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹੈ।
সম্পাদকের মন্তব্য: আমরা এই সাইটটি একটি বহুভাষিক এআই সংবাদ এবং নির্দেশিকা কেন্দ্র হিসাবে তৈরি করেছি তাদের জন্য যারা কম্পিউটার বিশেষজ্ঞ নন, কিন্তু তবুও কৃত্রিম বুদ্ধিমত্তা বুঝতে চান, এটিকে আরও আত্মবিশ্বাসের সাথে ব্যবহার করতে চান এবং যে ভবিষ্যত ইতিমধ্যেই আসছে, তা অনুসরণ করতে চান।
ਕੋਈ ਗਲਤੀ ਮਿਲੀ ਜਾਂ ਕੁਝ ਠੀਕ ਕਰਨ ਦੀ ਲੋੜ ਹੈ? ਸਾਨੂੰ ਦੱਸੋ।