ਅੱਜ ਦੇ ਸਮੇਂ ਦਾ ਸਭ ਤੋਂ ਖਤਰਨਾਕ ਡੀਪਫੇਕ ਰੁਝਾਨ
ਵਿਜ਼ੂਅਲ ਡੀਪਫੇਕ ਦਾ ਦੌਰ ਸਿਰਫ਼ ਇੱਕ ਭਟਕਾਅ ਸੀ। ਜਦੋਂ ਲੋਕ ਵਿਸ਼ਵ ਨੇਤਾਵਾਂ ਦੀਆਂ ਜਾਅਲੀ ਵੀਡੀਓਜ਼ ਨੂੰ ਲੈ ਕੇ ਚਿੰਤਤ ਸਨ, ਉਦੋਂ ਇੱਕ ਕਿਤੇ ਜ਼ਿਆਦਾ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਅਤੇ ਅਦਿੱਖ ਖਤਰਾ ਚੁੱਪਚਾਪ ਪੈਦਾ ਹੋ ਰਿਹਾ ਸੀ। ਆਡੀਓ ਸਿੰਥੇਸਿਸ ਹੁਣ ਉੱਚ-ਮੁੱਲ ਦੀ ਧੋਖਾਧੜੀ ਅਤੇ ਰਾਜਨੀਤਿਕ ਅਸਥਿਰਤਾ ਲਈ ਮੁੱਖ ਸਾਧਨ ਬਣ ਗਿਆ ਹੈ। ਇਹ ਹੁਣ ਕਿਸੇ ਚਿਹਰੇ ਦੇ ਹਿੱਲਣ ਦੇ ਅਜੀਬ ਅਨੁਭਵ ਬਾਰੇ ਨਹੀਂ ਹੈ। ਇਹ ਕਿਸੇ ਪਰਿਵਾਰਕ ਮੈਂਬਰ ਦੀ ਜਾਣੀ-ਪਛਾਣੀ ਆਵਾਜ਼ ਜਾਂ ਕਿਸੇ ਸੀਈਓ ਦੇ ਅਧਿਕਾਰਤ ਲਹਿਜੇ ਬਾਰੇ ਹੈ। ਇਹ ਤਬਦੀਲੀ ਮਹੱਤਵਪੂਰਨ ਹੈ ਕਿਉਂਕਿ ਆਡੀਓ ਨੂੰ ਵੀਡੀਓ ਨਾਲੋਂ ਘੱਟ ਬੈਂਡਵਿਡਥ, ਘੱਟ ਪ੍ਰੋਸੈਸਿੰਗ ਪਾਵਰ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਅਤੇ ਇਹ ਵਧੇਰੇ ਭਾਵਨਾਤਮਕ ਭਾਰ ਰੱਖਦਾ ਹੈ। ਇੱਕ ਅਜਿਹੀ ਦੁਨੀਆ ਵਿੱਚ ਜਿੱਥੇ ਅਸੀਂ ਵੌਇਸ ਬਾਇਓਮੈਟ੍ਰਿਕਸ ਜਾਂ ਤੇਜ਼ ਫ਼ੋਨ ਕਾਲਾਂ ਰਾਹੀਂ ਆਪਣੀ ਪਛਾਣ ਦੀ ਪੁਸ਼ਟੀ ਕਰਦੇ ਹਾਂ, ਤਿੰਨ ਸਕਿੰਟਾਂ ਦੀ ਸਮੱਗਰੀ ਨਾਲ ਕਿਸੇ ਇਨਸਾਨ ਦੀ ਆਵਾਜ਼ ਨੂੰ ਕਲੋਨ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਨੇ ਆਧੁਨਿਕ ਸੰਚਾਰ ਪ੍ਰਣਾਲੀ ਦੇ ਬੁਨਿਆਦੀ ਭਰੋਸੇ ਨੂੰ ਤੋੜ ਦਿੱਤਾ ਹੈ। ਅਸੀਂ ਸਿਨੇਮੈਟਿਕ ਚਾਲਾਂ ਤੋਂ ਦੂਰ ਹੋ ਕੇ ਵਿਹਾਰਕ, ਉੱਚ-ਦਾਅ ਵਾਲੀ ਧੋਖਾਧੜੀ ਵੱਲ ਵਧ ਰਹੇ ਹਾਂ ਜੋ ਕਾਰਪੋਰੇਸ਼ਨਾਂ ਦੀਆਂ ਜੇਬਾਂ ਅਤੇ ਆਮ ਲੋਕਾਂ ਦੇ ਨਰਵਸ ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਉਂਦੀ ਹੈ। ਇਹ ਸਮੱਸਿਆ ਇੱਕ ਸਾਲ ਪਹਿਲਾਂ ਨਾਲੋਂ ਹੁਣ ਵਧੇਰੇ ਗੰਭੀਰ ਲੱਗਦੀ ਹੈ ਕਿਉਂਕਿ ਟੂਲਸ ਪ੍ਰਯੋਗਾਤਮਕ ਲੈਬਾਂ ਤੋਂ ਨਿਕਲ ਕੇ ਆਸਾਨ ਕਲਾਊਡ ਇੰਟਰਫੇਸਾਂ ਤੱਕ ਪਹੁੰਚ ਗਏ ਹਨ।
ਸਿੰਥੈਟਿਕ ਪਛਾਣ ਦੀ ਮਕੈਨਿਕਸ
ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੀ ਵੌਇਸ ਕਲੋਨਿੰਗ ਲਈ ਤਕਨੀਕੀ ਰੁਕਾਵਟ ਖਤਮ ਹੋ ਗਈ ਹੈ। ਪਹਿਲਾਂ, ਇੱਕ ਯਕੀਨੀ ਵੋਕਲ ਰਿਪਲੀਕਾ ਬਣਾਉਣ ਲਈ ਘੰਟਿਆਂਬੱਧੀ ਸਟੂਡੀਓ-ਗੁਣਵੱਤਾ ਦੀ ਰਿਕਾਰਡਿੰਗ ਅਤੇ ਕਾਫ਼ੀ ਕੰਪਿਊਟ ਸਮੇਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਸੀ। ਅੱਜ, ਇੱਕ ਧੋਖੇਬਾਜ਼ ਕਿਸੇ ਵਿਅਕਤੀ ਦੀ ਆਵਾਜ਼ ਨੂੰ ਇੱਕ ਛੋਟੀ ਸੋਸ਼ਲ ਮੀਡੀਆ ਕਲਿੱਪ ਜਾਂ ਰਿਕਾਰਡ ਕੀਤੇ ਵੈਬਿਨਾਰ ਤੋਂ ਚੋਰੀ ਕਰ ਸਕਦਾ ਹੈ। ਆਧੁਨਿਕ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਜ਼ੀਰੋ-ਸ਼ਾਟ ਟੈਕਸਟ-ਟੂ-ਸਪੀਚ ਨਾਮਕ ਪ੍ਰਕਿਰਿਆ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ। ਇਹ ਇੱਕ ਮਾਡਲ ਨੂੰ ਕਿਸੇ ਵਿਅਕਤੀ ‘ਤੇ ਦਿਨਾਂ ਤੱਕ ਸਿਖਲਾਈ ਦਿੱਤੇ ਬਿਨਾਂ ਉਸਦੇ ਲਹਿਜੇ, ਪਿੱਚ ਅਤੇ ਭਾਵਨਾਤਮਕ ਉਤਰਾਅ-ਚੜ੍ਹਾਅ ਨੂੰ ਅਪਣਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਨਤੀਜਾ ਇੱਕ ਡਿਜੀਟਲ ਭੂਤ ਹੈ ਜੋ ਅਸਲ ਸਮੇਂ ਵਿੱਚ ਕੁਝ ਵੀ ਕਹਿ ਸਕਦਾ ਹੈ। ਇਹ ਸਿਰਫ਼ ਇੱਕ ਰਿਕਾਰਡਿੰਗ ਨਹੀਂ ਹੈ। ਇਹ ਇੱਕ ਲਾਈਵ, ਇੰਟਰਐਕਟਿਵ ਟੂਲ ਹੈ ਜੋ ਦੋ-ਪੱਖੀ ਗੱਲਬਾਤ ਵਿੱਚ ਹਿੱਸਾ ਲੈ ਸਕਦਾ ਹੈ। ਜਦੋਂ ਵੱਡੇ ਲੈਂਗੂਏਜ ਮਾਡਲਾਂ ਨਾਲ ਜੋੜਿਆ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਇਹ ਕਲੋਨ ਨਿਸ਼ਾਨਾ ਵਿਅਕਤੀ ਦੀਆਂ ਖਾਸ ਸ਼ਬਦਾਵਲੀ ਅਤੇ ਬੋਲਣ ਦੀਆਂ ਆਦਤਾਂ ਦੀ ਨਕਲ ਵੀ ਕਰ ਸਕਦੇ ਹਨ। ਇਹ ਧੋਖਾਧੜੀ ਨੂੰ ਕਿਸੇ ਅਣਜਾਣ ਸਰੋਤੇ ਲਈ ਲਗਭਗ ਅਸੰਭਵ ਬਣਾ ਦਿੰਦਾ ਹੈ ਜੋ ਇਹ ਮੰਨਦਾ ਹੈ ਕਿ ਉਹ ਕਿਸੇ ਜਾਣਕਾਰ ਨਾਲ ਰੁਟੀਨ ਗੱਲਬਾਤ ਕਰ ਰਿਹਾ ਹੈ।
ਜਨਤਕ ਧਾਰਨਾ ਅਕਸਰ ਇਸ ਹਕੀਕਤ ਤੋਂ ਪਿੱਛੇ ਰਹਿ ਜਾਂਦੀ ਹੈ। ਬਹੁਤ ਸਾਰੇ ਲੋਕ ਅਜੇ ਵੀ ਮੰਨਦੇ ਹਨ ਕਿ ਡੀਪਫੇਕ ਨੂੰ ਗਲਤੀਆਂ ਜਾਂ ਰੋਬੋਟਿਕ ਆਵਾਜ਼ਾਂ ਕਾਰਨ ਪਛਾਣਨਾ ਆਸਾਨ ਹੈ। ਇਹ ਇੱਕ ਖਤਰਨਾਕ ਗਲਤਫਹਿਮੀ ਹੈ। ਆਡੀਓ ਮਾਡਲਾਂ ਦੀ ਨਵੀਨਤਮ ਪੀੜ੍ਹੀ ਬਾਕੀ ਬਚੀਆਂ ਕਮੀਆਂ ਨੂੰ ਲੁਕਾਉਣ ਲਈ ਖਰਾਬ ਸੈਲੂਲਰ ਕਨੈਕਸ਼ਨ ਜਾਂ ਭੀੜ-ਭੜੱਕੇ ਵਾਲੇ ਕਮਰੇ ਦੀ ਆਵਾਜ਼ ਨੂੰ ਸਿਮੂਲੇਟ ਕਰ ਸਕਦੀ ਹੈ। ਸਿੰਥੈਟਿਕ ਆਡੀਓ ਦੀ ਗੁਣਵੱਤਾ ਨੂੰ ਜਾਣਬੁੱਝ ਕੇ ਘਟਾ ਕੇ, ਹਮਲਾਵਰ ਇਸਨੂੰ ਵਧੇਰੇ ਪ੍ਰਮਾਣਿਕ ਮਹਿਸੂਸ ਕਰਵਾਉਂਦੇ ਹਨ। ਇਹ ਮੌਜੂਦਾ ਸੰਕਟ ਦਾ ਮੂਲ ਹੈ। ਅਸੀਂ AI ਦੇ ਸੰਕੇਤ ਵਜੋਂ ਸੰਪੂਰਨਤਾ ਦੀ ਭਾਲ ਕਰ ਰਹੇ ਹਾਂ, ਪਰ ਸਭ ਤੋਂ ਖਤਰਨਾਕ ਫੇਕ ਉਹ ਹਨ ਜੋ ਅਪੂਰਣਤਾ ਨੂੰ ਅਪਣਾਉਂਦੇ ਹਨ। ਉਦਯੋਗ ਉਸ ਗਤੀ ਨਾਲ ਅੱਗੇ ਵਧ ਰਿਹਾ ਹੈ ਜਿਸਦਾ ਮੁਕਾਬਲਾ ਨੀਤੀ ਨਹੀਂ ਕਰ ਸਕਦੀ। ਜਦੋਂ ਕਿ ਖੋਜਕਰਤਾ ਵਾਟਰਮਾਰਕਿੰਗ ਤਕਨੀਕਾਂ ਵਿਕਸਿਤ ਕਰ ਰਹੇ ਹਨ, ਓਪਨ-ਸੋਰਸ ਕਮਿਊਨਿਟੀ ਅਜਿਹੇ ਮਾਡਲ ਜਾਰੀ ਕਰ ਰਹੀ ਹੈ ਜੋ ਸਥਾਨਕ ਤੌਰ ‘ਤੇ ਚਲਾਏ ਜਾ ਸਕਦੇ ਹਨ, ਕਿਸੇ ਵੀ ਸੁਰੱਖਿਆ ਫਿਲਟਰ ਜਾਂ ਨੈਤਿਕ ਰੁਕਾਵਟਾਂ ਨੂੰ ਬਾਈਪਾਸ ਕਰਦੇ ਹੋਏ। ਜਨਤਾ ਕੀ ਉਮੀਦ ਕਰਦੀ ਹੈ ਅਤੇ ਤਕਨਾਲੋਜੀ ਕੀ ਕਰ ਸਕਦੀ ਹੈ, ਇਸ ਵਿਚਕਾਰ ਇਹ ਅੰਤਰ ਉਹ ਮੁੱਖ ਪਾੜਾ ਹੈ ਜਿਸਦਾ ਅਪਰਾਧੀ ਹੁਣ ਉੱਚ ਕੁਸ਼ਲਤਾ ਨਾਲ ਫਾਇਦਾ ਉਠਾ ਰਹੇ ਹਨ।
ਕਲਾਊਡ-ਅਧਾਰਿਤ ਧੋਖਾਧੜੀ ਦੀ ਭੂ-ਰਾਜਨੀਤੀ
ਇਸ ਤਕਨਾਲੋਜੀ ‘ਤੇ ਸ਼ਕਤੀ ਕੁਝ ਖਾਸ ਹੱਥਾਂ ਵਿੱਚ ਕੇਂਦਰਿਤ ਹੈ। ਜ਼ਿਆਦਾਤਰ ਪ੍ਰਮੁੱਖ ਆਡੀਓ ਸਿੰਥੇਸਿਸ ਪਲੇਟਫਾਰਮ ਸੰਯੁਕਤ ਰਾਜ ਵਿੱਚ ਅਧਾਰਤ ਹਨ, ਜੋ ਸਿਲੀਕਾਨ ਵੈਲੀ ਦੁਆਰਾ ਪ੍ਰਦਾਨ ਕੀਤੀ ਗਈ ਵਿਸ਼ਾਲ ਪੂੰਜੀ ਅਤੇ ਕਲਾਊਡ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ‘ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹਨ। ਇਹ ਇੱਕ ਵਿਲੱਖਣ ਤਣਾਅ ਪੈਦਾ ਕਰਦਾ ਹੈ। ਜਦੋਂ ਕਿ ਅਮਰੀਕੀ ਸਰਕਾਰ AI ਸੁਰੱਖਿਆ ਲਈ ਦਿਸ਼ਾ-ਨਿਰਦੇਸ਼ ਤਿਆਰ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਦੀ ਹੈ, ਇਹਨਾਂ ਕੰਪਨੀਆਂ ਦੀ ਉਦਯੋਗਿਕ ਗਤੀ ਇੱਕ ਗਲੋਬਲ ਮਾਰਕੀਟ ਦੁਆਰਾ ਚਲਾਈ ਜਾਂਦੀ ਹੈ ਜੋ ਵਧੇਰੇ ਯਥਾਰਥਵਾਦ ਅਤੇ ਘੱਟ ਲੇਟੈਂਸੀ ਦੀ ਮੰਗ ਕਰਦੀ ਹੈ। ਐਮਾਜ਼ਾਨ, ਮਾਈਕ੍ਰੋਸਾਫਟ ਅਤੇ ਗੂਗਲ ਵਰਗੀਆਂ ਕੰਪਨੀਆਂ ਦੁਆਰਾ ਵਰਤਿਆ ਜਾਣ ਵਾਲਾ ਕਲਾਊਡ ਕੰਟਰੋਲ ਮਤਲਬ ਹੈ ਕਿ ਉਹ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਢੰਗ ਨਾਲ ਦੁਨੀਆ ਦੇ ਸਭ ਤੋਂ ਸ਼ਕਤੀਸ਼ਾਲੀ ਧੋਖਾਧੜੀ ਦੇ ਸਾਧਨਾਂ ਦੇ ਗੇਟਕੀਪਰ ਹਨ। ਹਾਲਾਂਕਿ, ਇਹ ਪਲੇਟਫਾਰਮ ਦੁਰਵਰਤੋਂ ਲਈ ਮੁੱਖ ਨਿਸ਼ਾਨੇ ਵੀ ਹਨ। ਇੱਕ ਦੇਸ਼ ਵਿੱਚ ਇੱਕ ਧੋਖੇਬਾਜ਼ ਕਿਸੇ ਦੂਜੇ ਦੇਸ਼ ਵਿੱਚ ਪੀੜਤ ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਉਣ ਲਈ ਅਮਰੀਕਾ-ਅਧਾਰਿਤ ਕਲਾਊਡ ਸੇਵਾ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦਾ ਹੈ, ਜਿਸ ਨਾਲ ਅਧਿਕਾਰ ਖੇਤਰ ਨੂੰ ਲਾਗੂ ਕਰਨਾ ਇੱਕ ਸੁਪਨਾ ਬਣ ਜਾਂਦਾ ਹੈ। ਇਹਨਾਂ ਟੈਕ ਦਿੱਗਜਾਂ ਦੀ ਪੂੰਜੀ ਦੀ ਡੂੰਘਾਈ ਉਹਨਾਂ ਨੂੰ ਅਜਿਹੇ ਮਾਡਲ ਬਣਾਉਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੀ ਹੈ ਜੋ ਕਿਸੇ ਵੀ ਛੋਟੇ ਦੇਸ਼ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੇ ਗਏ ਕਿਸੇ ਵੀ ਚੀਜ਼ ਨਾਲੋਂ ਕਿਤੇ ਬਿਹਤਰ ਹਨ, ਫਿਰ ਵੀ ਉਹਨਾਂ ਕੋਲ ਆਪਣੇ ਸਰਵਰਾਂ ‘ਤੇ ਪੈਦਾ ਹੋਏ ਹਰ ਆਡੀਓ ਦੀ ਪੁਲਿਸਿੰਗ ਕਰਨ ਦਾ ਕਾਨੂੰਨੀ ਆਦੇਸ਼ ਨਹੀਂ ਹੈ।
ਰਾਜਨੀਤਿਕ ਹੇਰਾਫੇਰੀ ਇਸ ਤਕਨਾਲੋਜੀ ਲਈ ਅਗਲੀ ਸਰਹੱਦ ਹੈ। ਅਸੀਂ ਵਿਆਪਕ ਗਲਤ ਜਾਣਕਾਰੀ ਮੁਹਿੰਮਾਂ ਤੋਂ ਹਾਈਪਰ-ਟਾਰਗੇਟਡ ਹਮਲਿਆਂ ਵੱਲ ਤਬਦੀਲੀ ਦੇਖ ਰਹੇ ਹਾਂ। ਇੱਕ ਸਥਾਨਕ ਚੋਣ ਦੀ ਕਲਪਨਾ ਕਰੋ ਜਿੱਥੇ ਵੋਟਰਾਂ ਨੂੰ ਵੋਟਿੰਗ ਵਾਲੀ ਸਵੇਰ ਨੂੰ ਇੱਕ ਉਮੀਦਵਾਰ ਦੀ ਆਵਾਜ਼ ਵਿੱਚ ਕਾਲ ਆਉਂਦੀ ਹੈ, ਜੋ ਉਹਨਾਂ ਨੂੰ ਦੱਸਦੀ ਹੈ ਕਿ ਪੋਲਿੰਗ ਸਥਾਨ ਬਦਲ ਗਿਆ ਹੈ। ਇਸ ਲਈ ਵਾਇਰਲ ਵੀਡੀਓ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਇਸ ਲਈ ਸਿਰਫ਼ ਇੱਕ ਫ਼ੋਨ ਸੂਚੀ ਅਤੇ ਥੋੜ੍ਹੇ ਜਿਹੇ ਸਰਵਰ ਸਮੇਂ ਦੀ ਲੋੜ ਹੈ। ਇਹਨਾਂ ਹਮਲਿਆਂ ਦੀ ਗਤੀ ਉਹਨਾਂ ਨੂੰ ਖਾਸ ਤੌਰ ‘ਤੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਬਣਾਉਂਦੀ ਹੈ। ਜਦੋਂ ਤੱਕ ਕੋਈ ਮੁਹਿੰਮ ਸੁਧਾਰ ਜਾਰੀ ਕਰ ਸਕਦੀ ਹੈ, ਨੁਕਸਾਨ ਹੋ ਚੁੱਕਾ ਹੁੰਦਾ ਹੈ। ਇਹੀ ਕਾਰਨ ਹੈ ਕਿ ਇਹ ਸਮੱਸਿਆ ਪਿਛਲੇ ਚੱਕਰਾਂ ਨਾਲੋਂ ਵਧੇਰੇ ਜ਼ਰੂਰੀ ਲੱਗਦੀ ਹੈ। ਵੱਡੇ ਪੱਧਰ ‘ਤੇ ਵਿਅਕਤੀਗਤ ਧੋਖਾਧੜੀ ਲਈ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਪੂਰੀ ਤਰ੍ਹਾਂ ਕਾਰਜਸ਼ੀਲ ਹੈ। ਫੈਡਰਲ ਟਰੇਡ ਕਮਿਸ਼ਨ ਦੇ ਅਨੁਸਾਰ, ਆਵਾਜ਼ ਨਾਲ ਸਬੰਧਤ ਧੋਖਾਧੜੀ ਵਿੱਚ ਵਾਧਾ ਪਹਿਲਾਂ ਹੀ ਖਪਤਕਾਰਾਂ ਨੂੰ ਸਾਲਾਨਾ ਕਰੋੜਾਂ ਡਾਲਰਾਂ ਦਾ ਨੁਕਸਾਨ ਪਹੁੰਚਾ ਰਿਹਾ ਹੈ। ਨੀਤੀਗਤ ਪ੍ਰਤੀਕਿਰਿਆ ਅਧਿਐਨ ਅਤੇ ਬਹਿਸ ਦੇ ਚੱਕਰ ਵਿੱਚ ਫਸੀ ਹੋਈ ਹੈ ਜਦੋਂ ਕਿ ਉਦਯੋਗਿਕ ਹਕੀਕਤ ਬਹੁਤ ਤੇਜ਼ ਰਫ਼ਤਾਰ ਨਾਲ ਅੱਗੇ ਵਧ ਰਹੀ ਹੈ। ਇਹ ਡਿਸਕਨੈਕਟ ਸਿਰਫ਼ ਇੱਕ ਨੌਕਰਸ਼ਾਹੀ ਦੀ ਅਸਫਲਤਾ ਨਹੀਂ ਹੈ। ਇਹ ਕਾਨੂੰਨ ਦੀ ਗਤੀ ਅਤੇ ਸਾਫਟਵੇਅਰ ਦੀ ਗਤੀ ਵਿਚਕਾਰ ਇੱਕ ਬੁਨਿਆਦੀ ਬੇਮੇਲਤਾ ਹੈ।
ਭਵਿੱਖ ਦੇ ਦਫਤਰ ਵਿੱਚ ਇੱਕ ਮੰਗਲਵਾਰ ਦੀ ਸਵੇਰ
ਸਾਰਾਹ ਨਾਮ ਦੀ ਇੱਕ ਕਾਰਪੋਰੇਟ ਖਜ਼ਾਨਚੀ ਦੇ ਜੀਵਨ ਵਿੱਚ ਇੱਕ ਦਿਨ ‘ਤੇ ਵਿਚਾਰ ਕਰੋ। ਇਹ ਇੱਕ ਵਿਅਸਤ ਮੰਗਲਵਾਰ ਦੀ ਸਵੇਰ ਹੈ। ਉਸਨੂੰ ਸੀਈਓ ਦਾ ਫ਼ੋਨ ਆਉਂਦਾ ਹੈ, ਜਿਸਦੀ ਆਵਾਜ਼ ਬੇਮਿਸਾਲ ਹੈ। ਉਹ ਤਣਾਅ ਵਿੱਚ ਲੱਗਦਾ ਹੈ ਅਤੇ ਦੱਸਦਾ ਹੈ ਕਿ ਉਹ ਇੱਕ ਰੌਲੇ-ਰੱਪੇ ਵਾਲੇ ਹਵਾਈ ਅੱਡੇ ‘ਤੇ ਹੈ। ਉਸਨੂੰ ਇੱਕ ਸੌਦੇ ਨੂੰ ਸੁਰੱਖਿਅਤ ਕਰਨ ਲਈ ਇੱਕ ਜ਼ਰੂਰੀ ਵਾਇਰ ਟ੍ਰਾਂਸਫਰ ਦੀ ਲੋੜ ਹੈ ਜੋ ਮਹੀਨਿਆਂ ਤੋਂ ਚੱਲ ਰਿਹਾ ਹੈ। ਉਹ ਪ੍ਰੋਜੈਕਟ ਦੇ ਖਾਸ ਨਾਮ ਅਤੇ ਸ਼ਾਮਲ ਕਾਨੂੰਨੀ ਫਰਮ ਦਾ ਜ਼ਿਕਰ ਕਰਦਾ ਹੈ। ਸਾਰਾਹ, ਮਦਦਗਾਰ ਬਣਨ ਦੀ ਇੱਛਾ ਨਾਲ, ਪ੍ਰਕਿਰਿਆ ਸ਼ੁਰੂ ਕਰਦੀ ਹੈ। ਦੂਜੇ ਪਾਸੇ ਦੀ ਆਵਾਜ਼ ਉਸਦੇ ਸਵਾਲਾਂ ਦਾ ਅਸਲ ਸਮੇਂ ਵਿੱਚ ਜਵਾਬ ਦਿੰਦੀ ਹੈ, ਇੱਥੋਂ ਤੱਕ ਕਿ ਟਰਮੀਨਲ ‘ਤੇ ਖਰਾਬ ਕੌਫੀ ਬਾਰੇ ਮਜ਼ਾਕ ਵੀ ਕਰਦੀ ਹੈ। ਇਹ ਕੋਈ ਰਿਕਾਰਡਿੰਗ ਨਹੀਂ ਹੈ। ਇਹ ਇੱਕ ਹਮਲਾਵਰ ਦੁਆਰਾ ਨਿਯੰਤਰਿਤ ਇੱਕ ਲਾਈਵ ਸਿੰਥੈਟਿਕ ਆਵਾਜ਼ ਹੈ ਜਿਸਨੇ ਕੰਪਨੀ ਦੀ ਅੰਦਰੂਨੀ ਭਾਸ਼ਾ ਦੀ ਖੋਜ ਕਰਨ ਵਿੱਚ ਹਫ਼ਤੇ ਬਿਤਾਏ ਹਨ। ਸਾਰਾਹ ਟ੍ਰਾਂਸਫਰ ਪੂਰਾ ਕਰਦੀ ਹੈ। ਸਿਰਫ਼ ਘੰਟਿਆਂ ਬਾਅਦ, ਜਦੋਂ ਉਹ ਇੱਕ ਫਾਲੋ-ਅਪ ਈਮੇਲ ਭੇਜਦੀ ਹੈ, ਤਾਂ ਉਸਨੂੰ ਅਹਿਸਾਸ ਹੁੰਦਾ ਹੈ ਕਿ ਸੀਈਓ ਅਸਲ ਵਿੱਚ ਪੂਰੇ ਸਮੇਂ ਲਈ ਇੱਕ ਬੋਰਡ ਮੀਟਿੰਗ ਵਿੱਚ ਸੀ। ਪੈਸੇ ਗਾਇਬ ਹਨ, ਖਾਤਿਆਂ ਦੀ ਇੱਕ ਲੜੀ ਰਾਹੀਂ ਭੇਜੇ ਗਏ ਹਨ ਜੋ ਮਿੰਟਾਂ ਵਿੱਚ ਗਾਇਬ ਹੋ ਜਾਂਦੇ ਹਨ। ਇਹ ਦ੍ਰਿਸ਼ ਹੁਣ ਇੱਕ ਸਿਧਾਂਤਕ ਅਭਿਆਸ ਨਹੀਂ ਹੈ। ਇਹ ਦੁਨੀਆ ਭਰ ਦੇ ਕਾਰੋਬਾਰਾਂ ਲਈ ਇੱਕ ਅਕਸਰ ਵਾਪਰਦੀ ਹਕੀਕਤ ਹੈ।
BotNews.today ਸਮੱਗਰੀ ਦੀ ਖੋਜ, ਲਿਖਣ, ਸੰਪਾਦਨ ਅਤੇ ਅਨੁਵਾਦ ਕਰਨ ਲਈ AI ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਸਾਡੀ ਟੀਮ ਜਾਣਕਾਰੀ ਨੂੰ ਉਪਯੋਗੀ, ਸਪਸ਼ਟ ਅਤੇ ਭਰੋਸੇਮੰਦ ਰੱਖਣ ਲਈ ਪ੍ਰਕਿਰਿਆ ਦੀ ਸਮੀਖਿਆ ਅਤੇ ਨਿਗਰਾਨੀ ਕਰਦੀ ਹੈ।
ਇਸ ਕਿਸਮ ਦੀ ਧੋਖਾਧੜੀ ਰਵਾਇਤੀ ਫਿਸ਼ਿੰਗ ਨਾਲੋਂ ਵਧੇਰੇ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਹੈ ਕਿਉਂਕਿ ਇਹ ਸਾਡੇ ਕੁਦਰਤੀ ਸ਼ੱਕ ਨੂੰ ਬਾਈਪਾਸ ਕਰਦੀ ਹੈ। ਅਸੀਂ ਈਮੇਲਾਂ ਵਿੱਚ ਟਾਈਪੋ ਲੱਭਣ ਲਈ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਹਾਂ, ਪਰ ਅਸੀਂ ਅਜੇ ਕਿਸੇ ਲੰਬੇ ਸਮੇਂ ਦੇ ਸਹਿਕਰਮੀ ਦੀ ਆਵਾਜ਼ ‘ਤੇ ਸ਼ੱਕ ਕਰਨ ਲਈ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਨਹੀਂ ਹਾਂ। ਫ਼ੋਨ ਕਾਲ ਦਾ ਭਾਵਨਾਤਮਕ ਦਬਾਅ ਵੀ ਸਾਡੀ ਆਲੋਚਨਾਤਮਕ ਸੋਚਣ ਦੀ ਸਮਰੱਥਾ ਨੂੰ ਸੀਮਤ ਕਰਦਾ ਹੈ। ਇੱਕ ਸੁਰੱਖਿਆ ਵਿਸ਼ਲੇਸ਼ਕ ਲਈ, ਦਿਨ ਹੁਣ ਸਿਰਫ਼ ਫਾਇਰਵਾਲਾਂ ਦੀ ਨਿਗਰਾਨੀ ਕਰਨ ਦੀ ਬਜਾਏ ਸੰਚਾਰ ਪੈਟਰਨਾਂ ਵਿੱਚ ਵਿਗਾੜਾਂ ਦੀ ਭਾਲ ਵਿੱਚ ਬਿਤਾਇਆ ਜਾਂਦਾ ਹੈ। ਉਹਨਾਂ ਨੂੰ ਨਵੇਂ ਪ੍ਰੋਟੋਕੋਲ ਲਾਗੂ ਕਰਨੇ ਪੈਂਦੇ ਹਨ, ਜਿਵੇਂ ਕਿ “ਚੈਲੇਂਜ-ਰਿਸਪੌਂਸ” ਵਾਕਾਂਸ਼ ਜੋ ਕਦੇ ਵੀ ਡਿਜੀਟਲ ਰੂਪ ਵਿੱਚ ਸਾਂਝੇ ਨਹੀਂ ਕੀਤੇ ਜਾਂਦੇ ਹਨ। ਇੱਕ ਸੁਰੱਖਿਆ ਟੀਮ ਆਪਣੀ ਸਵੇਰ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਬਾਰੇ ਨਵੀਨਤਮ ਜਾਣਕਾਰੀ ਦੀ ਸਮੀਖਿਆ ਕਰਨ ਵਿੱਚ ਬਿਤਾ ਸਕਦੀ ਹੈ ਤਾਂ ਜੋ ਹਮਲਿਆਂ ਦੀ ਅਗਲੀ ਲਹਿਰ ਤੋਂ ਅੱਗੇ ਰਹਿ ਸਕੇ। ਉਹ ਹੁਣ ਸਿਰਫ਼ ਹੈਕਰਾਂ ਨਾਲ ਨਹੀਂ ਲੜ ਰਹੇ ਹਨ। ਉਹ ਉਸ ਮਨੋਵਿਗਿਆਨਕ ਨਿਸ਼ਚਿਤਤਾ ਨਾਲ ਲੜ ਰਹੇ ਹਨ ਜੋ ਸਾਡੇ ਕੰਨ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ। ਹਕੀਕਤ ਇਹ ਹੈ ਕਿ ਮਨੁੱਖੀ ਆਵਾਜ਼ ਹੁਣ ਇੱਕ ਸੁਰੱਖਿਅਤ ਪ੍ਰਮਾਣ ਪੱਤਰ ਨਹੀਂ ਰਹੀ। ਇਹ ਅਹਿਸਾਸ ਇਸ ਗੱਲ ‘ਤੇ ਮੁੜ ਵਿਚਾਰ ਕਰਨ ਲਈ ਮਜਬੂਰ ਕਰ ਰਿਹਾ ਹੈ ਕਿ ਕਾਰਪੋਰੇਟ ਵਾਤਾਵਰਣ ਵਿੱਚ ਵਿਸ਼ਵਾਸ ਕਿਵੇਂ ਸਥਾਪਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਇਸ ਤਬਦੀਲੀ ਦੀ ਕੀਮਤ ਸਿਰਫ਼ ਵਿੱਤੀ ਨਹੀਂ ਹੈ। ਇਹ ਉਸ ਆਮ, ਉੱਚ-ਭਰੋਸੇ ਵਾਲੇ ਸੰਚਾਰ ਦਾ ਨੁਕਸਾਨ ਹੈ ਜੋ ਸੰਸਥਾਵਾਂ ਨੂੰ ਕੁਸ਼ਲਤਾ ਨਾਲ ਕੰਮ ਕਰਨ ਲਈ ਮਜਬੂਰ ਕਰਦਾ ਹੈ। ਹਰ ਕਾਲ ਹੁਣ ਸ਼ੱਕ ਦਾ ਇੱਕ ਲੁਕਿਆ ਹੋਇਆ ਟੈਕਸ ਰੱਖਦੀ ਹੈ।
ਇੱਕ ਸਿੰਥੈਟਿਕ ਯੁੱਗ ਲਈ ਸਖ਼ਤ ਸਵਾਲ
ਸਾਨੂੰ ਇਸ ਤਕਨਾਲੋਜੀ ਦੇ ਮੌਜੂਦਾ ਰਾਹ ‘ਤੇ ਸੁਕਰਾਤੀ ਸ਼ੱਕ ਦਾ ਪੱਧਰ ਲਾਗੂ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ। ਜੇਕਰ ਕਿਸੇ ਵੀ ਆਵਾਜ਼ ਨੂੰ ਕਲੋਨ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ, ਤਾਂ ਜਨਤਕ ਸ਼ਖਸੀਅਤ ਨੂੰ ਬਣਾਈ ਰੱਖਣ ਦੀ ਲੁਕਵੀਂ ਕੀਮਤ ਕੀ ਹੈ? ਅਸੀਂ ਅਸਲ ਵਿੱਚ ਹਰ ਜਨਤਕ ਬੁਲਾਰੇ, ਕਾਰਜਕਾਰੀ ਅਤੇ ਪ੍ਰਭਾਵਕ ਨੂੰ ਦੱਸ ਰਹੇ ਹਾਂ ਕਿ ਉਹਨਾਂ ਦੀ ਵੋਕਲ ਪਛਾਣ ਹੁਣ ਜਨਤਕ ਜਾਇਦਾਦ ਹੈ। ਬਚਾਅ ਦੇ ਕੰਪਿਊਟ ਖਰਚਿਆਂ ਲਈ ਕੌਣ ਜ਼ਿੰਮੇਵਾਰ ਹੈ? ਜੇਕਰ ਕੰਪਨੀਆਂ ਨੂੰ ਇਹ ਪੁਸ਼ਟੀ ਕਰਨ ਲਈ ਲੱਖਾਂ ਖਰਚ ਕਰਨੇ ਪੈਂਦੇ ਹਨ ਕਿ ਉਹਨਾਂ ਦੇ ਕਰਮਚਾਰੀ ਉਹ ਹਨ ਜੋ ਉਹ ਕਹਿੰਦੇ ਹਨ, ਤਾਂ ਇਹ ਵਿਸ਼ਵ ਅਰਥਚਾਰੇ ‘ਤੇ ਸਿੱਧਾ ਅਸਰ ਹੈ। ਸਾਨੂੰ “ਝੂਠੇ ਦੇ ਲਾਭਅੰਸ਼” ਬਾਰੇ ਵੀ ਪੁੱਛਣਾ ਪਵੇਗਾ। ਇਹ ਉਹ ਵਰਤਾਰਾ ਹੈ ਜਿੱਥੇ ਇੱਕ ਅਸਲ ਰਿਕਾਰਡਿੰਗ ਵਿੱਚ ਫੜਿਆ ਗਿਆ ਵਿਅਕਤੀ ਸਿਰਫ਼ ਇਹ ਦਾਅਵਾ ਕਰ ਸਕਦਾ ਹੈ ਕਿ ਇਹ ਇੱਕ ਡੀਪਫੇਕ ਸੀ। ਇਹ ਇੱਕ ਅਜਿਹੀ ਦੁਨੀਆ ਬਣਾਉਂਦਾ ਹੈ ਜਿੱਥੇ ਕੋਈ ਵੀ ਸਬੂਤ ਨਿਸ਼ਚਿਤ ਨਹੀਂ ਹੁੰਦਾ। ਇੱਕ ਕਾਨੂੰਨੀ ਪ੍ਰਣਾਲੀ ਕਿਵੇਂ ਕੰਮ ਕਰਦੀ ਹੈ ਜਦੋਂ ਸਬੂਤ ਦਾ ਮੁੱਖ ਰੂਪ—ਗਵਾਹ ਦੀ ਰਿਕਾਰਡਿੰਗ—ਨੂੰ ਸਿੰਥੈਟਿਕ ਉਤਪਾਦ ਵਜੋਂ ਖਾਰਜ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ? ਅਸੀਂ ਇੱਕ ਅਜਿਹੀ ਹਕੀਕਤ ਵੱਲ ਵਧ ਰਹੇ ਹਾਂ ਜਿੱਥੇ ਸੱਚਾਈ ਸਿਰਫ਼ ਲੁਕੀ ਹੋਈ ਨਹੀਂ, ਸਗੋਂ ਸੰਭਾਵੀ ਤੌਰ ‘ਤੇ ਅਪ੍ਰਮਾਣਿਤ ਹੈ। ਕੀ ਜਨਰੇਟਿਵ ਆਡੀਓ ਦੀ ਸਹੂਲਤ ਆਡੀਟੋਰੀ ਸਬੂਤਾਂ ਦੇ ਕੁੱਲ ਵਿਨਾਸ਼ ਦੇ ਯੋਗ ਹੈ? ਇਹ ਦੂਰ ਦੇ ਭਵਿੱਖ ਲਈ ਸਵਾਲ ਨਹੀਂ ਹਨ। ਇਹ ਲਈ ਸਵਾਲ ਹਨ। ਅਸੀਂ ਇਹ ਵੀ ਦੇਖ ਰਹੇ ਹਾਂ ਕਿ ਸੁਰੱਖਿਆ ਦਾ ਖਰਚਾ ਕੌਣ ਉਠਾ ਸਕਦਾ ਹੈ। ਵੱਡੀਆਂ ਕਾਰਪੋਰੇਸ਼ਨਾਂ ਮਹਿੰਗੇ ਵੈਰੀਫਿਕੇਸ਼ਨ ਟੂਲ ਖਰੀਦ ਸਕਦੀਆਂ ਹਨ, ਪਰ ਉਸ ਆਮ ਵਿਅਕਤੀ ਦਾ ਕੀ ਜਿਸਦੇ ਬਜ਼ੁਰਗ ਮਾਤਾ-ਪਿਤਾ ਨੂੰ ਵੌਇਸ-ਕਲੋਨਡ ਅਗਵਾ ਘੁਟਾਲੇ ਦੁਆਰਾ ਨਿਸ਼ਾਨਾ ਬਣਾਇਆ ਜਾਂਦਾ ਹੈ? ਗੋਪਨੀਯਤਾ ਦਾ ਪਾੜਾ ਵਧ ਰਿਹਾ ਹੈ, ਅਤੇ ਸਭ ਤੋਂ ਕਮਜ਼ੋਰ ਉਹ ਹਨ ਜੋ ਬਿਨਾਂ ਕਿਸੇ ਢਾਲ ਦੇ ਰਹਿ ਗਏ ਹਨ।
ਕੀ ਤੁਹਾਡੇ ਕੋਲ ਕੋਈ AI ਕਹਾਣੀ, ਟੂਲ, ਰੁਝਾਨ ਜਾਂ ਸਵਾਲ ਹੈ ਜੋ ਤੁਹਾਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ ਸਾਨੂੰ ਕਵਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ? ਸਾਨੂੰ ਆਪਣਾ ਲੇਖ ਦਾ ਵਿਚਾਰ ਭੇਜੋ — ਅਸੀਂ ਇਸਨੂੰ ਸੁਣਨਾ ਪਸੰਦ ਕਰਾਂਗੇ।
ਡੀਪਫੇਕ ਪ੍ਰਣਾਲੀਆਂ ਦੀ ਲੇਟੈਂਸੀ ਅਤੇ ਤਰਕ
ਇਹ ਸਮਝਣ ਲਈ ਕਿ ਇਸਨੂੰ ਰੋਕਣਾ ਇੰਨਾ ਮੁਸ਼ਕਲ ਕਿਉਂ ਹੈ, ਸਾਨੂੰ ਇਹਨਾਂ ਪ੍ਰਣਾਲੀਆਂ ਦੀਆਂ ਪਾਵਰ ਯੂਜ਼ਰ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਦੇਖਣਾ ਪਵੇਗਾ। ਜ਼ਿਆਦਾਤਰ ਆਧੁਨਿਕ ਵੌਇਸ ਕਲੋਨਿੰਗ ਟੂਲ ਇੱਕ API-ਅਧਾਰਿਤ ਆਰਕੀਟੈਕਚਰ ‘ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹਨ। OpenAI ਜਾਂ ElevenLabs ਵਰਗੀਆਂ ਸੇਵਾਵਾਂ ਬਹੁਤ ਘੱਟ ਲੇਟੈਂਸੀ ਦੇ ਨਾਲ ਉੱਚ-ਵਫ਼ਾਦਾਰੀ ਆਉਟਪੁੱਟ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੀਆਂ ਹਨ। ਅਸੀਂ 500 ਮਿਲੀਸਕਿੰਟ ਤੋਂ ਇੱਕ ਸਕਿੰਟ ਦੀ ਦੇਰੀ ਬਾਰੇ ਗੱਲ ਕਰ ਰਹੇ ਹਾਂ। ਇਹ ਇੱਕ ਕੁਦਰਤੀ ਗੱਲਬਾਤ ਲਈ ਕਾਫ਼ੀ ਤੇਜ਼ ਹੈ। ਉਹਨਾਂ ਲਈ ਜੋ ਪ੍ਰਬੰਧਿਤ ਸੇਵਾ ਦੀਆਂ ਪਾਬੰਦੀਆਂ ਤੋਂ ਬਚਣਾ ਚਾਹੁੰਦੇ ਹਨ, ਮਾਡਲ ਵੇਟਸ ਦੀ ਸਥਾਨਕ ਸਟੋਰੇਜ ਤਰਜੀਹੀ ਰਸਤਾ ਹੈ। 12GB VRAM ਵਾਲਾ ਇੱਕ ਮਿਆਰੀ ਕੰਜ਼ਿਊਮਰ GPU ਹੁਣ ਇੱਕ ਵਧੀਆ RVC (ਰਿਟ੍ਰੀਵਲ-ਅਧਾਰਿਤ ਵੌਇਸ ਕਨਵਰਜ਼ਨ) ਮਾਡਲ ਚਲਾ ਸਕਦਾ ਹੈ। ਇਹ ਇੱਕ ਹਮਲਾਵਰ ਨੂੰ ਸਥਾਨਕ ਤੌਰ ‘ਤੇ ਆਡੀਓ ਨੂੰ ਪ੍ਰੋਸੈਸ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ, ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦੇ ਹੋਏ ਕਿ ਉਹਨਾਂ ਦੀਆਂ ਗਤੀਵਿਧੀਆਂ ਨੂੰ ਕਦੇ ਵੀ ਤੀਜੀ-ਧਿਰ ਪ੍ਰਦਾਤਾ ਦੁਆਰਾ ਲੌਗ ਨਹੀਂ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਵਰਕਫਲੋ ਏਕੀਕਰਣ ਵੀ ਸਹਿਜ ਹੁੰਦਾ ਜਾ ਰਿਹਾ ਹੈ। ਧੋਖੇਬਾਜ਼ ਆਪਣੇ ਸਿੰਥੈਟਿਕ ਆਡੀਓ ਨੂੰ ਸਿੱਧੇ ਇੱਕ ਵਰਚੁਅਲ ਮਾਈਕ੍ਰੋਫੋਨ ਵਿੱਚ ਪਾਈਪ ਕਰ ਸਕਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਇਹ ਜ਼ੂਮ, ਟੀਮਾਂ, ਜਾਂ VoIP ਗੇਟਵੇ ਰਾਹੀਂ ਇੱਕ ਮਿਆਰੀ ਫ਼ੋਨ ਲਾਈਨ ਲਈ ਇੱਕ ਜਾਇਜ਼ ਇਨਪੁਟ ਵਜੋਂ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ।
ਇਹਨਾਂ ਪ੍ਰਣਾਲੀਆਂ ‘ਤੇ ਸੀਮਾਵਾਂ ਜ਼ਿਆਦਾਤਰ ਕੰਪਿਊਟ ਪਾਵਰ ਦੀ ਬਜਾਏ ਡੇਟਾ ਦੀ ਗੁਣਵੱਤਾ ਨਾਲ ਸਬੰਧਤ ਹਨ। ਇੱਕ ਮਾਡਲ ਸਿਰਫ਼ ਰੈਫਰੈਂਸ ਆਡੀਓ ਜਿੰਨਾ ਹੀ ਵਧੀਆ ਹੁੰਦਾ ਹੈ। ਹਾਲਾਂਕਿ, ਇੰਟਰਨੈਟ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਵੋਕਲ ਡੇਟਾ ਦਾ ਇੱਕ ਵਿਸ਼ਾਲ ਭੰਡਾਰ ਹੈ। ਡਿਵੈਲਪਰਾਂ ਲਈ, ਚੁਣੌਤੀ ਇਨਫਰੈਂਸ ਸਪੀਡ ਦਾ ਪ੍ਰਬੰਧਨ ਕਰਨਾ ਹੈ। ਜੇਕਰ ਲੇਟੈਂਸੀ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹੈ, ਤਾਂ ਗੱਲਬਾਤ “ਬੰਦ” ਮਹਿਸੂਸ ਹੁੰਦੀ ਹੈ। ਪਾਵਰ ਯੂਜ਼ਰਸ ਵਰਤਮਾਨ ਵਿੱਚ ਛੋਟੇ, ਕੁਆਂਟਾਈਜ਼ਡ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਆਪਣੇ ਸਟੈਕ ਨੂੰ ਅਨੁਕੂਲਿਤ ਕਰ ਰਹੇ ਹਨ ਜੋ ਜਵਾਬਦੇਹੀ ਵਿੱਚ ਵੱਡੇ ਲਾਭ ਲਈ ਵਫ਼ਾਦਾਰੀ ਦਾ ਇੱਕ ਛੋਟਾ ਜਿਹਾ ਹਿੱਸਾ ਕੁਰਬਾਨ ਕਰਦੇ ਹਨ। ਉਹ ਆਮ ਨਿਸ਼ਾਨਿਆਂ ਦੀਆਂ ਪਹਿਲਾਂ ਤੋਂ ਗਣਨਾ ਕੀਤੀਆਂ ਵੋਕਲ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਸਟੋਰ ਕਰਨ ਲਈ ਸਥਾਨਕ ਡੇਟਾਬੇਸ ਦੀ ਵਰਤੋਂ ਵੀ ਕਰ ਰਹੇ ਹਨ। ਤਕਨੀਕੀ ਸੂਝ-ਬੂਝ ਦੇ ਇਸ ਪੱਧਰ ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਬਚਾਅ ਵੀ ਬਰਾਬਰ ਸਵੈਚਾਲਿਤ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਮੈਨੂਅਲ ਪੁਸ਼ਟੀ ਬਹੁਤ ਹੌਲੀ ਹੈ। ਅਸੀਂ ਇੱਕ ਅਜਿਹੇ ਪੜਾਅ ਵਿੱਚ ਦਾਖਲ ਹੋ ਰਹੇ ਹਾਂ ਜਿੱਥੇ AI-ਸੰਚਾਲਿਤ “ਸਰੋਤਿਆਂ” ਨੂੰ ਅਸਲ ਸਮੇਂ ਵਿੱਚ ਆਡੀਓ ਦੀ ਸਪੈਕਟ੍ਰਲ ਇਕਸਾਰਤਾ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਲਈ ਸਾਡੀਆਂ ਫ਼ੋਨ ਲਾਈਨਾਂ ‘ਤੇ ਬੈਠਣਾ ਪਵੇਗਾ। ਇਹ ਗੋਪਨੀਯਤਾ ਦੀਆਂ ਚਿੰਤਾਵਾਂ ਦਾ ਇੱਕ ਨਵਾਂ ਸਮੂਹ ਪੈਦਾ ਕਰਦਾ ਹੈ। ਸਾਨੂੰ ਫੇਕ ਤੋਂ ਬਚਾਉਣ ਲਈ, ਕੀ ਸਾਨੂੰ ਇੱਕ ਐਲਗੋਰਿਦਮ ਨੂੰ ਸਾਡੇ ਦੁਆਰਾ ਕਹੇ ਗਏ ਹਰ ਸ਼ਬਦ ਨੂੰ ਸੁਣਨ ਦੇਣਾ ਪਵੇਗਾ? ਸੁਰੱਖਿਆ ਅਤੇ ਗੋਪਨੀਯਤਾ ਵਿਚਕਾਰ ਵਪਾਰ-ਬੰਦ ਕਦੇ ਵੀ ਇੰਨਾ ਸ਼ਾਬਦਿਕ ਨਹੀਂ ਰਿਹਾ ਹੈ।
- ਰੀਅਲ-ਟਾਈਮ ਵੌਇਸ ਕਲੋਨਿੰਗ ਲਈ ਔਸਤ ਲੇਟੈਂਸੀ ਪਿਛਲੇ ਬਾਰਾਂ ਮਹੀਨਿਆਂ ਵਿੱਚ 800 ਮਿਲੀਸਕਿੰਟ ਤੋਂ ਹੇਠਾਂ ਆ ਗਈ ਹੈ।
- ਵੌਇਸ ਕਨਵਰਜ਼ਨ ਲਈ ਓਪਨ-ਸੋਰਸ ਰਿਪੋਜ਼ਟਰੀਆਂ ਵਿੱਚ ਮੌਜੂਦਾ ਚੱਕਰ ਦੀ ਸ਼ੁਰੂਆਤ ਤੋਂ ਬਾਅਦ ਯੋਗਦਾਨਾਂ ਵਿੱਚ 300 ਪ੍ਰਤੀਸ਼ਤ ਦਾ ਵਾਧਾ ਦੇਖਿਆ ਗਿਆ ਹੈ।
ਨਵੇਂ ਖਤਰੇ ਦੀ ਹਕੀਕਤ
ਡੀਪਫੇਕ ਵਿੱਚ ਸਭ ਤੋਂ ਖਤਰਨਾਕ ਰੁਝਾਨ ਆਮ ਚੀਜ਼ਾਂ ਵੱਲ ਵਧਣਾ ਹੈ। ਇਹ ਉੱਚ-ਬਜਟ ਵਾਲੀ ਫਿਲਮ ਜਾਂ ਵਾਇਰਲ ਪੈਰੋਡੀ ਨਹੀਂ ਹੈ ਜਿਸ ਬਾਰੇ ਸਾਨੂੰ ਚਿੰਤਾ ਕਰਨੀ ਚਾਹੀਦੀ ਹੈ। ਇਹ ਸ਼ਾਂਤ, ਪੇਸ਼ੇਵਰ ਅਤੇ ਬਹੁਤ ਹੀ ਯਕੀਨੀ ਆਡੀਓ ਹੈ ਜੋ ਇੱਕ ਮਿਆਰੀ ਫ਼ੋਨ ਕਾਲ ਰਾਹੀਂ ਆਉਂਦਾ ਹੈ। ਇਸ ਤਕਨਾਲੋਜੀ ਨੇ ਸਾਡੀ ਪਛਾਣ ਦੇ ਸਭ ਤੋਂ ਮਨੁੱਖੀ ਹਿੱਸੇ: ਸਾਡੀ ਆਵਾਜ਼ ਨੂੰ ਸਫਲਤਾਪੂਰਵਕ ਹਥਿਆਰ ਬਣਾਇਆ ਹੈ। ਜਿਵੇਂ ਕਿ ਅਸੀਂ ਰਾਇਟਰਜ਼ ਦੀਆਂ ਰਿਪੋਰਟਾਂ ਵਿੱਚ ਦੇਖਿਆ ਹੈ, ਇਸ ਸਮੱਸਿਆ ਦਾ ਪੈਮਾਨਾ ਵਿਸ਼ਵਵਿਆਪੀ ਹੈ ਅਤੇ ਹੱਲ ਵਰਤਮਾਨ ਵਿੱਚ ਖੰਡਿਤ ਹਨ। ਅਸੀਂ ਇੱਕ ਅਜਿਹੇ ਦੌਰ ਵਿੱਚੋਂ ਲੰਘ ਰਹੇ ਹਾਂ ਜਿੱਥੇ AI ਵਿਕਾਸ ਦੀ ਉਦਯੋਗਿਕ ਗਤੀ ਨੇ ਹਕੀਕਤ ਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਦੀ ਸਾਡੀ ਸਮਾਜਿਕ ਅਤੇ ਕਾਨੂੰਨੀ ਯੋਗਤਾ ਨੂੰ ਪਿੱਛੇ ਛੱਡ ਦਿੱਤਾ ਹੈ। ਅੱਗੇ ਦਾ ਰਸਤਾ ਸਿਰਫ਼ ਬਿਹਤਰ ਸਾਫਟਵੇਅਰ ਨਾਲੋਂ ਵੱਧ ਮੰਗਦਾ ਹੈ। ਇਸ ਲਈ ਇੱਕ ਡਿਜੀਟਲ ਸੰਸਾਰ ਵਿੱਚ ਵਿਸ਼ਵਾਸ ਤੱਕ ਪਹੁੰਚਣ ਦੇ ਤਰੀਕੇ ਵਿੱਚ ਇੱਕ ਬੁਨਿਆਦੀ ਤਬਦੀਲੀ ਦੀ ਲੋੜ ਹੈ। ਅਸੀਂ ਹੁਣ ਇਹ ਨਹੀਂ ਮੰਨ ਸਕਦੇ ਕਿ ਸੁਣਨਾ ਹੀ ਵਿਸ਼ਵਾਸ ਕਰਨਾ ਹੈ। ਵੋਕਲ ਫਿੰਗਰਪ੍ਰਿੰਟ ਟੁੱਟ ਗਿਆ ਹੈ ਅਤੇ ਮੁਰੰਮਤ ਦੀ ਪ੍ਰਕਿਰਿਆ ਲੰਬੀ, ਮਹਿੰਗੀ ਅਤੇ ਤਕਨੀਕੀ ਤੌਰ ‘ਤੇ ਮੰਗ ਵਾਲੀ ਹੋਵੇਗੀ। ਸਾਨੂੰ ਹਰ ਅਪ੍ਰਮਾਣਿਤ ਬੇਨਤੀ ‘ਤੇ ਸ਼ੱਕ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ, ਭਾਵੇਂ ਆਵਾਜ਼ ਕਿੰਨੀ ਵੀ ਜਾਣੀ-ਪਛਾਣੀ ਕਿਉਂ ਨਾ ਲੱਗੇ। ਇਸ ਨਵੇਂ ਸਿੰਥੈਟਿਕ ਵਾਤਾਵਰਣ ਵਿੱਚ ਗਲਤੀ ਦੀ ਕੀਮਤ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹੈ।
संपादक का नोट: हमने इस साइट को उन लोगों के लिए एक बहुभाषी AI समाचार और गाइड हब के रूप में बनाया है जो कंप्यूटर गीक नहीं हैं, लेकिन फिर भी आर्टिफिशियल इंटेलिजेंस को समझना चाहते हैं, इसे अधिक आत्मविश्वास के साथ उपयोग करना चाहते हैं, और उस भविष्य का अनुसरण करना चाहते हैं जो पहले से ही आ रहा है।
ਕੋਈ ਗਲਤੀ ਮਿਲੀ ਜਾਂ ਕੁਝ ਠੀਕ ਕਰਨ ਦੀ ਲੋੜ ਹੈ? ਸਾਨੂੰ ਦੱਸੋ।