ਉਹ ਲਾਈਵ ਡੈਮੋ ਜਿਨ੍ਹਾਂ ਨੇ AI ਬਾਰੇ ਗੱਲਬਾਤ ਬਦਲ ਦਿੱਤੀ
AI ਡੈਮੋ ਅਕਸਰ ਇੰਜੀਨੀਅਰਿੰਗ ਨਾਲੋਂ ਮਾਰਕੀਟਿੰਗ ਬਾਰੇ ਜ਼ਿਆਦਾ ਹੁੰਦੇ ਹਨ। ਉਹ ਇੱਕ ਅਜਿਹੀ ਦੁਨੀਆ ਦਿਖਾਉਂਦੇ ਹਨ ਜਿੱਥੇ ਸਾਫਟਵੇਅਰ ਹਰ ਬਾਰੀਕੀ ਨੂੰ ਸਮਝਦਾ ਹੈ ਅਤੇ ਤੁਰੰਤ ਜਵਾਬ ਦਿੰਦਾ ਹੈ। ਪਰ ਜ਼ਿਆਦਾਤਰ ਲੋਕਾਂ ਲਈ, ਅਸਲੀਅਤ ਸਿਰਫ ਇੱਕ ਘੁੰਮਦਾ ਹੋਇਆ ਲੋਡਿੰਗ ਆਈਕਨ ਜਾਂ ਕੋਈ ਬੇਤੁਕਾ ਜਵਾਬ ਹੁੰਦੀ ਹੈ। ਸਾਨੂੰ ਇਹਨਾਂ ਪੇਸ਼ਕਾਰੀਆਂ ਨੂੰ ਵਾਅਦਿਆਂ ਦੀ ਬਜਾਏ ਪ੍ਰਦਰਸ਼ਨ ਵਜੋਂ ਦੇਖਣ ਦੀ ਲੋੜ ਹੈ। ਤਕਨਾਲੋਜੀ ਦੀ ਅਸਲ ਕੀਮਤ ਕਿਸੇ ਵੀਡੀਓ ਵਿੱਚ ਨਹੀਂ, ਸਗੋਂ ਇਸ ਵਿੱਚ ਹੈ ਕਿ ਇਹ ਇੱਕ ਖਿੰਡੇ ਹੋਏ ਕਮਰੇ ਜਾਂ ਕਮਜ਼ੋਰ ਸਿਗਨਲ ਨੂੰ ਕਿਵੇਂ ਸੰਭਾਲਦੀ ਹੈ। ਜਦੋਂ ਕੋਈ ਕੰਪਨੀ ਕਿਸੇ ਵਿਅਕਤੀ ਨਾਲ ਗੱਲ ਕਰਦੇ ਹੋਏ ਨਵੇਂ ਵੌਇਸ ਅਸਿਸਟੈਂਟ ਨੂੰ ਦਿਖਾਉਂਦੀ ਹੈ, ਤਾਂ ਉਹ ਸਭ ਤੋਂ ਵਧੀਆ ਹਾਰਡਵੇਅਰ ਅਤੇ ਸਭ ਤੋਂ ਤੇਜ਼ ਇੰਟਰਨੈੱਟ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ। ਇਹ ਇੱਕ ਉਮੀਦ ਪੈਦਾ ਕਰਦਾ ਹੈ ਕਿ ਇਹ ਤਕਨੀਕ ਜਕਾਰਤਾ ਦੇ ਕਿਸੇ ਵਿਦਿਆਰਥੀ ਜਾਂ ਕੀਨੀਆ ਦੇ ਕਿਸੇ ਕਿਸਾਨ ਲਈ ਵੀ ਉਸੇ ਤਰ੍ਹਾਂ ਕੰਮ ਕਰੇਗੀ। ਅਕਸਰ, ਇਹ ਵੀਡੀਓ ਦੇਖਣ ਵਾਲੇ ਲੋਕ ਇਹ ਨਹੀਂ ਸਮਝਦੇ ਕਿ ਗਲਤੀਆਂ ਤੋਂ ਬਚਣ ਲਈ ਇੰਟਰੈਕਸ਼ਨ ਨੂੰ ਕਿੰਨਾ ਜ਼ਿਆਦਾ ਕੰਟਰੋਲ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਇਹ ਪਾੜਾ ਹੀ ਹੈ ਜਿੱਥੇ ਅਕਸਰ ਭਰੋਸਾ ਟੁੱਟ ਜਾਂਦਾ ਹੈ। ਮੌਜੂਦਾ 2026 ਤਕਨੀਕੀ ਰਿਲੀਜ਼ਾਂ ਦਾ ਚੱਕਰ ਇਹਨਾਂ ਵਿਜ਼ੂਅਲ ਤਮਾਸ਼ਿਆਂ ‘ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਕੇਂਦ੍ਰਿਤ ਰਿਹਾ ਹੈ। ਅਸੀਂ ਰੋਬੋਟਾਂ ਨੂੰ ਕੱਪੜੇ ਤਹਿ ਕਰਦੇ ਜਾਂ AI ਏਜੰਟਾਂ ਨੂੰ ਇੱਕ ਕਮਾਂਡ ਨਾਲ ਫਲਾਈਟਾਂ ਬੁੱਕ ਕਰਦੇ ਦੇਖਦੇ ਹਾਂ। ਹਾਲਾਂਕਿ ਇਹ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਕਾਰਨਾਮੇ ਹਨ, ਪਰ ਇਹ ਹਮੇਸ਼ਾ ਜਨਤਾ ਲਈ ਇੱਕ ਭਰੋਸੇਯੋਗ ਉਤਪਾਦ ਵਿੱਚ ਨਹੀਂ ਬਦਲਦੇ। ਸਾਨੂੰ ਉਸ ਉਤਪਾਦ ਵਿੱਚ ਫਰਕ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਜੋ ਦੁਨੀਆ ਲਈ ਤਿਆਰ ਹੈ ਅਤੇ ਉਸ ਸੰਭਾਵਨਾ ਵਿੱਚ ਜੋ ਅਜੇ ਵੀ ਲੈਬ ਵਿੱਚ ਹੈ। ਜੇ ਅਜਿਹਾ ਨਹੀਂ ਕਰਦੇ, ਤਾਂ ਅਸੀਂ ਝੂਠੀਆਂ ਉਮੀਦਾਂ ਪੈਦਾ ਕਰਦੇ ਹਾਂ।
ਆਧੁਨਿਕ ਪੇਸ਼ਕਾਰੀ ਦੀ ਮਕੈਨਿਕਸ
ਇੱਕ ਡੈਮੋ ਇੱਕ ਨਿਯੰਤਰਿਤ ਵਾਤਾਵਰਣ ਹੁੰਦਾ ਹੈ ਜਿੱਥੇ ਕਿਸੇ ਫੀਚਰ ਨੂੰ ਉਜਾਗਰ ਕਰਨ ਲਈ ਵੇਰੀਏਬਲ ਹਟਾ ਦਿੱਤੇ ਜਾਂਦੇ ਹਨ। ਇਸ ਨੂੰ ਇੱਕ ਕੰਸੈਪਟ ਕਾਰ ਵਾਂਗ ਸੋਚੋ ਜਿਸ ਵਿੱਚ ਇੰਜਣ ਨਹੀਂ ਹੈ ਪਰ ਦਰਵਾਜ਼ੇ ਖੰਭਾਂ ਵਾਂਗ ਖੁੱਲ੍ਹਦੇ ਹਨ। ਇਸਦਾ ਮਤਲਬ ਰੋਜ਼ਾਨਾ ਸਵਾਰੀ ਦੇਣ ਦੀ ਬਜਾਏ ਦਿਲਚਸਪੀ ਪੈਦਾ ਕਰਨਾ ਹੈ। ਬਹੁਤ ਸਾਰੇ AI ਡੈਮੋ ਪਹਿਲਾਂ ਤੋਂ ਰਿਕਾਰਡ ਕੀਤੇ ਜਵਾਬਾਂ ਜਾਂ ਖਾਸ ਪ੍ਰੋਂਪਟਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਮਾਡਲ ਪੂਰੀ ਤਰ੍ਹਾਂ ਸੰਭਾਲਦਾ ਹੈ। ਇਹ ਧਾਰਨਾ ਇੰਜੀਨੀਅਰਾਂ ਨੂੰ ਇਹ ਦਿਖਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ ਕਿ ਉਹ ਭਵਿੱਖ ਵਿੱਚ ਕੀ ਪ੍ਰਾਪਤ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹਨ। ਅਕਾਦਮਿਕ ਸ਼ਬਦਾਵਲੀ ਜਿਵੇਂ ਕਿ low latency ਜਾਂ multimodal processing ਅਕਸਰ ਇਹਨਾਂ ਇਵੈਂਟਾਂ ਵਿੱਚ ਭਰੀ ਹੁੰਦੀ ਹੈ। Low latency ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਕੰਪਿਊਟਰ ਬਿਨਾਂ ਕਿਸੇ ਲੰਬੇ ਵਿਰਾਮ ਦੇ ਜਲਦੀ ਜਵਾਬ ਦਿੰਦਾ ਹੈ ਜੋ ਗੱਲਬਾਤ ਨੂੰ ਅਜੀਬ ਬਣਾਉਂਦਾ ਹੈ। Multimodal processing ਦਾ ਮਤਲਬ ਹੈ ਕਿ AI ਇੱਕੋ ਸਮੇਂ ਤਸਵੀਰਾਂ ਦੇਖ ਸਕਦਾ ਹੈ ਅਤੇ ਆਵਾਜ਼ਾਂ ਸੁਣ ਸਕਦਾ ਹੈ, ਨਾ ਕਿ ਸਿਰਫ ਟੈਕਸਟ ਪੜ੍ਹਨਾ। ਇਹ ਮੁਸ਼ਕਲ ਤਕਨੀਕੀ ਰੁਕਾਵਟਾਂ ਹਨ ਜਿਨ੍ਹਾਂ ਨੂੰ ਅਸਲ-ਸੰਸਾਰ ਸੈਟਿੰਗ ਵਿੱਚ ਸਾਫ਼ ਕਰਨ ਲਈ ਬਹੁਤ ਜ਼ਿਆਦਾ ਪਾਵਰ ਅਤੇ ਡੇਟਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਸਟੇਜਡ ਡੈਮੋ ਲਾਈਵ ਡੈਮੋ ਤੋਂ ਵੱਖਰੇ ਹੁੰਦੇ ਹਨ ਕਿਉਂਕਿ ਉਹਨਾਂ ਨੂੰ ਗਲਤੀਆਂ ਨੂੰ ਹਟਾਉਣ ਲਈ ਐਡਿਟ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਇੱਕ ਲਾਈਵ ਡੈਮੋ ਵਧੇਰੇ ਜੋਖਮ ਭਰਿਆ ਹੁੰਦਾ ਹੈ ਕਿਉਂਕਿ AI ਸਟੇਜ ‘ਤੇ ਅਸਫਲ ਹੋ ਸਕਦਾ ਹੈ ਜਾਂ ਅਜੀਬ ਨਤੀਜਾ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ। ਜਦੋਂ ਇੱਕ AI ਇੱਕ ਅਜੀਬ ਨਤੀਜਾ ਪੈਦਾ ਕਰਦਾ ਹੈ, ਤਾਂ ਇਸਨੂੰ ਅਕਸਰ hallucination ਕਿਹਾ ਜਾਂਦਾ ਹੈ। ਇੱਕ ਲਾਈਵ ਅਸਫਲਤਾ ਨੂੰ ਦੇਖਣਾ ਇੱਕ ਸੰਪੂਰਨ ਵੀਡੀਓ ਦੇਖਣ ਨਾਲੋਂ ਅਕਸਰ ਵਧੇਰੇ ਜਾਣਕਾਰੀ ਭਰਪੂਰ ਹੁੰਦਾ ਹੈ ਕਿਉਂਕਿ ਇਹ ਸਾਫਟਵੇਅਰ ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਇਹ ਪ੍ਰਭਾਵ ਸ਼ੁਰੂਆਤੀ ਤਕਨੀਕ ਵਿੱਚ ਆਮ ਹੈ।