ਕਾਪੀਰਾਈਟ ਦੀਆਂ ਲੜਾਈਆਂ AI ਉਤਪਾਦਾਂ ਨੂੰ ਕਿਵੇਂ ਬਦਲ ਸਕਦੀਆਂ ਹਨ
ਮੁਫਤ ਡੇਟਾ ਦੇ ਯੁੱਗ ਦਾ ਅੰਤ
ਬਿਨਾਂ ਕਿਸੇ ਨਤੀਜੇ ਦੇ ਡੇਟਾ ਇਕੱਠਾ ਕਰਨ ਦਾ ਯੁੱਗ ਖਤਮ ਹੋ ਗਿਆ ਹੈ। ਸਾਲਾਂ ਤੱਕ, ਡਿਵੈਲਪਰਾਂ ਨੇ ਇਹ ਮੰਨ ਕੇ ਵੱਡੇ ਲੈਂਗੂਏਜ ਮਾਡਲ ਬਣਾਏ ਕਿ ਖੁੱਲ੍ਹਾ ਇੰਟਰਨੈੱਟ ਇੱਕ ਜਨਤਕ ਸਰੋਤ ਹੈ। ਇਹ ਧਾਰਨਾ ਹੁਣ ਅਦਾਲਤ ਦੀ ਹਕੀਕਤ ਨਾਲ ਟਕਰਾ ਰਹੀ ਹੈ। ਨਿਊਜ਼ ਸੰਸਥਾਵਾਂ ਅਤੇ ਕਲਾਕਾਰਾਂ ਵੱਲੋਂ ਕੀਤੇ ਗਏ ਉੱਚ-ਪੱਧਰੀ ਮੁਕੱਦਮੇ ਇਹ ਬਦਲਣ ਲਈ ਮਜਬੂਰ ਕਰ ਰਹੇ ਹਨ ਕਿ ਇਹ ਉਤਪਾਦ ਕਿਵੇਂ ਬਣਾਏ ਅਤੇ ਵੇਚੇ ਜਾਂਦੇ ਹਨ। ਕੰਪਨੀਆਂ ਹੁਣ ਆਪਣੇ ਟ੍ਰੇਨਿੰਗ ਸੈੱਟਾਂ ਦੇ ਮੂਲ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਨਹੀਂ ਕਰ ਸਕਦੀਆਂ। ਨਤੀਜਾ ਇੱਕ ਲਾਇਸੰਸਸ਼ੁਦਾ ਮਾਡਲ ਵੱਲ ਵਧ ਰਿਹਾ ਹੈ ਜਿੱਥੇ ਹਰ ਟੋਕਨ ਦੀ ਇੱਕ ਕੀਮਤ ਹੈ। ਇਹ ਤਬਦੀਲੀ ਇਹ ਤੈਅ ਕਰੇਗੀ ਕਿ ਕਿਹੜੀਆਂ ਕੰਪਨੀਆਂ ਬਚਣਗੀਆਂ ਅਤੇ ਕਿਹੜੀਆਂ ਕਾਨੂੰਨੀ ਫੀਸਾਂ ਦੇ ਬੋਝ ਹੇਠ ਡਿੱਗ ਜਾਣਗੀਆਂ। ਇਹ ਸਿਰਫ਼ ਨੈਤਿਕਤਾ ਜਾਂ ਸਿਰਜਣਹਾਰਾਂ ਦੇ ਅਧਿਕਾਰਾਂ ਬਾਰੇ ਨਹੀਂ ਹੈ। ਇਹ ਕਾਰੋਬਾਰੀ ਸਥਿਰਤਾ ਦਾ ਮਾਮਲਾ ਹੈ। ਜੇਕਰ ਅਦਾਲਤਾਂ ਇਹ ਫੈਸਲਾ ਕਰਦੀਆਂ ਹਨ ਕਿ ਕਾਪੀਰਾਈਟ ਕੀਤੇ ਡੇਟਾ ‘ਤੇ ਟ੍ਰੇਨਿੰਗ ਦੇਣਾ ‘ਫੇਅਰ ਯੂਜ਼’ ਨਹੀਂ ਹੈ, ਤਾਂ ਇੱਕ ਮੁਕਾਬਲੇ ਵਾਲਾ ਮਾਡਲ ਬਣਾਉਣ ਦੀ ਲਾਗਤ ਅਸਮਾਨੀ ਚੜ੍ਹ ਜਾਵੇਗੀ। ਇਹ ਉਨ੍ਹਾਂ ਟੈਕ ਦਿੱਗਜਾਂ ਦੇ ਹੱਕ ਵਿੱਚ ਹੋਵੇਗਾ ਜਿਨ੍ਹਾਂ ਕੋਲ ਪਹਿਲਾਂ ਹੀ ਪੈਸਾ ਅਤੇ ਲਾਇਸੰਸਿੰਗ ਸੌਦੇ ਹਨ। ਛੋਟੇ ਖਿਡਾਰੀ ਆਪਣੇ ਆਪ ਨੂੰ ਮਾਰਕੀਟ ਤੋਂ ਬਾਹਰ ਮਹਿਸੂਸ ਕਰ ਸਕਦੇ ਹਨ। ਵਿਕਾਸ ਦੀ ਗਤੀ ਇੱਕ ਅਜਿਹੀ ਕਾਨੂੰਨੀ ਕੰਧ ਨਾਲ ਟਕਰਾ ਰਹੀ ਹੈ ਜੋ ਆਉਣ ਵਾਲੇ ਸਾਲਾਂ ਲਈ ਉਦਯੋਗ ਨੂੰ ਮੁੜ ਆਕਾਰ ਦੇਵੇਗੀ।
ਸਕ੍ਰੈਪਿੰਗ ਤੋਂ ਲਾਇਸੰਸਿੰਗ ਤੱਕ
ਇਸਦੇ ਮੂਲ ਵਿੱਚ, ਮੌਜੂਦਾ ਟਕਰਾਅ ਇਸ ਗੱਲ ਤੋਂ ਪੈਦਾ ਹੁੰਦਾ ਹੈ ਕਿ ਜਨਰੇਟਿਵ ਮਾਡਲ ਕਿਵੇਂ ਸਿੱਖਦੇ ਹਨ। ਇਹ ਸਿਸਟਮ ਪੈਟਰਨਾਂ ਦੀ ਪਛਾਣ ਕਰਨ ਲਈ ਅਰਬਾਂ ਸ਼ਬਦਾਂ ਅਤੇ ਚਿੱਤਰਾਂ ਨੂੰ ਖਾਂਦੇ ਹਨ। ਵਿਕਾਸ ਦੇ ਸ਼ੁਰੂਆਤੀ ਪੜਾਵਾਂ ਵਿੱਚ, ਖੋਜਕਰਤਾਵਾਂ ਨੇ Common Crawl ਵਰਗੇ ਵਿਸ਼ਾਲ ਡੇਟਾਸੈਟਾਂ ਦੀ ਵਰਤੋਂ ਕੀਤੀ, ਬਿਨਾਂ ਇਸ ਗੱਲ ਦੀ ਪਰਵਾਹ ਕੀਤੇ ਕਿ ਉਸ ਡੇਟਾ ਨਾਲ ਕਿਹੜੇ ਵਿਅਕਤੀਗਤ ਅਧਿਕਾਰ ਜੁੜੇ ਹੋਏ ਹਨ। ਉਨ੍ਹਾਂ ਨੇ ਦਲੀਲ ਦਿੱਤੀ ਕਿ ਇਹ ਪ੍ਰਕਿਰਿਆ ਪਰਿਵਰਤਨਸ਼ੀਲ ਸੀ, ਮਤਲਬ ਕਿ ਇਸਨੇ ਕੁਝ ਪੂਰੀ ਤਰ੍ਹਾਂ ਨਵਾਂ ਬਣਾਇਆ ਅਤੇ ਅਸਲ ਕੰਮ ਨੂੰ ਨਹੀਂ ਬਦਲਿਆ। ਇਹ ਦਲੀਲ ਸੰਯੁਕਤ ਰਾਜ ਵਿੱਚ ‘ਫੇਅਰ ਯੂਜ਼’ ਬਚਾਅ ਪੱਖ ਦੀ ਨੀਂਹ ਹੈ। ਹਾਲਾਂਕਿ, ਮੌਜੂਦਾ AI ਉਤਪਾਦਨ ਦੇ ਪੈਮਾਨੇ ਨੇ ਸਮੀਕਰਨ ਬਦਲ ਦਿੱਤਾ ਹੈ। ਜਦੋਂ ਇੱਕ ਮਾਡਲ ਕਿਸੇ ਖਾਸ ਪੱਤਰਕਾਰ ਦੀ ਸ਼ੈਲੀ ਵਿੱਚ ਇੱਕ ਨਿਊਜ਼ ਆਰਟੀਕਲ ਜਾਂ ਕਿਸੇ ਜਿਉਂਦੇ ਕਲਾਕਾਰ ਦੀ ਨਕਲ ਕਰਨ ਵਾਲਾ ਚਿੱਤਰ ਤਿਆਰ ਕਰ ਸਕਦਾ ਹੈ, ਤਾਂ ਪਰਿਵਰਤਨ ਦਾ ਦਾਅਵਾ ਕਰਨਾ ਮੁਸ਼ਕਲ ਹੋ ਜਾਂਦਾ ਹੈ। ਇਸ ਨਾਲ ਸਮੱਗਰੀ ਦੇ ਮਾਲਕਾਂ ਵੱਲੋਂ ਮੁਕੱਦਮਿਆਂ ਦੀ ਲਹਿਰ ਚੱਲ ਪਈ ਹੈ ਜੋ ਦੇਖਦੇ ਹਨ ਕਿ ਉਨ੍ਹਾਂ ਦੀ ਰੋਜ਼ੀ-ਰੋਟੀ ਦੀ ਵਰਤੋਂ ਉਨ੍ਹਾਂ ਦੇ ਬਦਲ ਤਿਆਰ ਕਰਨ ਲਈ ਕੀਤੀ ਜਾ ਰਹੀ ਹੈ।
ਹਾਲੀਆ ਤਬਦੀਲੀਆਂ ਦਰਸਾਉਂਦੀਆਂ ਹਨ ਕਿ ਉਦਯੋਗ ‘ਮਾਫੀ ਮੰਗਣ’ ਦੀ ਰਣਨੀਤੀ ਤੋਂ ਦੂਰ ਹੋ ਰਿਹਾ ਹੈ। ਵੱਡੀਆਂ ਟੈਕ ਫਰਮਾਂ ਹੁਣ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ, ਕਾਨੂੰਨੀ ਡੇਟਾ ਨੂੰ ਸੁਰੱਖਿਅਤ ਕਰਨ ਲਈ ਪ੍ਰਕਾਸ਼ਕਾਂ ਨਾਲ ਕਰੋੜਾਂ ਡਾਲਰ ਦੇ ਸੌਦੇ ਕਰ ਰਹੀਆਂ ਹਨ। ਇਹ ਇੱਕ ਦੋ-ਪੱਧਰੀ ਸਿਸਟਮ ਬਣਾਉਂਦਾ ਹੈ। ਇੱਕ ਪਾਸੇ, ਤੁਹਾਡੇ ਕੋਲ ਲਾਇਸੰਸਸ਼ੁਦਾ ਜਾਂ ਪਬਲਿਕ ਡੋਮੇਨ ਡੇਟਾ ‘ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ‘ਸਾਫ਼’ ਮਾਡਲ ਹਨ। ਦੂਜੇ ਪਾਸੇ, ਤੁਹਾਡੇ ਕੋਲ ਸਕ੍ਰੈਪ ਕੀਤੇ ਡੇਟਾ ‘ਤੇ ਬਣੇ ਮਾਡਲ ਹਨ ਜੋ ਮਹੱਤਵਪੂਰਨ ਕਾਨੂੰਨੀ ਜੋਖਮ ਰੱਖਦੇ ਹਨ। ਕਾਰੋਬਾਰੀ ਜਗਤ ਪਹਿਲੇ ਨੂੰ ਤਰਜੀਹ ਦੇਣ ਲੱਗਾ ਹੈ। ਕੰਪਨੀਆਂ ਅਜਿਹੇ ਟੂਲ ਨੂੰ ਜੋੜਨਾ ਨਹੀਂ ਚਾਹੁੰਦੀਆਂ ਜੋ ਅਦਾਲਤੀ ਹੁਕਮਾਂ ਦੁਆਰਾ ਬੰਦ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ ਜਾਂ ਜਿਸਦੇ ਨਤੀਜੇ ਵਜੋਂ ਕਾਪੀਰਾਈਟ ਉਲੰਘਣਾ ਦਾ ਵੱਡਾ ਬਿੱਲ ਆ ਸਕਦਾ ਹੈ। ਇਸ ਨੇ ਕਾਨੂੰਨੀ ਪ੍ਰਮਾਣਿਕਤਾ ਨੂੰ ਇੱਕ ਮੁੱਖ ਉਤਪਾਦ ਵਿਸ਼ੇਸ਼ਤਾ ਵਿੱਚ ਬਦਲ ਦਿੱਤਾ ਹੈ। ਇਹ ਜਾਣਨਾ ਕਿ ਡੇਟਾ ਕਿੱਥੋਂ ਆਇਆ ਹੈ, ਹੁਣ ਉਨਾ ਹੀ ਮਹੱਤਵਪੂਰਨ ਹੈ ਜਿੰਨਾ ਕਿ ਮਾਡਲ ਕੀ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਰੁਝਾਨ OpenAI ਅਤੇ Apple ਵਰਗੀਆਂ ਕੰਪਨੀਆਂ ਦੇ ਹਾਲੀਆ ਕੰਮਾਂ ਵਿੱਚ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ, ਜਿਨ੍ਹਾਂ ਨੇ ਇਹ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਵੱਡੇ ਮੀਡੀਆ ਸਮੂਹਾਂ ਨਾਲ ਸਾਂਝੇਦਾਰੀ ਕੀਤੀ ਹੈ ਕਿ ਉਨ੍ਹਾਂ ਦੀਆਂ ਟ੍ਰੇਨਿੰਗ ਪਾਈਪਲਾਈਨਾਂ ਅਦਾਲਤੀ ਹੁਕਮਾਂ ਦੁਆਰਾ ਪ੍ਰਭਾਵਿਤ ਨਾ ਹੋਣ।
ਇੱਕ ਖੰਡਿਤ ਗਲੋਬਲ ਕਾਨੂੰਨੀ ਨਕਸ਼ਾ
ਕਾਨੂੰਨੀ ਲੜਾਈ ਇੱਕ ਦੇਸ਼ ਤੱਕ ਸੀਮਤ ਨਹੀਂ ਹੈ। ਇਹ ਇੱਕ ਗਲੋਬਲ ਸੰਘਰਸ਼ ਹੈ ਜਿਸ ਵਿੱਚ ਵੱਖ-ਵੱਖ ਖੇਤਰ ਵੱਖ-ਵੱਖ ਪਹੁੰਚ ਅਪਣਾ ਰਹੇ ਹਨ। ਯੂਰਪੀਅਨ ਯੂਨੀਅਨ ਵਿੱਚ, AI ਐਕਟ ਪਾਰਦਰਸ਼ਤਾ ਲਈ ਸਖ਼ਤ ਮਾਪਦੰਡ ਨਿਰਧਾਰਤ ਕਰ ਰਿਹਾ ਹੈ। ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਇਹ ਖੁਲਾਸਾ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਉਨ੍ਹਾਂ ਨੇ ਟ੍ਰੇਨਿੰਗ ਲਈ ਕਿਹੜੀ ਕਾਪੀਰਾਈਟ ਸਮੱਗਰੀ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਹੈ। ਇਹ ਉਨ੍ਹਾਂ ਕੰਪਨੀਆਂ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਰੁਕਾਵਟ ਹੈ ਜਿਨ੍ਹਾਂ ਨੇ ਆਪਣੇ ਟ੍ਰੇਨਿੰਗ ਸੈੱਟਾਂ ਨੂੰ ਗੁਪਤ ਰੱਖਿਆ ਹੈ। Reuters ਦੀ ਇੱਕ ਰਿਪੋਰਟ ਦੇ ਅਨੁਸਾਰ, ਇਹ ਨਿਯਮ ਕਾਰਪੋਰੇਟ ਸ਼ਕਤੀ ਨੂੰ ਵਿਅਕਤੀਗਤ ਅਧਿਕਾਰਾਂ ਨਾਲ ਸੰਤੁਲਿਤ ਕਰਨ ਦਾ ਉਦੇਸ਼ ਰੱਖਦੇ ਹਨ, ਪਰ ਇਹ ਪਾਲਣਾ ਦੀ ਇੱਕ ਭਾਰੀ ਪਰਤ ਵੀ ਜੋੜਦੇ ਹਨ। ਜਾਪਾਨ ਵਿੱਚ, ਸਰਕਾਰ ਨੇ ਵਧੇਰੇ ਡਿਵੈਲਪਰ-ਅਨੁਕੂਲ ਰੁਖ ਅਪਣਾਇਆ ਹੈ, ਇਹ ਸੁਝਾਅ ਦਿੰਦੇ ਹੋਏ ਕਿ ਡੇਟਾ ‘ਤੇ ਟ੍ਰੇਨਿੰਗ ਦੇਣਾ ਕਈ ਮਾਮਲਿਆਂ ਵਿੱਚ ਕਾਪੀਰਾਈਟ ਕਾਨੂੰਨਾਂ ਦੀ ਉਲੰਘਣਾ ਨਹੀਂ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਰੈਗੂਲੇਟਰੀ ਆਰਬਿਟਰੇਜ ਬਣਾਉਂਦਾ ਹੈ ਜਿੱਥੇ ਕੰਪਨੀਆਂ ਆਪਣੇ ਕੰਮ ਨੂੰ ਵਧੇਰੇ ਨਰਮ ਨਿਯਮਾਂ ਵਾਲੇ ਦੇਸ਼ਾਂ ਵਿੱਚ ਤਬਦੀਲ ਕਰ ਸਕਦੀਆਂ ਹਨ, ਜਿਸ ਨਾਲ AI ਸਮਰੱਥਾਵਾਂ ਵਿੱਚ ਭੂਗੋਲਿਕ ਵੰਡ ਹੋ ਸਕਦੀ ਹੈ।
ਸੰਯੁਕਤ ਰਾਜ ਅਮਰੀਕਾ ਮੁੱਖ ਰਣਭੂਮੀ ਬਣਿਆ ਹੋਇਆ ਹੈ ਕਿਉਂਕਿ ਜ਼ਿਆਦਾਤਰ ਪ੍ਰਮੁੱਖ AI ਕੰਪਨੀਆਂ ਉੱਥੇ ਅਧਾਰਤ ਹਨ। The New York Times ਅਤੇ ਵੱਖ-ਵੱਖ ਲੇਖਕਾਂ ਨਾਲ ਜੁੜੇ ਮਾਮਲਿਆਂ ਦਾ ਨਤੀਜਾ ਬਾਕੀ ਦੁਨੀਆ ਲਈ ਸੁਰ ਨਿਰਧਾਰਤ ਕਰੇਗਾ। ਜੇਕਰ ਅਮਰੀਕੀ ਅਦਾਲਤਾਂ AI ਕੰਪਨੀਆਂ ਦੇ ਖਿਲਾਫ ਫੈਸਲਾ ਦਿੰਦੀਆਂ ਹਨ, ਤਾਂ ਇਹ ਵਿਸ਼ਵ ਪੱਧਰ ‘ਤੇ ਸਮਾਨ ਮੁਕੱਦਮਿਆਂ ਦੀ ਲਹਿਰ ਸ਼ੁਰੂ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਅਨਿਸ਼ਚਿਤਤਾ ਕੁਝ ਲਈ ਨਿਵੇਸ਼ ‘ਤੇ ਇੱਕ ਵੱਡੀ ਰੁਕਾਵਟ ਹੈ, ਜਦੋਂ ਕਿ ਦੂਸਰੇ ਇਸ ਨੂੰ ਸ਼ਕਤੀ ਨੂੰ ਮਜ਼ਬੂਤ ਕਰਨ ਦੇ ਮੌਕੇ ਵਜੋਂ ਦੇਖਦੇ ਹਨ। ਮੌਜੂਦਾ ਸਮੱਗਰੀ ਲਾਇਬ੍ਰੇਰੀਆਂ ਵਾਲੀਆਂ ਵੱਡੀਆਂ ਕਾਰਪੋਰੇਸ਼ਨਾਂ, ਜਿਵੇਂ ਕਿ ਫਿਲਮ ਸਟੂਡੀਓ ਅਤੇ ਸਟਾਕ ਫੋਟੋ ਏਜੰਸੀਆਂ, ਅਚਾਨਕ ਬਹੁਤ ਜ਼ਿਆਦਾ ਲਾਭ ਵਾਲੀ ਸਥਿਤੀ ਵਿੱਚ ਹਨ। ਉਹ ਹੁਣ ਸਿਰਫ਼ ਸਮੱਗਰੀ ਨਿਰਮਾਤਾ ਨਹੀਂ ਹਨ। ਉਹ ਸਾਫਟਵੇਅਰ ਦੀ ਅਗਲੀ ਪੀੜ੍ਹੀ ਲਈ ਲੋੜੀਂਦੇ ਕੱਚੇ ਮਾਲ ਦੇ ਗੇਟਕੀਪਰ ਹਨ। ਇਹ ਤਬਦੀਲੀ ਪੂਰੇ ਟੈਕ ਉਦਯੋਗ ਦੀ ਸ਼ਕਤੀ ਦੀ ਗਤੀਸ਼ੀਲਤਾ ਨੂੰ ਬਦਲ ਰਹੀ ਹੈ, ਪ੍ਰਭਾਵ ਨੂੰ ਸ਼ੁੱਧ ਸਾਫਟਵੇਅਰ ਇੰਜੀਨੀਅਰਾਂ ਤੋਂ ਦੂਰ ਅਤੇ ਉਨ੍ਹਾਂ ਵੱਲ ਲਿਜਾ ਰਹੀ ਹੈ ਜੋ ਮਨੁੱਖੀ ਪ੍ਰਗਟਾਵੇ ਦੇ ਅਧਿਕਾਰਾਂ ਦੇ ਮਾਲਕ ਹਨ। ਇਹ ਵਿਕਾਸ ਆਧੁਨਿਕ ਯੁੱਗ ਵਿੱਚ AI ਗਵਰਨੈਂਸ ਅਤੇ ਨੈਤਿਕਤਾ ਬਾਰੇ ਚੱਲ ਰਹੀ ਚਰਚਾ ਲਈ ਕੇਂਦਰੀ ਹੈ।
ਕਾਰੋਬਾਰ ਕਰਨ ਦੀ ਨਵੀਂ ਲਾਗਤ
ਇਨ੍ਹਾਂ ਕਾਨੂੰਨੀ ਲੜਾਈਆਂ ਦਾ ਵਿਹਾਰਕ ਪ੍ਰਭਾਵ ਪਹਿਲਾਂ ਹੀ ਕਾਰਪੋਰੇਟ ਬੋਰਡਰੂਮਾਂ ਵਿੱਚ ਦਿਖਾਈ ਦੇ ਰਿਹਾ ਹੈ। 2026 ਵਿੱਚ ਇੱਕ ਮੱਧ-ਆਕਾਰ ਦੀ ਟੈਕ ਫਰਮ ਵਿੱਚ ਇੱਕ ਪ੍ਰੋਡਕਟ ਮੈਨੇਜਰ ਲਈ ਇੱਕ ਆਮ ਦਿਨ ਬਾਰੇ ਸੋਚੋ। ਉਨ੍ਹਾਂ ਦਾ ਕੰਮ ਇੱਕ ਨਵਾਂ ਆਟੋਮੇਟਿਡ ਮਾਰਕੀਟਿੰਗ ਟੂਲ ਲਾਂਚ ਕਰਨਾ ਹੈ। ਕੁਝ ਸਾਲ ਪਹਿਲਾਂ, ਉਹ ਬਸ ਇੱਕ ਪ੍ਰਸਿੱਧ API ਨਾਲ ਜੁੜ ਜਾਂਦੇ ਅਤੇ ਸ਼ਿਪਿੰਗ ਸ਼ੁਰੂ ਕਰ ਦਿੰਦੇ। ਅੱਜ, ਉਨ੍ਹਾਂ ਨੂੰ ਉਸ API ਲਈ ਸੇਵਾ ਦੀਆਂ ਸ਼ਰਤਾਂ ਦੀ ਸਮੀਖਿਆ ਕਰਨ ਲਈ ਕਾਨੂੰਨੀ ਟੀਮ ਨਾਲ ਘੰਟੇ ਬਿਤਾਉਣੇ ਪੈਂਦੇ ਹਨ। ਉਨ੍ਹਾਂ ਨੂੰ ਇਹ ਜਾਣਨ ਦੀ ਲੋੜ ਹੈ ਕਿ ਕੀ ਮਾਡਲ ਨੂੰ ‘ਸੁਰੱਖਿਅਤ’ ਡੇਟਾ ‘ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ ਅਤੇ ਕੀ ਪ੍ਰਦਾਤਾ ਮੁਆਵਜ਼ਾ ਦਿੰਦਾ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਪ੍ਰਦਾਤਾ ਕਿਸੇ ਵੀ ਕਾਨੂੰਨੀ ਖਰਚੇ ਦਾ ਭੁਗਤਾਨ ਕਰਨ ਦਾ ਵਾਅਦਾ ਕਰਦਾ ਹੈ ਜੇਕਰ ਕਿਸੇ ਗਾਹਕ ‘ਤੇ ਕਾਪੀਰਾਈਟ ਉਲੰਘਣਾ ਲਈ ਮੁਕੱਦਮਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਇਹ ਸਾਫਟਵੇਅਰ ਵੇਚਣ ਦੇ ਤਰੀਕੇ ਵਿੱਚ ਇੱਕ ਵੱਡੀ ਤਬਦੀਲੀ ਹੈ। ਫੋਕਸ ਸ਼ੁੱਧ ਪ੍ਰਦਰਸ਼ਨ ਤੋਂ ਕਾਨੂੰਨੀ ਸੁਰੱਖਿਆ ਵੱਲ ਚਲਾ ਗਿਆ ਹੈ। ਜੇਕਰ ਕੋਈ ਟੂਲ ਆਪਣੇ ਡੇਟਾ ਸਰੋਤਾਂ ਦੀ ਗਰੰਟੀ ਨਹੀਂ ਦੇ ਸਕਦਾ ਹੈ, ਤਾਂ ਇਸਨੂੰ ਅਕਸਰ ਜੋਖਮ-ਵਿਰੋਧੀ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਗਾਹਕਾਂ ਦੁਆਰਾ ਰੱਦ ਕਰ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ।
ਇੱਕ ਗ੍ਰਾਫਿਕ ਡਿਜ਼ਾਈਨਰ ਦੀ ਕਲਪਨਾ ਕਰੋ ਜੋ ਇੱਕ ਗਲੋਬਲ ਬ੍ਰਾਂਡ ਲਈ ਮੁਹਿੰਮ ਬਣਾਉਣ ਲਈ ਇੱਕ AI ਟੂਲ ਦੀ ਵਰਤੋਂ ਕਰ ਰਿਹਾ ਹੈ। ਉਹ ਇੱਕ ਚਿੱਤਰ ਤਿਆਰ ਕਰਦੇ ਹਨ, ਪਰ ਇਹ ਇੱਕ ਮਸ਼ਹੂਰ ਫੋਟੋਗ੍ਰਾਫਰ ਦੇ ਕੰਮ ਵਰਗਾ ਲੱਗਦਾ ਹੈ। ਜੇਕਰ ਬ੍ਰਾਂਡ ਉਸ ਚਿੱਤਰ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ, ਤਾਂ ਉਨ੍ਹਾਂ ਨੂੰ ਮੁਕੱਦਮੇ ਦਾ ਸਾਹਮਣਾ ਕਰਨਾ ਪੈ ਸਕਦਾ ਹੈ। ਇਸ ਤੋਂ ਬਚਣ ਲਈ, ਕੰਪਨੀਆਂ ਹੁਣ ‘human-in-the-loop’ ਵਰਕਫਲੋ ਲਾਗੂ ਕਰ ਰਹੀਆਂ ਹਨ ਜਿੱਥੇ ਹਰ AI ਆਉਟਪੁੱਟ ਨੂੰ ਕਾਪੀਰਾਈਟ ਡੇਟਾਬੇਸ ਦੇ ਵਿਰੁੱਧ ਚੈੱਕ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਇਹ ਰਗੜ ਦੀ ਇੱਕ ਪਰਤ ਜੋੜਦਾ ਹੈ ਜਿਸਦੀ ਬਹੁਤ ਸਾਰੇ ਲੋਕਾਂ ਨੇ ਉਮੀਦ ਨਹੀਂ ਕੀਤੀ ਸੀ। ਇਹ ਉਤਪਾਦਨ ਦੀ ਗਤੀ ਨੂੰ ਹੌਲੀ ਕਰ ਦਿੰਦਾ ਹੈ, ਜੋ ਕਿ ਪਹਿਲੀ ਥਾਂ ‘ਤੇ AI ਦਾ ਮੁੱਖ ਵਿਕਰੀ ਬਿੰਦੂ ਸੀ। ਕਾਨੂੰਨੀ ਅਨਿਸ਼ਚਿਤਤਾ ਦੇ ਕਾਰੋਬਾਰੀ ਨਤੀਜੇ ਸਪੱਸ਼ਟ ਹਨ। ਇਹ ਉੱਚ ਬੀਮਾ ਪ੍ਰੀਮੀਅਮ, ਹੌਲੀ ਉਤਪਾਦ ਚੱਕਰ, ਅਤੇ ਮੁਕੱਦਮੇ ਦੇ ਨਿਰੰਤਰ ਡਰ ਵੱਲ ਲੈ ਜਾਂਦਾ ਹੈ। ਕੰਪਨੀਆਂ ਹੁਣ ਖੋਜ ਅਤੇ ਵਿਕਾਸ ਦੀ ਬਜਾਏ ਕਾਨੂੰਨੀ ਬਚਾਅ ਅਤੇ ਲਾਇਸੈਂਸਿੰਗ ਫੀਸਾਂ ਲਈ ਆਪਣੇ ਬਜਟ ਦੇ ਮਹੱਤਵਪੂਰਨ ਹਿੱਸੇ ਅਲਾਟ ਕਰਨ ਲਈ ਮਜਬੂਰ ਹਨ।
ਕੀ ਤੁਹਾਡੇ ਕੋਲ ਕੋਈ AI ਕਹਾਣੀ, ਟੂਲ, ਰੁਝਾਨ ਜਾਂ ਸਵਾਲ ਹੈ ਜੋ ਤੁਹਾਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ ਸਾਨੂੰ ਕਵਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ? ਸਾਨੂੰ ਆਪਣਾ ਲੇਖ ਦਾ ਵਿਚਾਰ ਭੇਜੋ — ਅਸੀਂ ਇਸਨੂੰ ਸੁਣਨਾ ਪਸੰਦ ਕਰਾਂਗੇ।ਲੋਕ ਅਕਸਰ ਇਸ ਗੱਲ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦੇ ਹਨ ਕਿ ਇਹ ਕਾਨੂੰਨੀ ਮੁੱਦੇ ਕਿੰਨੀ ਜਲਦੀ ਹੱਲ ਹੋ ਜਾਣਗੇ। ਉਹ ਸੋਚਦੇ ਹਨ ਕਿ ਇੱਕ ਅਦਾਲਤੀ ਕੇਸ ਸਭ ਕੁਝ ਸੁਲਝਾ ਦੇਵੇਗਾ। ਅਸਲ ਵਿੱਚ, ਇਹ ਅਪੀਲਾਂ ਅਤੇ ਵਿਧਾਨਕ ਤਬਦੀਲੀਆਂ ਦੀ ਇੱਕ ਦਹਾਕੇ ਲੰਬੀ ਪ੍ਰਕਿਰਿਆ ਹੋਵੇਗੀ। ਉਸੇ ਸਮੇਂ, ਲੋਕ ਇੱਕ ਵਾਰ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਹੋਣ ਤੋਂ ਬਾਅਦ ਮਾਡਲ ਵਿੱਚੋਂ ਕਾਪੀਰਾਈਟ ਕੀਤੇ ਡੇਟਾ ਨੂੰ ਹਟਾਉਣ ਦੀ ਤਕਨੀਕੀ ਮੁਸ਼ਕਲ ਨੂੰ ਘੱਟ ਸਮਝਦੇ ਹਨ। ਤੁਸੀਂ ਸਿਰਫ਼ ਇੱਕ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਤੋਂ ਕਿਸੇ ਖਾਸ ਕਿਤਾਬ ਜਾਂ ਲੇਖ ਨੂੰ ‘ਡਿਲੀਟ’ ਨਹੀਂ ਕਰ ਸਕਦੇ। ਅਕਸਰ, ਹਟਾਉਣ ਦੇ ਆਦੇਸ਼ ਦੀ ਪਾਲਣਾ ਕਰਨ ਦਾ ਇੱਕੋ ਇੱਕ ਤਰੀਕਾ ਹੈ ਪੂਰੇ ਮਾਡਲ ਨੂੰ ਮਿਟਾਉਣਾ ਅਤੇ ਸਕ੍ਰੈਚ ਤੋਂ ਸ਼ੁਰੂ ਕਰਨਾ। ਇਹ ਕਿਸੇ ਵੀ ਕਾਰੋਬਾਰ ਲਈ ਇੱਕ ਵਿਨਾਸ਼ਕਾਰੀ ਜੋਖਮ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਇੱਕ ਕਾਨੂੰਨੀ ਨੁਕਸਾਨ ਸਾਲਾਂ ਦੀ ਮਿਹਨਤ ਅਤੇ ਲੱਖਾਂ ਡਾਲਰਾਂ ਦੇ ਨਿਵੇਸ਼ ਨੂੰ ਖਤਮ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਹਕੀਕਤ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਸ਼ੁਰੂ ਤੋਂ ਹੀ ਆਪਣੇ ਟ੍ਰੇਨਿੰਗ ਸੈੱਟਾਂ ਵਿੱਚ ਕੀ ਸ਼ਾਮਲ ਕਰਨਾ ਹੈ, ਇਸ ਬਾਰੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਚੋਣਵੇਂ ਹੋਣ ਲਈ ਮਜਬੂਰ ਕਰ ਰਹੀ ਹੈ।
ਇਜਾਜ਼ਤ ਦੀ ਉੱਚ ਕੀਮਤ
‘ਸਾਫ਼’ ਮਾਡਲ ਦੀ ਅਸਲ ਕੀਮਤ ਕੀ ਹੈ? ਜੇਕਰ ਸਿਰਫ਼ ਸਭ ਤੋਂ ਵੱਡੀਆਂ ਕੰਪਨੀਆਂ ਹੀ ਮਨੁੱਖੀ ਸੋਚ ਦੇ ਪੂਰੇ ਇਤਿਹਾਸ ਨੂੰ ਲਾਇਸੰਸ ਦੇਣ ਦੇ ਸਮਰੱਥ ਹਨ, ਤਾਂ ਕੀ ਅਸੀਂ ਬੁੱਧੀ ‘ਤੇ एकाधिकार (monopoly) ਨਾਲ ਖਤਮ ਹੋਵਾਂਗੇ? ਸਾਨੂੰ ਇਹ ਪੁੱਛਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਕੀ ਵਿਅਕਤੀਗਤ ਸਿਰਜਣਹਾਰਾਂ ਦੀ ਸੁਰੱਖਿਆ ਅਣਜਾਣੇ ਵਿੱਚ ਉਸ ਮੁਕਾਬਲੇ ਨੂੰ ਨਸ਼ਟ ਕਰ ਦੇਵੇਗੀ ਜੋ ਟੈਕ ਉਦਯੋਗ ਨੂੰ ਸਿਹਤਮੰਦ ਰੱਖਦੀ ਹੈ। ਗੋਪਨੀਯਤਾ ਦਾ ਸਵਾਲ ਵੀ ਹੈ। ਜੇਕਰ ਕੰਪਨੀਆਂ ਜਨਤਕ ਵੈੱਬ ਸਕ੍ਰੈਪਿੰਗ ਤੋਂ ਦੂਰ ਅਤੇ ਨਿੱਜੀ ਡੇਟਾ ਸੈੱਟਾਂ ਵੱਲ ਵਧਦੀਆਂ ਹਨ, ਤਾਂ ਕੀ ਉਹ ਆਪਣੇ ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਸਾਡੀਆਂ ਨਿੱਜੀ ਈਮੇਲਾਂ ਅਤੇ ਨਿੱਜੀ ਦਸਤਾਵੇਜ਼ਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰ ਦੇਣਗੀਆਂ? ‘ਕਾਨੂੰਨੀ’ AI ਦੀ ਲੁਕਵੀਂ ਕੀਮਤ ਸਾਡੀ ਡਿਜੀਟਲ ਗੋਪਨੀਯਤਾ ਦਾ ਹੋਰ ਖਾਤਮਾ ਹੋ ਸਕਦੀ ਹੈ ਕਿਉਂਕਿ ਕੰਪਨੀਆਂ ਡੇਟਾ ਦੇ ਹਰ ਸੰਭਵ ਸਰੋਤ ਦੀ ਭਾਲ ਕਰਦੀਆਂ ਹਨ ਜਿਸਦੀ ਉਹ ਕਾਨੂੰਨੀ ਤੌਰ ‘ਤੇ ਮਾਲਕ ਹੋ ਸਕਦੀਆਂ ਹਨ। ਇਹ ਤਬਦੀਲੀ ਇੱਕ ਅਜਿਹੀ ਦੁਨੀਆ ਬਣਾ ਸਕਦੀ ਹੈ ਜਿੱਥੇ ਸਾਡੀ ਨਿੱਜੀ ਜਾਣਕਾਰੀ ਸਭ ਤੋਂ ਕੀਮਤੀ ਟ੍ਰੇਨਿੰਗ ਡੇਟਾ ਬਣ ਜਾਂਦੀ ਹੈ।
ਸਾਨੂੰ ਇਹ ਵੀ ਵਿਚਾਰਨਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਇਨ੍ਹਾਂ ਲਾਇਸੈਂਸਿੰਗ ਸੌਦਿਆਂ ਤੋਂ ਅਸਲ ਵਿੱਚ ਕੌਣ ਲਾਭ ਉਠਾਉਂਦਾ ਹੈ। ਕੀ ਪੈਸਾ ਵਿਅਕਤੀਗਤ ਲੇਖਕਾਂ ਅਤੇ ਕਲਾਕਾਰਾਂ ਕੋਲ ਜਾ ਰਿਹਾ ਹੈ, ਜਾਂ ਇਹ ਵੱਡੇ ਪ੍ਰਕਾਸ਼ਨ ਸਮੂਹਾਂ ਦੁਆਰਾ ਹੜੱਪਿਆ ਜਾ ਰਿਹਾ ਹੈ? ਜੇਕਰ ਕਾਪੀਰਾਈਟ ਦਾ ਉਦੇਸ਼ ਰਚਨਾਤਮਕਤਾ ਨੂੰ ਉਤਸ਼ਾਹਿਤ ਕਰਨਾ ਹੈ, ਤਾਂ ਸਾਨੂੰ ਇਹ ਪੁੱਛਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਕੀ ਇਹ ਨਵੇਂ ਸੌਦੇ ਅਸਲ ਵਿੱਚ ਅਜਿਹਾ ਕਰਦੇ ਹਨ। ਜਾਂ ਕੀ ਉਹ ਸਿਰਫ਼ ਕਾਰਪੋਰੇਟ ਸੰਸਥਾਵਾਂ ਲਈ ਆਮਦਨੀ ਦਾ ਇੱਕ ਨਵਾਂ ਸਰੋਤ ਬਣਾਉਂਦੇ ਹਨ ਜਦੋਂ ਕਿ ਅਸਲ ਸਿਰਜਣਹਾਰ ਘੱਟ ਤਨਖਾਹ ਪ੍ਰਾਪਤ ਕਰਦੇ ਹਨ?
BotNews.today ਸਮੱਗਰੀ ਦੀ ਖੋਜ, ਲਿਖਣ, ਸੰਪਾਦਨ ਅਤੇ ਅਨੁਵਾਦ ਕਰਨ ਲਈ AI ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਸਾਡੀ ਟੀਮ ਜਾਣਕਾਰੀ ਨੂੰ ਉਪਯੋਗੀ, ਸਪਸ਼ਟ ਅਤੇ ਭਰੋਸੇਮੰਦ ਰੱਖਣ ਲਈ ਪ੍ਰਕਿਰਿਆ ਦੀ ਸਮੀਖਿਆ ਅਤੇ ਨਿਗਰਾਨੀ ਕਰਦੀ ਹੈ।
ਤਕਨੀਕੀ ਹੱਲ ਅਤੇ ਡੇਟਾ ਗੈਪ
ਪਾਵਰ ਯੂਜ਼ਰਸ ਅਤੇ ਡਿਵੈਲਪਰਾਂ ਲਈ, ਲਾਇਸੰਸਸ਼ੁਦਾ ਡੇਟਾ ਵੱਲ ਤਬਦੀਲੀ ਤਕਨੀਕੀ ਸਟੈਕ ਨੂੰ ਬਦਲ ਰਹੀ ਹੈ। ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਰੁਝਾਨਾਂ ਵਿੱਚੋਂ ਇੱਕ Retrieval-Augmented Generation ਜਾਂ RAG ਵੱਲ ਵਧਣਾ ਹੈ। ਟ੍ਰੇਨਿੰਗ ਦੌਰਾਨ ਮਾਡਲ ਦੇ ਵਜ਼ਨ ਵਿੱਚ ਸਾਰਾ ਗਿਆਨ ਪਾਉਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਦੀ ਬਜਾਏ, RAG ਇੱਕ ਸਿਸਟਮ ਨੂੰ ਰੀਅਲ-ਟਾਈਮ ਵਿੱਚ ਇੱਕ ਨਿੱਜੀ, ਲਾਇਸੰਸਸ਼ੁਦਾ ਡੇਟਾਬੇਸ ਵਿੱਚ ਜਾਣਕਾਰੀ ਲੱਭਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ। ਇਹ ਬਹੁਤ ਸਾਰੇ ਕਾਪੀਰਾਈਟ ਮੁੱਦਿਆਂ ਨੂੰ ਬਾਈਪਾਸ ਕਰਦਾ ਹੈ ਕਿਉਂਕਿ ਮਾਡਲ ਡੇਟਾ ਨੂੰ ਸਥਾਈ ਤਰੀਕੇ ਨਾਲ ‘ਸਿੱਖ’ ਨਹੀਂ ਰਿਹਾ ਹੈ। ਇਹ ਸਿਰਫ਼ ਇੱਕ ਖਾਸ ਸਵਾਲ ਦਾ ਜਵਾਬ ਦੇਣ ਲਈ ਇਸਨੂੰ ਪੜ੍ਹ ਰਿਹਾ ਹੈ। ਇਹ ਸਥਾਨਕ ਸਟੋਰੇਜ ਅਤੇ ਕੁਸ਼ਲ ਇੰਡੈਕਸਿੰਗ ਨੂੰ ਪਹਿਲਾਂ ਨਾਲੋਂ ਵੱਧ ਮਹੱਤਵਪੂਰਨ ਬਣਾਉਂਦਾ ਹੈ। ਡਿਵੈਲਪਰ ਮਜ਼ਬੂਤ ਰੀਟ੍ਰੀਵਲ ਸਿਸਟਮ ਬਣਾਉਣ ਵਿੱਚ ਜ਼ਿਆਦਾ ਸਮਾਂ ਬਿਤਾ ਰਹੇ ਹਨ ਅਤੇ ਟ੍ਰੇਨਿੰਗ ਪ੍ਰਕਿਰਿਆ ‘ਤੇ ਘੱਟ। ਇਹ ਆਰਕੀਟੈਕਚਰਲ ਤਬਦੀਲੀ ਉਦਯੋਗ ਨੂੰ ਦਰਪੇਸ਼ ਕਾਨੂੰਨੀ ਦਬਾਅ ਦਾ ਸਿੱਧਾ ਜਵਾਬ ਹੈ।
ਹਾਲਾਂਕਿ, RAG ਦੀਆਂ ਆਪਣੀਆਂ ਸੀਮਾਵਾਂ ਹਨ। ਇਹ ਬਾਹਰੀ ਡੇਟਾਬੇਸ ਦੀ ਗੁਣਵੱਤਾ ਅਤੇ ਰੀਟ੍ਰੀਵਲ ਪ੍ਰਕਿਰਿਆ ਦੀ ਗਤੀ ‘ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ। API ਸੀਮਾਵਾਂ ਵੀ ਇੱਕ ਵੱਡਾ ਕਾਰਕ ਹਨ। ਜਿਵੇਂ-ਜਿਵੇਂ ਡੇਟਾ ਪ੍ਰਦਾਤਾ ਆਪਣੀ ਸਮੱਗਰੀ ਦੀ ਕੀਮਤ ਨੂੰ ਸਮਝਦੇ ਹਨ, ਉਹ ਆਪਣੇ API ਨੂੰ ਸਖ਼ਤ ਕਰ ਰਹੇ ਹਨ। ਉਹ ਸੀਮਤ ਕਰ ਰਹੇ ਹਨ ਕਿ ਇੱਕ ਡਿਵੈਲਪਰ ਕਿੰਨੀਆਂ ਬੇਨਤੀਆਂ ਕਰ ਸਕਦਾ ਹੈ ਅਤੇ ਡੇਟਾ ਹੋਣ ਤੋਂ ਬਾਅਦ ਉਹ ਇਸ ਨਾਲ ਕੀ ਕਰ ਸਕਦੇ ਹਨ। ਇਹ ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਬਣਾਉਣਾ ਔਖਾ ਬਣਾਉਂਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤਾਜ਼ੀ ਜਾਣਕਾਰੀ ਤੱਕ ਨਿਰੰਤਰ ਪਹੁੰਚ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਡਿਵੈਲਪਰ ਤੰਗ, ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਡੇਟਾਸੈਟਾਂ ‘ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਛੋਟੇ, ਵਿਸ਼ੇਸ਼ ਮਾਡਲਾਂ ਨੂੰ ਵੀ ਦੇਖ ਰਹੇ ਹਨ। ਇਹ ‘ਛੋਟੇ ਲੈਂਗੂਏਜ ਮਾਡਲ’ ਆਡਿਟ ਕਰਨ ਲਈ ਆਸਾਨ ਹਨ ਅਤੇ ਘੱਟ ਕਾਨੂੰਨੀ ਜੋਖਮ ਰੱਖਦੇ ਹਨ। ਉਨ੍ਹਾਂ ਨੂੰ ਸਥਾਨਕ ਤੌਰ ‘ਤੇ ਹੋਸਟ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ, ਜੋ ਗੋਪਨੀਯਤਾ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ ਅਤੇ ਮਹਿੰਗੇ ਤੀਜੀ-ਧਿਰ API ‘ਤੇ ਨਿਰਭਰਤਾ ਨੂੰ ਘਟਾਉਂਦਾ ਹੈ। ਗੀਕ ਕਮਿਊਨਿਟੀ ਵਰਤਮਾਨ ਵਿੱਚ ਇਸ ਗੱਲ ‘ਤੇ ਕੇਂਦ੍ਰਿਤ ਹੈ ਕਿ ਟ੍ਰੇਨਿੰਗ ਸੈੱਟ ਦੇ ਆਕਾਰ ਨੂੰ ਘਟਾਉਂਦੇ ਹੋਏ ਮਾਡਲ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਨੂੰ ਕਿਵੇਂ ਬਰਕਰਾਰ ਰੱਖਿਆ ਜਾਵੇ। ਇਸ ਲਈ ਵਧੇਰੇ ਆਧੁਨਿਕ ਡੇਟਾ ਸਫਾਈ ਅਤੇ ਇਸ ਗੱਲ ਦੀ ਬਿਹਤਰ ਸਮਝ ਦੀ ਲੋੜ ਹੈ ਕਿ ਕਿਹੜੇ ਟੋਕਨ ਅਸਲ ਵਿੱਚ ਮਾਡਲ ਦੀ ਬੁੱਧੀ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾਉਂਦੇ ਹਨ। 2026 ਦੀ ਤਕਨੀਕੀ ਚੁਣੌਤੀ ਹੁਣ ਸਿਰਫ਼ ਪੈਮਾਨੇ ਬਾਰੇ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਕੁਸ਼ਲਤਾ ਅਤੇ ਕਾਨੂੰਨੀ ਪਾਲਣਾ ਬਾਰੇ ਹੈ।
ਪਾਲਣਾ ਦਾ ਆਦੇਸ਼
ਸਿੱਟਾ ਇਹ ਹੈ ਕਿ AI ਅਤੇ ਕਾਪੀਰਾਈਟ ਵਿਚਕਾਰ ਸਬੰਧ ਇੱਕ ਨਵੇਂ, ਵਧੇਰੇ ਪਰਿਪੱਕ ਪੜਾਅ ਵਿੱਚ ਦਾਖਲ ਹੋ ਗਏ ਹਨ। ਬਿਨਾਂ ਕਿਸੇ ਰੋਕ-ਟੋਕ ਦੇ ਸਕ੍ਰੈਪਿੰਗ ਦੇ ਦਿਨ ਖਤਮ ਹੋ ਗਏ ਹਨ। ਕਾਰੋਬਾਰਾਂ ਨੂੰ ਹੁਣ ਤਕਨੀਕੀ ਪ੍ਰਦਰਸ਼ਨ ਦੇ ਬਰਾਬਰ ਕਾਨੂੰਨੀ ਪਾਲਣਾ ਨੂੰ ਤਰਜੀਹ ਦੇਣੀ ਚਾਹੀਦੀ ਹੈ। ਇਹ ਵਧੇਰੇ ਮਹਿੰਗੇ AI ਉਤਪਾਦਾਂ ਦੀ ਅਗਵਾਈ ਕਰੇਗਾ, ਪਰ ਉਹ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਵਰਤੋਂ ਲਈ ਵਧੇਰੇ ਸਥਿਰ ਅਤੇ ਭਰੋਸੇਮੰਦ ਵੀ ਹੋਣਗੇ। ਨਵੀਨਤਾ ਅਤੇ ਮਾਲਕੀ ਵਿਚਕਾਰ ਤਣਾਅ ਆਉਣ ਵਾਲੇ ਸਮੇਂ ਲਈ ਉਦਯੋਗ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨਾ ਜਾਰੀ ਰੱਖੇਗਾ। ਜੋ ਕੰਪਨੀਆਂ ਸਿਰਜਣਹਾਰ ਦੇ ਅਧਿਕਾਰਾਂ ਦਾ ਸਤਿਕਾਰ ਕਰਦੇ ਹੋਏ ਸੰਭਵ ਚੀਜ਼ਾਂ ਦੀਆਂ ਸੀਮਾਵਾਂ ਨੂੰ ਅੱਗੇ ਵਧਾਉਣ ਦਾ ਤਰੀਕਾ ਲੱਭ ਸਕਦੀਆਂ ਹਨ, ਉਹ ਅਗਲੇ ਦਹਾਕੇ ਦੀ ਟੈਕ ਦੀ ਅਗਵਾਈ ਕਰਨਗੀਆਂ। ਇੱਕ ਸ਼ਕਤੀਸ਼ਾਲੀ ਟੂਲ ਬਣਾਉਣਾ ਹੁਣ ਕਾਫ਼ੀ ਨਹੀਂ ਹੈ। ਤੁਹਾਨੂੰ ਇਹ ਵੀ ਸਾਬਤ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਤੁਹਾਡੇ ਕੋਲ ਇਸਨੂੰ ਬਣਾਉਣ ਦਾ ਅਧਿਕਾਰ ਹੈ। AI ਦਾ ਭਵਿੱਖ ਸਿਰਫ਼ ਕੋਡ ਵਿੱਚ ਨਹੀਂ ਲਿਖਿਆ ਗਿਆ ਹੈ, ਸਗੋਂ ਉਨ੍ਹਾਂ ਇਕਰਾਰਨਾਮਿਆਂ ਵਿੱਚ ਹੈ ਜੋ ਇਸਦੇ ਪਿੱਛੇ ਦੇ ਡੇਟਾ ਨੂੰ ਨਿਯੰਤਰਿਤ ਕਰਦੇ ਹਨ।
संपादक का नोट: हमने इस साइट को उन लोगों के लिए एक बहुभाषी AI समाचार और गाइड हब के रूप में बनाया है जो कंप्यूटर गीक नहीं हैं, लेकिन फिर भी आर्टिफिशियल इंटेलिजेंस को समझना चाहते हैं, इसे अधिक आत्मविश्वास के साथ उपयोग करना चाहते हैं, और उस भविष्य का अनुसरण करना चाहते हैं जो पहले से ही आ रहा है।
ਕੋਈ ਗਲਤੀ ਮਿਲੀ ਜਾਂ ਕੁਝ ਠੀਕ ਕਰਨ ਦੀ ਲੋੜ ਹੈ? ਸਾਨੂੰ ਦੱਸੋ।