ਪ੍ਰਾਈਵੇਸੀ, ਸਪੀਡ ਅਤੇ ਕੰਟਰੋਲ: ਲੋਕਲ AI ਕਿਉਂ ਜ਼ਰੂਰੀ ਹੈ
ਹਰ ਪ੍ਰੋਂਪਟ ਨੂੰ ਰਿਮੋਟ ਸਰਵਰ ‘ਤੇ ਭੇਜਣ ਦਾ ਦੌਰ ਖਤਮ ਹੋ ਰਿਹਾ ਹੈ। ਯੂਜ਼ਰਸ ਹੁਣ ਆਪਣਾ ਡਾਟਾ ਵਾਪਸ ਲੈ ਰਹੇ ਹਨ। ਇਸ ਬਦਲਾਅ ਦਾ ਮੁੱਖ ਕਾਰਨ ਪ੍ਰਾਈਵੇਸੀ ਹੈ। ਕਈ ਸਾਲਾਂ ਤੱਕ, ਇਹ ਸੌਦਾ ਬਹੁਤ ਸਧਾਰਨ ਸੀ: ਤੁਸੀਂ ਇੱਕ ਵੱਡੇ ਟੈਕ ਜਾਇੰਟ ਨੂੰ ਆਪਣਾ ਡਾਟਾ ਦਿੰਦੇ ਸੀ ਅਤੇ ਬਦਲੇ ਵਿੱਚ ਇੱਕ ਵੱਡੇ ਲੈਂਗੂਏਜ ਮਾਡਲ ਦੀ ਪਾਵਰ ਮਿਲਦੀ ਸੀ। ਪਰ ਹੁਣ ਇਹ ਸੌਦਾ ਜ਼ਰੂਰੀ ਨਹੀਂ ਰਿਹਾ। ਇੱਕ ਚੁੱਪ-ਚੁਪੀਤੇ ਮਾਈਗ੍ਰੇਸ਼ਨ ਹੋ ਰਹੀ ਹੈ ਜਿੱਥੇ ਵਿਅਕਤੀ ਅਤੇ ਕੰਪਨੀਆਂ ਆਪਣੀ ਇੰਟੈਲੀਜੈਂਸ ਨੂੰ ਉਸ ਹਾਰਡਵੇਅਰ ‘ਤੇ ਵਾਪਸ ਲਿਆ ਰਹੇ ਹਨ ਜਿਸ ਨੂੰ ਉਹ ਖੁਦ ਕੰਟਰੋਲ ਕਰਦੇ ਹਨ। ਇਹ ਸਿਰਫ਼ ਸਬਸਕ੍ਰਿਪਸ਼ਨ ਫੀਸਾਂ ਤੋਂ ਬਚਣ ਬਾਰੇ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਇਹ ਇਸ ਗੱਲ ਦਾ ਮੁੜ-ਮੁਲਾਂਕਣ ਹੈ ਕਿ ਡਾਟਾ ਕਿਵੇਂ ਟ੍ਰੈਵਲ ਕਰਦਾ ਹੈ। ਜਦੋਂ ਤੁਸੀਂ ਮਾਡਲ ਨੂੰ ਲੋਕਲ ਚਲਾਉਂਦੇ ਹੋ, ਤਾਂ ਤੁਹਾਡਾ ਡਾਟਾ ਕਦੇ ਵੀ ਤੁਹਾਡੀ ਮਸ਼ੀਨ ਤੋਂ ਬਾਹਰ ਨਹੀਂ ਜਾਂਦਾ। ਕੋਈ ਵਿਚੋਲਾ ਨਹੀਂ ਹੁੰਦਾ ਜੋ ਤੁਹਾਡੀਆਂ ਕੁਐਰੀਜ਼ ਨੂੰ ਟ੍ਰੇਨਿੰਗ ਲਈ ਸਕ੍ਰੈਪ ਕਰ ਸਕੇ। ਇਹ ਬਦਲਾਅ ਇਸ ਅਹਿਸਾਸ ਤੋਂ ਆਇਆ ਹੈ ਕਿ ਡਾਟਾ ਅਜੋਕੇ ਸਮੇਂ ਦੀ ਸਭ ਤੋਂ ਕੀਮਤੀ ਸੰਪਤੀ ਹੈ। ਲੋਕਲ AI ਤੁਹਾਨੂੰ ਇਸ ਸੰਪਤੀ ਨੂੰ ਗੁਆਏ ਬਿਨਾਂ ਐਡਵਾਂਸਡ ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦਾ ਤਰੀਕਾ ਦਿੰਦਾ ਹੈ। ਇਹ ਡਿਜੀਟਲ ਆਤਮ-ਨਿਰਭਰਤਾ ਵੱਲ ਇੱਕ ਕਦਮ ਹੈ ਜੋ ਦੋ ਸਾਲ ਪਹਿਲਾਂ ਸੋਚਣਾ ਵੀ ਅਸੰਭਵ ਸੀ।
ਲੋਕਲ ਇੰਟੈਲੀਜੈਂਸ ਵੱਲ ਵੱਡੀ ਮਾਈਗ੍ਰੇਸ਼ਨ
ਲੋਕਲ AI ਨੂੰ ਸਮਝਣ ਦੀ ਸ਼ੁਰੂਆਤ ਹਾਰਡਵੇਅਰ ਤੋਂ ਹੁੰਦੀ ਹੈ। ਇਹ ਕਲਾਊਡ ਪ੍ਰੋਵਾਈਡਰ ਦੇ ਸਰਵਰ ਦੀ ਬਜਾਏ ਆਪਣੇ ਖੁਦ ਦੇ ਸਿਲੀਕਾਨ ‘ਤੇ ਵੱਡੇ ਲੈਂਗੂਏਜ ਮਾਡਲ ਚਲਾਉਣ ਦੀ ਪ੍ਰਕਿਰਿਆ ਹੈ। ਇਸ ਵਿੱਚ ਮਾਡਲ ਵੇਟਸ (model weights) ਨੂੰ ਡਾਊਨਲੋਡ ਕਰਨਾ ਅਤੇ ਆਪਣੇ ਗ੍ਰਾਫਿਕਸ ਕਾਰਡ ਜਾਂ ਪ੍ਰੋਸੈਸਰ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਉਹਨਾਂ ਨੂੰ ਚਲਾਉਣਾ ਸ਼ਾਮਲ ਹੈ। ਪਹਿਲਾਂ ਇਸ ਲਈ ਵੱਡੇ ਸਰਵਰ ਰੈਕਸ ਦੀ ਲੋੜ ਹੁੰਦੀ ਸੀ, ਪਰ ਅੱਜ ਇੱਕ ਵਧੀਆ ਲੈਪਟਾਪ ਵੀ ਅਜਿਹੇ ਮਾਡਲ ਚਲਾ ਸਕਦਾ ਹੈ ਜੋ ਕਲਾਊਡ ਟੂਲਸ ਨੂੰ ਟੱਕਰ ਦਿੰਦੇ ਹਨ। ਸਾਫਟਵੇਅਰ ਸਟੈਕ ਵਿੱਚ ਆਮ ਤੌਰ ‘ਤੇ ਇੱਕ ਮਾਡਲ ਲੋਡਰ ਅਤੇ ਇੱਕ ਯੂਜ਼ਰ ਇੰਟਰਫੇਸ ਹੁੰਦਾ ਹੈ ਜੋ ਪ੍ਰਸਿੱਧ ਚੈਟਬੋਟਸ ਵਰਗਾ ਅਨੁਭਵ ਦਿੰਦਾ ਹੈ। ਫਰਕ ਸਿਰਫ ਇਹ ਹੈ ਕਿ ਇੱਥੇ ਇੰਟਰਨੈੱਟ ਦੀ ਲੋੜ ਨਹੀਂ ਹੁੰਦੀ। ਤੁਸੀਂ ਸਮੁੰਦਰ ਦੇ ਵਿਚਕਾਰ ਜਾਂ ਕਿਸੇ ਸੁਰੱਖਿਅਤ ਬੰਕਰ ਵਿੱਚ ਵੀ ਟੈਕਸਟ ਜਨਰੇਟ ਕਰ ਸਕਦੇ ਹੋ ਜਾਂ ਕੋਡ ਲਿਖ ਸਕਦੇ ਹੋ।
ਲੋਕਲ ਸੈੱਟਅੱਪ ਦੇ ਮੁੱਖ ਹਿੱਸੇ ਹਨ: ਮਾਡਲ, ਇਨਫਰੈਂਸ ਇੰਜਣ ਅਤੇ ਇੰਟਰਫੇਸ। Meta ਦਾ Llama ਜਾਂ Mistral AI ਵਰਗੇ ਮਾਡਲ ਅਕਸਰ ਵਰਤੇ ਜਾਂਦੇ ਹਨ। ਇਹ ਮਾਡਲ ‘ਓਪਨ-ਵੇਟ’ ਹੁੰਦੇ ਹਨ, ਮਤਲਬ ਕਿ ਕੰਪਨੀ AI ਦਾ ਦਿਮਾਗ ਹਰ ਕਿਸੇ ਲਈ ਡਾਊਨਲੋਡ ਕਰਨ ਵਾਸਤੇ ਉਪਲਬਧ ਕਰਵਾਉਂਦੀ ਹੈ। ਇਨਫਰੈਂਸ ਇੰਜਣ ਉਹ ਸਾਫਟਵੇਅਰ ਹੈ ਜੋ ਤੁਹਾਡੇ ਹਾਰਡਵੇਅਰ ਨੂੰ ਉਸ ਦਿਮਾਗ ਨਾਲ ਗੱਲ ਕਰਨ ਦਿੰਦਾ ਹੈ। ਇਹ ਸੈੱਟਅੱਪ ਉਹਨਾਂ ਲਈ ਬਹੁਤ ਫਾਇਦੇਮੰਦ ਹੈ ਜੋ ਸਹੂਲਤ ਨਾਲੋਂ ਕੰਟਰੋਲ ਨੂੰ ਪਹਿਲ ਦਿੰਦੇ ਹਨ। ਇਹ ਸਰਵਰ ਨੂੰ ਡਾਟਾ ਭੇਜਣ ਦੀ ਲੈਟੈਂਸੀ (latency) ਨੂੰ ਖਤਮ ਕਰਦਾ ਹੈ ਅਤੇ ਸਰਵਿਸ ਆਊਟੇਜ ਜਾਂ ਅਚਾਨਕ ਬਦਲੇ ਗਏ ਨਿਯਮਾਂ ਦੇ ਖਤਰੇ ਨੂੰ ਦੂਰ ਕਰਦਾ ਹੈ। ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ, ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ ਕਿ ਤੁਹਾਡੀ ਗੱਲਬਾਤ ਪ੍ਰਾਈਵੇਟ ਰਹੇ। ਰਿਮੋਟ ਸਰਵਰ ‘ਤੇ ਕੋਈ ਲੌਗ ਸਟੋਰ ਨਹੀਂ ਹੁੰਦੇ, ਇਸ ਲਈ ਡਾਟਾ ਲੀਕ ਹੋਣ ਦਾ ਕੋਈ ਡਰ ਨਹੀਂ ਰਹਿੰਦਾ।
ਭੂ-ਰਾਜਨੀਤੀ ਅਤੇ ਡਾਟਾ ਪ੍ਰਭੂਸੱਤਾ
ਲੋਕਲ AI ਵੱਲ ਗਲੋਬਲ ਰੁਝਾਨ ਸਿਰਫ ਨਿੱਜੀ ਪ੍ਰਾਈਵੇਸੀ ਤੱਕ ਸੀਮਤ ਨਹੀਂ ਹੈ। ਇਹ ਰਾਸ਼ਟਰੀ ਅਤੇ ਕਾਰਪੋਰੇਟ ਸੁਰੱਖਿਆ ਦਾ ਮਾਮਲਾ ਵੀ ਹੈ। ਸਰਕਾਰਾਂ ਹੁਣ ਸੰਵੇਦਨਸ਼ੀਲ ਡਾਟਾ ਦੇ ਸਰਹੱਦਾਂ ਪਾਰ ਜਾਣ ਨੂੰ ਲੈ ਕੇ ਚਿੰਤਤ ਹਨ। ਬਰਲਿਨ ਵਿੱਚ ਕੋਈ ਲਾਅ ਫਰਮ ਜਾਂ ਟੋਕੀਓ ਵਿੱਚ ਕੋਈ ਹਸਪਤਾਲ ਇਹ ਜੋਖਮ ਨਹੀਂ ਲੈ ਸਕਦਾ ਕਿ ਮਰੀਜ਼ਾਂ ਜਾਂ ਕਲਾਇੰਟਸ ਦਾ ਡਾਟਾ ਕਿਸੇ ਦੂਜੇ ਦੇਸ਼ ਦੇ ਸਰਵਰ ‘ਤੇ ਪ੍ਰੋਸੈਸ ਹੋਵੇ। ਇੱਥੇ ਹੀ ਡਾਟਾ ਸੋਵਰਨਟੀ (data sovereignty) ਦਾ ਸੰਕਲਪ ਅਹਿਮ ਹੋ ਜਾਂਦਾ ਹੈ। AI ਕੰਮਾਂ ਨੂੰ ਲੋਕਲ ਹਾਰਡਵੇਅਰ ‘ਤੇ ਲਿਜਾ ਕੇ, ਸੰਸਥਾਵਾਂ ਸਖਤ GDPR ਨਿਯਮਾਂ ਅਤੇ ਹੋਰ ਖੇਤਰੀ ਪ੍ਰਾਈਵੇਸੀ ਕਾਨੂੰਨਾਂ ਦੀ ਪਾਲਣਾ ਯਕੀਨੀ ਬਣਾ ਸਕਦੀਆਂ ਹਨ। ਉਹ ਹੁਣ ਕਿਸੇ ਵਿਦੇਸ਼ੀ ਕਾਰਪੋਰੇਸ਼ਨ ਦੀਆਂ ਡਾਟਾ ਰਿਟੈਨਸ਼ਨ ਪਾਲਿਸੀਆਂ ‘ਤੇ ਨਿਰਭਰ ਨਹੀਂ ਹਨ। ਜੇਕਰ ਡਾਟਾ ਬਿਲਡਿੰਗ ਤੋਂ ਬਾਹਰ ਨਹੀਂ ਜਾਂਦਾ, ਤਾਂ ਹੈਕਰਾਂ ਲਈ ਹਮਲਾ ਕਰਨਾ ਬਹੁਤ ਮੁਸ਼ਕਲ ਹੋ ਜਾਂਦਾ ਹੈ।
ਪਬਲਿਸ਼ਰ ਅਤੇ ਕ੍ਰਿਏਟਰ ਵੀ ਆਪਣੀ ਇੰਟੈਲੈਕਚੁਅਲ ਪ੍ਰਾਪਰਟੀ ਨੂੰ ਬਚਾਉਣ ਲਈ ਲੋਕਲ ਵਿਕਲਪ ਲੱਭ ਰਹੇ ਹਨ। ਮੌਜੂਦਾ ਕਲਾਊਡ ਮਾਡਲ ਵਿੱਚ ਅਕਸਰ ਇੱਕ ਅਸਪਸ਼ਟ ਸਹਿਮਤੀ ਪ੍ਰਕਿਰਿਆ ਹੁੰਦੀ ਹੈ ਜਿੱਥੇ ਯੂਜ਼ਰ ਦੇ ਇਨਪੁਟਸ ਨੂੰ ਮਾਡਲ ਨੂੰ ਹੋਰ ਟ੍ਰੇਨ ਕਰਨ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ। ਇੱਕ ਪੇਸ਼ੇਵਰ ਲੇਖਕ ਜਾਂ ਸਾਫਟਵੇਅਰ ਆਰਕੀਟੈਕਟ ਲਈ, ਇਹ ਬਿਲਕੁਲ ਵੀ ਸਵੀਕਾਰਯੋਗ ਨਹੀਂ ਹੈ। ਉਹ ਨਹੀਂ ਚਾਹੁੰਦੇ ਕਿ ਉਨ੍ਹਾਂ ਦਾ ਵਿਲੱਖਣ ਸਟਾਈਲ ਜਾਂ ਪ੍ਰੋਪਰਾਈਟਰੀ ਕੋਡ ਕਿਸੇ ਪਬਲਿਕ ਟ੍ਰੇਨਿੰਗ ਸੈੱਟ ਦਾ ਹਿੱਸਾ ਬਣੇ। ਲੋਕਲ AI ਉਹਨਾਂ ਨੂੰ ਆਪਣੀ ਪ੍ਰਤੀਯੋਗੀ ਬੜ੍ਹਤ ਨੂੰ ਗੁਆਏ ਬਿਨਾਂ ਇਹਨਾਂ ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦਾ ਮੌਕਾ ਦਿੰਦਾ ਹੈ। ਕੰਪਨੀਆਂ ਹੁਣ ਸਮਝ ਰਹੀਆਂ ਹਨ ਕਿ ਡਾਟਾ ਲੀਕ ਹੋਣ ਦਾ ਖਰਚਾ ਲੋਕਲ ਹਾਰਡਵੇਅਰ ਵਿੱਚ ਨਿਵੇਸ਼ ਕਰਨ ਨਾਲੋਂ ਕਿਤੇ ਜ਼ਿਆਦਾ ਹੈ।
ਕਲੀਨਿਕਲ ਪ੍ਰਾਈਵੇਸੀ ਅਮਲ ਵਿੱਚ
ਸਾਰਾਹ ਦੀ ਉਦਾਹਰਣ ਲਓ, ਜੋ ਇੱਕ ਮੈਡੀਕਲ ਖੋਜਕਰਤਾ ਹੈ। ਪਹਿਲਾਂ, ਸਾਰਾਹ ਨੂੰ ਕਲਾਊਡ-ਅਧਾਰਿਤ AI ਦੀ ਸਪੀਡ ਅਤੇ ਮੈਨੂਅਲ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਸੁਰੱਖਿਆ ਵਿੱਚੋਂ ਇੱਕ ਚੁਣਨਾ ਪੈਂਦਾ ਸੀ। ਅੱਜ, ਉਹ ਦੋ NVIDIA GPUs ਨਾਲ ਲੈਸ ਇੱਕ ਲੋਕਲ ਵਰਕਸਟੇਸ਼ਨ ‘ਤੇ ਕੰਮ ਕਰਦੀ ਹੈ। ਉਹ ਇੱਕ ਵਿਸ਼ੇਸ਼ ਮਾਡਲ ਲੋਡ ਕਰਦੀ ਹੈ ਜੋ ਮੈਡੀਕਲ ਸ਼ਬਦਾਵਲੀ ਲਈ ਟਿਊਨ ਕੀਤਾ ਗਿਆ ਹੈ। ਕਿਉਂਕਿ ਮਾਡਲ ਲੋਕਲ ਹੈ, ਸਾਰਾਹ ਨੂੰ HIPAA ਉਲੰਘਣਾਵਾਂ ਜਾਂ ਡਾਟਾ ਸ਼ੇਅਰਿੰਗ ਬਾਰੇ ਚਿੰਤਾ ਕਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਡਾਟਾ ਉਸਦੀ ਐਨਕ੍ਰਿਪਟਡ ਡਰਾਈਵ ‘ਤੇ ਹੀ ਰਹਿੰਦਾ ਹੈ। ਜਦੋਂ ਉਹ ਯਾਤਰਾ ਕਰਦੀ ਹੈ, ਤਾਂ ਉਹ ਆਪਣੇ ਲੈਪਟਾਪ ‘ਤੇ ਵੀ ਕੰਮ ਜਾਰੀ ਰੱਖ ਸਕਦੀ ਹੈ। ਇਹ ਪੱਧਰ ਦੀ ਗਤੀਸ਼ੀਲਤਾ ਅਤੇ ਸੁਰੱਖਿਆ ਉਦੋਂ ਅਸੰਭਵ ਸੀ ਜਦੋਂ AI ਕਲਾਊਡ ਨਾਲ ਜੁੜਿਆ ਹੁੰਦਾ ਸੀ।
ਇੱਕ ਸਾਫਟਵੇਅਰ ਡਿਵੈਲਪਰ ਲਈ ਵੀ ਇਹ ਬਹੁਤ ਫਾਇਦੇਮੰਦ ਹੈ। ਉਹ ਇੱਕ ਲੋਕਲ ਮਾਡਲ ਨੂੰ ਸਿੱਧਾ ਆਪਣੇ ਕੋਡਿੰਗ ਵਾਤਾਵਰਣ ਵਿੱਚ ਇੰਟੀਗ੍ਰੇਟ ਕਰ ਸਕਦੇ ਹਨ। ਜਿਵੇਂ ਹੀ ਉਹ ਸੰਵੇਦਨਸ਼ੀਲ ਕੋਡ ਲਿਖਦੇ ਹਨ, AI ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਅਤੇ ਬੱਗ ਲੱਭਦਾ ਹੈ। ਕੰਪਨੀ ਦੇ “secret sauce” ਦੇ ਕਿਸੇ ਤੀਜੀ-ਧਿਰ ਦੇ ਸਰਵਰ ‘ਤੇ ਅਪਲੋਡ ਹੋਣ ਦਾ ਕੋਈ ਜੋਖਮ ਨਹੀਂ ਹੁੰਦਾ। ਇਹ ਵਿਆਪਕ AI ਪ੍ਰਾਈਵੇਸੀ ਗਾਈਡ ਦੱਸਦੀ ਹੈ ਕਿ ਕਿਵੇਂ ਇਹ ਕੰਟਰੋਲ ਟੈਕ ਕੰਪਨੀਆਂ ਲਈ ਗੋਲਡ ਸਟੈਂਡਰਡ ਬਣ ਰਿਹਾ ਹੈ। ਲੋਕਲ AI ਕਸਟਮਾਈਜ਼ੇਸ਼ਨ ਦਾ ਉਹ ਪੱਧਰ ਦਿੰਦਾ ਹੈ ਜੋ ਕਲਾਊਡ ਟੂਲਸ ਨਹੀਂ ਦੇ ਸਕਦੇ। ਉਹ ਪੂਰੇ ਪਾਈਪਲਾਈਨ ਦੇ ਮਾਲਕ ਹੁੰਦੇ ਹਨ, ਇਨਪੁਟ ਤੋਂ ਆਊਟਪੁੱਟ ਤੱਕ।
BotNews.today ਸਮੱਗਰੀ ਦੀ ਖੋਜ, ਲਿਖਣ, ਸੰਪਾਦਨ ਅਤੇ ਅਨੁਵਾਦ ਕਰਨ ਲਈ AI ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਸਾਡੀ ਟੀਮ ਜਾਣਕਾਰੀ ਨੂੰ ਉਪਯੋਗੀ, ਸਪਸ਼ਟ ਅਤੇ ਭਰੋਸੇਮੰਦ ਰੱਖਣ ਲਈ ਪ੍ਰਕਿਰਿਆ ਦੀ ਸਮੀਖਿਆ ਅਤੇ ਨਿਗਰਾਨੀ ਕਰਦੀ ਹੈ।
ਕੁੱਲ ਖੁਦਮੁਖਤਿਆਰੀ ਦੀ ਕੀਮਤ
ਹਾਲਾਂਕਿ ਫਾਇਦੇ ਸਪੱਸ਼ਟ ਹਨ, ਪਰ ਸਾਨੂੰ ਇਸ ਤਬਦੀਲੀ ਦੀਆਂ ਲੁਕੀਆਂ ਹੋਈਆਂ ਲਾਗਤਾਂ ਬਾਰੇ ਵੀ ਸੋਚਣਾ ਚਾਹੀਦਾ ਹੈ। ਕੀ ਲੋਕਲ AI ਸੱਚਮੁੱਚ ਪ੍ਰਾਈਵੇਟ ਹੈ ਜੇਕਰ ਮਾਡਲ ਵੇਟਸ ਅਜੇ ਵੀ ਇੱਕ ਬਲੈਕ ਬਾਕਸ ਹਨ? ਅਸੀਂ ਅਕਸਰ ਮੰਨ ਲੈਂਦੇ ਹਾਂ ਕਿ ਲੋਕਲ ਹੋਣ ਕਰਕੇ ਪ੍ਰਕਿਰਿਆ ਪਾਰਦਰਸ਼ੀ ਹੈ, ਪਰ ਜ਼ਿਆਦਾਤਰ ਯੂਜ਼ਰਸ ਕੋਲ ਮਾਡਲ ਦੇ ਅਰਬਾਂ ਪੈਰਾਮੀਟਰਾਂ ਨੂੰ ਆਡਿਟ ਕਰਨ ਦੀ ਮਹਾਰਤ ਨਹੀਂ ਹੁੰਦੀ। ਹਾਰਡਵੇਅਰ ਦੀ ਬਰਬਾਦੀ ਦਾ ਸਵਾਲ ਵੀ ਹੈ। ਜਦੋਂ ਹਰ ਕੋਈ ਨਵੇਂ GPUs ਖਰੀਦਣ ਦੀ ਦੌੜ ਵਿੱਚ ਹੈ, ਤਾਂ ਇਸ ਦਾ ਵਾਤਾਵਰਣ ‘ਤੇ ਕੀ ਅਸਰ ਪਵੇਗਾ? ਸਾਨੂੰ ਡਿਜੀਟਲ ਵੰਡ (digital divide) ਬਾਰੇ ਵੀ ਸੋਚਣਾ ਚਾਹੀਦਾ ਹੈ। ਲੋਕਲ AI ਲਈ ਮਹਿੰਗੇ ਹਾਰਡਵੇਅਰ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਕੀ ਇਹ “ਡਾਟਾ-ਅਮੀਰ” ਯੂਜ਼ਰਸ ਦੀ ਇੱਕ ਨਵੀਂ ਸ਼੍ਰੇਣੀ ਬਣਾਉਂਦਾ ਹੈ ਜੋ ਪ੍ਰਾਈਵੇਸੀ ਖਰੀਦ ਸਕਦੇ ਹਨ, ਜਦੋਂ ਕਿ “ਡਾਟਾ-ਗਰੀਬ” ਲੋਕਾਂ ਨੂੰ ਕਲਾਊਡ ਐਕਸੈਸ ਲਈ ਆਪਣੀ ਪ੍ਰਾਈਵੇਸੀ ਦਾ ਸੌਦਾ ਕਰਨਾ ਪੈਂਦਾ ਹੈ?
ਸਹਿਮਤੀ ਦੀ ਭਾਸ਼ਾ ਇੱਕ ਹੋਰ ਸਮੱਸਿਆ ਹੈ। ਕਈ ਕਲਾਊਡ ਪ੍ਰੋਵਾਈਡਰ ਗੁੰਝਲਦਾਰ ਕਾਨੂੰਨੀ ਭਾਸ਼ਾ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਇਹ ਲੁਕਾਉਂਦੇ ਹਨ ਕਿ ਉਹ ਟ੍ਰੇਨਿੰਗ ਲਈ ਡਾਟਾ ਰੱਖ ਰਹੇ ਹਨ। ਲੋਕਲ ਸੈੱਟਅੱਪ ਵਿੱਚ ਵੀ, ਕੁਝ ਸਾਫਟਵੇਅਰ ਟੈਲੀਮੈਟਰੀ ਡਾਟਾ ਭੇਜ ਸਕਦੇ ਹਨ। ਯੂਜ਼ਰਸ ਨੂੰ ਉਹਨਾਂ ਟੂਲਸ ਬਾਰੇ ਸਾਵਧਾਨ ਰਹਿਣਾ ਚਾਹੀਦਾ ਹੈ ਜੋ ਉਹ ਚੁਣਦੇ ਹਨ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਮਾਡਲ ਡਿਕੇ (model decay) ਦਾ ਮੁੱਦਾ ਹੈ। ਇੱਕ ਲੋਕਲ ਮਾਡਲ ਸਮੇਂ ਦੇ ਨਾਲ ਆਪਣੇ ਆਪ ਸਮਾਰਟ ਨਹੀਂ ਹੁੰਦਾ ਜਦੋਂ ਤੱਕ ਯੂਜ਼ਰ ਇਸਨੂੰ ਅਪਡੇਟ ਨਾ ਕਰੇ। ਕਲਾਊਡ ਮਾਡਲ ਲਗਾਤਾਰ ਸੁਧਾਰੇ ਜਾਂਦੇ ਹਨ। ਕੀ ਇੱਕ ਸਥਿਰ, ਘੱਟ ਸਮਰੱਥ ਮਾਡਲ ਪ੍ਰਾਈਵੇਸੀ ਦੇ ਫਾਇਦੇ ਲਈ ਕਾਫੀ ਹੈ? ਬਹੁਤਿਆਂ ਲਈ ਜਵਾਬ ਹਾਂ ਹੈ, ਪਰ ਸਮਰੱਥਾ ਦਾ ਅੰਤਰ ਇੱਕ ਚਿੰਤਾ ਦਾ ਵਿਸ਼ਾ ਹੈ। ਜਦੋਂ ਤੁਸੀਂ ਆਪਣਾ AI ਚਲਾਉਂਦੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਖੁਦ ਹੀ IT ਵਿਭਾਗ ਹੁੰਦੇ ਹੋ। ਤੁਸੀਂ ਸੁਰੱਖਿਆ ਪੈਚ, ਹਾਰਡਵੇਅਰ ਫੇਲ੍ਹ ਹੋਣ ਅਤੇ ਸਾਫਟਵੇਅਰ ਟਕਰਾਅ ਲਈ ਜ਼ਿੰਮੇਵਾਰ ਹੁੰਦੇ ਹੋ।
ਤਕਨੀਕੀ ਰੁਕਾਵਟਾਂ
ਪਾਵਰ ਯੂਜ਼ਰਸ ਲਈ, ਲੋਕਲ AI ਵੱਲ ਤਬਦੀਲੀ ਵਿੱਚ ਕੁਝ ਤਕਨੀਕੀ ਚੁਣੌਤੀਆਂ ਹਨ। ਵਰਕਫਲੋ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਮੁੱਖ ਰੁਕਾਵਟ ਹੈ। ਇੱਕ ਵੈੱਬ ਟੈਬ ਦੇ ਉਲਟ, ਲੋਕਲ ਮਾਡਲ ਨੂੰ ਇੱਕ ਇਨਫਰੈਂਸ ਸਰਵਰ ਜਿਵੇਂ ਕਿ Ollama ਜਾਂ LocalAI ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਜੋ API ਐਂਡਪੁਆਇੰਟ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਜ਼ਿਆਦਾਤਰ ਪਾਵਰ ਯੂਜ਼ਰਸ ਉਹ ਟੂਲ ਵਰਤਣਾ ਪਸੰਦ ਕਰਦੇ ਹਨ ਜੋ OpenAI API ਸਟੈਂਡਰਡ ਨੂੰ ਸਪੋਰਟ ਕਰਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਕਲਾਊਡ-ਅਧਾਰਿਤ ਕੀ (key) ਨੂੰ ਲੋਕਲ URL ਨਾਲ ਬਦਲਣਾ ਆਸਾਨ ਹੋ ਜਾਂਦਾ ਹੈ। ਹਾਲਾਂਕਿ, API ਸੀਮਾਵਾਂ ਦੀ ਥਾਂ ਹਾਰਡਵੇਅਰ ਸੀਮਾਵਾਂ ਆ ਜਾਂਦੀਆਂ ਹਨ। ਤੁਸੀਂ ਜੋ ਮਾਡਲ ਚਲਾ ਸਕਦੇ ਹੋ, ਉਸਦਾ ਆਕਾਰ ਤੁਹਾਡੇ Video RAM (VRAM) ‘ਤੇ ਨਿਰਭਰ ਕਰਦਾ ਹੈ। 70 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰਾਂ ਵਾਲੇ ਮਾਡਲ ਲਈ ਆਮ ਤੌਰ ‘ਤੇ ਘੱਟੋ-ਘੱਟ 40GB VRAM ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਅਕਸਰ ਪ੍ਰੋਫੈਸ਼ਨਲ-ਗ੍ਰੇਡ ਹਾਰਡਵੇਅਰ ਵਿੱਚ ਨਿਵੇਸ਼ ਕਰਨਾ ਹੁੰਦਾ ਹੈ ਜਾਂ quantization ਵਰਗੀਆਂ ਤਕਨੀਕਾਂ ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਹੁੰਦਾ ਹੈ।
ਲੋਕਲ ਸਟੋਰੇਜ ਇੱਕ ਹੋਰ ਅਹਿਮ ਕਾਰਕ ਹੈ। ਇੱਕ ਸਿੰਗਲ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲਾ ਮਾਡਲ 50GB ਤੋਂ 100GB ਤੱਕ ਜਗ੍ਹਾ ਲੈ ਸਕਦਾ ਹੈ। ਪਾਵਰ ਯੂਜ਼ਰਸ ਅਕਸਰ ਸਮਰਪਿਤ NVMe ਡਰਾਈਵਾਂ ‘ਤੇ ਵੱਖ-ਵੱਖ ਮਾਡਲਾਂ ਦੀ ਲਾਇਬ੍ਰੇਰੀ ਰੱਖਦੇ ਹਨ। ਉਹਨਾਂ ਨੂੰ “context window” ਨੂੰ ਵੀ ਮੈਨੇਜ ਕਰਨਾ ਪੈਂਦਾ ਹੈ, ਜੋ ਕਿ ਉਹ ਜਾਣਕਾਰੀ ਹੈ ਜੋ ਮਾਡਲ ਇੱਕ ਗੱਲਬਾਤ ਦੌਰਾਨ ਯਾਦ ਰੱਖ ਸਕਦਾ ਹੈ। ਇਸ ਨੂੰ ਪਾਰ ਕਰਨ ਲਈ, ਯੂਜ਼ਰਸ Retrieval-Augmented Generation (RAG) ਲਾਗੂ ਕਰਦੇ ਹਨ। ਇਸ ਵਿੱਚ ਹਜ਼ਾਰਾਂ ਦਸਤਾਵੇਜ਼ਾਂ ਨੂੰ ਸਟੋਰ ਕਰਨ ਲਈ ਇੱਕ ਲੋਕਲ ਵੈਕਟਰ ਡਾਟਾਬੇਸ ਦੀ ਵਰਤੋਂ ਕੀਤੀ ਜਾਂਦੀ ਹੈ। ਸਿਸਟਮ ਫਿਰ ਸਭ ਤੋਂ ਸੰਬੰਧਿਤ ਹਿੱਸਿਆਂ ਨੂੰ “retrieve” ਕਰਦਾ ਹੈ ਅਤੇ ਮਾਡਲ ਨੂੰ ਦਿੰਦਾ ਹੈ। ਲੋਕਲ ਸੈੱਟਅੱਪ ਲਈ ਮੁੱਖ ਹਾਰਡਵੇਅਰ ਵਿਚਾਰ:
- VRAM ਸਮਰੱਥਾ: ਮਾਡਲ ਦੇ ਆਕਾਰ ਅਤੇ ਸਪੀਡ ਲਈ ਇਹ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਹੈ।
- ਮੈਮੋਰੀ ਬੈਂਡਵਿਡਥ: ਤੇਜ਼ ਮੈਮੋਰੀ ਮਾਡਲ ਨੂੰ ਟੋਕਨਾਂ ਨੂੰ ਤੇਜ਼ੀ ਨਾਲ ਪ੍ਰੋਸੈਸ ਕਰਨ ਦਿੰਦੀ ਹੈ।
- ਸਟੋਰੇਜ ਸਪੀਡ: ਵੱਡੀਆਂ ਮਾਡਲ ਫਾਈਲਾਂ ਨੂੰ ਮੈਮੋਰੀ ਵਿੱਚ ਲੋਡ ਕਰਨ ਲਈ NVMe ਡਰਾਈਵਾਂ ਜ਼ਰੂਰੀ ਹਨ।
- ਕੂਲਿੰਗ: ਲੰਬੇ ਸਮੇਂ ਤੱਕ ਇਨਫਰੈਂਸ ਚਲਾਉਣ ਨਾਲ ਕਾਫੀ ਗਰਮੀ ਪੈਦਾ ਹੁੰਦੀ ਹੈ।
ਸਾਫਟਵੇਅਰ ਸਾਈਡ ਵੀ ਵਿਕਸਿਤ ਹੋ ਰਹੀ ਹੈ। LM Studio ਅਤੇ AnythingLLM ਵਰਗੇ ਟੂਲ ਇਹਨਾਂ ਗੁੰਝਲਦਾਰ ਸੈੱਟਅੱਪਾਂ ਨੂੰ ਮੈਨੇਜ ਕਰਨ ਦੇ ਆਸਾਨ ਤਰੀਕੇ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ। ਹਾਲਾਂਕਿ, ਇਸ ਅੰਦੋਲਨ ਦਾ “geek” ਹਿੱਸਾ ਅਜੇ ਵੀ ਕਮਾਂਡ ਲਾਈਨ ਦੀ ਵਰਤੋਂ ਕਰਨ ਅਤੇ ਡਰਾਈਵਰ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਦੀ ਇੱਛਾ ਦੁਆਰਾ ਪਰਿਭਾਸ਼ਿਤ ਹੈ। ਇਹ ਸ਼ੌਕੀਨਾਂ ਦੇ ਉਸ ਦੌਰ ਦੀ ਵਾਪਸੀ ਹੈ, ਜਿੱਥੇ ਤਕਨੀਕੀ ਮਿਹਨਤ ਦਾ ਇਨਾਮ ਆਪਣੀ ਡਿਜੀਟਲ ਜ਼ਿੰਦਗੀ ‘ਤੇ ਪੂਰਾ ਕੰਟਰੋਲ ਹੈ। ਇਹ ਕਮਿਊਨਿਟੀ Hugging Face ਵਰਗੇ ਪਲੇਟਫਾਰਮਾਂ ‘ਤੇ ਕੇਂਦਰਿਤ ਹੈ, ਜਿੱਥੇ ਨਵੇਂ ਮਾਡਲ ਅਤੇ ਆਪਟੀਮਾਈਜ਼ੇਸ਼ਨ ਰੋਜ਼ਾਨਾ ਸ਼ੇਅਰ ਕੀਤੇ ਜਾਂਦੇ ਹਨ।
ایڈیٹر کا نوٹ: ہم نے یہ سائٹ ایک کثیر لسانی AI خبروں اور گائیڈز کے مرکز کے طور پر ان لوگوں کے لیے بنائی ہے جو کمپیوٹر گیکس نہیں ہیں، لیکن پھر بھی مصنوعی ذہانت کو سمجھنا چاہتے ہیں، اسے زیادہ اعتماد کے ساتھ استعمال کرنا چاہتے ہیں، اور اس مستقبل کی پیروی کرنا چاہتے ہیں جو پہلے ہی آ رہا ہے۔
ਕੋਈ ਗਲਤੀ ਮਿਲੀ ਜਾਂ ਕੁਝ ਠੀਕ ਕਰਨ ਦੀ ਲੋੜ ਹੈ? ਸਾਨੂੰ ਦੱਸੋ।ਸੋਵਰਨ ਕੰਪਿਊਟਿੰਗ ਦਾ ਭਵਿੱਖ
ਲੋਕਲ AI ਹੁਣ ਸਿਰਫ ਪ੍ਰਾਈਵੇਸੀ ਦੇ ਸ਼ੌਕੀਨਾਂ ਲਈ ਇੱਕ ਨਿਸ਼ (niche) ਦਿਲਚਸਪੀ ਨਹੀਂ ਰਿਹਾ। ਇਹ ਇੱਕ ਅਜਿਹੀ ਦੁਨੀਆ ਲਈ ਜ਼ਰੂਰੀ ਵਿਕਾਸ ਹੈ ਜੋ ਕੇਂਦਰੀਕ੍ਰਿਤ ਕਲਾਊਡ ਸੇਵਾਵਾਂ ‘ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਨਿਰਭਰ ਹੋ ਗਈ ਹੈ। ਸਪੀਡ, ਪ੍ਰਾਈਵੇਸੀ ਅਤੇ ਕੰਟਰੋਲ ਦੇ ਫਾਇਦੇ ਇੰਨੇ ਵੱਡੇ ਹਨ ਕਿ ਉਹਨਾਂ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਨਹੀਂ ਕੀਤਾ ਜਾ ਸਕਦਾ। ਹਾਲਾਂਕਿ ਹਾਰਡਵੇਅਰ ਦੀਆਂ ਲੋੜਾਂ ਕਈਆਂ ਲਈ ਇੱਕ ਰੁਕਾਵਟ ਹਨ, ਪਰ ਇਹ ਪਾੜਾ ਘੱਟ ਰਿਹਾ ਹੈ। ਜਿਵੇਂ-ਜਿਵੇਂ ਵਿਸ਼ੇਸ਼ AI ਚਿਪਸ ਕੰਜ਼ਿਊਮਰ ਇਲੈਕਟ੍ਰੋਨਿਕਸ ਵਿੱਚ ਸਟੈਂਡਰਡ ਬਣ ਜਾਣਗੇ, ਲੋਕਲ ਤੌਰ ‘ਤੇ ਸ਼ਕਤੀਸ਼ਾਲੀ ਮਾਡਲ ਚਲਾਉਣ ਦੀ ਸਮਰੱਥਾ ਇੱਕ ਡਿਫੌਲਟ ਫੀਚਰ ਬਣ ਜਾਵੇਗੀ। ਇਹ ਤਬਦੀਲੀ ਤਕਨਾਲੋਜੀ ਨਾਲ ਸਾਡੇ ਰਿਸ਼ਤੇ ਨੂੰ ਮੁੜ ਪਰਿਭਾਸ਼ਿਤ ਕਰੇਗੀ। ਅਸੀਂ “software as a service” ਤੋਂ “intelligence as an asset” ਦੇ ਮਾਡਲ ਵੱਲ ਵਧ ਰਹੇ ਹਾਂ। ਉਹਨਾਂ ਲਈ ਜੋ ਆਪਣੇ ਡਾਟਾ ਅਤੇ ਆਪਣੀ ਖੁਦਮੁਖਤਿਆਰੀ ਦੀ ਕਦਰ ਕਰਦੇ ਹਨ, ਚੋਣ ਸਪੱਸ਼ਟ ਹੈ। AI ਦਾ ਭਵਿੱਖ ਕਲਾਊਡ ਵਿੱਚ ਨਹੀਂ ਹੈ। ਇਹ ਤੁਹਾਡੇ ਡੈਸਕ ‘ਤੇ, ਤੁਹਾਡੀ ਜੇਬ ਵਿੱਚ ਅਤੇ ਤੁਹਾਡੇ ਕੰਟਰੋਲ ਹੇਠ ਹੈ।