ਛੋਟੇ ਮਾਡਲ ਕਿਵੇਂ ਲਿਆ ਰਹੇ ਹਨ ਵੱਡੇ ਬਦਲਾਅ 2026

ਸਭ ਤੋਂ ਵੱਡਾ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਮਾਡਲ ਬਣਾਉਣ ਦੀ ਦੌੜ ਹੁਣ ਇੱਕ ਸੀਮਾ ਤੱਕ ਪਹੁੰਚ ਗਈ ਹੈ। ਜਿੱਥੇ ਸੁਰਖੀਆਂ ਅਕਸਰ ਟ੍ਰਿਲੀਅਨਾਂ ਪੈਰਾਮੀਟਰਾਂ ਵਾਲੇ ਵਿਸ਼ਾਲ ਸਿਸਟਮਾਂ ‘ਤੇ ਕੇਂਦ੍ਰਿਤ ਹੁੰਦੀਆਂ ਹਨ, ਉੱਥੇ ਅਸਲ ਤਰੱਕੀ ਹਾਸ਼ੀਏ ‘ਤੇ ਹੋ ਰਹੀ ਹੈ। ਇਹ ਮਾਡਲ ਡੇਟਾ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰੋਸੈਸ ਕਰਦੇ ਹਨ, ਇਸ ਵਿੱਚ ਛੋਟੇ ਸੁਧਾਰ ਸਾਫਟਵੇਅਰ ਦੀ ਰੋਜ਼ਾਨਾ ਕਾਰਜਕੁਸ਼ਲਤਾ ਵਿੱਚ ਵੱਡੇ ਬਦਲਾਅ ਲਿਆ ਰਹੇ ਹਨ। ਅਸੀਂ ਉਸ ਦੌਰ ਤੋਂ ਦੂਰ ਜਾ ਰਹੇ ਹਾਂ ਜਿੱਥੇ ਸਿਰਫ਼ ਕੱਚਾ ਪੈਮਾਨਾ (raw scale) ਹੀ ਮਾਇਨੇ ਰੱਖਦਾ ਸੀ। ਅੱਜ, ਧਿਆਨ ਇਸ ਗੱਲ ‘ਤੇ ਹੈ ਕਿ ਅਸੀਂ ਕਿੰਨੀ ਬੁੱਧੀ ਨੂੰ ਇੱਕ ਛੋਟੇ ਫੁੱਟਪ੍ਰਿੰਟ ਵਿੱਚ ਸਮਾ ਸਕਦੇ ਹਾਂ। ਇਹ ਤਬਦੀਲੀ ਤਕਨਾਲੋਜੀ ਨੂੰ ਹਰ ਕਿਸੇ ਲਈ ਵਧੇਰੇ ਪਹੁੰਚਯੋਗ ਅਤੇ ਤੇਜ਼ ਬਣਾਉਂਦੀ ਹੈ। ਇਹ ਹੁਣ ਇੱਕ ਵੱਡਾ ਦਿਮਾਗ ਬਣਾਉਣ ਬਾਰੇ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਮੌਜੂਦਾ ਦਿਮਾਗਾਂ ਨੂੰ ਕਿਤੇ ਜ਼ਿਆਦਾ ਕੁਸ਼ਲਤਾ ਨਾਲ ਕੰਮ ਕਰਨ ਬਾਰੇ ਹੈ। ਜਦੋਂ ਇੱਕ ਮਾਡਲ ਦਸ ਪ੍ਰਤੀਸ਼ਤ ਛੋਟਾ ਹੋ ਜਾਂਦਾ ਹੈ ਪਰ ਆਪਣੀ ਸ਼ੁੱਧਤਾ ਬਰਕਰਾਰ ਰੱਖਦਾ ਹੈ, ਤਾਂ ਇਹ ਸਿਰਫ਼ ਸਰਵਰ ਦੇ ਖਰਚਿਆਂ ਨੂੰ ਹੀ ਨਹੀਂ ਬਚਾਉਂਦਾ, ਸਗੋਂ ਇਹ ਐਪਲੀਕੇਸ਼ਨਾਂ ਦੀ ਇੱਕ ਪੂਰੀ ਨਵੀਂ ਸ਼੍ਰੇਣੀ ਨੂੰ ਸਮਰੱਥ ਬਣਾਉਂਦਾ ਹੈ ਜੋ ਪਹਿਲਾਂ ਹਾਰਡਵੇਅਰ ਦੀਆਂ ਸੀਮਾਵਾਂ ਕਾਰਨ ਅਸੰਭਵ ਸਨ। ਇਹ ਤਬਦੀਲੀ ਇਸ ਸਮੇਂ ਟੈਕ ਸੈਕਟਰ ਵਿੱਚ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਰੁਝਾਨ ਹੈ ਕਿਉਂਕਿ ਇਹ ਉੱਨਤ ਕੰਪਿਊਟੇਸ਼ਨ ਦੀ ਸ਼ਕਤੀ ਨੂੰ ਵਿਸ਼ਾਲ ਡੇਟਾ ਸੈਂਟਰਾਂ ਤੋਂ ਤੁਹਾਡੀ ਹਥੇਲੀ ਵਿੱਚ ਲੈ ਆਉਂਦੀ ਹੈ।

ਵੱਡਾ ਹੀ ਬਿਹਤਰ ਹੈ ਦੇ ਯੁੱਗ ਦਾ ਅੰਤ

ਇਹ ਸਮਝਣ ਲਈ ਕਿ ਇਹ ਮਾਮੂਲੀ ਬਦਲਾਅ ਕਿਉਂ ਮਾਇਨੇ ਰੱਖਦੇ ਹਨ, ਸਾਨੂੰ ਇਹ ਦੇਖਣਾ ਹੋਵੇਗਾ ਕਿ ਉਹ ਅਸਲ ਵਿੱਚ ਕੀ ਹਨ। ਜ਼ਿਆਦਾਤਰ ਤਰੱਕੀ ਤਿੰਨ ਖੇਤਰਾਂ ਤੋਂ ਆਉਂਦੀ ਹੈ: ਡੇਟਾ ਕਿਊਰੇਸ਼ਨ, ਕੁਆਂਟਾਈਜ਼ੇਸ਼ਨ, ਅਤੇ ਆਰਕੀਟੈਕਚਰਲ ਸੁਧਾਰ। ਲੰਬੇ ਸਮੇਂ ਤੱਕ, ਖੋਜਕਰਤਾਵਾਂ ਦਾ ਮੰਨਣਾ ਸੀ ਕਿ ਜ਼ਿਆਦਾ ਡੇਟਾ ਹਮੇਸ਼ਾ ਬਿਹਤਰ ਹੁੰਦਾ ਹੈ। ਉਨ੍ਹਾਂ ਨੇ ਪੂਰੇ ਇੰਟਰਨੈੱਟ ਨੂੰ ਸਕ੍ਰੈਪ ਕੀਤਾ ਅਤੇ ਮਸ਼ੀਨਾਂ ਵਿੱਚ ਫੀਡ ਕੀਤਾ। ਹੁਣ, ਅਸੀਂ ਜਾਣਦੇ ਹਾਂ ਕਿ ਉੱਚ ਗੁਣਵੱਤਾ ਵਾਲਾ ਡੇਟਾ ਮਾਤਰਾ ਨਾਲੋਂ ਕਿਤੇ ਜ਼ਿਆਦਾ ਕੀਮਤੀ ਹੈ। ਡੇਟਾਸੈਟਾਂ ਨੂੰ ਸਾਫ਼ ਕਰਕੇ ਅਤੇ ਬੇਲੋੜੀ ਜਾਣਕਾਰੀ ਨੂੰ ਹਟਾ ਕੇ, ਇੰਜੀਨੀਅਰ ਛੋਟੇ ਮਾਡਲ ਤਿਆਰ ਕਰ ਸਕਦੇ ਹਨ ਜੋ ਆਪਣੇ ਵੱਡੇ ਪੂਰਵਜਾਂ ਨੂੰ ਪਛਾੜ ਦਿੰਦੇ ਹਨ। ਇਸ ਨੂੰ ਅਕਸਰ ਟੈਕਸਟਬੁੱਕ ਕੁਆਲਿਟੀ ਡੇਟਾ ਕਿਹਾ ਜਾਂਦਾ ਹੈ। ਇੱਕ ਹੋਰ ਵੱਡਾ ਕਾਰਕ ਕੁਆਂਟਾਈਜ਼ੇਸ਼ਨ ਹੈ। ਇਹ ਉਹ ਪ੍ਰਕਿਰਿਆ ਹੈ ਜੋ ਮਾਡਲ ਦੁਆਰਾ ਗਣਨਾ ਕਰਨ ਲਈ ਵਰਤੇ ਜਾਣ ਵਾਲੇ ਨੰਬਰਾਂ ਦੀ ਸ਼ੁੱਧਤਾ ਨੂੰ ਘਟਾਉਂਦੀ ਹੈ। ਉੱਚ ਸ਼ੁੱਧਤਾ ਵਾਲੇ ਦਸ਼ਮਲਵ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਬਜਾਏ, ਇੱਕ ਮਾਡਲ ਸਧਾਰਨ ਪੂਰਨ ਅੰਕਾਂ (integers) ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਸੁਣਨ ਵਿੱਚ ਅਜੀਬ ਲੱਗ ਸਕਦਾ ਹੈ ਕਿ ਇਹ ਨਤੀਜਿਆਂ ਨੂੰ ਖਰਾਬ ਕਰ ਦੇਵੇਗਾ, ਪਰ ਚਲਾਕ ਗਣਿਤ ਮਾਡਲ ਨੂੰ ਲਗਭਗ ਉਨਾ ਹੀ ਸਮਾਰਟ ਰਹਿਣ ਦਿੰਦਾ ਹੈ ਜਦੋਂ ਕਿ ਮੈਮੋਰੀ ਦਾ ਇੱਕ ਛੋਟਾ ਹਿੱਸਾ ਹੀ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ। ਤੁਸੀਂ QLoRA ਅਤੇ ਮਾਡਲ ਕੰਪ੍ਰੈਸ਼ਨ ‘ਤੇ ਹਾਲੀਆ ਖੋਜ ਵਿੱਚ ਇਹਨਾਂ ਤਕਨੀਕੀ ਬਦਲਾਅ ਬਾਰੇ ਹੋਰ ਪੜ੍ਹ ਸਕਦੇ ਹੋ।

ਅੰਤ ਵਿੱਚ, ਅਟੈਨਸ਼ਨ ਮਕੈਨਿਜ਼ਮ ਵਰਗੇ ਆਰਕੀਟੈਕਚਰਲ ਬਦਲਾਅ ਹਨ ਜੋ ਵਾਕ ਦੇ ਸਭ ਤੋਂ ਸੰਬੰਧਿਤ ਹਿੱਸਿਆਂ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਦੇ ਹਨ। ਇਹ ਕੋਈ ਵੱਡੇ ਬਦਲਾਅ ਨਹੀਂ ਹਨ। ਇਹ ਗਣਿਤ ਵਿੱਚ ਸੂਖਮ ਸਮਾਯੋਜਨ ਹਨ ਜੋ ਸਿਸਟਮ ਨੂੰ ਸ਼ੋਰ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੇ ਹਨ। ਜਦੋਂ ਤੁਸੀਂ ਇਹਨਾਂ ਕਾਰਕਾਂ ਨੂੰ ਜੋੜਦੇ ਹੋ, ਤਾਂ ਤੁਹਾਨੂੰ ਇੱਕ ਅਜਿਹਾ ਮਾਡਲ ਮਿਲਦਾ ਹੈ ਜੋ ਵਿਸ਼ੇਸ਼ ਚਿਪਸ ਨਾਲ ਭਰੇ ਕਮਰੇ ਦੀ ਬਜਾਏ ਇੱਕ ਸਟੈਂਡਰਡ ਲੈਪਟਾਪ ‘ਤੇ ਫਿੱਟ ਹੋ ਜਾਂਦਾ ਹੈ। ਲੋਕ ਅਕਸਰ ਸਧਾਰਨ ਕੰਮਾਂ ਲਈ ਵੱਡੇ ਮਾਡਲਾਂ ਦੀ ਲੋੜ ਨੂੰ ਵਧਾ-ਚੜ੍ਹਾ ਕੇ ਦੇਖਦੇ ਹਨ। ਉਹ ਇਹ ਘੱਟ ਸਮਝਦੇ ਹਨ ਕਿ ਕੁਝ ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰਾਂ ਵਿੱਚ ਕਿੰਨੀ ਤਰਕਸ਼ੀਲਤਾ (logic) ਪੈਕ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ। ਅਸੀਂ ਇੱਕ ਰੁਝਾਨ ਦੇਖ ਰਹੇ ਹਾਂ ਜਿੱਥੇ ਜ਼ਿਆਦਾਤਰ ਖਪਤਕਾਰ ਉਤਪਾਦਾਂ ਲਈ ‘ਕਾਫ਼ੀ ਚੰਗਾ’ ਹੋਣਾ ਹੀ ਮਿਆਰ ਬਣ ਰਿਹਾ ਹੈ। ਇਹ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਉੱਚ ਕਲਾਊਡ ਲਾਗਤਾਂ ਨੂੰ ਕਵਰ ਕਰਨ ਲਈ ਸਬਸਕ੍ਰਿਪਸ਼ਨ ਫੀਸ ਲਏ ਬਿਨਾਂ ਐਪਸ ਵਿੱਚ ਸਮਾਰਟ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਨੂੰ ਜੋੜਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ। ਇਹ ਸਾਫਟਵੇਅਰ ਦੇ ਬਣਾਏ ਜਾਣ ਅਤੇ ਵੰਡੇ ਜਾਣ ਦੇ ਤਰੀਕੇ ਵਿੱਚ ਇੱਕ ਬੁਨਿਆਦੀ ਤਬਦੀਲੀ ਹੈ।

ਕਲਾਊਡ ਪਾਵਰ ਨਾਲੋਂ ਲੋਕਲ ਇੰਟੈਲੀਜੈਂਸ ਕਿਉਂ ਜ਼ਿਆਦਾ ਮਹੱਤਵਪੂਰਨ ਹੈ

ਇਹਨਾਂ ਛੋਟੇ ਸੁਧਾਰਾਂ ਦੇ ਵਿਸ਼ਵਵਿਆਪੀ ਪ੍ਰਭਾਵ ਨੂੰ ਘੱਟ ਕਰਕੇ ਨਹੀਂ ਦੇਖਿਆ ਜਾ ਸਕਦਾ। ਦੁਨੀਆ ਦੇ ਜ਼ਿਆਦਾਤਰ ਹਿੱਸਿਆਂ ਕੋਲ ਵਿਸ਼ਾਲ ਕਲਾਊਡ-ਅਧਾਰਿਤ ਮਾਡਲਾਂ ਨਾਲ ਇੰਟਰੈਕਟ ਕਰਨ ਲਈ ਲੋੜੀਂਦਾ ਹਾਈ-ਸਪੀਡ ਇੰਟਰਨੈਟ ਨਹੀਂ ਹੈ। ਜਦੋਂ ਇੰਟੈਲੀਜੈਂਸ ਨੂੰ ਵਰਜੀਨੀਆ ਜਾਂ ਡਬਲਿਨ ਵਿੱਚ ਇੱਕ ਸਰਵਰ ਨਾਲ ਨਿਰੰਤਰ ਕਨੈਕਸ਼ਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਤਾਂ ਇਹ ਅਮੀਰਾਂ ਲਈ ਇੱਕ ਲਗਜ਼ਰੀ ਬਣੀ ਰਹਿੰਦੀ ਹੈ। ਛੋਟੇ ਮਾਡਲ ਦੇ ਸੁਧਾਰ ਇਸ ਨੂੰ ਬਦਲ ਦਿੰਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਸਾਫਟਵੇਅਰ ਨੂੰ ਮਿਡ-ਰੇਂਜ ਹਾਰਡਵੇਅਰ ‘ਤੇ ਸਥਾਨਕ ਤੌਰ ‘ਤੇ ਚਲਾਇਆ ਜਾ ਸਕਦਾ ਹੈ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਇੱਕ ਪੇਂਡੂ ਖੇਤਰ ਵਿੱਚ ਇੱਕ ਵਿਦਿਆਰਥੀ ਜਾਂ ਉੱਭਰਦੀ ਮਾਰਕੀਟ ਵਿੱਚ ਇੱਕ ਕਰਮਚਾਰੀ ਉਸੇ ਪੱਧਰ ਦੀ ਸਹਾਇਤਾ ਤੱਕ ਪਹੁੰਚ ਕਰ ਸਕਦਾ ਹੈ ਜਿਵੇਂ ਕਿ ਇੱਕ ਟੈਕ ਹੱਬ ਵਿੱਚ ਕੋਈ ਵਿਅਕਤੀ ਕਰਦਾ ਹੈ। ਇਹ ਖੇਡ ਦੇ ਮੈਦਾਨ ਨੂੰ ਉਸ ਤਰੀਕੇ ਨਾਲ ਬਰਾਬਰ ਕਰਦਾ ਹੈ ਜੋ ਕੱਚਾ ਪੈਮਾਨਾ ਕਦੇ ਨਹੀਂ ਕਰ ਸਕਦਾ ਸੀ। ਇੰਟੈਲੀਜੈਂਸ ਦੀ ਲਾਗਤ ਜ਼ੀਰੋ ਵੱਲ ਘਟ ਰਹੀ ਹੈ। ਇਹ ਗੋਪਨੀਯਤਾ ਅਤੇ ਸੁਰੱਖਿਆ ਲਈ ਵਿਸ਼ੇਸ਼ ਤੌਰ ‘ਤੇ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਜਦੋਂ ਡੇਟਾ ਨੂੰ ਡਿਵਾਈਸ ਤੋਂ ਬਾਹਰ ਜਾਣ ਦੀ ਲੋੜ ਨਹੀਂ ਹੁੰਦੀ, ਤਾਂ ਉਲੰਘਣਾ ਦਾ ਜੋਖਮ ਕਾਫ਼ੀ ਘੱਟ ਹੁੰਦਾ ਹੈ। ਸਰਕਾਰਾਂ ਅਤੇ ਸਿਹਤ ਸੰਭਾਲ ਪ੍ਰਦਾਤਾ ਇਹਨਾਂ ਕੁਸ਼ਲ ਮਾਡਲਾਂ ਨੂੰ ਨਾਗਰਿਕਾਂ ਦੇ ਡੇਟਾ ਨਾਲ ਸਮਝੌਤਾ ਕੀਤੇ ਬਿਨਾਂ ਸੇਵਾਵਾਂ ਪ੍ਰਦਾਨ ਕਰਨ ਦੇ ਇੱਕ ਤਰੀਕੇ ਵਜੋਂ ਦੇਖ ਰਹੇ ਹਨ।

ਇਹ ਤਬਦੀਲੀ ਵਾਤਾਵਰਣ ਨੂੰ ਵੀ ਪ੍ਰਭਾਵਿਤ ਕਰਦੀ ਹੈ। ਵੱਡੇ ਪੱਧਰ ‘ਤੇ ਟ੍ਰੇਨਿੰਗ ਰਨ ਕੂਲਿੰਗ ਲਈ ਬਿਜਲੀ ਅਤੇ ਪਾਣੀ ਦੀ ਭਾਰੀ ਮਾਤਰਾ ਦੀ ਖਪਤ ਕਰਦੇ ਹਨ। ਕੁਸ਼ਲਤਾ ‘ਤੇ ਧਿਆਨ ਕੇਂਦ੍ਰਤ ਕਰਕੇ, ਉਦਯੋਗ ਬਿਹਤਰ ਉਤਪਾਦ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹੋਏ ਆਪਣੇ ਕਾਰਬਨ ਫੁੱਟਪ੍ਰਿੰਟ ਨੂੰ ਘਟਾ ਸਕਦਾ ਹੈ। Nature ਵਰਗੇ ਵਿਗਿਆਨਕ ਰਸਾਲਿਆਂ ਨੇ ਉਜਾਗਰ ਕੀਤਾ ਹੈ ਕਿ ਕਿਵੇਂ ਕੁਸ਼ਲ AI ਉਦਯੋਗ ਦੇ ਵਾਤਾਵਰਣਕ ਨੁਕਸਾਨ ਨੂੰ ਘਟਾ ਸਕਦਾ ਹੈ। ਇੱਥੇ ਕੁਝ ਤਰੀਕੇ ਹਨ ਜਿਨ੍ਹਾਂ ਰਾਹੀਂ ਇਹ ਗਲੋਬਲ ਤਬਦੀਲੀ ਪ੍ਰਗਟ ਹੋ ਰਹੀ ਹੈ:

ਸਥਾਨਕ ਅਨੁਵਾਦ ਸੇਵਾਵਾਂ ਜੋ ਬਿਨਾਂ ਕਿਸੇ ਇੰਟਰਨੈਟ ਕਨੈਕਸ਼ਨ ਦੇ ਕੰਮ ਕਰਦੀਆਂ ਹਨ।
ਮੈਡੀਕਲ ਡਾਇਗਨੌਸਟਿਕ ਟੂਲ ਜੋ ਦੂਰ-ਦੁਰਾਡੇ ਦੇ ਕਲੀਨਿਕਾਂ ਵਿੱਚ ਪੋਰਟੇਬਲ ਟੈਬਲੇਟਾਂ ‘ਤੇ ਚੱਲਦੇ ਹਨ।
ਵਿਦਿਅਕ ਸਾਫਟਵੇਅਰ ਜੋ ਘੱਟ ਕੀਮਤ ਵਾਲੇ ਹਾਰਡਵੇਅਰ ‘ਤੇ ਵਿਦਿਆਰਥੀ ਦੀਆਂ ਲੋੜਾਂ ਅਨੁਸਾਰ ਅਨੁਕੂਲ ਹੁੰਦਾ ਹੈ।
ਵੀਡੀਓ ਕਾਲਾਂ ਲਈ ਰੀਅਲ-ਟਾਈਮ ਪ੍ਰਾਈਵੇਸੀ ਫਿਲਟਰਿੰਗ ਜੋ ਪੂਰੀ ਤਰ੍ਹਾਂ ਡਿਵਾਈਸ ‘ਤੇ ਹੁੰਦੀ ਹੈ।
ਸਸਤੇ ਡਰੋਨ ਅਤੇ ਸਥਾਨਕ ਪ੍ਰੋਸੈਸਿੰਗ ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਕਿਸਾਨਾਂ ਲਈ ਆਟੋਮੇਟਿਡ ਫਸਲ ਨਿਗਰਾਨੀ।

ਇਹ ਸਿਰਫ਼ ਚੀਜ਼ਾਂ ਨੂੰ ਤੇਜ਼ ਕਰਨ ਬਾਰੇ ਨਹੀਂ ਹੈ। ਇਹ ਉਹਨਾਂ ਨੂੰ ਸਰਵਵਿਆਪੀ ਬਣਾਉਣ ਬਾਰੇ ਹੈ। ਜਦੋਂ ਹਾਰਡਵੇਅਰ ਦੀਆਂ ਲੋੜਾਂ ਘਟਦੀਆਂ ਹਨ, ਤਾਂ ਸੰਭਾਵੀ ਉਪਭੋਗਤਾ ਅਧਾਰ ਅਰਬਾਂ ਲੋਕਾਂ ਤੱਕ ਵਧ ਜਾਂਦਾ ਹੈ। ਇਹ ਰੁਝਾਨ AI ਵਿਕਾਸ ਵਿੱਚ ਨਵੀਨਤਮ ਰੁਝਾਨਾਂ ਨਾਲ ਨੇੜਿਓਂ ਜੁੜਿਆ ਹੋਇਆ ਹੈ ਜੋ ਕੱਚੀ ਸ਼ਕਤੀ ਨਾਲੋਂ ਪਹੁੰਚਯੋਗਤਾ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੇ ਹਨ।

ਆਫਲਾਈਨ ਅਸਿਸਟੈਂਟ ਨਾਲ ਇੱਕ ਮੰਗਲਵਾਰ

ਮਾਰਕਸ ਨਾਮ ਦੇ ਇੱਕ ਫੀਲਡ ਇੰਜੀਨੀਅਰ ਦੇ ਜੀਵਨ ਵਿੱਚ ਇੱਕ ਦਿਨ ‘ਤੇ ਵਿਚਾਰ ਕਰੋ। ਉਹ ਆਫਸ਼ੋਰ ਵਿੰਡ ਟਰਬਾਈਨਾਂ ‘ਤੇ ਕੰਮ ਕਰਦਾ ਹੈ ਜਿੱਥੇ ਇੰਟਰਨੈਟ ਦੀ ਪਹੁੰਚ ਬਿਲਕੁਲ ਨਹੀਂ ਹੈ। ਅਤੀਤ ਵਿੱਚ, ਜੇ ਮਾਰਕਸ ਨੂੰ ਕੋਈ ਮਕੈਨੀਕਲ ਨੁਕਸ ਮਿਲਦਾ ਸੀ ਜਿਸਨੂੰ ਉਹ ਨਹੀਂ ਪਛਾਣਦਾ ਸੀ, ਤਾਂ ਉਸਨੂੰ ਫੋਟੋਆਂ ਲੈਣੀਆਂ ਪੈਂਦੀਆਂ ਸਨ, ਕਿਨਾਰੇ ਵਾਪਸ ਆਉਣ ਤੱਕ ਇੰਤਜ਼ਾਰ ਕਰਨਾ ਪੈਂਦਾ ਸੀ, ਅਤੇ ਇੱਕ ਮੈਨੂਅਲ ਜਾਂ ਸੀਨੀਅਰ ਸਹਿਯੋਗੀ ਨਾਲ ਸਲਾਹ ਕਰਨੀ ਪੈਂਦੀ ਸੀ। ਇਸ ਨਾਲ ਮੁਰੰਮਤ ਵਿੱਚ ਕਈ ਦਿਨਾਂ ਦੀ ਦੇਰੀ ਹੋ ਸਕਦੀ ਸੀ। ਹੁਣ, ਉਹ ਇੱਕ ਉੱਚ-ਅਨੁਕੂਲਿਤ ਲੋਕਲ ਮਾਡਲ ਵਾਲੀ ਇੱਕ ਰਗਡਾਈਜ਼ਡ ਟੈਬਲੇਟ ਰੱਖਦਾ ਹੈ। ਉਹ ਕੈਮਰੇ ਨੂੰ ਟਰਬਾਈਨ ਦੇ ਹਿੱਸਿਆਂ ਵੱਲ ਇਸ਼ਾਰਾ ਕਰਦਾ ਹੈ ਅਤੇ ਮਾਡਲ ਰੀਅਲ-ਟਾਈਮ ਵਿੱਚ ਸਮੱਸਿਆ ਦੀ ਪਛਾਣ ਕਰਦਾ ਹੈ। ਇਹ ਮਸ਼ੀਨ ਦੇ ਖਾਸ ਸੀਰੀਅਲ ਨੰਬਰ ਦੇ ਆਧਾਰ ‘ਤੇ ਕਦਮ-ਦਰ-ਕਦਮ ਮੁਰੰਮਤ ਗਾਈਡ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਮਾਰਕਸ ਜੋ ਮਾਡਲ ਵਰਤਦਾ ਹੈ ਉਹ ਕੋਈ ਟ੍ਰਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਵਾਲਾ ਦੈਂਤ ਨਹੀਂ ਹੈ। ਇਹ ਇੱਕ ਛੋਟਾ, ਵਿਸ਼ੇਸ਼ ਸੰਸਕਰਣ ਹੈ ਜਿਸਨੂੰ ਮਕੈਨੀਕਲ ਇੰਜੀਨੀਅਰਿੰਗ ਨੂੰ ਸਮਝਣ ਲਈ ਸੁਧਾਰਿਆ ਗਿਆ ਸੀ। ਇਹ ਇੱਕ ਠੋਸ ਉਦਾਹਰਣ ਹੈ ਕਿ ਕਿਵੇਂ ਮਾਡਲ ਕੁਸ਼ਲਤਾ ਵਿੱਚ ਇੱਕ ਛੋਟਾ ਸੁਧਾਰ ਉਤਪਾਦਕਤਾ ਵਿੱਚ ਇੱਕ ਵੱਡਾ ਬਦਲਾਅ ਲਿਆਉਂਦਾ ਹੈ।

ਉਸ ਦਿਨ ਬਾਅਦ ਵਿੱਚ, ਮਾਰਕਸ ਇੱਕ ਵਿਦੇਸ਼ੀ ਸਪਲਾਇਰ ਤੋਂ ਤਕਨੀਕੀ ਦਸਤਾਵੇਜ਼ ਦਾ ਅਨੁਵਾਦ ਕਰਨ ਲਈ ਉਸੇ ਡਿਵਾਈਸ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਅਨੁਵਾਦ ਲਗਭਗ ਸੰਪੂਰਨ ਹੈ ਕਿਉਂਕਿ ਮਾਡਲ ਨੂੰ ਇੰਜੀਨੀਅਰਿੰਗ ਟੈਕਸਟ ਦੇ ਇੱਕ ਛੋਟੇ ਪਰ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਸੈੱਟ ‘ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਗਈ ਸੀ। ਉਸਨੂੰ ਕਲਾਊਡ ‘ਤੇ ਇੱਕ ਵੀ ਫਾਈਲ ਅਪਲੋਡ ਕਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਪਈ। ਇਹ ਭਰੋਸੇਯੋਗਤਾ ਹੀ ਹੈ ਜੋ ਤਕਨਾਲੋਜੀ ਨੂੰ ਅਸਲ ਸੰਸਾਰ ਵਿੱਚ ਲਾਭਦਾਇਕ ਬਣਾਉਂਦੀ ਹੈ। ਬਹੁਤ ਸਾਰੇ ਲੋਕ ਮੰਨਦੇ ਹਨ ਕਿ ਮਦਦਗਾਰ ਹੋਣ ਲਈ AI ਨੂੰ ਇੱਕ ਜਨਰਲਿਸਟ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ, ਪਰ ਮਾਰਕਸ ਸਾਬਤ ਕਰਦਾ ਹੈ ਕਿ ਵਿਸ਼ੇਸ਼, ਛੋਟੇ ਸਿਸਟਮ ਅਕਸਰ ਪੇਸ਼ੇਵਰ ਕੰਮਾਂ ਲਈ ਬਿਹਤਰ ਹੁੰਦੇ ਹਨ। ਮਾਡਲ ਦੀ ਛੋਟੀ ਪ੍ਰਕਿਰਤੀ ਅਸਲ ਵਿੱਚ ਇੱਕ ਵਿਸ਼ੇਸ਼ਤਾ ਹੈ, ਨਾ ਕਿ ਕੋਈ ਬੱਗ। ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਸਿਸਟਮ ਤੇਜ਼, ਵਧੇਰੇ ਨਿੱਜੀ, ਅਤੇ ਚਲਾਉਣ ਲਈ ਸਸਤਾ ਹੈ। ਮਾਰਕਸ ਨੂੰ ਪਿਛਲੇ ਹਫ਼ਤੇ ਆਪਣਾ ਨਵੀਨਤਮ ਅਪਡੇਟ ਮਿਲਿਆ, ਅਤੇ ਗਤੀ ਵਿੱਚ ਅੰਤਰ ਤੁਰੰਤ ਦਿਖਾਈ ਦਿੱਤਾ।

BotNews.today ਸਮੱਗਰੀ ਦੀ ਖੋਜ, ਲਿਖਣ, ਸੰਪਾਦਨ ਅਤੇ ਅਨੁਵਾਦ ਕਰਨ ਲਈ AI ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਸਾਡੀ ਟੀਮ ਜਾਣਕਾਰੀ ਨੂੰ ਉਪਯੋਗੀ, ਸਪਸ਼ਟ ਅਤੇ ਭਰੋਸੇਮੰਦ ਰੱਖਣ ਲਈ ਪ੍ਰਕਿਰਿਆ ਦੀ ਸਮੀਖਿਆ ਅਤੇ ਨਿਗਰਾਨੀ ਕਰਦੀ ਹੈ।

ਇੱਥੇ ਵਿਰੋਧਾਭਾਸ ਇਹ ਹੈ ਕਿ ਜਦੋਂ ਮਾਡਲ ਛੋਟੇ ਹੋ ਰਹੇ ਹਨ, ਉਹ ਜੋ ਕੰਮ ਕਰਦੇ ਹਨ ਉਹ ਵੱਡੇ ਹੁੰਦੇ ਜਾ ਰਹੇ ਹਨ। ਅਸੀਂ ਇੱਕ ਬੋਟ ਨਾਲ ਗੱਲਬਾਤ ਕਰਨ ਤੋਂ ਦੂਰ ਹੋ ਕੇ ਇੱਕ ਵਰਕਫਲੋ ਵਿੱਚ ਇੱਕ ਟੂਲ ਨੂੰ ਜੋੜਨ ਵੱਲ ਇੱਕ ਕਦਮ ਦੇਖ ਰਹੇ ਹਾਂ। ਲੋਕ ਕਵਿਤਾ ਲਿਖਣ ਦੇ ਯੋਗ ਹੋਣ ਵਾਲੇ ਮਾਡਲ ਦੀ ਮਹੱਤਤਾ ਨੂੰ ਵਧਾ-ਚੜ੍ਹਾ ਕੇ ਦੇਖਦੇ ਹਨ। ਉਹ ਇੱਕ ਅਜਿਹੇ ਮਾਡਲ ਦੀ ਕੀਮਤ ਨੂੰ ਘੱਟ ਸਮਝਦੇ ਹਨ ਜੋ ਇੱਕ ਧੁੰਦਲੀ ਇਨਵੌਇਸ ਤੋਂ ਡੇਟਾ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਐਕਸਟਰੈਕਟ ਕਰ ਸਕਦਾ ਹੈ ਜਾਂ ਸਟੀਲ ਬੀਮ ਵਿੱਚ ਵਾਲਾਂ ਵਰਗੀ ਤਰੇੜ ਦੀ ਪਛਾਣ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਉਹ ਕੰਮ ਹਨ ਜੋ ਗਲੋਬਲ ਆਰਥਿਕਤਾ ਨੂੰ ਚਲਾਉਂਦੇ ਹਨ। ਜਿਵੇਂ-ਜਿਵੇਂ ਇਹ ਛੋਟੇ ਸੁਧਾਰ ਜਾਰੀ ਰਹਿਣਗੇ, ਸਮਾਰਟ ਸਾਫਟਵੇਅਰ ਅਤੇ ਨਿਯਮਤ ਸਾਫਟਵੇਅਰ ਵਿਚਕਾਰ ਰੇਖਾ ਖਤਮ ਹੋ ਜਾਵੇਗੀ। ਸਭ ਕੁਝ ਬਸ ਬਿਹਤਰ ਕੰਮ ਕਰੇਗਾ। ਇਹ ਮੌਜੂਦਾ ਤਕਨੀਕੀ ਮਾਹੌਲ ਦੀ ਅਸਲੀਅਤ ਹੈ।

ਕੁਸ਼ਲਤਾ ਦੇ ਸਮਝੌਤੇ ਬਾਰੇ ਔਖੇ ਸਵਾਲ

ਹਾਲਾਂਕਿ, ਸਾਨੂੰ ਇਸ ਰੁਝਾਨ ‘ਤੇ ਕੁਝ ਸੁਕਰਾਤੀ ਸੰਦੇਹਵਾਦ (Socratic skepticism) ਲਾਗੂ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ। ਜੇ ਅਸੀਂ ਛੋਟੇ, ਵਧੇਰੇ ਅਨੁਕੂਲਿਤ ਮਾਡਲਾਂ ਵੱਲ ਵਧ ਰਹੇ ਹਾਂ, ਤਾਂ ਅਸੀਂ ਕੀ ਪਿੱਛੇ ਛੱਡ ਰਹੇ ਹਾਂ? ਇੱਕ ਮੁਸ਼ਕਲ ਸਵਾਲ ਇਹ ਹੈ ਕਿ ਕੀ ਕੁਸ਼ਲਤਾ ‘ਤੇ ਧਿਆਨ ਕੇਂਦਰਿਤ ਕਰਨ ਨਾਲ ਇੱਕ ‘ਕਾਫ਼ੀ ਚੰਗਾ’ ਪਠਾਰ ਬਣ ਜਾਂਦਾ ਹੈ? ਜੇ ਇੱਕ ਮਾਡਲ ਨੂੰ ਤੇਜ਼ ਹੋਣ ਲਈ ਅਨੁਕੂਲਿਤ ਕੀਤਾ ਗਿਆ ਹੈ, ਤਾਂ ਕੀ ਇਹ ਉਹਨਾਂ ਐਜ ਕੇਸਾਂ ਨੂੰ ਸੰਭਾਲਣ ਦੀ ਸਮਰੱਥਾ ਗੁਆ ਦਿੰਦਾ ਹੈ ਜੋ ਇੱਕ ਵੱਡਾ ਮਾਡਲ ਫੜ ਸਕਦਾ ਹੈ? ਸਾਨੂੰ ਇਹ ਪੁੱਛਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਕੀ ਮਾਡਲਾਂ ਨੂੰ ਸੁੰਗੜਨ ਦੀ ਕਾਹਲੀ ਇੱਕ ਨਵੀਂ ਕਿਸਮ ਦਾ ਪੱਖਪਾਤ ਪੈਦਾ ਕਰ ਰਹੀ ਹੈ। ਜੇ ਅਸੀਂ ਇਹਨਾਂ ਸਿਸਟਮਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਸਿਰਫ਼ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਡੇਟਾ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਾਂ, ਤਾਂ ਗੁਣਵੱਤਾ ਕੀ ਹੈ, ਇਹ ਕੌਣ ਪਰਿਭਾਸ਼ਿਤ ਕਰਦਾ ਹੈ? ਅਸੀਂ ਅਣਜਾਣੇ ਵਿੱਚ ਹਾਸ਼ੀਏ ‘ਤੇ ਰਹਿ ਗਏ ਸਮੂਹਾਂ ਦੀਆਂ ਆਵਾਜ਼ਾਂ ਅਤੇ ਦ੍ਰਿਸ਼ਟੀਕੋਣਾਂ ਨੂੰ ਫਿਲਟਰ ਕਰ ਸਕਦੇ ਹਾਂ ਕਿਉਂਕਿ ਉਨ੍ਹਾਂ ਦਾ ਡੇਟਾ ਟੈਕਸਟਬੁੱਕ ਮਿਆਰ ਵਿੱਚ ਫਿੱਟ ਨਹੀਂ ਬੈਠਦਾ।

ਕੀ ਤੁਹਾਡੇ ਕੋਲ ਕੋਈ AI ਕਹਾਣੀ, ਟੂਲ, ਰੁਝਾਨ ਜਾਂ ਸਵਾਲ ਹੈ ਜੋ ਤੁਹਾਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ ਸਾਨੂੰ ਕਵਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ? ਸਾਨੂੰ ਆਪਣਾ ਲੇਖ ਦਾ ਵਿਚਾਰ ਭੇਜੋ — ਅਸੀਂ ਇਸਨੂੰ ਸੁਣਨਾ ਪਸੰਦ ਕਰਾਂਗੇ।

ਲੁਕਵੀਂ ਲਾਗਤ ਦਾ ਸਵਾਲ ਵੀ ਹੈ। ਹਾਲਾਂਕਿ ਇੱਕ ਛੋਟਾ ਮਾਡਲ ਚਲਾਉਣਾ ਸਸਤਾ ਹੈ, ਇੱਕ ਵੱਡੇ ਮਾਡਲ ਨੂੰ ਸੁੰਗੜਨ ਲਈ ਲੋੜੀਂਦੀ ਖੋਜ ਅਤੇ ਵਿਕਾਸ ਬਹੁਤ ਮਹਿੰਗਾ ਹੈ। ਕੀ ਅਸੀਂ ਸਿਰਫ਼ ਊਰਜਾ ਦੀ ਖਪਤ ਨੂੰ ਇਨਫਰੈਂਸ ਪੜਾਅ ਤੋਂ ਟ੍ਰੇਨਿੰਗ ਅਤੇ ਓਪਟੀਮਾਈਜੇਸ਼ਨ ਪੜਾਅ ‘ਤੇ ਤਬਦੀਲ ਕਰ ਰਹੇ ਹਾਂ? ਨਾਲ ਹੀ, ਜਿਵੇਂ-ਜਿਵੇਂ ਇਹ ਮਾਡਲ ਨਿੱਜੀ ਡਿਵਾਈਸਾਂ ‘ਤੇ ਵਧੇਰੇ ਆਮ ਹੁੰਦੇ ਜਾ ਰਹੇ ਹਨ, ਸਾਡੀ ਗੋਪਨੀਯਤਾ ਦਾ ਕੀ ਹੋਵੇਗਾ? ਭਾਵੇਂ ਮਾਡਲ ਸਥਾਨਕ ਤੌਰ ‘ਤੇ ਚੱਲਦਾ ਹੈ, ਅਸੀਂ ਇਸਦੀ ਵਰਤੋਂ ਕਿਵੇਂ ਕਰਦੇ ਹਾਂ ਇਸ ਬਾਰੇ ਮੈਟਾਡੇਟਾ ਅਜੇ ਵੀ ਇਕੱਠਾ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਸਾਨੂੰ ਇਹ ਪੁੱਛਣ ਦੀ ਲੋੜ ਹੈ ਕਿ ਕੀ ਸਥਾਨਕ ਇੰਟੈਲੀਜੈਂਸ ਦੀ ਸਹੂਲਤ ਵਧੇਰੇ ਹਮਲਾਵਰ ਟਰੈਕਿੰਗ ਦੀ ਸੰਭਾਵਨਾ ਦੇ ਬਰਾਬਰ ਹੈ। ਜੇ ਤੁਹਾਡੇ ਫੋਨ ‘ਤੇ ਹਰ ਐਪ ਦਾ ਆਪਣਾ ਛੋਟਾ ਦਿਮਾਗ ਹੈ, ਤਾਂ ਇਹ ਕੌਣ ਨਿਗਰਾਨੀ ਕਰ ਰਿਹਾ ਹੈ ਕਿ ਉਹ ਦਿਮਾਗ ਤੁਹਾਡੇ ਬਾਰੇ ਕੀ ਸਿੱਖ ਰਹੇ ਹਨ? ਸਾਨੂੰ ਹਾਰਡਵੇਅਰ ਦੀ ਲੰਬੀ ਉਮਰ ‘ਤੇ ਵੀ ਵਿਚਾਰ ਕਰਨਾ ਹੋਵੇਗਾ। ਜੇ ਸਾਫਟਵੇਅਰ ਵਧੇਰੇ ਕੁਸ਼ਲ ਹੁੰਦਾ ਜਾ ਰਿਹਾ ਹੈ, ਤਾਂ ਕੀ ਕੰਪਨੀਆਂ ਅਜੇ ਵੀ ਸਾਨੂੰ ਹਰ ਸਾਲ ਆਪਣੇ ਡਿਵਾਈਸਾਂ ਨੂੰ ਅਪਗ੍ਰੇਡ ਕਰਨ ਲਈ ਮਜਬੂਰ ਕਰਨਗੀਆਂ? ਜਾਂ ਕੀ ਇਹ ਇੱਕ ਟਿਕਾਊ ਯੁੱਗ ਵੱਲ ਲੈ ਜਾਵੇਗਾ ਜਿੱਥੇ ਪੰਜ ਸਾਲ ਪੁਰਾਣਾ ਫੋਨ ਅਜੇ ਵੀ ਨਵੀਨਤਮ ਟੂਲ ਚਲਾਉਣ ਦੇ ਪੂਰੀ ਤਰ੍ਹਾਂ ਸਮਰੱਥ ਹੈ? ਇਹ ਉਹ ਵਿਰੋਧਾਭਾਸ ਹਨ ਜਿਨ੍ਹਾਂ ਦਾ ਸਾਨੂੰ ਤਕਨਾਲੋਜੀ ਦੇ ਵਿਕਾਸ ਦੇ ਨਾਲ ਸਾਹਮਣਾ ਕਰਨਾ ਪਵੇਗਾ।

ਕੰਪ੍ਰੈਸ਼ਨ ਦੇ ਪਿੱਛੇ ਦੀ ਇੰਜੀਨੀਅਰਿੰਗ

ਪਾਵਰ ਯੂਜ਼ਰਾਂ ਅਤੇ ਡਿਵੈਲਪਰਾਂ ਲਈ, ਛੋਟੇ ਮਾਡਲਾਂ ਵੱਲ ਤਬਦੀਲੀ ਤਕਨੀਕੀ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦਾ ਮਾਮਲਾ ਹੈ। ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਮੈਟ੍ਰਿਕ ਹੁਣ ਸਿਰਫ਼ ਪੈਰਾਮੀਟਰ ਦੀ ਗਿਣਤੀ ਨਹੀਂ ਹੈ। ਇਹ ਪ੍ਰਤੀ ਪੈਰਾਮੀਟਰ ਬਿੱਟਸ ਹੈ। ਅਸੀਂ 16-bit ਫਲੋਟਿੰਗ ਪੁਆਇੰਟ ਵੇਟਸ ਤੋਂ 8-bit ਅਤੇ ਇੱਥੋਂ ਤੱਕ ਕਿ 4-bit ਕੁਆਂਟਾਈਜ਼ੇਸ਼ਨ ਵੱਲ ਇੱਕ ਕਦਮ ਦੇਖ ਰਹੇ ਹਾਂ। ਇਹ ਇੱਕ ਅਜਿਹੇ ਮਾਡਲ ਨੂੰ, ਜਿਸਨੂੰ ਆਮ ਤੌਰ ‘ਤੇ 40 ਗੀਗਾਬਾਈਟ VRAM ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, 10 ਗੀਗਾਬਾਈਟ ਤੋਂ ਘੱਟ ਵਿੱਚ ਫਿੱਟ ਹੋਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ। ਇਹ ਲੋਕਲ ਸਟੋਰੇਜ ਅਤੇ GPU ਲੋੜਾਂ ਲਈ ਇੱਕ ਵੱਡਾ ਬਦਲਾਅ ਹੈ। ਡਿਵੈਲਪਰ ਹੁਣ ਪੂਰੇ ਸਿਸਟਮ ਨੂੰ ਦੁਬਾਰਾ ਸਿਖਲਾਈ ਦਿੱਤੇ ਬਿਨਾਂ ਖਾਸ ਕੰਮਾਂ ‘ਤੇ ਇਹਨਾਂ ਮਾਡਲਾਂ ਨੂੰ ਫਾਈਨ-ਟਿਊਨ ਕਰਨ ਲਈ LoRA, ਜਾਂ Low-Rank Adaptation, ਵੱਲ ਦੇਖ ਰਹੇ ਹਨ। ਇਹ ਵਰਕਫਲੋ ਇੰਟੀਗ੍ਰੇਸ਼ਨ ਨੂੰ ਬਹੁਤ ਸੌਖਾ ਬਣਾਉਂਦਾ ਹੈ। ਤੁਸੀਂ MIT Technology Review ‘ਤੇ ਇਹਨਾਂ ਤਰੀਕਿਆਂ ਬਾਰੇ ਤਕਨੀਕੀ ਦਸਤਾਵੇਜ਼ ਲੱਭ ਸਕਦੇ ਹੋ।

ਐਪਲੀਕੇਸ਼ਨ ਬਣਾਉਣ ਵੇਲੇ, ਤੁਹਾਨੂੰ ਹੇਠ ਲਿਖੀਆਂ ਤਕਨੀਕੀ ਸੀਮਾਵਾਂ ‘ਤੇ ਵਿਚਾਰ ਕਰਨਾ ਹੋਵੇਗਾ:

ਲੋਕਲ ਇਨਫਰੈਂਸ ਲਈ ਮੈਮੋਰੀ ਬੈਂਡਵਿਡਥ ਅਕਸਰ ਕੱਚੀ ਕੰਪਿਊਟ ਪਾਵਰ ਨਾਲੋਂ ਵੱਡੀ ਰੁਕਾਵਟ ਹੁੰਦੀ ਹੈ।
ਕਲਾਊਡ ਮਾਡਲਾਂ ਲਈ API ਸੀਮਾਵਾਂ ਘੱਟ ਸੰਬੰਧਿਤ ਹੋ ਰਹੀਆਂ ਹਨ ਕਿਉਂਕਿ ਲੋਕਲ ਹੋਸਟਿੰਗ ਉਤਪਾਦਨ ਲਈ ਵਿਹਾਰਕ ਬਣ ਰਹੀ ਹੈ।
ਕੰਟੈਕਸਟ ਵਿੰਡੋ ਪ੍ਰਬੰਧਨ ਅਜੇ ਵੀ ਛੋਟੇ ਮਾਡਲਾਂ ਲਈ ਇੱਕ ਚੁਣੌਤੀ ਹੈ ਕਿਉਂਕਿ ਉਹ ਲੰਬੀ ਗੱਲਬਾਤ ਦਾ ਟਰੈਕ ਗੁਆਉਣ ਦੀ ਸੰਭਾਵਨਾ ਰੱਖਦੇ ਹਨ।
FP8 ਅਤੇ INT4 ਸ਼ੁੱਧਤਾ ਵਿਚਕਾਰ ਚੋਣ ਰਚਨਾਤਮਕ ਕੰਮਾਂ ਵਿੱਚ ਭੁਲੇਖੇ (hallucination) ਦੀ ਦਰ ਨੂੰ ਮਹੱਤਵਪੂਰਣ ਰੂਪ ਵਿੱਚ ਪ੍ਰਭਾਵਿਤ ਕਰ ਸਕਦੀ ਹੈ।
ਲੋਕਲ ਸਟੋਰੇਜ ਦੀਆਂ ਲੋੜਾਂ ਘਟ ਰਹੀਆਂ ਹਨ ਪਰ ਤੇਜ਼ ਮਾਡਲ ਲੋਡਿੰਗ ਲਈ ਹਾਈ-ਸਪੀਡ NVMe ਡਰਾਈਵਾਂ ਦੀ ਲੋੜ ਬਣੀ ਹੋਈ ਹੈ।

ਅਸੀਂ ਸਪੈਕੂਲੇਟਿਵ ਡੀਕੋਡਿੰਗ ਦਾ ਉਭਾਰ ਵੀ ਦੇਖ ਰਹੇ ਹਾਂ, ਜਿੱਥੇ ਇੱਕ ਛੋਟਾ ਮਾਡਲ ਅਗਲੇ ਕੁਝ ਟੋਕਨਾਂ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਦਾ ਹੈ ਅਤੇ ਇੱਕ ਵੱਡਾ ਮਾਡਲ ਉਹਨਾਂ ਦੀ ਪੁਸ਼ਟੀ ਕਰਦਾ ਹੈ। ਇਹ ਹਾਈਬ੍ਰਿਡ ਪਹੁੰਚ ਇੱਕ ਛੋਟੇ ਮਾਡਲ ਦੀ ਗਤੀ ਦੇ ਨਾਲ ਇੱਕ ਦੈਂਤ ਦੀ ਸ਼ੁੱਧਤਾ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦੀ ਹੈ। ਇਹ ਮਾਡਲ ਦੇ ਆਕਾਰ ਦੇ ਰਵਾਇਤੀ ਵਪਾਰ-ਆਫਸ (trade-offs) ਨੂੰ ਬਾਈਪਾਸ ਕਰਨ ਦਾ ਇੱਕ ਚਲਾਕ ਤਰੀਕਾ ਹੈ। ਇਸ ਖੇਤਰ ਵਿੱਚ ਅੱਗੇ ਰਹਿਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰਨ ਵਾਲੇ ਕਿਸੇ ਵੀ ਵਿਅਕਤੀ ਲਈ, ਇਹਨਾਂ ਕੰਪ੍ਰੈਸ਼ਨ ਤਕਨੀਕਾਂ ਨੂੰ ਸਮਝਣਾ ਮਾਡਲ ਨੂੰ ਸਕ੍ਰੈਚ ਤੋਂ ਬਣਾਉਣ ਨਾਲੋਂ ਜ਼ਿਆਦਾ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਭਵਿੱਖ ਉਹਨਾਂ ਓਪਟੀਮਾਈਜ਼ਰਾਂ ਦਾ ਹੈ ਜੋ ਘੱਟ ਨਾਲ ਜ਼ਿਆਦਾ ਕਰ ਸਕਦੇ ਹਨ। ਧਿਆਨ ਕੱਚੀ ਸ਼ਕਤੀ ਤੋਂ ਚਲਾਕ ਇੰਜੀਨੀਅਰਿੰਗ ਵੱਲ ਬਦਲ ਰਿਹਾ ਹੈ।

ਅਨੁਕੂਲ ਪ੍ਰਦਰਸ਼ਨ ਦਾ ਚਲਦਾ ਨਿਸ਼ਾਨਾ

ਸਿੱਟਾ ਇਹ ਹੈ ਕਿ ‘ਵੱਡਾ ਹਮੇਸ਼ਾ ਬਿਹਤਰ ਹੁੰਦਾ ਹੈ’ ਦਾ ਯੁੱਗ ਖਤਮ ਹੋ ਰਿਹਾ ਹੈ। ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਤਰੱਕੀ ਹੁਣ ਹੋਰ ਪਰਤਾਂ ਜਾਂ ਜ਼ਿਆਦਾ ਡੇਟਾ ਜੋੜਨ ਬਾਰੇ ਨਹੀਂ ਹੈ। ਉਹ ਸੁਧਾਰ, ਕੁਸ਼ਲਤਾ ਅਤੇ ਪਹੁੰਚਯੋਗਤਾ ਬਾਰੇ ਹਨ। ਅਸੀਂ ਇੱਕ ਅਜਿਹੀ ਤਬਦੀਲੀ ਦੇਖ ਰਹੇ ਹਾਂ ਜੋ ਉੱਨਤ ਕੰਪਿਊਟੇਸ਼ਨ ਨੂੰ ਕੈਲਕੁਲੇਟਰ ਵਾਂਗ ਆਮ ਬਣਾ ਦੇਵੇਗੀ। ਇਹ ਤਰੱਕੀ ਸਿਰਫ਼ ਇੱਕ ਤਕਨੀਕੀ ਪ੍ਰਾਪਤੀ ਨਹੀਂ ਹੈ। ਇਹ ਇੱਕ ਸਮਾਜਿਕ ਪ੍ਰਾਪਤੀ ਹੈ। ਇਹ ਸਭ ਤੋਂ ਉੱਨਤ ਖੋਜ ਦੀ ਸ਼ਕਤੀ ਨੂੰ ਹਰ ਕਿਸੇ ਲਈ ਲਿਆਉਂਦਾ ਹੈ, ਭਾਵੇਂ ਉਹਨਾਂ ਦਾ ਹਾਰਡਵੇਅਰ ਜਾਂ ਇੰਟਰਨੈਟ ਕਨੈਕਸ਼ਨ ਕੋਈ ਵੀ ਹੋਵੇ। ਇਹ ਓਪਟੀਮਾਈਜੇਸ਼ਨ ਦੇ ਪਿਛਲੇ ਦਰਵਾਜ਼ੇ ਰਾਹੀਂ ਇੰਟੈਲੀਜੈਂਸ ਦਾ ਲੋਕਤੰਤਰੀਕਰਨ ਹੈ।

Editor’s note: We created this site as a multilingual AI news and guides hub for people who are not computer geeks, but still want to understand artificial intelligence, use it with more confidence, and follow the future that is already arriving.

ਕੋਈ ਗਲਤੀ ਮਿਲੀ ਜਾਂ ਕੁਝ ਠੀਕ ਕਰਨ ਦੀ ਲੋੜ ਹੈ? ਸਾਨੂੰ ਦੱਸੋ।

ਜਿਵੇਂ ਕਿ ਅਸੀਂ ਅਗਲੇ ਸਾਲਾਂ ਵੱਲ ਦੇਖਦੇ ਹਾਂ, ਖੁੱਲਾ ਸਵਾਲ ਬਣਿਆ ਹੋਇਆ ਹੈ: ਕੀ ਅਸੀਂ ਇੰਟੈਲੀਜੈਂਸ ਨੂੰ ਸੁੰਗੜਨ ਦੇ ਤਰੀਕੇ ਲੱਭਣਾ ਜਾਰੀ ਰੱਖਾਂਗੇ, ਜਾਂ ਕੀ ਅਸੀਂ ਅੰਤ ਵਿੱਚ ਇੱਕ ਭੌਤਿਕ ਸੀਮਾ ਤੱਕ ਪਹੁੰਚ ਜਾਵਾਂਗੇ ਜੋ ਸਾਨੂੰ ਵਾਪਸ ਕਲਾਊਡ ਵੱਲ ਮਜਬੂਰ ਕਰੇਗੀ? ਫਿਲਹਾਲ, ਰੁਝਾਨ ਸਪੱਸ਼ਟ ਹੈ। ਛੋਟਾ ਹੀ ਨਵਾਂ ਵੱਡਾ ਹੈ। ਅਸੀਂ ਕੱਲ੍ਹ ਜੋ ਸਿਸਟਮ ਵਰਤਾਂਗੇ, ਉਹ ਇਸ ਗੱਲ ਦੁਆਰਾ ਪਰਿਭਾਸ਼ਿਤ ਨਹੀਂ ਹੋਣਗੇ ਕਿ ਉਹ ਕਿੰਨਾ ਜਾਣਦੇ ਹਨ, ਸਗੋਂ ਇਸ ਦੁਆਰਾ ਕਿ ਉਹ ਜੋ ਉਹਨਾਂ ਕੋਲ ਹੈ ਉਸਦੀ ਵਰਤੋਂ ਕਿੰਨੀ ਚੰਗੀ ਤਰ੍ਹਾਂ ਕਰਦੇ ਹਨ।

Frequently Asked Questions

ਪਾਠਕ “ਲੈਬ ਨੋਟਸ” ਲੇਖਾਂ ਨੂੰ ਅਮਲ ਵਿੱਚ ਕਿਵੇਂ ਵਰਤ ਸਕਦੇ ਹਨ?

ਲੈਬ ਨੋਟਸ: AI ਖੋਜ, ਪ੍ਰਯੋਗਾਂ ਅਤੇ ਤਕਨੀਕੀ ਤਰੱਕੀ ਲਈ ਇੱਕ ਵਿਆਪਕ ਗਾਈਡ ਜੋ ਗੁੰਝਲਦਾਰ ਵਿਸ਼ਿਆਂ ਨੂੰ ਸਰਲ ਅਤੇ ਉਪਯੋਗੀ ਬਣਾਉਂਦੀ ਹੈ। ਟੂਲਾਂ ਦੀ ਤੁਲਨਾ ਕਰਨ, ਖਤਰੇ ਸਮਝਣ, ਵਧੀਆ ਸਵਾਲ ਪੁੱਛਣ ਅਤੇ ਸਮਾਂ ਜਾਂ ਪੈਸਾ ਖਰਚਣ ਤੋਂ ਪਹਿਲਾਂ ਕੀ ਧਿਆਨ ਦੇਣ ਯੋਗ ਹੈ ਇਹ ਫੈਸਲਾ ਕਰਨ ਲਈ ਇਹ ਲੇਖ ਵਰਤੋ।

“ਓਪਨ ਮਾਡਲ” ਕਿਸ ਲਈ ਸਭ ਤੋਂ ਲਾਭਕਾਰੀ ਹੈ?

ਓਪਨ ਮਾਡਲਾਂ, ਕਮਿਊਨਿਟੀ ਰੀਲੀਜ਼ਾਂ ਅਤੇ ਸਵੈ-ਹੋਸਟ ਕੀਤੇ AI ਵਿਕਲਪਾਂ ਬਾਰੇ ਤਾਜ਼ਾ ਖ਼ਬਰਾਂ, ਗਾਈਡਾਂ ਅਤੇ ਡੂੰਘਾਈ ਨਾਲ ਵਿਆਖਿਆਵਾਂ ਦੀ ਪੜਚੋਲ ਕਰੋ। ਇਹ ਸਮੱਗਰੀ ਆਮ ਪਾਠਕਾਂ, ਛੋਟੀਆਂ ਟੀਮਾਂ, creators, ਕਾਰੋਬਾਰੀ ਮਾਲਕਾਂ, marketers, ਵਿਦਿਆਰਥੀਆਂ ਅਤੇ hype ਤੋਂ ਬਿਨਾਂ ਸਪਸ਼ਟ AI ਸੰਦਰਭ ਚਾਹੁਣ ਵਾਲਿਆਂ ਲਈ ਲਿਖੀ ਗਈ ਹੈ।

ਵੱਡਾ ਹੀ ਬਿਹਤਰ ਹੈ ਦੇ ਯੁੱਗ ਦਾ ਅੰਤ