2026 ਵਿੱਚ LLM ਮਾਰਕੀਟ ਕਿਵੇਂ ਵੰਡੀ ਜਾ ਰਹੀ ਹੈ
ਮੋਨੋਲਿਥਿਕ AI ਮਾਡਲ ਦਾ ਦੌਰ ਆਪਣੀ ਕੁਦਰਤੀ ਸੀਮਾ ਤੱਕ ਪਹੁੰਚ ਗਿਆ ਹੈ। ਪਿਛਲੇ ਕੁਝ ਸਾਲਾਂ ਤੋਂ, ਟੈਕ ਇੰਡਸਟਰੀ ਇਸ ਸਧਾਰਨ ਧਾਰਨਾ ‘ਤੇ ਚੱਲ ਰਹੀ ਸੀ ਕਿ ਜ਼ਿਆਦਾ ਪੈਰਾਮੀਟਰ ਅਤੇ ਜ਼ਿਆਦਾ ਡੇਟਾ ਹਰ ਸੰਭਵ ਵਰਤੋਂ ਲਈ ਬਿਹਤਰ ਨਤੀਜੇ ਦੇਣਗੇ। ਇਹ ਧਾਰਨਾ 2026 ਵਿੱਚ ਟੁੱਟ ਗਈ ਜਦੋਂ ਮਾਰਕੀਟ ਦੋ ਵੱਖ-ਵੱਖ ਅਤੇ ਵਿਰੋਧੀ ਦਿਸ਼ਾਵਾਂ ਵਿੱਚ ਵੰਡੀ ਜਾਣ ਲੱਗੀ। ਅਸੀਂ ਹੁਣ ਲਾਰਜ ਲੈਂਗੂਏਜ ਮਾਡਲਾਂ ਲਈ ਇੱਕੋ ਰਾਹ ਨਹੀਂ ਦੇਖ ਰਹੇ ਹਾਂ। ਇਸ ਦੀ ਬਜਾਏ, ਅਸੀਂ ਡੂੰਘੀ ਤਰਕਸ਼ੀਲਤਾ (reasoning) ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਵਿਸ਼ਾਲ ਕਲਾਉਡ-ਅਧਾਰਿਤ ਸਿਸਟਮਾਂ ਅਤੇ ਨਿੱਜੀ ਹਾਰਡਵੇਅਰ ‘ਤੇ ਚੱਲਣ ਵਾਲੇ ਛੋਟੇ, ਬਹੁਤ ਹੀ ਕੁਸ਼ਲ ਮਾਡਲਾਂ ਵਿਚਕਾਰ ਵੰਡ ਦੇਖ ਰਹੇ ਹਾਂ। ਇਹ ਬਦਲਾਅ ਸਿਰਫ਼ ਤਕਨੀਕੀ ਬੈਂਚਮਾਰਕ ਬਾਰੇ ਨਹੀਂ ਹੈ। ਇਹ ਇਸ ਬਾਰੇ ਹੈ ਕਿ ਕਾਰੋਬਾਰ ਅਤੇ ਵਿਅਕਤੀ ਆਪਣੇ ਪੈਸੇ ਕਿੱਥੇ ਖਰਚਣਾ ਚੁਣਦੇ ਹਨ ਅਤੇ ਉਹ ਆਪਣਾ ਡੇਟਾ ਕਿੱਥੇ ਸੁਰੱਖਿਅਤ ਰੱਖਣਾ ਚਾਹੁੰਦੇ ਹਨ। ਹੁਣ ਚੋਣ ਇਹ ਨਹੀਂ ਹੈ ਕਿ ਕਿਹੜਾ ਮਾਡਲ ਸਭ ਤੋਂ ਸਮਾਰਟ ਹੈ, ਸਗੋਂ ਇਹ ਹੈ ਕਿ ਕਿਹੜਾ ਮਾਡਲ ਕੰਮ ਲਈ ਸਹੀ ਆਕਾਰ ਦਾ ਹੈ। ਇਸ ਵੰਡ ਨੂੰ ਸਮਝਣਾ ਨਵੀਨਤਮ AI ਇੰਡਸਟਰੀ ਦੇ ਰੁਝਾਨਾਂ ਨੂੰ ਟਰੈਕ ਕਰਨ ਵਾਲੇ ਹਰ ਵਿਅਕਤੀ ਲਈ ਜ਼ਰੂਰੀ ਹੈ ਕਿਉਂਕਿ ਖੇਡ ਦੇ ਨਿਯਮ ਹਮੇਸ਼ਾ ਲਈ ਬਦਲ ਗਏ ਹਨ।
ਜਨਰਲਿਸਟ ਯੁੱਗ ਦਾ ਅੰਤ
ਇਸ ਵੰਡ ਦਾ ਪਹਿਲਾ ਹਿੱਸਾ ਫਰੰਟੀਅਰ ਮਾਡਲਾਂ ਦਾ ਹੈ। ਇਹ ਸ਼ੁਰੂਆਤੀ GPT ਸਿਸਟਮਾਂ ਦੇ ਵੰਸ਼ਜ ਹਨ, ਪਰ ਇਹ ਬਹੁਤ ਜ਼ਿਆਦਾ ਵਿਸ਼ੇਸ਼ ਬਣ ਗਏ ਹਨ। OpenAI ਵਰਗੀਆਂ ਕੰਪਨੀਆਂ ਅਜਿਹੇ ਮਾਡਲਾਂ ਵੱਲ ਵਧ ਰਹੀਆਂ ਹਨ ਜੋ ਕੇਂਦਰੀ ਤਰਕ ਇੰਜਣਾਂ ਵਜੋਂ ਕੰਮ ਕਰਦੇ ਹਨ। ਇਹ ਸਿਸਟਮ ਇੰਨੇ ਵੱਡੇ ਹਨ ਕਿ ਇਹ ਸਿਰਫ਼ ਵਿਸ਼ਾਲ ਸਰਵਰ ਫਾਰਮਾਂ ‘ਤੇ ਹੀ ਚੱਲ ਸਕਦੇ ਹਨ। ਇਹ ਸਭ ਤੋਂ ਗੁੰਝਲਦਾਰ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰਨ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਹਨ, ਜਿਵੇਂ ਕਿ ਮਲਟੀ-ਸਟੈਪ ਵਿਗਿਆਨਕ ਖੋਜ, ਉੱਨਤ ਕੋਡਿੰਗ ਆਰਕੀਟੈਕਚਰ, ਅਤੇ ਉੱਚ-ਪੱਧਰੀ ਰਣਨੀਤਕ ਯੋਜਨਾਬੰਦੀ। ਇਹ ਇੰਡਸਟਰੀ ਦੇ ਮਹਿੰਗੇ, ਉੱਚ-ਊਰਜਾ ਵਾਲੇ ਦਿਮਾਗ ਹਨ। ਹਾਲਾਂਕਿ, ਜਨਤਕ ਧਾਰਨਾ ਕਿ ਇਹ ਦਿੱਗਜ ਅੰਤ ਵਿੱਚ ਹਰ ਰੋਜ਼ਾਨਾ ਦੇ ਕੰਮ ਨੂੰ ਸੰਭਾਲ ਲੈਣਗੇ, ਹਕੀਕਤ ਤੋਂ ਦੂਰ ਹੁੰਦੀ ਜਾ ਰਹੀ ਹੈ। ਜ਼ਿਆਦਾਤਰ ਲੋਕਾਂ ਨੂੰ ਇੱਕ ਮੈਮੋ ਲਿਖਣ ਜਾਂ ਕੈਲੰਡਰ ਵਿਵਸਥਿਤ ਕਰਨ ਲਈ ਟ੍ਰਿਲੀਅਨ-ਪੈਰਾਮੀਟਰ ਮਾਡਲ ਦੀ ਲੋੜ ਨਹੀਂ ਹੁੰਦੀ। ਇਸ ਅਹਿਸਾਸ ਨੇ ਮਾਰਕੀਟ ਦੇ ਦੂਜੇ ਹਿੱਸੇ ਨੂੰ ਜਨਮ ਦਿੱਤਾ ਹੈ: ਸਮਾਲ ਲੈਂਗੂਏਜ ਮਾਡਲ (SLM)।
ਸਮਾਲ ਲੈਂਗੂਏਜ ਮਾਡਲ, ਜਾਂ SLMs, 2026 ਦੇ ਉਪਯੋਗੀ ਖਿਡਾਰੀ ਹਨ। ਇਹ ਮਾਡਲ ਚੁਸਤ ਹੋਣ ਲਈ ਤਿਆਰ ਕੀਤੇ ਗਏ ਹਨ। ਉਹਨਾਂ ਵਿੱਚ ਅਕਸਰ ਦਸ ਬਿਲੀਅਨ ਤੋਂ ਘੱਟ ਪੈਰਾਮੀਟਰ ਹੁੰਦੇ ਹਨ, ਜੋ ਉਹਨਾਂ ਨੂੰ ਇੱਕ ਉੱਚ-ਅੰਤ ਦੇ ਸਮਾਰਟਫੋਨ ਜਾਂ ਆਧੁਨਿਕ ਲੈਪਟਾਪ ‘ਤੇ ਸਥਾਨਕ ਤੌਰ ‘ਤੇ ਚੱਲਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੇ ਹਨ। ਇੰਡਸਟਰੀ ਇਸ ਵਿਚਾਰ ਤੋਂ ਦੂਰ ਹੋ ਗਈ ਹੈ ਕਿ ਇੱਕ ਮਾਡਲ ਨੂੰ ਉਪਯੋਗੀ ਹੋਣ ਲਈ ਦੁਨੀਆ ਦੇ ਇਤਿਹਾਸ ਬਾਰੇ ਸਭ ਕੁਝ ਜਾਣਨ ਦੀ ਲੋੜ ਹੈ। ਇਸ ਦੀ ਬਜਾਏ, ਡਿਵੈਲਪਰ ਇਹਨਾਂ ਛੋਟੇ ਸਿਸਟਮਾਂ ਨੂੰ ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ, ਕਿਉਰੇਟ ਕੀਤੇ ਡੇਟਾਸੈਟਾਂ ‘ਤੇ ਸਿਖਲਾਈ ਦੇ ਰਹੇ ਹਨ ਜੋ ਤਰਕਪੂਰਨ ਕਟੌਤੀ ਜਾਂ ਸਾਫ਼-ਸੁਥਰੀ ਲਿਖਤ ਵਰਗੇ ਖਾਸ ਹੁਨਰਾਂ ‘ਤੇ ਕੇਂਦ੍ਰਿਤ ਹਨ। ਨਤੀਜਾ ਇੱਕ ਅਜਿਹੀ ਮਾਰਕੀਟ ਹੈ ਜਿੱਥੇ ਸਭ ਤੋਂ ਕੀਮਤੀ ਟੂਲ ਅਕਸਰ ਉਹ ਹੁੰਦਾ ਹੈ ਜਿਸਨੂੰ ਚਲਾਉਣ ਲਈ ਸਭ ਤੋਂ ਘੱਟ ਖਰਚਾ ਆਉਂਦਾ ਹੈ। ਇਹ ਵੰਡ ਕੰਪਿਊਟ ਦੀ ਭਾਰੀ ਲਾਗਤ ਅਤੇ ਗੋਪਨੀਯਤਾ ਦੀ ਵਧਦੀ ਮੰਗ ਦੁਆਰਾ ਚਲਾਈ ਜਾ ਰਹੀ ਹੈ। ਉਪਭੋਗਤਾ ਇਹ ਮਹਿਸੂਸ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰ ਰਹੇ ਹਨ ਕਿ ਹਰ ਇੱਕ ਕੀਸਟ੍ਰੋਕ ਨੂੰ ਕਲਾਉਡ ਸਰਵਰ ‘ਤੇ ਭੇਜਣਾ ਹੌਲੀ ਅਤੇ ਜੋਖਮ ਭਰਿਆ ਦੋਵੇਂ ਹੈ।
ਸੋਵਰੇਨ ਕੰਪਿਊਟ ਦੀ ਭੂ-ਰਾਜਨੀਤੀ
ਇਸ ਮਾਰਕੀਟ ਵੰਡ ਦੇ ਗਲੋਬਲ ਪਾਵਰ ਡਾਇਨਾਮਿਕਸ ਲਈ ਡੂੰਘੇ ਪ੍ਰਭਾਵ ਹਨ। ਅਸੀਂ ਸੋਵਰੇਨ ਕੰਪਿਊਟ ਦਾ ਉਭਾਰ ਦੇਖ ਰਹੇ ਹਾਂ, ਜਿੱਥੇ ਦੇਸ਼ ਸਿਲੀਕਾਨ ਵੈਲੀ ਦੇ ਕੁਝ ਪ੍ਰਦਾਤਾਵਾਂ ‘ਤੇ ਨਿਰਭਰ ਰਹਿਣ ਤੋਂ ਸੰਤੁਸ਼ਟ ਨਹੀਂ ਹਨ। ਯੂਰਪ ਅਤੇ ਏਸ਼ੀਆ ਦੇ ਦੇਸ਼ ਸਥਾਨਕ ਮਾਡਲਾਂ ਦੀ ਮੇਜ਼ਬਾਨੀ ਕਰਨ ਲਈ ਆਪਣੇ ਖੁਦ ਦੇ ਬੁਨਿਆਦੀ ਢਾਂਚੇ ਵਿੱਚ ਭਾਰੀ ਨਿਵੇਸ਼ ਕਰ ਰਹੇ ਹਨ। ਟੀਚਾ ਇਹ ਯਕੀਨੀ ਬਣਾਉਣਾ ਹੈ ਕਿ ਸੰਵੇਦਨਸ਼ੀਲ ਰਾਸ਼ਟਰੀ ਡੇਟਾ ਕਦੇ ਵੀ ਉਹਨਾਂ ਦੀਆਂ ਸਰਹੱਦਾਂ ਤੋਂ ਬਾਹਰ ਨਾ ਜਾਵੇ। ਇਹ ਫਰੰਟੀਅਰ ਮਾਡਲਾਂ ਦੀਆਂ ਵਿਸ਼ਾਲ ਊਰਜਾ ਅਤੇ ਹਾਰਡਵੇਅਰ ਲੋੜਾਂ ਦਾ ਸਿੱਧਾ ਜਵਾਬ ਹੈ। ਹਰ ਦੇਸ਼ ਸਭ ਤੋਂ ਵੱਡੇ ਸਿਸਟਮਾਂ ਲਈ ਲੋੜੀਂਦੇ ਵਿਸ਼ਾਲ ਡੇਟਾ ਸੈਂਟਰ ਬਣਾਉਣ ਦਾ ਖਰਚਾ ਨਹੀਂ ਉਠਾ ਸਕਦਾ, ਪਰ ਲਗਭਗ ਕੋਈ ਵੀ ਦੇਸ਼ ਛੋਟੇ, ਵਿਸ਼ੇਸ਼ ਮਾਡਲਾਂ ਦੇ ਨੈਟਵਰਕ ਦਾ ਸਮਰਥਨ ਕਰ ਸਕਦਾ ਹੈ। ਇਸ ਨਾਲ ਇੱਕ ਵਿਭਿੰਨ ਈਕੋਸਿਸਟਮ ਬਣਿਆ ਹੈ ਜਿੱਥੇ ਵੱਖ-ਵੱਖ ਖੇਤਰ ਆਪਣੀਆਂ ਖਾਸ ਆਰਥਿਕ ਲੋੜਾਂ ਅਤੇ ਰੈਗੂਲੇਟਰੀ ਫਰੇਮਵਰਕ ਦੇ ਆਧਾਰ ‘ਤੇ ਵੱਖ-ਵੱਖ ਆਰਕੀਟੈਕਚਰ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੇ ਹਨ।
ਇਹਨਾਂ ਮਾਡਲਾਂ ਲਈ ਸਪਲਾਈ ਚੇਨ ਵੀ ਵੱਖ ਹੋ ਰਹੀ ਹੈ। ਜਦੋਂ ਕਿ ਵਿਸ਼ਾਲ ਮਾਡਲਾਂ ਨੂੰ NVIDIA ਤੋਂ ਨਵੀਨਤਮ ਅਤੇ ਸਭ ਤੋਂ ਮਹਿੰਗੇ ਚਿਪਸ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਛੋਟੇ ਮਾਡਲਾਂ ਨੂੰ ਕੰਜ਼ਿਊਮਰ-ਗ੍ਰੇਡ ਹਾਰਡਵੇਅਰ ‘ਤੇ ਚੱਲਣ ਲਈ ਅਨੁਕੂਲਿਤ ਕੀਤਾ ਜਾ ਰਿਹਾ ਹੈ। ਇਹ ਬੁੱਧੀ ਤੱਕ ਪਹੁੰਚ ਨੂੰ ਉਸ ਤਰੀਕੇ ਨਾਲ ਲੋਕਤੰਤਰੀਕਰਨ ਕਰਦਾ ਹੈ ਜੋ AI ਬੂਮ ਦੇ ਸ਼ੁਰੂਆਤੀ ਦਿਨਾਂ ਵਿੱਚ ਨਹੀਂ ਸੀ। ਇੱਕ ਵਿਕਾਸਸ਼ੀਲ ਅਰਥਵਿਵਸਥਾ ਵਿੱਚ ਇੱਕ ਸਟਾਰਟਅੱਪ ਹੁਣ ਇੱਕ ਫਰੰਟੀਅਰ ਸਿਸਟਮ ਦੇ API ਸਬਸਕ੍ਰਿਪਸ਼ਨ ਦੀ ਲਾਗਤ ਦੇ ਇੱਕ ਹਿੱਸੇ ਵਿੱਚ ਇੱਕ ਛੋਟੇ, ਓਪਨ-ਸੋਰਸ ਮਾਡਲ ਨੂੰ ਫਾਈਨ-ਟਿਊਨ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਬਦਲਾਅ ਕਲਾਉਡ ਕ੍ਰੈਡਿਟ ਵਿੱਚ ਵੱਡੇ ਪੱਧਰ ‘ਤੇ ਨਿਵੇਸ਼ ਕੀਤੇ ਬਿਨਾਂ ਸਥਾਨਕ ਨਵੀਨਤਾ ਨੂੰ ਵਧਣ-ਫੁੱਲਣ ਦੀ ਇਜਾਜ਼ਤ ਦੇ ਕੇ ਡਿਜੀਟਲ ਪਾੜੇ ਨੂੰ ਘਟਾ ਰਿਹਾ ਹੈ। ਗਲੋਬਲ ਪ੍ਰਭਾਵ ਇੱਕ ਕੇਂਦਰੀਕ੍ਰਿਤ AI ਮੋਨੋਪੋਲੀ ਤੋਂ ਦੂਰ ਇੱਕ ਵਧੇਰੇ ਵੰਡੇ ਅਤੇ ਲਚਕੀਲੇ ਮਸ਼ੀਨ ਇੰਟੈਲੀਜੈਂਸ ਨੈਟਵਰਕ ਵੱਲ ਵਧਣਾ ਹੈ ਜੋ ਸਥਾਨਕ ਭਾਸ਼ਾਵਾਂ ਅਤੇ ਸੱਭਿਆਚਾਰਕ ਬਾਰੀਕੀਆਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ।
ਹਾਈਬ੍ਰਿਡ ਇੰਟੈਲੀਜੈਂਸ ਦੇ ਯੁੱਗ ਵਿੱਚ ਇੱਕ ਮੰਗਲਵਾਰ
ਇਹ ਅਮਲ ਵਿੱਚ ਕਿਵੇਂ ਕੰਮ ਕਰਦਾ ਹੈ, ਇਹ ਦੇਖਣ ਲਈ 2026 ਵਿੱਚ ਇੱਕ ਪੇਸ਼ੇਵਰ ਲਈ ਇੱਕ ਆਮ ਦਿਨ ‘ਤੇ ਵਿਚਾਰ ਕਰੋ। ਮਾਰਕਸ ਨੂੰ ਮਿਲੋ, ਜੋ ਇੱਕ ਮੱਧ-ਆਕਾਰ ਦੀ ਫਰਮ ਵਿੱਚ ਸਾਫਟਵੇਅਰ ਇੰਜੀਨੀਅਰ ਹੈ। ਜਦੋਂ ਮਾਰਕਸ ਆਪਣਾ ਦਿਨ ਸ਼ੁਰੂ ਕਰਦਾ ਹੈ, ਉਹ ਆਪਣਾ ਕੋਡ ਐਡੀਟਰ ਖੋਲ੍ਹਦਾ ਹੈ। ਉਹ ਆਪਣੇ ਰੁਟੀਨ ਦੇ ਕੰਮਾਂ ਲਈ ਕਲਾਉਡ-ਅਧਾਰਿਤ ਅਸਿਸਟੈਂਟ ਦੀ ਵਰਤੋਂ ਨਹੀਂ ਕਰਦਾ। ਇਸ ਦੀ ਬਜਾਏ, ਇੱਕ ਛੋਟਾ, ਤਿੰਨ-ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਵਾਲਾ ਮਾਡਲ ਉਸਦੇ ਵਰਕਸਟੇਸ਼ਨ ‘ਤੇ ਸਥਾਨਕ ਤੌਰ ‘ਤੇ ਚੱਲਦਾ ਹੈ। ਇਹ ਮਾਡਲ ਵਿਸ਼ੇਸ਼ ਤੌਰ ‘ਤੇ ਉਸਦੀ ਕੰਪਨੀ ਦੇ ਪ੍ਰਾਈਵੇਟ ਕੋਡਬੇਸ ‘ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਹੈ। ਇਹ ਰੀਅਲ-ਟਾਈਮ ਵਿੱਚ ਜ਼ੀਰੋ ਲੈਟੈਂਸੀ ਦੇ ਨਾਲ ਕੋਡ ਪੂਰਾ ਕਰਨ ਅਤੇ ਸਿੰਟੈਕਸ ਗਲਤੀਆਂ ਨੂੰ ਠੀਕ ਕਰਨ ਦਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ। ਕਿਉਂਕਿ ਮਾਡਲ ਸਥਾਨਕ ਹੈ, ਮਾਰਕਸ ਨੂੰ ਇਸ ਗੱਲ ਦੀ ਚਿੰਤਾ ਕਰਨ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ ਕਿ ਉਸਦੀ ਕੰਪਨੀ ਦੀ ਬੌਧਿਕ ਸੰਪਤੀ ਕਿਸੇ ਤੀਜੀ ਧਿਰ ਨੂੰ ਲੀਕ ਹੋ ਜਾਵੇਗੀ। ਇਹ ਅਮਲ ਵਿੱਚ ਛੋਟੇ ਮਾਡਲ ਦੀ ਕੁਸ਼ਲਤਾ ਹੈ। ਇਹ ਤੇਜ਼, ਪ੍ਰਾਈਵੇਟ ਅਤੇ ਕੋਡਿੰਗ ਦੇ ਦੁਹਰਾਉਣ ਵਾਲੇ ਸੁਭਾਅ ਲਈ ਬਿਲਕੁਲ ਸਹੀ ਹੈ। ਇਹ ਇੰਟਰਨੈਟ ਨਾਲ ਕਨੈਕਟ ਕੀਤੇ ਬਿਨਾਂ ਉਸਦੇ ਕੰਮ ਦੇ ਅੱਸੀ ਪ੍ਰਤੀਸ਼ਤ ਨੂੰ ਸੰਭਾਲ ਲੈਂਦਾ ਹੈ।
ਬਾਅਦ ਵਿੱਚ ਦੁਪਹਿਰ ਨੂੰ, ਮਾਰਕਸ ਇੱਕ ਮੁਸ਼ਕਲ ਵਿੱਚ ਫਸ ਜਾਂਦਾ ਹੈ। ਉਸਨੂੰ ਇੱਕ ਨਵਾਂ ਸਿਸਟਮ ਆਰਕੀਟੈਕਚਰ ਡਿਜ਼ਾਈਨ ਕਰਨ ਦੀ ਲੋੜ ਹੈ ਜਿਸ ਵਿੱਚ ਗੁੰਝਲਦਾਰ ਡੇਟਾ ਮਾਈਗ੍ਰੇਸ਼ਨ ਅਤੇ ਉੱਚ-ਪੱਧਰੀ ਸੁਰੱਖਿਆ ਪ੍ਰੋਟੋਕੋਲ ਸ਼ਾਮਲ ਹਨ। ਇੱਥੇ ਮਾਰਕੀਟ ਦੀ ਵੰਡ ਦਿਖਾਈ ਦਿੰਦੀ ਹੈ। ਉਸਦਾ ਸਥਾਨਕ ਮਾਡਲ ਇਹਨਾਂ ਉੱਚ-ਦਾਅ ਵਾਲੇ ਆਰਕੀਟੈਕਚਰਲ ਫੈਸਲਿਆਂ ‘ਤੇ ਤਰਕ ਕਰਨ ਲਈ ਇੰਨਾ ਸ਼ਕਤੀਸ਼ਾਲੀ ਨਹੀਂ ਹੈ। ਮਾਰਕਸ ਇੱਕ ਫਰੰਟੀਅਰ ਮਾਡਲ ‘ਤੇ ਸਵਿਚ ਕਰਦਾ ਹੈ। ਉਹ ਆਪਣੀਆਂ ਖਾਸ ਲੋੜਾਂ ਨੂੰ ਇੱਕ ਵਿਸ਼ਾਲ ਤਰਕ ਇੰਜਣ ਦੇ ਸੁਰੱਖਿਅਤ ਕਲਾਉਡ ਇੰਸਟੈਂਸ ‘ਤੇ ਅਪਲੋਡ ਕਰਦਾ ਹੈ। ਇਹ ਸਿਸਟਮ, ਜੋ ਪ੍ਰਤੀ ਕੁਐਰੀ ਕਾਫ਼ੀ ਜ਼ਿਆਦਾ ਖਰਚਾ ਲੈਂਦਾ ਹੈ, ਹਜ਼ਾਰਾਂ ਸੰਭਾਵੀ ਅਸਫਲਤਾ ਬਿੰਦੂਆਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਦਾ ਹੈ ਅਤੇ ਇੱਕ ਮਜ਼ਬੂਤ ਯੋਜਨਾ ਦਾ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ। ਮਾਰਕਸ ਤੀਹ ਮਿੰਟ ਦੇ ਡੂੰਘੇ ਕੰਮ ਲਈ ਮਹਿੰਗੇ, ਉੱਚ-ਊਰਜਾ ਵਾਲੇ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ, ਫਿਰ ਲਾਗੂ ਕਰਨ ਲਈ ਵਾਪਸ ਆਪਣੇ ਸਥਾਨਕ ਮਾਡਲ ‘ਤੇ ਆ ਜਾਂਦਾ ਹੈ। ਇਹ ਹਾਈਬ੍ਰਿਡ ਵਰਕਫਲੋ ਕਾਨੂੰਨੀ ਸੇਵਾਵਾਂ ਤੋਂ ਲੈ ਕੇ ਮੈਡੀਕਲ ਖੋਜ ਤੱਕ ਹਰ ਉਦਯੋਗ ਵਿੱਚ ਮਿਆਰੀ ਬਣ ਰਿਹਾ ਹੈ।
ਮੈਡੀਕਲ ਖੇਤਰ ਵਿੱਚ, ਇੱਕ ਡਾਕਟਰ ਸਲਾਹ-ਮਸ਼ਵਰੇ ਦੌਰਾਨ ਮਰੀਜ਼ਾਂ ਦੇ ਨੋਟਸ ਦਾ ਸਾਰ ਦੇਣ ਲਈ ਇੱਕ ਸਥਾਨਕ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦਾ ਹੈ। ਇਹ ਯਕੀਨੀ ਬਣਾਉਂਦਾ ਹੈ ਕਿ ਸੰਵੇਦਨਸ਼ੀਲ ਸਿਹਤ ਡੇਟਾ ਕਲੀਨਿਕ ਦੇ ਪ੍ਰਾਈਵੇਟ ਨੈਟਵਰਕ ਦੇ ਅੰਦਰ ਰਹੇ। ਹਾਲਾਂਕਿ, ਜੇਕਰ ਉਸੇ ਡਾਕਟਰ ਨੂੰ ਨਵੀਨਤਮ ਗਲੋਬਲ ਓਨਕੋਲੋਜੀ ਖੋਜ ਦੇ ਵਿਰੁੱਧ ਮਰੀਜ਼ ਦੇ ਦੁਰਲੱਭ ਲੱਛਣਾਂ ਨੂੰ ਕਰਾਸ-ਰੈਫਰੈਂਸ ਕਰਨ ਦੀ ਲੋੜ ਹੈ, ਤਾਂ ਉਹ ਇੱਕ ਫਰੰਟੀਅਰ ਮਾਡਲ ਨੂੰ ਬੁਲਾਉਣਗੇ। ਵੰਡ ਗਤੀ ਅਤੇ ਡੂੰਘਾਈ ਵਿਚਕਾਰ ਸੰਤੁਲਨ ਦੀ ਆਗਿਆ ਦਿੰਦੀ ਹੈ। ਲੋਕ ਅਕਸਰ ਇਸ ਗੱਲ ਦਾ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦੇ ਹਨ ਕਿ ਉਹਨਾਂ ਨੂੰ ਰੋਜ਼ਾਨਾ ਜੀਵਨ ਲਈ ਵਿਸ਼ਾਲ ਮਾਡਲਾਂ ਦੀ ਕਿੰਨੀ ਲੋੜ ਹੈ ਜਦੋਂ ਕਿ ਇਹ ਘੱਟ ਅੰਦਾਜ਼ਾ ਲਗਾਉਂਦੇ ਹਨ ਕਿ ਛੋਟੇ ਮਾਡਲਾਂ ਵਿੱਚ ਕਿੰਨਾ ਸੁਧਾਰ ਹੋਇਆ ਹੈ। ਹਕੀਕਤ ਇਹ ਹੈ ਕਿ 2026 ਵਿੱਚ ਸਭ ਤੋਂ ਪ੍ਰਭਾਵਸ਼ਾਲੀ ਲਾਭ ਵੱਡੇ ਮਾਡਲਾਂ ਨੂੰ ਵੱਡਾ ਬਣਾਉਣ ਦੀ ਬਜਾਏ ਛੋਟੇ ਮਾਡਲਾਂ ਨੂੰ ਸਮਾਰਟ ਬਣਾਉਣ ਤੋਂ ਆਏ ਹਨ। ਇਹ ਰੁਝਾਨ AI ਨੂੰ ਭਵਿੱਖ ਦੀ ਨਵੀਨਤਾ ਦੀ ਬਜਾਏ ਬਿਜਲੀ ਜਾਂ ਹਾਈ-ਸਪੀਡ ਇੰਟਰਨੈਟ ਵਰਗੀ ਇੱਕ ਮਿਆਰੀ ਸਹੂਲਤ ਵਾਂਗ ਮਹਿਸੂਸ ਕਰਵਾ ਰਿਹਾ ਹੈ।
BotNews.today ਸਮੱਗਰੀ ਦੀ ਖੋਜ, ਲਿਖਣ, ਸੰਪਾਦਨ ਅਤੇ ਅਨੁਵਾਦ ਕਰਨ ਲਈ AI ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਸਾਡੀ ਟੀਮ ਜਾਣਕਾਰੀ ਨੂੰ ਉਪਯੋਗੀ, ਸਪਸ਼ਟ ਅਤੇ ਭਰੋਸੇਮੰਦ ਰੱਖਣ ਲਈ ਪ੍ਰਕਿਰਿਆ ਦੀ ਸਮੀਖਿਆ ਅਤੇ ਨਿਗਰਾਨੀ ਕਰਦੀ ਹੈ।
ਕੀ ਤੁਹਾਡੇ ਕੋਲ ਕੋਈ AI ਕਹਾਣੀ, ਟੂਲ, ਰੁਝਾਨ ਜਾਂ ਸਵਾਲ ਹੈ ਜੋ ਤੁਹਾਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ ਸਾਨੂੰ ਕਵਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ? ਸਾਨੂੰ ਆਪਣਾ ਲੇਖ ਦਾ ਵਿਚਾਰ ਭੇਜੋ — ਅਸੀਂ ਇਸਨੂੰ ਸੁਣਨਾ ਪਸੰਦ ਕਰਾਂਗੇ।
ਸਿੰਥੈਟਿਕ ਤਰਕ ਦਾ ਲੁਕਿਆ ਹੋਇਆ ਟੈਕਸ
ਜਿਵੇਂ ਕਿ ਅਸੀਂ ਇਸ ਵੰਡੀ ਹੋਈ ਮਾਰਕੀਟ ਵਿੱਚ ਅੱਗੇ ਵਧਦੇ ਹਾਂ, ਸਾਨੂੰ ਇਸ ਤਕਨਾਲੋਜੀ ਦੀਆਂ ਲੰਬੇ ਸਮੇਂ ਦੀਆਂ ਲਾਗਤਾਂ ਬਾਰੇ ਮੁਸ਼ਕਲ ਸਵਾਲ ਪੁੱਛਣੇ ਚਾਹੀਦੇ ਹਨ। ਇੱਕ ਵੱਡੀ ਚਿੰਤਾ ਫਰੰਟੀਅਰ ਮਾਡਲਾਂ ਦਾ ਵਾਤਾਵਰਣ ‘ਤੇ ਪ੍ਰਭਾਵ ਹੈ। ਜਦੋਂ ਕਿ ਛੋਟੇ ਮਾਡਲ ਕੁਸ਼ਲ ਹਨ, ਵਿਸ਼ਾਲ ਸਿਸਟਮ ਪਾਣੀ ਅਤੇ ਬਿਜਲੀ ਦੀ ਭਾਰੀ ਮਾਤਰਾ ਦੀ ਖਪਤ ਕਰਨਾ ਜਾਰੀ ਰੱਖਦੇ ਹਨ। ਕੀ ਅਸੀਂ ਇੱਕ ਅਜਿਹਾ ਸਿਸਟਮ ਬਣਾ ਰਹੇ ਹਾਂ ਜੋ ਟਿਕਾਊ ਹੈ, ਜਾਂ ਕੀ ਅਸੀਂ ਆਪਣੇ ਵਾਤਾਵਰਣ ਦੇ ਭਵਿੱਖ ਨੂੰ ਤੇਜ਼ ਸਾਫਟਵੇਅਰ ਲਈ ਵਪਾਰ ਕਰ ਰਹੇ ਹਾਂ? ਡੇਟਾ ਦੀ ਉਤਪਤੀ ਦਾ ਸਵਾਲ ਵੀ ਹੈ। ਜਿਵੇਂ-ਜਿਵੇਂ ਮਾਡਲ ਵਧੇਰੇ ਵਿਸ਼ੇਸ਼ ਹੁੰਦੇ ਜਾਂਦੇ ਹਨ, ਉੱਚ-ਗੁਣਵੱਤਾ ਵਾਲੇ ਡੇਟਾ ਦੀ ਮੰਗ ਵਧਦੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਨੇ ਇੱਕ ਗੁਪਤ ਮਾਰਕੀਟ ਨੂੰ ਜਨਮ ਦਿੱਤਾ ਹੈ ਜਿੱਥੇ ਡੇਟਾ ਨੂੰ ਇੱਕ ਵਸਤੂ ਵਾਂਗ ਖਰੀਦਿਆ ਅਤੇ ਵੇਚਿਆ ਜਾਂਦਾ ਹੈ। ਇਹਨਾਂ ਸਿਸਟਮਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਵਾਲੀ ਜਾਣਕਾਰੀ ਦਾ ਅਸਲ ਮਾਲਕ ਕੌਣ ਹੈ? ਜੇਕਰ ਇੱਕ ਮਾਡਲ ਨੂੰ ਇੰਟਰਨੈਟ ਦੇ ਸਮੂਹਿਕ ਗਿਆਨ ‘ਤੇ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ, ਤਾਂ ਕੀ ਉਸ ਮਾਡਲ ਦੇ ਲਾਭ ਇੱਕ ਸਿੰਗਲ ਕਾਰਪੋਰੇਸ਼ਨ ਦੇ ਹੋਣੇ ਚਾਹੀਦੇ ਹਨ?
ਸਾਨੂੰ ਤਰਕ ਦੇ ਸਿਲੋਜ਼ (logic silos) ਦੇ ਜੋਖਮ ‘ਤੇ ਵੀ ਵਿਚਾਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ। ਜੇਕਰ ਕੋਈ ਕੰਪਨੀ ਪੂਰੀ ਤਰ੍ਹਾਂ ਆਪਣੇ ਡੇਟਾ ‘ਤੇ ਸਿਖਲਾਈ ਪ੍ਰਾਪਤ ਇੱਕ ਛੋਟੇ, ਸਥਾਨਕ ਮਾਡਲ ‘ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ, ਤਾਂ ਕੀ ਉਹ ਨਵੀਨਤਾ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਗੁਆ ਦਿੰਦੀ ਹੈ? ਇਹ ਖਤਰਾ ਹੈ ਕਿ ਇਹ ਵਿਸ਼ੇਸ਼ ਸਿਸਟਮ ਸੋਚ ਦੇ ਗੂੰਜ ਚੈਂਬਰ (echo chambers) ਬਣਾਉਣਗੇ, ਜਿੱਥੇ AI ਸਿਰਫ ਉਸ ਚੀਜ਼ ਨੂੰ ਮਜ਼ਬੂਤ ਕਰਦਾ ਹੈ ਜੋ ਕੰਪਨੀ ਪਹਿਲਾਂ ਹੀ ਜਾਣਦੀ ਹੈ। ਇਸ ਤੋਂ ਇਲਾਵਾ, ਉਹਨਾਂ ਲੋਕਾਂ ਵਿਚਕਾਰ ਪਾੜਾ ਜੋ ਫਰੰਟੀਅਰ ਮਾਡਲਾਂ ਨੂੰ ਖਰੀਦ ਸਕਦੇ ਹਨ ਅਤੇ ਉਹ ਜੋ ਨਹੀਂ ਕਰ ਸਕਦੇ, ਜਾਣਕਾਰੀ ਦੀ ਅਸਮਾਨਤਾ ਦਾ ਇੱਕ ਨਵਾਂ ਵਰਗ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ। MIT Technology Review ਦੇ ਅਨੁਸਾਰ, ਸਭ ਤੋਂ ਉੱਨਤ ਸਿਸਟਮਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਦੀ ਲਾਗਤ ਹਰ ਕੁਝ ਮਹੀਨਿਆਂ ਵਿੱਚ ਦੁੱਗਣੀ ਹੋ ਰਹੀ ਹੈ। ਇਹ ਇੱਕ ਅਜਿਹੇ ਭਵਿੱਖ ਵੱਲ ਲੈ ਜਾ ਸਕਦਾ ਹੈ ਜਿੱਥੇ ਸਿਰਫ ਸਭ ਤੋਂ ਅਮੀਰ ਦੇਸ਼ਾਂ ਅਤੇ ਕਾਰਪੋਰੇਸ਼ਨਾਂ ਕੋਲ ਮਸ਼ੀਨ ਤਰਕ ਦੇ ਉੱਚੇ ਪੱਧਰਾਂ ਤੱਕ ਪਹੁੰਚ ਹੋਵੇਗੀ। ਸਾਨੂੰ ਇਹ ਪੁੱਛਣਾ ਪਵੇਗਾ ਕਿ ਕੀ ਸਥਾਨਕ AI ਦੀ ਸਹੂਲਤ ਗਲੋਬਲ ਗਿਆਨ ਦੇ ਸੰਭਾਵੀ ਵਿਖੰਡਨ ਦੇ ਯੋਗ ਹੈ।
ਹੁਡ ਦੇ ਹੇਠਾਂ ਸਿਲੀਕਾਨ
ਪਾਵਰ ਯੂਜ਼ਰਾਂ ਲਈ, ਮਾਰਕੀਟ ਵਿੱਚ ਵੰਡ ਤਕਨੀਕੀ ਰੁਕਾਵਟਾਂ ਅਤੇ ਤੈਨਾਤੀ ਰਣਨੀਤੀਆਂ ਦੁਆਰਾ ਪਰਿਭਾਸ਼ਿਤ ਕੀਤੀ ਗਈ ਹੈ। ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਤਬਦੀਲੀ ਸਥਾਨਕ ਅਨੁਮਾਨ (local inference) ਵੱਲ ਵਧਣਾ ਹੈ। vLLM ਅਤੇ llama.cpp ਵਰਗੇ ਟੂਲਾਂ ਨੇ ਅਜਿਹੇ ਹਾਰਡਵੇਅਰ ‘ਤੇ ਵਧੀਆ ਮਾਡਲਾਂ ਨੂੰ ਚਲਾਉਣਾ ਸੰਭਵ ਬਣਾਇਆ ਹੈ ਜਿਸਨੂੰ ਪਹਿਲਾਂ ਘੱਟ ਸ਼ਕਤੀਸ਼ਾਲੀ ਮੰਨਿਆ ਜਾਂਦਾ ਸੀ। ਇਹ ਕੁਆਂਟਾਈਜ਼ੇਸ਼ਨ ਦੁਆਰਾ ਪ੍ਰਾਪਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਇੱਕ ਪ੍ਰਕਿਰਿਆ ਜੋ ਮੈਮੋਰੀ ਬਚਾਉਣ ਲਈ ਮਾਡਲ ਦੇ ਵਜ਼ਨ ਦੀ ਸ਼ੁੱਧਤਾ ਨੂੰ ਘਟਾਉਂਦੀ ਹੈ। ਇੱਕ ਮਾਡਲ ਜਿਸਨੂੰ ਅਸਲ ਵਿੱਚ 40GB VRAM ਦੀ ਲੋੜ ਸੀ, ਹੁਣ ਸ਼ੁੱਧਤਾ ਵਿੱਚ ਘੱਟੋ-ਘੱਟ ਨੁਕਸਾਨ ਦੇ ਨਾਲ 12GB ‘ਤੇ ਚੱਲ ਸਕਦਾ ਹੈ। ਇਸਨੇ ਉਹਨਾਂ ਡਿਵੈਲਪਰਾਂ ਲਈ ਵਰਕਫਲੋ ਬਦਲ ਦਿੱਤਾ ਹੈ ਜੋ ਹੁਣ ਆਪਣੇ ਸਥਾਨਕ ਵਾਤਾਵਰਣ ਲਈ ਮਾਡਲਾਂ ਦੇ 4-bit ਜਾਂ 8-bit ਕੁਆਂਟਾਈਜ਼ਡ ਸੰਸਕਰਣਾਂ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੇ ਹਨ। ਫੋਕਸ ਕੱਚੇ ਪੈਰਾਮੀਟਰ ਗਿਣਤੀ ਤੋਂ ਹਟ ਕੇ ਕੰਜ਼ਿਊਮਰ ਹਾਰਡਵੇਅਰ ‘ਤੇ ਟੋਕਨ-ਪ੍ਰਤੀ-ਸਕਿੰਟ ਪ੍ਰਦਰਸ਼ਨ ‘ਤੇ ਆ ਗਿਆ ਹੈ।
API ਸੀਮਾਵਾਂ ਅਤੇ ਰੇਟ ਥ੍ਰੋਟਲਿੰਗ ਵੀ ਇਸ ਗੱਲ ਵਿੱਚ ਇੱਕ ਵੱਡਾ ਕਾਰਕ ਬਣ ਗਏ ਹਨ ਕਿ ਕੰਪਨੀਆਂ ਆਪਣੇ ਮਾਡਲਾਂ ਨੂੰ ਕਿਵੇਂ ਚੁਣਦੀਆਂ ਹਨ। ਫਰੰਟੀਅਰ ਪ੍ਰਦਾਤਾ ਤੇਜ਼ੀ ਨਾਲ ਟਾਇਰਡ ਐਕਸੈਸ ਵੱਲ ਵਧ ਰਹੇ ਹਨ, ਜਿੱਥੇ ਸਭ ਤੋਂ ਸਮਰੱਥ ਮਾਡਲ ਉੱਚ-ਭੁਗਤਾਨ ਕਰਨ ਵਾਲੇ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਗਾਹਕਾਂ ਲਈ ਰਾਖਵੇਂ ਹਨ। ਇਸਨੇ ਛੋਟੇ ਸਟਾਰਟਅੱਪਾਂ ਨੂੰ ਸਥਾਨਕ-ਪਹਿਲੀ ਰਣਨੀਤੀ ਅਪਣਾਉਣ ਲਈ ਮਜਬੂਰ ਕੀਤਾ ਹੈ। ਉਹ ਆਪਣੀ ਪ੍ਰੋਸੈਸਿੰਗ ਦੇ ਵੱਡੇ ਹਿੱਸੇ ਲਈ ਸਥਾਨਕ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ ਅਤੇ ਸਿਰਫ ਉਦੋਂ ਹੀ ਮਹਿੰਗੇ API ਨੂੰ ਹਿੱਟ ਕਰਦੇ ਹਨ ਜਦੋਂ ਬਿਲਕੁਲ ਜ਼ਰੂਰੀ ਹੋਵੇ। ਇਸ ਲਈ ਇੱਕ ਗੁੰਝਲਦਾਰ ਆਰਕੈਸਟ੍ਰੇਸ਼ਨ ਲੇਅਰ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ ਜੋ ਪ੍ਰੋਂਪਟ ਦੀ ਮੁਸ਼ਕਲ ਦੇ ਆਧਾਰ ‘ਤੇ ਕੰਮਾਂ ਨੂੰ ਸਭ ਤੋਂ ਕੁਸ਼ਲ ਮਾਡਲ ਤੱਕ ਪਹੁੰਚਾ ਸਕਦੀ ਹੈ। ਸਥਾਨਕ ਸਟੋਰੇਜ ਵੀ ਵਾਪਸੀ ਕਰ ਰਹੀ ਹੈ। ਕਲਾਉਡ-ਅਧਾਰਿਤ ਵੈਕਟਰ ਡੇਟਾਬੇਸ ‘ਤੇ ਨਿਰਭਰ ਕਰਨ ਦੀ ਬਜਾਏ, ਬਹੁਤ ਸਾਰੇ ਉਪਭੋਗਤਾ ਹੁਣ ਸਥਾਨਕ RAG (Retrieval-Augmented Generation) ਸਿਸਟਮ ਚਲਾ ਰਹੇ ਹਨ। ਇਹ ਉਹਨਾਂ ਨੂੰ ਆਪਣੇ ਖੁਦ ਦੇ ਦਸਤਾਵੇਜ਼ਾਂ ਵਿੱਚ ਖੋਜ ਕਰਨ ਅਤੇ ਉਹਨਾਂ ਡੇਟਾ ਨੂੰ ਕਿਸੇ ਤੀਜੀ ਧਿਰ ਨੂੰ ਭੇਜੇ ਬਿਨਾਂ ਉਹਨਾਂ ਦੇ ਮਾਡਲਾਂ ਨੂੰ ਸੰਦਰਭ ਪ੍ਰਦਾਨ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਮਾਰਕੀਟ ਦਾ ਗੀਕ ਸੈਕਸ਼ਨ ਹੁਣ ਇਸ ਗੱਲ ਨਾਲ ਜਨੂੰਨੀ ਨਹੀਂ ਹੈ ਕਿ ਕਿਸ ਕੋਲ ਸਭ ਤੋਂ ਵੱਡਾ ਮਾਡਲ ਹੈ, ਸਗੋਂ ਇਹ ਹੈ ਕਿ ਕਿਸ ਕੋਲ ਸਭ ਤੋਂ ਕੁਸ਼ਲ ਸਟੈਕ ਹੈ।
ਚੋਣ ਦਾ ਨਵਾਂ ਤਰਕ
LLM ਮਾਰਕੀਟ ਵਿੱਚ ਵੰਡ ਪਰਿਪੱਕਤਾ ਦਾ ਸੰਕੇਤ ਹੈ। ਅਸੀਂ ਹਨੀਮੂਨ ਪੜਾਅ ਤੋਂ ਅੱਗੇ ਵਧ ਗਏ ਹਾਂ ਜਿੱਥੇ ਹਰ ਨਵੇਂ ਮਾਡਲ ਦਾ ਬਿਨਾਂ ਕਿਸੇ ਆਲੋਚਨਾ ਦੇ ਸਵਾਗਤ ਕੀਤਾ ਜਾਂਦਾ ਸੀ। ਅੱਜ, ਉਪਭੋਗਤਾ ਵਧੇਰੇ ਸੰਦੇਹਵਾਦੀ ਅਤੇ ਵਧੇਰੇ ਵਿਹਾਰਕ ਹਨ। ਉਹ ਜਾਣਨਾ ਚਾਹੁੰਦੇ ਹਨ ਕਿ ਕੀ ਕੋਈ ਮਾਡਲ ਉਹਨਾਂ ਦਾ ਸਮਾਂ ਬਚਾਏਗਾ ਅਤੇ ਕੀ ਇਹ ਉਹਨਾਂ ਦੀ ਗੋਪਨੀਯਤਾ ਦੀ ਰੱਖਿਆ ਕਰੇਗਾ। ਵਿਸ਼ਾਲ ਕਲਾਉਡ ਇੰਜਣਾਂ ਅਤੇ ਚੁਸਤ ਸਥਾਨਕ ਮਾਡਲਾਂ ਵਿਚਕਾਰ ਅੰਤਰ ਇਹਨਾਂ ਮੰਗਾਂ ਦਾ ਜਵਾਬ ਹੈ। ਇਹ ਇੱਕ ਮਾਨਤਾ ਹੈ ਕਿ ਬੁੱਧੀ ਇੱਕ ਚੀਜ਼ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਸਮਰੱਥਾਵਾਂ ਦਾ ਇੱਕ ਸਪੈਕਟ੍ਰਮ ਹੈ ਜਿਸਨੂੰ ਸਹੀ ਵਾਤਾਵਰਣ ਨਾਲ ਮੇਲ ਖਾਣਾ ਚਾਹੀਦਾ ਹੈ। ਸਭ ਤੋਂ ਸਫਲ ਕੰਪਨੀਆਂ ਉਹ ਹੋਣਗੀਆਂ ਜੋ ਇਸ ਵੰਡ ਨੂੰ ਨੈਵੀਗੇਟ ਕਰ ਸਕਦੀਆਂ ਹਨ, ਰਣਨੀਤੀ ਲਈ ਦਿੱਗਜਾਂ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੀਆਂ ਹਨ ਅਤੇ ਐਗਜ਼ੀਕਿਊਸ਼ਨ ਲਈ ਛੋਟੇ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦੀਆਂ ਹਨ। ਲਾਈਵ ਸਵਾਲ ਜੋ ਬਾਕੀ ਹੈ ਉਹ ਇਹ ਹੈ ਕਿ ਕੀ ਇਹਨਾਂ ਦੋ ਕਿਸਮਾਂ ਦੇ ਮਾਡਲਾਂ ਵਿਚਕਾਰ ਪਾੜਾ ਵਧਦਾ ਰਹੇਗਾ ਜਾਂ ਕੀ ਕੋਈ ਨਵੀਂ ਆਰਕੀਟੈਕਚਰਲ ਸਫਲਤਾ ਅੰਤ ਵਿੱਚ ਉਹਨਾਂ ਨੂੰ ਦੁਬਾਰਾ ਜੋੜ ਦੇਵੇਗੀ। ਫਿਲਹਾਲ, ਮਾਰਕੀਟ ਆਪਣਾ ਪੱਖ ਚੁਣ ਰਹੀ ਹੈ, ਅਤੇ ਵਿਸ਼ੇਸ਼ ਮਾਡਲ ਦਾ ਯੁੱਗ ਸੱਚਮੁੱਚ ਆ ਗਿਆ ਹੈ।
Editor’s note: We created this site as a multilingual AI news and guides hub for people who are not computer geeks, but still want to understand artificial intelligence, use it with more confidence, and follow the future that is already arriving.
ਕੋਈ ਗਲਤੀ ਮਿਲੀ ਜਾਂ ਕੁਝ ਠੀਕ ਕਰਨ ਦੀ ਲੋੜ ਹੈ? ਸਾਨੂੰ ਦੱਸੋ।