DeepSeek, Perplexity ਅਤੇ AI ਚੁਣੌਤੀਆਂ ਦੀ ਨਵੀਂ ਲਹਿਰ
ਮਹਿੰਗੇ ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ (AI) ਦੇ एकाधिकार ਦਾ ਦੌਰ ਖਤਮ ਹੋ ਰਿਹਾ ਹੈ। ਪਿਛਲੇ ਦੋ ਸਾਲਾਂ ਤੋਂ, ਇੰਡਸਟਰੀ ਇਸ ਧਾਰਨਾ ‘ਤੇ ਚੱਲ ਰਹੀ ਸੀ ਕਿ ਉੱਚ ਪੱਧਰੀ ਪ੍ਰਦਰਸ਼ਨ ਲਈ ਅਰਬਾਂ ਡਾਲਰਾਂ ਦੀ ਕੰਪਿਊਟਿੰਗ ਅਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਊਰਜਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। DeepSeek ਅਤੇ Perplexity ਹੁਣ ਇਹ ਸਾਬਤ ਕਰ ਰਹੇ ਹਨ ਕਿ ਕੁਸ਼ਲਤਾ ਕੱਚੇ ਪੈਮਾਨੇ (raw scale) ਨੂੰ ਮਾਤ ਦੇ ਸਕਦੀ ਹੈ। DeepSeek ਨੇ ਮਾਰਕੀਟ ਨੂੰ ਹੈਰਾਨ ਕਰ ਦਿੱਤਾ ਹੈ, ਅਜਿਹੇ ਮਾਡਲ ਜਾਰੀ ਕਰਕੇ ਜੋ ਇੰਡਸਟਰੀ ਦੇ ਦਿੱਗਜਾਂ ਦੇ ਬਰਾਬਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦੇ ਹਨ, ਉਹ ਵੀ ਸਿਖਲਾਈ ਦੀ ਲਾਗਤ ਦੇ ਇੱਕ ਛੋਟੇ ਜਿਹੇ ਹਿੱਸੇ ਵਿੱਚ। ਇਸ ਦੌਰਾਨ, Perplexity ਇੰਟਰਨੈੱਟ ਨਾਲ ਲੋਕਾਂ ਦੇ ਗੱਲਬਾਤ ਕਰਨ ਦੇ ਤਰੀਕੇ ਨੂੰ ਬੁਨਿਆਦੀ ਤੌਰ ‘ਤੇ ਬਦਲ ਰਿਹਾ ਹੈ, ਲਿੰਕਾਂ ਦੀ ਰਵਾਇਤੀ ਸੂਚੀ ਨੂੰ ਸਿੱਧੇ ਅਤੇ ਹਵਾਲੇ ਵਾਲੇ ਜਵਾਬਾਂ ਨਾਲ ਬਦਲ ਕੇ। ਇਹ ਬਦਲਾਅ ਸਿਰਫ਼ ਨਵੇਂ ਟੂਲਸ ਬਾਰੇ ਨਹੀਂ ਹੈ। ਇਹ ਇੰਟੈਲੀਜੈਂਸ ਦੇ ਅਰਥ ਸ਼ਾਸਤਰ ਵਿੱਚ ਇੱਕ ਬੁਨਿਆਦੀ ਤਬਦੀਲੀ ਬਾਰੇ ਹੈ। ਧਿਆਨ ਇਸ ਗੱਲ ਤੋਂ ਹਟ ਗਿਆ ਹੈ ਕਿ ਇੱਕ ਮਾਡਲ ਕਿੰਨਾ ਵੱਡਾ ਹੋ ਸਕਦਾ ਹੈ ਅਤੇ ਇਸ ਗੱਲ ‘ਤੇ ਆ ਗਿਆ ਹੈ ਕਿ ਇਸਨੂੰ ਚਲਾਉਣ ਲਈ ਕਿੰਨਾ ਘੱਟ ਖਰਚਾ ਆ ਸਕਦਾ ਹੈ। ਜਿਵੇਂ-ਜਿਵੇਂ ਇਹ ਚੁਣੌਤੀ ਦੇਣ ਵਾਲੇ ਅੱਗੇ ਵਧ ਰਹੇ ਹਨ, ਸਥਾਪਿਤ ਦਿੱਗਜਾਂ ਨੂੰ ਆਪਣੇ ਉੱਚ-ਮਾਰਜਿਨ ਵਾਲੇ ਬਿਜ਼ਨਸ ਮਾਡਲਾਂ ਨੂੰ ਚੁਸਤ, ਵਿਸ਼ੇਸ਼ ਪ੍ਰਤੀਯੋਗੀਆਂ ਤੋਂ ਬਚਾਉਣ ਲਈ ਮਜਬੂਰ ਹੋਣਾ ਪੈ ਰਿਹਾ ਹੈ ਜੋ ਹਾਈਪ ਨਾਲੋਂ ਉਪਯੋਗਤਾ ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੇ ਹਨ।
ਇੰਟੈਲੀਜੈਂਸ ਮਾਰਕੀਟ ਲਈ ਕੁਸ਼ਲਤਾ ਦਾ ਝਟਕਾ
DeepSeek AI ਦੁਨੀਆ ਦੀ ਉਤਪਾਦ ਅਸਲੀਅਤ ਵਿੱਚ ਇੱਕ ਬਦਲਾਅ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਜਦੋਂ ਕਿ ਬਹੁਤ ਸਾਰੀਆਂ ਕੰਪਨੀਆਂ ਸਭ ਤੋਂ ਵੱਡੇ ਨਿਊਰਲ ਨੈੱਟਵਰਕ ਬਣਾਉਣ ‘ਤੇ ਧਿਆਨ ਦਿੰਦੀਆਂ ਹਨ, ਇਸ ਟੀਮ ਨੇ ਆਰਕੀਟੈਕਚਰਲ ਅਨੁਕੂਲਨ (optimization) ‘ਤੇ ਧਿਆਨ ਦਿੱਤਾ। ਉਨ੍ਹਾਂ ਦਾ DeepSeek-V3 ਮਾਡਲ ‘Mixture of Experts’ ਪਹੁੰਚ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਜੋ ਕਿਸੇ ਵੀ ਕੰਮ ਲਈ ਕੁੱਲ ਪੈਰਾਮੀਟਰਾਂ ਦੇ ਸਿਰਫ਼ ਇੱਕ ਛੋਟੇ ਹਿੱਸੇ ਨੂੰ ਸਰਗਰਮ ਕਰਦਾ ਹੈ। ਇਹ ਮਾਡਲ ਨੂੰ ਉੱਚ ਪ੍ਰਦਰਸ਼ਨ ਬਣਾਈ ਰੱਖਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ ਜਦੋਂ ਕਿ ਹਰ ਸ਼ਬਦ ਜੋ ਇਹ ਤਿਆਰ ਕਰਦਾ ਹੈ, ਉਸ ਲਈ ਲੋੜੀਂਦੀ ਕੰਪਿਊਟੇਸ਼ਨਲ ਪਾਵਰ ਨੂੰ ਕਾਫ਼ੀ ਘਟਾ ਦਿੰਦਾ ਹੈ। ਇਸ ਕੰਪਨੀ ਦੇ ਆਲੇ-ਦੁਆਲੇ ਦੀ ਕਹਾਣੀ ਅਕਸਰ ਇਸਦੇ ਘੱਟ ਸਿਖਲਾਈ ਬਜਟ ‘ਤੇ ਕੇਂਦਰਿਤ ਹੁੰਦੀ ਹੈ, ਜੋ ਕਿ ਕਥਿਤ ਤੌਰ ‘ਤੇ ਛੇ ਮਿਲੀਅਨ ਡਾਲਰ ਤੋਂ ਘੱਟ ਹੈ। ਇਹ ਅੰਕੜਾ ਇਸ ਵਿਚਾਰ ਨੂੰ ਚੁਣੌਤੀ ਦਿੰਦਾ ਹੈ ਕਿ ਸਿਰਫ਼ ਸਭ ਤੋਂ ਅਮੀਰ ਦੇਸ਼ ਅਤੇ ਕਾਰਪੋਰੇਸ਼ਨਾਂ ਹੀ ਫਰੰਟੀਅਰ ਮਾਡਲ ਬਣਾ ਸਕਦੀਆਂ ਹਨ। ਇਹ ਸੁਝਾਅ ਦਿੰਦਾ ਹੈ ਕਿ ਉੱਚ-ਪੱਧਰੀ ਮਸ਼ੀਨ ਲਰਨਿੰਗ ਵਿੱਚ ਦਾਖਲੇ ਲਈ ਰੁਕਾਵਟ ਪਹਿਲਾਂ ਸੋਚੇ ਗਏ ਨਾਲੋਂ ਘੱਟ ਹੈ।
Perplexity ਸਮੱਸਿਆ ਨੂੰ ਯੂਜ਼ਰ ਇੰਟਰਫੇਸ ਦੇ ਨਜ਼ਰੀਏ ਤੋਂ ਦੇਖਦਾ ਹੈ। ਇਹ ਇੱਕ ਰਵਾਇਤੀ ਸਰਚ ਇੰਜਣ ਦੀ ਬਜਾਏ ਇੱਕ ਜਵਾਬ ਇੰਜਣ (answer engine) ਹੈ। ਇਹ ਲਾਈਵ ਵੈੱਬ ਨੂੰ ਸਕੈਨ ਕਰਨ, ਸੰਬੰਧਿਤ ਜਾਣਕਾਰੀ ਕੱਢਣ, ਅਤੇ ਇਸਨੂੰ ਫੁੱਟਨੋਟਸ ਦੇ ਨਾਲ ਇੱਕ ਇਕਸਾਰ ਪੈਰਾ ਵਿੱਚ ਪੇਸ਼ ਕਰਨ ਲਈ ਮੌਜੂਦਾ ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇਹ ਡਿਜ਼ਾਈਨ ਵਿਕਲਪ ਮਿਆਰੀ AI ਮਾਡਲਾਂ ਦੀ ਮੁੱਖ ਕਮਜ਼ੋਰੀ ਨੂੰ ਹੱਲ ਕਰਦਾ ਹੈ, ਜੋ ਕਿ ਤੱਥਾਂ ਨੂੰ ਪੁਰਾਣਾ ਜਾਂ ਪੂਰੀ ਤਰ੍ਹਾਂ ਕਲਪਨਾਤਮਕ ਦੱਸਣ ਦੀ ਉਨ੍ਹਾਂ ਦੀ ਪ੍ਰਵਿਰਤੀ ਹੈ। ਹਰ ਜਵਾਬ ਨੂੰ ਰੀਅਲ-ਟਾਈਮ ਵੈੱਬ ਡੇਟਾ ਵਿੱਚ ਆਧਾਰਿਤ ਕਰਕੇ, Perplexity ਨੇ ਇੱਕ ਅਜਿਹਾ ਟੂਲ ਬਣਾਇਆ ਹੈ ਜੋ ਇੱਕ ਮਿਆਰੀ ਚੈਟ ਬੋਟ ਨਾਲੋਂ ਪੇਸ਼ੇਵਰ ਖੋਜ ਲਈ ਵਧੇਰੇ ਭਰੋਸੇਮੰਦ ਮਹਿਸੂਸ ਹੁੰਦਾ ਹੈ। ਉਤਪਾਦ ਸਿਰਫ਼ ਮਾਡਲ ਹੀ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਇਸਦੇ ਆਲੇ-ਦੁਆਲੇ ਦੀ ਰਿਟਰੀਵਲ ਅਤੇ ਸਾਈਟੇਸ਼ਨ ਪ੍ਰਣਾਲੀ ਹੈ। ਇਹ ਪਹੁੰਚ ਰਵਾਇਤੀ ਸਰਚ ਪ੍ਰਦਾਤਾਵਾਂ ‘ਤੇ ਬਹੁਤ ਦਬਾਅ ਪਾਉਂਦੀ ਹੈ ਜੋ ਨਤੀਜਿਆਂ ਦੇ ਕਈ ਪੰਨਿਆਂ ‘ਤੇ ਕਲਿੱਕ ਕਰਨ ਵਾਲੇ ਉਪਭੋਗਤਾਵਾਂ ਤੋਂ ਵਿਗਿਆਪਨ ਮਾਲੀਏ ‘ਤੇ ਨਿਰਭਰ ਕਰਦੇ ਹਨ।
BotNews.today ਸਮੱਗਰੀ ਦੀ ਖੋਜ, ਲਿਖਣ, ਸੰਪਾਦਨ ਅਤੇ ਅਨੁਵਾਦ ਕਰਨ ਲਈ AI ਟੂਲਸ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਸਾਡੀ ਟੀਮ ਜਾਣਕਾਰੀ ਨੂੰ ਉਪਯੋਗੀ, ਸਪਸ਼ਟ ਅਤੇ ਭਰੋਸੇਮੰਦ ਰੱਖਣ ਲਈ ਪ੍ਰਕਿਰਿਆ ਦੀ ਸਮੀਖਿਆ ਅਤੇ ਨਿਗਰਾਨੀ ਕਰਦੀ ਹੈ।
ਸਸਤੇ ਕੰਪਿਊਟ ਦੀ ਭੂ-ਰਾਜਨੀਤੀ
ਇਨ੍ਹਾਂ ਚੁਣੌਤੀ ਦੇਣ ਵਾਲਿਆਂ ਦਾ ਵਿਸ਼ਵਵਿਆਪੀ ਪ੍ਰਭਾਵ ਉੱਚ-ਪ੍ਰਦਰਸ਼ਨ ਵਾਲੇ ਇਨਫਰੈਂਸ ਦੇ ਲੋਕਤੰਤਰੀਕਰਨ ਵਿੱਚ ਹੈ। ਜਦੋਂ ਇੱਕ ਮਾਡਲ ਨੂੰ ਚਲਾਉਣ ਦੀ ਲਾਗਤ ਨੱਬੇ ਪ੍ਰਤੀਸ਼ਤ ਤੱਕ ਘੱਟ ਜਾਂਦੀ ਹੈ, ਤਾਂ ਰੋਜ਼ਾਨਾ ਦੇ ਸੌਫਟਵੇਅਰ ਵਿੱਚ ਏਕੀਕਰਣ ਦੀ ਸੰਭਾਵਨਾ ਤੇਜ਼ੀ ਨਾਲ ਵਧਦੀ ਹੈ। ਉੱਭਰ ਰਹੇ ਬਾਜ਼ਾਰਾਂ ਵਿੱਚ ਡਿਵੈਲਪਰ ਜੋ ਪਹਿਲਾਂ ਉੱਚ-ਪੱਧਰੀ API ਦੀ ਵਰਤੋਂ ਕਰਨ ਤੋਂ ਬਾਹਰ ਸਨ, ਹੁਣ ਆਧੁਨਿਕ ਐਪਲੀਕੇਸ਼ਨ ਬਣਾ ਸਕਦੇ ਹਨ। ਇਹ ਪੂਰੀ ਇੰਡਸਟਰੀ ਲਈ ਗੰਭੀਰਤਾ ਦਾ ਕੇਂਦਰ ਬਦਲਦਾ ਹੈ। ਜੇਕਰ ਸਭ ਤੋਂ ਕੁਸ਼ਲ ਮਾਡਲ ਰਵਾਇਤੀ ਸਿਲੀਕਾਨ ਵੈਲੀ ਹੱਬਾਂ ਤੋਂ ਬਾਹਰੋਂ ਆ ਰਹੇ ਹਨ, ਤਾਂ ਵਿਸ਼ਾਲ ਘਰੇਲੂ ਸਰਵਰ ਫਾਰਮਾਂ ਦਾ ਰਣਨੀਤਕ ਫਾਇਦਾ ਘਟਣਾ ਸ਼ੁਰੂ ਹੋ ਜਾਂਦਾ ਹੈ। ਇਹ ਮਾਡਲ ਪ੍ਰਭੂਸੱਤਾ ਬਾਰੇ ਗੱਲਬਾਤ ਕਰਨ ਲਈ ਮਜਬੂਰ ਕਰਦਾ ਹੈ ਅਤੇ ਇਹ ਕਿ ਕੀ ਦੇਸ਼ਾਂ ਨੂੰ ਕੁਝ ਕੇਂਦਰੀਕ੍ਰਿਤ ਪ੍ਰਦਾਤਾਵਾਂ ‘ਤੇ ਨਿਰਭਰ ਰਹਿਣਾ ਚਾਹੀਦਾ ਹੈ ਜਾਂ ਆਪਣੇ ਖੁਦ ਦੇ ਕੁਸ਼ਲ ਆਰਕੀਟੈਕਚਰ ਵਿੱਚ ਨਿਵੇਸ਼ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ। ਇਹ ਇੱਕ ਅਜਿਹਾ ਸੰਕੇਤ ਹੈ ਜਿਸਦਾ ਪਾਲਣ ਕਰਨਾ ਮਹੱਤਵਪੂਰਣ ਹੈ ਕਿਉਂਕਿ ਇਹ ਇੰਡਸਟਰੀ ਨੂੰ ‘ਵਿਨਰ-ਟੇਕ-ਆਲ’ ਡਾਇਨਾਮਿਕ ਤੋਂ ਦੂਰ ਇੱਕ ਵਧੇਰੇ ਖੰਡਿਤ ਅਤੇ ਪ੍ਰਤੀਯੋਗੀ ਮਾਰਕੀਟ ਵੱਲ ਲਿਜਾਂਦਾ ਹੈ।
ਐਂਟਰਪ੍ਰਾਈਜ਼ ਖਰੀਦਦਾਰ ਆਪਣੇ ਮੁਨਾਫੇ ‘ਤੇ ਇਸ ਬਦਲਾਅ ਨੂੰ ਮਹਿਸੂਸ ਕਰਨਾ ਸ਼ੁਰੂ ਕਰ ਰਹੇ ਹਨ। ਘੱਟ ਲਾਗਤ ਵਾਲੇ ਇਨਫਰੈਂਸ ਦੀ ਕਹਾਣੀ ਇਹ ਬਦਲ ਰਹੀ ਹੈ ਕਿ ਕੰਪਨੀਆਂ ਆਪਣੇ ਲੰਬੇ ਸਮੇਂ ਦੇ ਟੈਕਨਾਲੋਜੀ ਸਟੈਕ ਦੀ ਯੋਜਨਾ ਕਿਵੇਂ ਬਣਾਉਂਦੀਆਂ ਹਨ। ਜੇਕਰ DeepSeek ਵਰਗਾ ਮਾਡਲ ਵਧੇਰੇ ਮਹਿੰਗੇ ਵਿਰੋਧੀ ਦੀ ਉਪਯੋਗਤਾ ਦਾ ਅੱਸੀ ਪ੍ਰਤੀਸ਼ਤ ਹਿੱਸਾ ਦਸ ਪ੍ਰਤੀਸ਼ਤ ਕੀਮਤ ‘ਤੇ ਪ੍ਰਦਾਨ ਕਰ ਸਕਦਾ ਹੈ, ਤਾਂ ਜ਼ਿਆਦਾਤਰ ਰੁਟੀਨ ਕੰਮਾਂ ਲਈ ਵਧੇਰੇ ਮਹਿੰਗੇ ਵਿਕਲਪ ਦਾ ਕਾਰੋਬਾਰੀ ਕੇਸ ਖਤਮ ਹੋ ਜਾਂਦਾ ਹੈ। ਇਹ ਇੱਕ ਪੱਧਰੀ ਮਾਰਕੀਟ ਬਣਾਉਂਦਾ ਹੈ ਜਿੱਥੇ ਸਭ ਤੋਂ ਮਹਿੰਗੇ ਮਾਡਲ ਬਹੁਤ ਗੁੰਝਲਦਾਰ ਤਰਕ ਲਈ ਰਾਖਵੇਂ ਹੁੰਦੇ ਹਨ, ਜਦੋਂ ਕਿ ਜ਼ਿਆਦਾਤਰ ਕੰਮ ਕੁਸ਼ਲ ਚੁਣੌਤੀ ਦੇਣ ਵਾਲਿਆਂ ਦੁਆਰਾ ਸੰਭਾਲਿਆ ਜਾਂਦਾ ਹੈ। ਇਹ ਆਰਥਿਕ ਅਸਲੀਅਤ ਵਿਗਿਆਪਨ ਦੀ ਦੁਨੀਆ ਨੂੰ ਵੀ ਪ੍ਰਭਾਵਿਤ ਕਰ ਰਹੀ ਹੈ। Perplexity ਇੱਕ ਅਜਿਹੇ ਮਾਡਲ ਨਾਲ ਪ੍ਰਯੋਗ ਕਰ ਰਿਹਾ ਹੈ ਜਿੱਥੇ ਵਿਗਿਆਪਨ ਖੋਜ ਪ੍ਰਕਿਰਿਆ ਵਿੱਚ ਏਕੀਕ੍ਰਿਤ ਹੁੰਦੇ ਹਨ ਨਾ ਕਿ ਇਸ ਤੋਂ ਇੱਕ ਭਟਕਣਾ। ਇਹ ਮੁੜ ਪਰਿਭਾਸ਼ਿਤ ਕਰ ਸਕਦਾ ਹੈ ਕਿ ਬ੍ਰਾਂਡ ਅਜਿਹੇ ਯੁੱਗ ਵਿੱਚ ਖਪਤਕਾਰਾਂ ਤੱਕ ਕਿਵੇਂ ਪਹੁੰਚਦੇ ਹਨ ਜਿੱਥੇ ਲੋਕ ਹੁਣ ਹੋਮਪੇਜਾਂ ‘ਤੇ ਨਹੀਂ ਜਾਂਦੇ ਜਾਂ ਖੋਜ ਨਤੀਜਿਆਂ ਰਾਹੀਂ ਸਕ੍ਰੌਲ ਨਹੀਂ ਕਰਦੇ। ਇਸਦਾ ਪ੍ਰਭਾਵ ਸੌਫਟਵੇਅਰ ਇੰਜੀਨੀਅਰ ਤੋਂ ਲੈ ਕੇ ਮਾਰਕੀਟਿੰਗ ਐਗਜ਼ੀਕਿਊਟਿਵ ਤੱਕ ਹਰ ਕੋਈ ਮਹਿਸੂਸ ਕਰਦਾ ਹੈ ਜੋ ਤਤਕਾਲ ਜਵਾਬਾਂ ਦੀ ਦੁਨੀਆ ਵਿੱਚ ਦਰਸ਼ਕ ਲੱਭਣ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਿਹਾ ਹੈ।
ਜਵਾਬ ਇੰਜਣਾਂ ਨਾਲ ਇੱਕ ਮੰਗਲਵਾਰ
ਅਸਲ ਸੰਸਾਰ ਦੇ ਪ੍ਰਭਾਵ ਨੂੰ ਸਮਝਣ ਲਈ, ਸਾਰਾਹ ਨਾਮ ਦੀ ਇੱਕ ਵਿੱਤੀ ਵਿਸ਼ਲੇਸ਼ਕ ਦੇ ਜੀਵਨ ਵਿੱਚ ਇੱਕ ਦਿਨ ‘ਤੇ ਵਿਚਾਰ ਕਰੋ। ਪਹਿਲਾਂ, ਸਾਰਾਹ ਆਪਣੀ ਸਵੇਰ ਦੀ ਸ਼ੁਰੂਆਤ ਬਾਜ਼ਾਰ ਦੀਆਂ ਹਰਕਤਾਂ ਅਤੇ ਖਬਰਾਂ ਦੀਆਂ ਰਿਪੋਰਟਾਂ ਦੀ ਜਾਂਚ ਕਰਨ ਲਈ ਦਸ ਵੱਖ-ਵੱਖ ਟੈਬਾਂ ਖੋਲ੍ਹ ਕੇ ਕਰਦੀ ਸੀ। ਉਹ ਡੇਟਾ ਨੂੰ ਸਵੇਰ ਦੇ ਸੰਖੇਪ ਵਿੱਚ ਸੰਸ਼ਲੇਸ਼ਣ ਕਰਨ ਵਿੱਚ ਘੰਟੇ ਬਿਤਾਉਂਦੀ ਸੀ। ਅੱਜ, ਉਹ ਇੱਕੋ ਸਮੇਂ ਕਈ ਸਰੋਤਾਂ ਤੋਂ ਖਾਸ ਡੇਟਾ ਪੁਆਇੰਟਾਂ ਦੀ ਪੁੱਛਗਿੱਛ ਕਰਨ ਲਈ ਇੱਕ ਜਵਾਬ ਇੰਜਣ ਦੀ ਵਰਤੋਂ ਕਰਦੀ ਹੈ। ਉਹ ਤਿੰਨ ਵੱਖ-ਵੱਖ ਤਿਮਾਹੀ ਰਿਪੋਰਟਾਂ ਦੀ ਤੁਲਨਾ ਕਰਨ ਲਈ ਕਹਿੰਦੀ ਹੈ ਅਤੇ ਸਕਿੰਟਾਂ ਵਿੱਚ ਇੱਕ ਹਵਾਲਾ ਦਿੱਤਾ ਗਿਆ ਸੰਖੇਪ ਪ੍ਰਾਪਤ ਕਰਦੀ ਹੈ। ਉਸ ਦੁਆਰਾ ਪ੍ਰਾਪਤ ਕੀਤੇ ਡੇਟਾ ਦੀ ਸਪੈਲਿੰਗ ਸਹੀ ਹੈ ਕਿਉਂਕਿ ਸਿਸਟਮ ਸਿੱਧੇ ਸਰੋਤ ਟੈਕਸਟ ਤੋਂ ਖਿੱਚਦਾ ਹੈ। ਉਹ ਹੁਣ ਆਪਣਾ ਸਮਾਂ ਜਾਣਕਾਰੀ ਲੱਭਣ ਵਿੱਚ ਨਹੀਂ ਬਿਤਾਉਂਦੀ। ਉਹ ਆਪਣਾ ਸਮਾਂ ਇਸਦੀ ਪੁਸ਼ਟੀ ਕਰਨ ਅਤੇ ਇਸਦੇ ਅਧਾਰ ‘ਤੇ ਫੈਸਲੇ ਲੈਣ ਵਿੱਚ ਬਿਤਾਉਂਦੀ ਹੈ। ਇਹ ਅਮਲ ਵਿੱਚ ਸਰਚ ਡਿਸਟ੍ਰੀਬਿਊਸ਼ਨ ਦੀ ਕਹਾਣੀ ਹੈ। ਇੰਟਰਫੇਸ ਖੋਜਕਰਤਾ ਬਣ ਗਿਆ ਹੈ, ਅਤੇ ਸਾਰਾਹ ਸੰਪਾਦਕ ਬਣ ਗਈ ਹੈ। ਉਸਦਾ ਵਰਕਫਲੋ ਤੇਜ਼ ਹੈ, ਪਰ ਇਹ ਇੰਜਣ ਦੁਆਰਾ ਪ੍ਰਦਾਨ ਕੀਤੇ ਗਏ ਹਵਾਲਿਆਂ ਦੀ ਸ਼ੁੱਧਤਾ ‘ਤੇ ਵੀ ਵਧੇਰੇ ਨਿਰਭਰ ਹੈ।
ਦਿਨ ਵਿੱਚ ਬਾਅਦ ਵਿੱਚ, ਸਾਰਾਹ ਨੂੰ ਡੇਟਾ ਐਂਟਰੀ ਕੰਮ ਨੂੰ ਸਵੈਚਾਲਿਤ ਕਰਨ ਲਈ ਇੱਕ ਕਸਟਮ ਸਕ੍ਰਿਪਟ ਲਿਖਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇੱਕ ਆਮ-ਉਦੇਸ਼ ਵਾਲੇ ਸਹਾਇਕ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਬਜਾਏ ਜੋ ਪ੍ਰੀਮੀਅਮ ਖਰਚ ਸਕਦਾ ਹੈ, ਉਹ DeepSeek ਵਰਗੇ ਚੁਣੌਤੀ ਦੇਣ ਵਾਲੇ ਤੋਂ ਇੱਕ ਵਿਸ਼ੇਸ਼ ਕੋਡਿੰਗ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਦੀ ਹੈ। ਮਾਡਲ ਤੁਰੰਤ ਕੋਡ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ, ਅਤੇ ਕਿਉਂਕਿ ਇਨਫਰੈਂਸ ਦੀ ਲਾਗਤ ਬਹੁਤ ਘੱਟ ਹੈ, ਉਸਦੀ ਕੰਪਨੀ ਉਸਨੂੰ ਬਜਟ ਦੀ ਚਿੰਤਾ ਕੀਤੇ ਬਿਨਾਂ ਦਿਨ ਭਰ ਹਜ਼ਾਰਾਂ ਛੋਟੇ ਕੰਮਾਂ ਲਈ ਇਸਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੀ ਹੈ। ਇਸ ਤਰ੍ਹਾਂ ਮਾਡਲ ਮਾਰਕੀਟ ਬਦਲ ਰਿਹਾ ਹੈ। ਇਹ ਇੱਕ ਕੀਮਤੀ ਸਰੋਤ ਦੀ ਬਜਾਏ ਇੱਕ ਬੈਕਗ੍ਰਾਉਂਡ ਉਪਯੋਗਤਾ ਬਣ ਰਿਹਾ ਹੈ। ਰਵਾਇਤੀ ਖੋਜ ਵਿਵਹਾਰ ‘ਤੇ ਦਬਾਅ ਉਦੋਂ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ ਜਦੋਂ ਸਾਰਾਹ ਨੂੰ ਅਹਿਸਾਸ ਹੁੰਦਾ ਹੈ ਕਿ ਉਸਨੇ ਤਿੰਨ ਦਿਨਾਂ ਤੋਂ ਇੱਕ ਮਿਆਰੀ ਸਰਚ ਬਾਰ ਦੀ ਵਰਤੋਂ ਨਹੀਂ ਕੀਤੀ ਹੈ। ਜਦੋਂ ਉਹ ਇੱਕ ਸੰਰਚਨਾਤਮਕ ਦਸਤਾਵੇਜ਼ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੀ ਹੈ ਤਾਂ ਉਸਨੂੰ ਲਿੰਕਾਂ ਦੀ ਸੂਚੀ ਦੀ ਕੋਈ ਲੋੜ ਨਹੀਂ ਹੈ। ਹੇਠਾਂ ਦਿੱਤੇ ਨੁਕਤੇ ਉਸਦੀ ਰੋਜ਼ਾਨਾ ਰੁਟੀਨ ਵਿੱਚ ਤਬਦੀਲੀ ਨੂੰ ਦਰਸਾਉਂਦੇ ਹਨ:
- ਸਾਰਾਹ ਮੈਨੂਅਲ ਨਿਊਜ਼ ਐਗਰੀਗੇਸ਼ਨ ਨੂੰ ਸਵੈਚਾਲਿਤ ਹਵਾਲਾ ਦਿੱਤੇ ਸੰਖੇਪਾਂ ਨਾਲ ਬਦਲਦੀ ਹੈ ਜੋ ਰੀਅਲ-ਟਾਈਮ ਵਿੱਚ ਅਪਡੇਟ ਹੁੰਦੇ ਹਨ।
- ਉਹ ਦੁਹਰਾਉਣ ਵਾਲੇ ਕੋਡਿੰਗ ਕੰਮਾਂ ਲਈ ਘੱਟ ਲਾਗਤ ਵਾਲੇ ਮਾਡਲਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੀ ਹੈ ਜੋ ਪਹਿਲਾਂ ਪੈਮਾਨੇ ‘ਤੇ ਸਵੈਚਾਲਿਤ ਕਰਨ ਲਈ ਬਹੁਤ ਮਹਿੰਗੇ ਸਨ।
- ਰਵਾਇਤੀ ਵਿਗਿਆਪਨ-ਸਮਰਥਿਤ ਸਰਚ ਇੰਜਣਾਂ ‘ਤੇ ਉਸਦੀ ਨਿਰਭਰਤਾ ਲਗਭਗ ਜ਼ੀਰੋ ਤੱਕ ਡਿੱਗ ਜਾਂਦੀ ਹੈ ਕਿਉਂਕਿ ਉਹ ਸਿੱਧੇ ਜਵਾਬਾਂ ਵਿੱਚ ਵਧੇਰੇ ਮੁੱਲ ਲੱਭਦੀ ਹੈ।
- ਬਚਾਇਆ ਗਿਆ ਸਮਾਂ ਉਸਨੂੰ ਡੇਟਾ ਦੀ ਭਾਲ ਕਰਨ ਦੀ ਬਜਾਏ ਉੱਚ-ਪੱਧਰੀ ਰਣਨੀਤੀ ਅਤੇ ਗਾਹਕ ਸਬੰਧਾਂ ‘ਤੇ ਧਿਆਨ ਦੇਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ।
ਮੁਫਤ ਇੰਟੈਲੀਜੈਂਸ ਦੀ ਲੁਕਵੀਂ ਕੀਮਤ
ਸੁਕਰਾਤੀ ਸੰਦੇਹਵਾਦ ਲਈ ਸਾਨੂੰ ਇਹ ਪੁੱਛਣ ਦੀ ਲੋੜ ਹੈ ਕਿ ਅਸੀਂ ਇਸ ਕੁਸ਼ਲਤਾ ਦੇ ਬਦਲੇ ਕੀ ਦੇ ਰਹੇ ਹਾਂ। ਜੇਕਰ ਕੋਈ ਮਾਡਲ ਸਿਖਲਾਈ ਦੇਣ ਅਤੇ ਚਲਾਉਣ ਲਈ ਕਾਫ਼ੀ ਸਸਤਾ ਹੈ, ਤਾਂ ਉਹ ਬੱਚਤ ਕਿੱਥੋਂ ਆਈ? ਸਾਨੂੰ ਇਹ ਪੁੱਛਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਕੀ ਇਹਨਾਂ ਕੁਸ਼ਲ ਮਾਡਲਾਂ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣ ਲਈ ਵਰਤਿਆ ਗਿਆ ਡੇਟਾ ਵਧੇਰੇ ਮਹਿੰਗੇ ਹਮਰੁਤਬਾ ਵਾਂਗ ਹੀ ਜਾਂਚ ਦੇ ਪੱਧਰ ਨਾਲ ਪ੍ਰਾਪਤ ਕੀਤਾ ਗਿਆ ਸੀ। ਇੱਕ ਜੋਖਮ ਹੈ ਕਿ ਕੀਮਤ ‘ਤੇ ਹੇਠਾਂ ਵੱਲ ਦੀ ਦੌੜ ਡੇਟਾ ਗੋਪਨੀਯਤਾ ਅਤੇ ਬੌਧਿਕ ਸੰਪੱਤੀ ਦੇ ਅਧਿਕਾਰਾਂ ‘ਤੇ ਹੇਠਾਂ ਵੱਲ ਦੀ ਦੌੜ ਵੱਲ ਲੈ ਜਾਵੇਗੀ। ਜੇਕਰ ਕੋਈ ਕੰਪਨੀ ਆਪਣੇ ਮਾਡਲ ਲਈ ਜ਼ਿਆਦਾ ਚਾਰਜ ਨਹੀਂ ਕਰ ਰਹੀ ਹੈ, ਤਾਂ ਕੀ ਉਹ ਇਸ ਦੀ ਬਜਾਏ ਉਸ ਡੇਟਾ ਦਾ ਮੁਦਰੀਕਰਨ ਕਰ ਰਹੀ ਹੈ ਜੋ ਉਪਭੋਗਤਾ ਇਸ ਵਿੱਚ ਫੀਡ ਕਰਦੇ ਹਨ? ਸਾਨੂੰ ਜਵਾਬ ਇੰਜਣ ਮਾਡਲ ਦੀ ਲੁਕਵੀਂ ਕੀਮਤ ‘ਤੇ ਵੀ ਵਿਚਾਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ। ਜਦੋਂ Perplexity ਇੱਕ ਵੈੱਬਸਾਈਟ ਦਾ ਸੰਖੇਪ ਕਰਦਾ ਹੈ, ਤਾਂ ਉਹ ਵੈੱਬਸਾਈਟ ਇੱਕ ਵਿਜ਼ਿਟਰ ਗੁਆ ਦਿੰਦੀ ਹੈ। ਜੇਕਰ ਅਸਲ ਸਮੱਗਰੀ ਦੇ ਨਿਰਮਾਤਾਵਾਂ ਨੂੰ ਮੁਆਵਜ਼ਾ ਨਹੀਂ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਉਹ ਜਾਣਕਾਰੀ ਜਿਸ ‘ਤੇ ਇਹ ਇੰਜਣ ਨਿਰਭਰ ਕਰਦੇ ਹਨ, ਆਖਰਕਾਰ ਗਾਇਬ ਹੋ ਸਕਦੀ ਹੈ। 2026 ਦੀ ਪੱਤਰਕਾਰੀ ਅਤੇ ਖੋਜ ਨੂੰ ਕੌਣ ਫੰਡ ਦੇਵੇਗਾ ਜੇਕਰ ਪਾਠਕ ਅਸਲ ਵਿੱਚ ਸਰੋਤ ‘ਤੇ ਕਦੇ ਨਹੀਂ ਜਾਂਦੇ?
ਇੱਕ ਹੋਰ ਮੁਸ਼ਕਲ ਸਵਾਲ ਇਹਨਾਂ ਚੁਸਤ ਆਰਕੀਟੈਕਚਰਾਂ ਦੀ ਭਰੋਸੇਯੋਗਤਾ ਨਾਲ ਜੁੜਿਆ ਹੈ। ਕੀ ‘Mixture of Experts’ ਪਹੁੰਚ ਨਵੀਆਂ ਕਿਸਮਾਂ ਦੀਆਂ ਗਲਤੀਆਂ ਪੇਸ਼ ਕਰਦੀ ਹੈ ਜਿਨ੍ਹਾਂ ਦਾ ਪਤਾ ਲਗਾਉਣਾ ਔਖਾ ਹੈ? ਸਾਨੂੰ ਇਹ ਪੁੱਛਣਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਕੀ ਅਸੀਂ ਗਤੀ ਦੀ ਖਾਤਰ ਡੂੰਘਾਈ ਦੀ ਬਲੀ ਦੇ ਰਹੇ ਹਾਂ। ਇੱਕ ਖਤਰਾ ਹੈ ਕਿ ਉਪਭੋਗਤਾ ਅਸਲ ਸੰਦਰਭ ਦੀ ਜਾਂਚ ਕੀਤੇ ਬਿਨਾਂ ਸੰਖੇਪ ਹਵਾਲਿਆਂ ‘ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਨਿਰਭਰ ਹੋ ਜਾਣਗੇ। ਇਹ ਗੁੰਝਲਦਾਰ ਵਿਸ਼ਿਆਂ ਦੀ ਇੱਕ ਉੱਪਰੀ ਸਮਝ ਵੱਲ ਲੈ ਜਾ ਸਕਦਾ ਹੈ ਜਿੱਥੇ ਸੰਖੇਪ ਜਵਾਬ ਦੀ ਭਾਲ ਵਿੱਚ ਬਾਰੀਕੀਆਂ ਗੁੰਮ ਹੋ ਜਾਂਦੀਆਂ ਹਨ। ਸਾਨੂੰ ਸਿਖਲਾਈ ਦੀਆਂ ਲਾਗਤਾਂ ਦੇ ਦਾਅਵਿਆਂ ਬਾਰੇ ਵੀ ਸ਼ੱਕੀ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਕੀ ਇਹ ਅੰਕੜੇ ਪੂਰੀ ਤਰ੍ਹਾਂ ਪਾਰਦਰਸ਼ੀ ਹਨ, ਜਾਂ ਕੀ ਉਹ ਮਨੁੱਖੀ ਕਿਰਤ ਦੀ ਲਾਗਤ ਅਤੇ ਹਾਰਡਵੇਅਰ ਦੇ ਵਾਤਾਵਰਣ ਪ੍ਰਭਾਵ ਨੂੰ ਛੱਡ ਦਿੰਦੇ ਹਨ? ਜਿਵੇਂ-ਜਿਵੇਂ ਅਸੀਂ ਸਸਤੀ ਇੰਟੈਲੀਜੈਂਸ ਦੀ ਦੁਨੀਆ ਵੱਲ ਵਧਦੇ ਹਾਂ, ਸਾਨੂੰ ਉਹਨਾਂ ਪ੍ਰਣਾਲੀਆਂ ਦੀ ਗੁਣਵੱਤਾ ਅਤੇ ਨੈਤਿਕਤਾ ਬਾਰੇ ਸੁਚੇਤ ਰਹਿਣਾ ਚਾਹੀਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਅਸੀਂ ਆਪਣੇ ਜੀਵਨ ਵਿੱਚ ਜੋੜ ਰਹੇ ਹਾਂ। ਇੱਕ ਨਵੇਂ ਉਤਪਾਦ ਦੀ ਰਿਲੀਜ਼ ਦਾ ਸ਼ੋਰ ਅਕਸਰ ਇਸਦੇ ਲੰਬੇ ਸਮੇਂ ਦੇ ਨਤੀਜਿਆਂ ਦੇ ਸੰਕੇਤ ਨੂੰ ਡੁਬੋ ਸਕਦਾ ਹੈ।
ਨਵੇਂ ਚੁਣੌਤੀ ਦੇਣ ਵਾਲਿਆਂ ਦੇ ਹੁੱਡ ਦੇ ਹੇਠਾਂ
ਪਾਵਰ ਯੂਜ਼ਰ ਲਈ, ਇਹਨਾਂ ਚੁਣੌਤੀ ਦੇਣ ਵਾਲਿਆਂ ਦੀ ਅਪੀਲ ਉਹਨਾਂ ਦੀ ਤਕਨੀਕੀ ਲਚਕਤਾ ਅਤੇ ਏਕੀਕਰਣ ਸਮਰੱਥਾਵਾਂ ਵਿੱਚ ਹੈ। DeepSeek-V3 ਇੱਕ ਸਿਖਲਾਈ ਫਰੇਮਵਰਕ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ ਜੋ FP8 ਸ਼ੁੱਧਤਾ ਲਈ ਅਨੁਕੂਲਿਤ ਕਰਦਾ ਹੈ, ਜੋ ਸ਼ੁੱਧਤਾ ਵਿੱਚ ਮਹੱਤਵਪੂਰਨ ਨੁਕਸਾਨ ਤੋਂ ਬਿਨਾਂ ਤੇਜ਼ੀ ਨਾਲ ਗਣਨਾ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਇਹ ਇੱਕ ਪ੍ਰਮੁੱਖ ਤਕਨੀਕੀ ਮੀਲ ਪੱਥਰ ਹੈ ਜੋ ਉਹਨਾਂ ਦੀ ਲਾਗਤ ਕੁਸ਼ਲਤਾ ਨੂੰ ਸਮਝਾਉਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ। ਉਹਨਾਂ ਦੀ ‘Multi-head Latent Attention’ ਵਿਧੀ ਇਨਫਰੈਂਸ ਦੌਰਾਨ ਮਾਡਲ ਦੇ ਮੈਮੋਰੀ ਫੁੱਟਪ੍ਰਿੰਟ ਨੂੰ ਘਟਾਉਂਦੀ ਹੈ, ਜੋ ਉਹਨਾਂ ਡਿਵੈਲਪਰਾਂ ਲਈ ਇੱਕ ਮਹੱਤਵਪੂਰਨ ਕਾਰਕ ਹੈ ਜੋ ਇਹਨਾਂ ਮਾਡਲਾਂ ਨੂੰ ਆਪਣੇ ਖੁਦ ਦੇ ਹਾਰਡਵੇਅਰ ‘ਤੇ ਹੋਸਟ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹਨ। ਇਹਨਾਂ ਵਿੱਚੋਂ ਬਹੁਤ ਸਾਰੇ ਨਵੇਂ ਮਾਡਲ ਓਪਨ ਵੇਟਸ ਦੇ ਨਾਲ ਜਾਰੀ ਕੀਤੇ ਗਏ ਹਨ, ਮਤਲਬ ਕਿ ਉਹਨਾਂ ਨੂੰ ਸਥਾਨਕ ਤੌਰ ‘ਤੇ ਜਾਂ ਪ੍ਰਾਈਵੇਟ ਕਲਾਉਡ ਇੰਸਟੈਂਸ ‘ਤੇ ਚਲਾਇਆ ਜਾ ਸਕਦਾ ਹੈ। ਇਹ ਉਹਨਾਂ ਉੱਦਮਾਂ ਲਈ ਇੱਕ ਵੱਡਾ ਫਾਇਦਾ ਹੈ ਜੋ ਸੰਵੇਦਨਸ਼ੀਲ ਡੇਟਾ ਨੂੰ ਤੀਜੀ-ਧਿਰ API ਨੂੰ ਭੇਜਣ ਦਾ ਜੋਖਮ ਨਹੀਂ ਲੈ ਸਕਦੇ। ਖਾਸ ਡੇਟਾਸੈਟਾਂ ‘ਤੇ ਇਹਨਾਂ ਮਾਡਲਾਂ ਨੂੰ ਫਾਈਨ-ਟਿਊਨ ਕਰਨ ਦੀ ਸਮਰੱਥਾ ਕਾਨੂੰਨੀ, ਮੈਡੀਕਲ, ਜਾਂ ਵਿੱਤੀ ਖੇਤਰਾਂ ਵਿੱਚ ਵਿਸ਼ੇਸ਼ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਉਹਨਾਂ ਦੇ ਮੁੱਲ ਨੂੰ ਹੋਰ ਵਧਾਉਂਦੀ ਹੈ।
ਕੀ ਤੁਹਾਡੇ ਕੋਲ ਕੋਈ AI ਕਹਾਣੀ, ਟੂਲ, ਰੁਝਾਨ ਜਾਂ ਸਵਾਲ ਹੈ ਜੋ ਤੁਹਾਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ ਸਾਨੂੰ ਕਵਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ? ਸਾਨੂੰ ਆਪਣਾ ਲੇਖ ਦਾ ਵਿਚਾਰ ਭੇਜੋ — ਅਸੀਂ ਇਸਨੂੰ ਸੁਣਨਾ ਪਸੰਦ ਕਰਾਂਗੇ।Perplexity ਆਪਣੇ API ਰਾਹੀਂ ਇੱਕ ਵੱਖਰੀ ਕਿਸਮ ਦਾ ਤਕਨੀਕੀ ਮੁੱਲ ਪੇਸ਼ ਕਰਦਾ ਹੈ, ਜੋ ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਆਪਣੀਆਂ ਐਪਲੀਕੇਸ਼ਨਾਂ ਵਿੱਚ ਸਿੱਧੇ ਤੌਰ ‘ਤੇ ਖੋਜ ਸਮਰੱਥਾਵਾਂ ਬਣਾਉਣ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ। ਇਹ ਇੱਕ ਵੱਖਰੇ ਸਰਚ ਇੰਡੈਕਸ ਅਤੇ ਇੱਕ ਵੱਖਰੇ ਭਾਸ਼ਾ ਮਾਡਲ ਦੀ ਲੋੜ ਨੂੰ ਬਾਈਪਾਸ ਕਰਦਾ ਹੈ। ਸਿਸਟਮ ਗਰਾਊਂਡਿੰਗ ਅਤੇ ਸਾਈਟੇਸ਼ਨ ਨੂੰ ਆਪਣੇ ਆਪ ਸੰਭਾਲਦਾ ਹੈ। ਹਾਲਾਂਕਿ, ਵਿਚਾਰਨ ਲਈ ਸੀਮਾਵਾਂ ਹਨ। API ਦਰ ਦੀਆਂ ਸੀਮਾਵਾਂ ਅਤੇ ਰੀਅਲ-ਟਾਈਮ ਵੈੱਬ ਖੋਜ ਦੀ ਲੇਟੈਂਸੀ ਉੱਚ-ਵਾਲੀਅਮ ਐਪਲੀਕੇਸ਼ਨਾਂ ਲਈ ਇੱਕ ਰੁਕਾਵਟ ਹੋ ਸਕਦੀ ਹੈ। ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਖੋਜ ਦੀ ਗਤੀ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਡੂੰਘਾਈ ਵਿਚਕਾਰ ਸੰਤੁਲਨ ਦਾ ਪ੍ਰਬੰਧਨ ਵੀ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ। ਇਹਨਾਂ ਖੋਜ ਨਤੀਜਿਆਂ ਦੀ ਸਥਾਨਕ ਸਟੋਰੇਜ ਪਾਵਰ ਯੂਜ਼ਰਾਂ ਲਈ ਇੱਕ ਹੋਰ ਵਿਚਾਰ ਹੈ ਜਿਨ੍ਹਾਂ ਨੂੰ ਇਹ ਬਣਾਈ ਰੱਖਣ ਦੀ ਲੋੜ ਹੈ ਕਿ ਉਹਨਾਂ ਦੀ ਜਾਣਕਾਰੀ ਕਿੱਥੋਂ ਆਈ ਹੈ। ਹੇਠਾਂ ਦਿੱਤੇ ਤਕਨੀਕੀ ਕਾਰਕ ਵਰਤਮਾਨ ਵਿੱਚ ਇਹਨਾਂ ਟੂਲਸ ਲਈ ਪ੍ਰਤੀਯੋਗੀ ਕਿਨਾਰੇ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰ ਰਹੇ ਹਨ:
- ਲੰਬੇ ਸੰਦਰਭ ਕਾਰਜਾਂ ਦੌਰਾਨ KV ਕੈਸ਼ ਮੈਮੋਰੀ ਦੀ ਵਰਤੋਂ ਨੂੰ ਘਟਾਉਣ ਲਈ ‘Multi-head Latent Attention’ ਦੀ ਵਰਤੋਂ।
- ਆਧੁਨਿਕ GPU ਹਾਰਡਵੇਅਰ ਦੇ ਥਰੂਪੁੱਟ ਨੂੰ ਵੱਧ ਤੋਂ ਵੱਧ ਕਰਨ ਲਈ FP8 ਸਿਖਲਾਈ ਅਤੇ ਇਨਫਰੈਂਸ ਲਈ ਸਮਰਥਨ।
- ਰੀਅਲ-ਟਾਈਮ RAG ਪਾਈਪਲਾਈਨਾਂ ਦਾ ਏਕੀਕਰਣ ਜੋ ਹਜ਼ਾਰਾਂ ਸਮਕਾਲੀ ਵੈੱਬ ਪੁੱਛਗਿੱਛਾਂ ਨੂੰ ਸੰਭਾਲ ਸਕਦਾ ਹੈ।
- ਸੁਰੱਖਿਅਤ ਵਾਤਾਵਰਣ ਵਿੱਚ ਸਥਾਨਕ ਤੈਨਾਤੀ ਲਈ ਓਪਨ ਵੇਟਸ ਦੀ ਉਪਲਬਧਤਾ।
ਚੋਣਵੀਂ ਇੰਟੈਲੀਜੈਂਸ ਦਾ ਭਵਿੱਖ
DeepSeek ਅਤੇ Perplexity ਦਾ ਉਭਾਰ ਇੱਕ ਵਧੇਰੇ ਪਰਿਪੱਕ AI ਮਾਰਕੀਟ ਦੀ ਸ਼ੁਰੂਆਤ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਅਸੀਂ ਉਹਨਾਂ ਮਾਡਲਾਂ ਦੀ ਨਵੀਨਤਾ ਤੋਂ ਦੂਰ ਜਾ ਰਹੇ ਹਾਂ ਜੋ ਗੱਲ ਕਰ ਸਕਦੇ ਹਨ ਅਤੇ ਉਹਨਾਂ ਮਾਡਲਾਂ ਦੀ ਉਪਯੋਗਤਾ ਵੱਲ ਵਧ ਰਹੇ ਹਾਂ ਜੋ ਕੁਸ਼ਲਤਾ ਨਾਲ ਕੰਮ ਕਰ ਸਕਦੇ ਹਨ। ਗੰਭੀਰਤਾ ਦਾ ਕੇਂਦਰ ਉਹਨਾਂ ਪ੍ਰਦਾਤਾਵਾਂ ਵੱਲ ਬਦਲ ਰਿਹਾ ਹੈ ਜੋ ਟਿਕਾਊ ਕੀਮਤ ‘ਤੇ ਉੱਚ ਗੁਣਵੱਤਾ ਵਾਲੇ ਨਤੀਜੇ ਪ੍ਰਦਾਨ ਕਰ ਸਕਦੇ ਹਨ। ਇਹ ਸਿਰਫ਼ ਮੌਜੂਦਾ 2026 ਲਈ ਇੱਕ ਰੁਝਾਨ ਨਹੀਂ ਹੈ, ਸਗੋਂ ਇਹ ਇੱਕ ਲੰਬੇ ਸਮੇਂ ਦਾ ਬਦਲਾਅ ਹੈ ਕਿ ਅਸੀਂ ਡਿਜੀਟਲ ਸੇਵਾਵਾਂ ਨੂੰ ਕਿਵੇਂ ਬਣਾਉਂਦੇ ਅਤੇ ਵਰਤਦੇ ਹਾਂ। ਰਵਾਇਤੀ ਖੋਜ ਅਤੇ ਉੱਚ ਲਾਗਤ ਵਾਲੇ ਮਾਡਲ ਪ੍ਰਦਾਤਾਵਾਂ ‘ਤੇ ਦਬਾਅ ਸਿਰਫ ਵਧੇਗਾ ਕਿਉਂਕਿ ਇਹ ਚੁਣੌਤੀ ਦੇਣ ਵਾਲੇ ਆਪਣੇ ਉਤਪਾਦਾਂ ਨੂੰ ਸੁਧਾਰਦੇ ਹਨ। ਉਪਭੋਗਤਾ ਲਈ, ਇਸਦਾ ਮਤਲਬ ਹੈ ਵਧੇਰੇ ਵਿਕਲਪ ਅਤੇ ਬਿਹਤਰ ਟੂਲ। ਇੰਡਸਟਰੀ ਲਈ, ਇਸਦਾ ਮਤਲਬ ਹੈ ਬਰੂਟ ਫੋਰਸ ਕੰਪਿਊਟੇਸ਼ਨ ਨਾਲੋਂ ਇੰਜੀਨੀਅਰਿੰਗ ਉੱਤਮਤਾ ‘ਤੇ ਨਵਾਂ ਫੋਕਸ। ਅਸਲ ਜੇਤੂ ਉਹ ਹੋਣਗੇ ਜੋ ਹਾਈਪ ਚੱਕਰ ਦੇ ਸ਼ੋਰ ਅਤੇ ਟੈਕਨਾਲੋਜੀ ਅਰਥਚਾਰੇ ਵਿੱਚ ਅਸਲ ਢਾਂਚਾਗਤ ਤਬਦੀਲੀ ਦੇ ਸੰਕੇਤ ਵਿਚਕਾਰ ਫਰਕ ਕਰ ਸਕਦੇ ਹਨ।
Editor’s note: We created this site as a multilingual AI news and guides hub for people who are not computer geeks, but still want to understand artificial intelligence, use it with more confidence, and follow the future that is already arriving.
ਕੋਈ ਗਲਤੀ ਮਿਲੀ ਜਾਂ ਕੁਝ ਠੀਕ ਕਰਨ ਦੀ ਲੋੜ ਹੈ? ਸਾਨੂੰ ਦੱਸੋ।