DeepSeek, Perplexity এবং এআই চ্যালেঞ্জারদের নতুন জোয়ার
দামি কৃত্রিম বুদ্ধিমত্তা বা এআই-এর একচেটিয়া আধিপত্যের দিন শেষ হয়ে আসছে। গত দুই বছর ধরে ইন্ডাস্ট্রি এমন এক ধারণার ওপর ভিত্তি করে চলছিল যে, সেরা পারফরম্যান্স পেতে হলে বিলিয়ন ডলারের কম্পিউটিং পাওয়ার এবং প্রচুর বিদ্যুৎ খরচ করা অপরিহার্য। কিন্তু DeepSeek এবং Perplexity এখন প্রমাণ করছে যে, বিশাল স্কেলের চেয়ে দক্ষতা অনেক বেশি কার্যকর। DeepSeek এমন সব মডেল বাজারে এনে সবাইকে চমকে দিয়েছে, যা ইন্ডাস্ট্রি লিডারদের সমান পারফরম্যান্স দেয়, অথচ সেগুলোর ট্রেনিং খরচ অনেক কম। অন্যদিকে, Perplexity ইন্টারনেটের সাথে মানুষের যোগাযোগের ধরনটাই বদলে দিচ্ছে; প্রথাগত লিঙ্কের তালিকার বদলে তারা সরাসরি তথ্যসূত্রসহ উত্তর দিচ্ছে। এই পরিবর্তন কেবল নতুন কিছু টুলের বিষয় নয়, বরং বুদ্ধিমত্তার অর্থনীতির একটি মৌলিক রূপান্তর। এখন মূল ফোকাস মডেল কতটা বড় তার ওপর নয়, বরং তা চালাতে কত কম খরচ হয় তার ওপর। এই চ্যালেঞ্জাররা যত শক্তিশালী হচ্ছে, বড় বড় জায়ান্ট কোম্পানিগুলো তাদের হাই-মার্জিন বিজনেস মডেল বাঁচাতে বাধ্য হচ্ছে।
ইন্টেলিজেন্স মার্কেটে দক্ষতার ধাক্কা
এআই জগতে DeepSeek একটি নতুন বাস্তবতার জন্ম দিয়েছে। যেখানে অনেক কোম্পানি সবচেয়ে বড় নিউরাল নেটওয়ার্ক তৈরির পেছনে ছুটছে, সেখানে এই টিমটি আর্কিটেকচারাল অপ্টিমাইজেশনের দিকে মনোযোগ দিয়েছে। তাদের DeepSeek-V3 মডেলটি ‘Mixture of Experts’ পদ্ধতি ব্যবহার করে, যা যেকোনো কাজের জন্য মোট প্যারামিটারের খুব সামান্য অংশ সক্রিয় করে। এতে মডেলটি উচ্চ পারফরম্যান্স বজায় রাখতে পারে এবং প্রতিটি শব্দ তৈরির জন্য প্রয়োজনীয় কম্পিউটেশনাল পাওয়ার অনেক কমিয়ে ফেলে। এই কোম্পানির সাফল্যের গল্প প্রায়ই তাদের কম ট্রেনিং বাজেটের চারপাশে ঘোরে, যা শোনা যায় ছয় মিলিয়ন ডলারের নিচে। এই সংখ্যাটি সেই ধারণাকে চ্যালেঞ্জ করে যে, কেবল ধনী দেশ বা কর্পোরেশনগুলোই ফ্রন্টিয়ার মডেল তৈরি করতে পারে। এটি ইঙ্গিত দেয় যে, হাই-লেভেল মেশিন লার্নিংয়ের প্রবেশপথ আগের চেয়ে অনেক সহজ হয়ে গেছে।
Perplexity বিষয়টিকে ইউজার ইন্টারফেসের দৃষ্টিকোণ থেকে দেখে। এটি একটি প্রথাগত সার্চ ইঞ্জিনের চেয়ে বরং একটি ‘অ্যানসার ইঞ্জিন’। এটি বিদ্যমান লার্জ ল্যাঙ্গুয়েজ মডেল ব্যবহার করে লাইভ ওয়েব স্ক্যান করে, প্রয়োজনীয় তথ্য বের করে এবং ফুটনোটসহ একটি গোছানো প্যারাগ্রাফে উপস্থাপন করে। এই ডিজাইনটি সাধারণ এআই মডেলের প্রধান দুর্বলতা—পুরানো বা ভুল তথ্য দেওয়ার প্রবণতা—দূর করে। প্রতিটি উত্তর রিয়েল-টাইম ওয়েব ডেটার ওপর ভিত্তি করে দেওয়ার ফলে, Perplexity সাধারণ চ্যাটবটের চেয়ে গবেষণার জন্য অনেক বেশি নির্ভরযোগ্য হয়ে উঠেছে। এর আসল শক্তি কেবল মডেলে নয়, বরং এর রিট্রিভাল এবং সাইটেশন সিস্টেমে। এটি প্রথাগত সার্চ প্রোভাইডারদের ওপর প্রচণ্ড চাপ সৃষ্টি করছে, যারা মূলত ইউজারদের লিঙ্কে ক্লিক করার বিজ্ঞাপনের ওপর নির্ভরশীল।
BotNews.today কন্টেন্ট গবেষণা, লেখা, সম্পাদনা এবং অনুবাদের জন্য এআই টুল ব্যবহার করে। আমাদের দল তথ্যকে দরকারী, স্পষ্ট এবং নির্ভরযোগ্য রাখতে প্রক্রিয়াটি পর্যালোচনা ও তত্ত্বাবধান করে।
সস্তা কম্পিউটের ভূ-রাজনীতি
এই চ্যালেঞ্জারদের বৈশ্বিক প্রভাব হাই-পারফরম্যান্স ইনফারেন্সের গণতন্ত্রীকরণের ওপর দাঁড়িয়ে আছে। যখন একটি মডেল চালানোর খরচ ৯০ শতাংশ কমে যায়, তখন দৈনন্দিন সফটওয়্যারে এর ব্যবহারের সম্ভাবনা বহুগুণ বেড়ে যায়। উদীয়মান বাজারের ডেভেলপাররা, যারা আগে দামী এপিআই (API) ব্যবহার করতে পারতেন না, তারা এখন জটিল সব অ্যাপ্লিকেশন তৈরি করতে পারছেন। এটি পুরো ইন্ডাস্ট্রির ভরকেন্দ্র বদলে দিচ্ছে। যদি সবচেয়ে দক্ষ মডেলগুলো সিলিকন ভ্যালির বাইরে থেকে আসে, তবে বিশাল সব সার্ভার ফার্মের কৌশলগত সুবিধা কমতে শুরু করবে। এটি মডেল সার্বভৌমত্ব নিয়ে আলোচনার জন্ম দিচ্ছে—দেশগুলো কি অল্প কিছু কেন্দ্রীয় প্রোভাইডারের ওপর নির্ভর করবে, নাকি নিজস্ব দক্ষ আর্কিটেকচারে বিনিয়োগ করবে? এটি একটি গুরুত্বপূর্ণ সংকেত, কারণ এটি ইন্ডাস্ট্রিকে ‘উইনার-টেক-অল’ ডাইনামিক থেকে সরিয়ে আরও প্রতিযোগিতামূলক বাজারের দিকে নিয়ে যাচ্ছে।
এন্টারপ্রাইজ ক্রেতারা তাদের মুনাফায় এই পরিবর্তনের আঁচ পেতে শুরু করেছেন। কম খরচের ইনফারেন্সের গল্প কোম্পানিগুলোর দীর্ঘমেয়াদী প্রযুক্তি পরিকল্পনা বদলে দিচ্ছে। যদি DeepSeek-এর মতো একটি মডেল দামী প্রতিদ্বন্দ্বীর ৮০ শতাংশ উপযোগিতা মাত্র ১০ শতাংশ খরচে দিতে পারে, তবে সাধারণ কাজের জন্য দামী অপশনটির প্রয়োজনীয়তা ফুরিয়ে যায়। এটি একটি টায়ার্ড মার্কেট তৈরি করছে, যেখানে দামী মডেলগুলো কেবল জটিল যুক্তিনির্ভর কাজের জন্য রাখা হচ্ছে, আর বাকি কাজগুলো দক্ষ চ্যালেঞ্জাররা সামলাচ্ছে। এই অর্থনৈতিক বাস্তবতা বিজ্ঞাপন জগতকেও প্রভাবিত করছে। Perplexity এমন একটি মডেল নিয়ে পরীক্ষা-নিরীক্ষা করছে যেখানে বিজ্ঞাপনগুলো গবেষণার প্রক্রিয়ার অংশ হিসেবে থাকে, যা ইউজারদের বিরক্ত করে না। এটি ব্র্যান্ডগুলোর গ্রাহকদের কাছে পৌঁছানোর উপায় বদলে দিতে পারে। সফটওয়্যার ইঞ্জিনিয়ার থেকে শুরু করে মার্কেটিং এক্সিকিউটিভ—সবার ওপরই এর প্রভাব পড়ছে।
অ্যানসার ইঞ্জিনের সাথে একটি মঙ্গলবার
বাস্তব প্রভাব বোঝার জন্য সারা নামের একজন ফিন্যান্সিয়াল অ্যানালিস্টের কথা ভাবুন। আগে সারা সকালে দশটি ট্যাব খুলে মার্কেট মুভমেন্ট আর নিউজ রিপোর্ট চেক করতেন। ডেটা গুছিয়ে ব্রিফ তৈরি করতে তার ঘণ্টার পর ঘণ্টা সময় লাগত। আজ, তিনি একটি অ্যানসার ইঞ্জিন ব্যবহার করে একই সাথে একাধিক সোর্স থেকে নির্দিষ্ট ডেটা খুঁজে বের করেন। তিনি তিনটি ভিন্ন কোয়ার্টারলি রিপোর্টের তুলনা করতে বলেন এবং কয়েক সেকেন্ডের মধ্যে সাইটেশনসহ সামারি পেয়ে যান। যেহেতু সিস্টেমটি সরাসরি সোর্স টেক্সট থেকে তথ্য নেয়, তাই ডেটার নির্ভুলতা নিয়ে চিন্তা করতে হয় না। তিনি এখন তথ্য খোঁজার চেয়ে তা যাচাই করা এবং সিদ্ধান্ত নেওয়ার কাজে বেশি সময় দিতে পারেন। ইন্টারফেসটি এখন গবেষক হয়ে উঠেছে, আর সারা হয়েছেন এডিটর। তার কাজ দ্রুত হয়েছে, তবে তা ইঞ্জিনের দেওয়া সাইটেশনের নির্ভুলতার ওপর অনেক বেশি নির্ভরশীল।
দিনের শেষে, সারাকে ডেটা এন্ট্রি অটোমেট করার জন্য একটি কাস্টম স্ক্রিপ্ট লিখতে হয়। দামী জেনারেল-পারপাস অ্যাসিস্ট্যান্ট ব্যবহার না করে তিনি DeepSeek-এর মতো চ্যালেঞ্জারের একটি স্পেশালাইজড কোডিং মডেল ব্যবহার করেন। মডেলটি তাৎক্ষণিকভাবে কোড দেয় এবং ইনফারেন্স খরচ এতই কম যে, তার কোম্পানি তাকে সারাদিনে হাজারবার এটি ব্যবহারের অনুমতি দেয়। মডেল মার্কেট এভাবেই পাল্টাচ্ছে। এটি এখন একটি মূল্যবান সম্পদের বদলে সাধারণ ইউটিলিটি হয়ে উঠছে। প্রথাগত সার্চের ওপর চাপ তখন স্পষ্ট হয় যখন সারা বুঝতে পারেন যে, তিনি গত তিন দিনে একবারও সার্চ বার ব্যবহার করেননি। তার সামনে যখন একটি গোছানো ডকুমেন্ট থাকে, তখন লিঙ্কের তালিকার কোনো প্রয়োজন নেই। তার দৈনন্দিন রুটিনের পরিবর্তনগুলো নিচে দেওয়া হলো:
- সারা ম্যানুয়াল নিউজ অ্যাগ্রিগেশনের বদলে রিয়েল-টাইম অটোমেটেড সাইটেড সামারি ব্যবহার করেন।
- তিনি পুনরাবৃত্তিমূলক কোডিং কাজের জন্য কম খরচের মডেল ব্যবহার করেন, যা আগে অটোমেট করা খুব ব্যয়বহুল ছিল।
- বিজ্ঞাপন-নির্ভর সার্চ ইঞ্জিনের ওপর তার নির্ভরতা প্রায় শূন্যে নেমে এসেছে।
- বেঁচে যাওয়া সময় তিনি হাই-লেভেল স্ট্র্যাটেজি এবং ক্লায়েন্ট রিলেশনে ব্যয় করতে পারছেন।
ফ্রি ইন্টেলিজেন্সের লুকানো মূল্য
সক্রেটিক সংশয়বাদ আমাদের শেখায় যে, এই দক্ষতার বিনিময়ে আমরা কী হারাচ্ছি তা নিয়ে প্রশ্ন তুলতে। যদি একটি মডেল তৈরি ও চালানো উল্লেখযোগ্যভাবে সস্তা হয়, তবে সেই সাশ্রয় কোথা থেকে আসছে? আমাদের প্রশ্ন করতে হবে, এই দক্ষ মডেলগুলো তৈরির ডেটা কি দামী মডেলগুলোর মতোই যাচাই-বাছাই করে নেওয়া হয়েছে? দাম কমানোর এই প্রতিযোগিতায় ডেটা প্রাইভেসি এবং ইন্টেলেকচুয়াল প্রপার্টি রাইটস ক্ষতিগ্রস্ত হওয়ার ঝুঁকি রয়েছে। কোম্পানি যদি মডেলের জন্য বেশি চার্জ না করে, তবে তারা কি ইউজারদের দেওয়া ডেটা থেকে মুনাফা করছে? আমাদের অ্যানসার ইঞ্জিন মডেলের লুকানো খরচ নিয়েও ভাবতে হবে। যখন Perplexity একটি ওয়েবসাইট সামারি করে, তখন সেই ওয়েবসাইট একজন ভিজিটর হারায়। যদি মূল কন্টেন্ট নির্মাতাদের ক্ষতিপূরণ না দেওয়া হয়, তবে যে তথ্যের ওপর এই ইঞ্জিনগুলো নির্ভর করে, তা একসময় হারিয়ে যেতে পারে। 2026 এর সাংবাদিকতা ও গবেষণার খরচ কে জোগাবে যদি পাঠকরা মূল সোর্সেই না যায়?
আরেকটি কঠিন প্রশ্ন হলো এই লিন আর্কিটেকচারের নির্ভরযোগ্যতা। ‘Mixture of Experts’ পদ্ধতি কি এমন নতুন ধরনের ত্রুটি তৈরি করছে যা শনাক্ত করা কঠিন? আমরা কি গতির জন্য গভীরতাকে বিসর্জন দিচ্ছি? ভয় আছে যে, ইউজাররা মূল কনটেক্সট চেক না করেই সামারি করা সাইটেশনের ওপর অতি-নির্ভরশীল হয়ে পড়বে। এটি জটিল বিষয়ের অগভীর বোঝার দিকে নিয়ে যেতে পারে। ট্রেনিং খরচ নিয়েও আমাদের সংশয়ী হওয়া উচিত। এই সংখ্যাগুলো কি পুরোপুরি স্বচ্ছ, নাকি এতে মানুষের শ্রম এবং হার্ডওয়্যারের পরিবেশগত প্রভাবের খরচ বাদ দেওয়া হয়েছে? সস্তা বুদ্ধিমত্তার দিকে এগিয়ে যাওয়ার সময় আমাদের ইন্টিগ্রেট করা সিস্টেমগুলোর গুণমান ও নৈতিকতা নিয়ে সতর্ক থাকতে হবে। নতুন প্রোডাক্ট রিলিজের শোরগোল অনেক সময় এর দীর্ঘমেয়াদী পরিণতির সংকেতকে ঢেকে ফেলে।
নতুন চ্যালেঞ্জারদের অন্দরমহল
পাওয়ার ইউজারদের কাছে এই চ্যালেঞ্জারদের আকর্ষণ তাদের টেকনিক্যাল ফ্লেক্সিবিলিটি এবং ইন্টিগ্রেশন ক্ষমতার মধ্যে। DeepSeek-V3 একটি ট্রেনিং ফ্রেমওয়ার্ক ব্যবহার করে যা FP8 প্রিসিশনের জন্য অপ্টিমাইজ করা, যা নির্ভুলতা না কমিয়ে দ্রুত কম্পিউটেশন করতে দেয়। এটি একটি বড় টেকনিক্যাল মাইলফলক যা তাদের খরচ সাশ্রয়ের কারণ ব্যাখ্যা করে। তাদের ‘Multi-head Latent Attention’ মেকানিজম ইনফারেন্সের সময় মডেলের মেমোরি ফুটপ্রিন্ট কমায়, যা ডেভেলপারদের জন্য খুবই গুরুত্বপূর্ণ। এই মডেলগুলোর অনেকগুলোই ওপেন ওয়েটসহ রিলিজ করা হয়েছে, যার মানে এগুলো লোকালি বা প্রাইভেট ক্লাউড ইনস্ট্যান্সে চালানো সম্ভব। এটি সেইসব এন্টারপ্রাইজের জন্য একটি বড় সুবিধা যারা থার্ড পার্টি এপিআই-তে সংবেদনশীল ডেটা পাঠাতে পারে না। নির্দিষ্ট ডেটাসেটে এই মডেলগুলোকে ফাইন-টিউন করার ক্ষমতা আইনি, চিকিৎসা বা আর্থিক খাতের জন্য এদের মূল্য আরও বাড়িয়ে দেয়।
আপনার কি কোনো এআই গল্প, টুল, প্রবণতা, বা প্রশ্ন আছে যা আপনার মনে হয় আমাদের কভার করা উচিত? আপনার প্রবন্ধের ধারণা আমাদের পাঠান — আমরা তা শুনতে আগ্রহী।Perplexity তাদের এপিআই-এর মাধ্যমে ভিন্ন ধরনের টেকনিক্যাল ভ্যালু দেয়, যা ডেভেলপারদের নিজস্ব অ্যাপ্লিকেশনে সরাসরি সার্চ ক্ষমতা যোগ করতে দেয়। এতে আলাদা সার্চ ইনডেক্স বা ল্যাঙ্গুয়েজ মডেলের প্রয়োজন হয় না। সিস্টেমটি গ্রাউন্ডিং এবং সাইটেশন স্বয়ংক্রিয়ভাবে সামলায়। তবে কিছু সীমাবদ্ধতাও আছে। এপিআই রেট লিমিট এবং রিয়েল-টাইম ওয়েব সার্চের ল্যাটেন্সি হাই-ভলিউম অ্যাপ্লিকেশনের জন্য বাধা হতে পারে। ইউজারদের সার্চের গতি এবং বিশ্লেষণের গভীরতার মধ্যে ভারসাম্য বজায় রাখতে হয়। সার্চ রেজাল্ট লোকালি স্টোর করা পাওয়ার ইউজারদের জন্য আরেকটি বিবেচ্য বিষয়। নিচের টেকনিক্যাল বিষয়গুলো বর্তমানে এই টুলগুলোর প্রতিযোগিতামূলক সুবিধা নির্ধারণ করছে:
- লং কনটেক্সট কাজের সময় KV ক্যাশ মেমোরি ব্যবহার কমাতে ‘Multi-head Latent Attention’-এর ব্যবহার।
- আধুনিক জিপিইউ হার্ডওয়্যারের থ্রুপুট সর্বোচ্চ করতে FP8 ট্রেনিং ও ইনফারেন্সের সাপোর্ট।
- হাজার হাজার কনকারেন্ট ওয়েব কুয়েরি সামলাতে সক্ষম রিয়েল-টাইম RAG পাইপলাইনের ইন্টিগ্রেশন।
- নিরাপদ পরিবেশে লোকাল ডেপ্লয়মেন্টের জন্য ওপেন ওয়েটের প্রাপ্যতা।
সিলেক্টিভ ইন্টেলিজেন্সের ভবিষ্যৎ
DeepSeek এবং Perplexity-এর উত্থান একটি আরও পরিপক্ক এআই মার্কেটের সূচনা। আমরা কথা বলতে পারা মডেলের নতুনত্ব থেকে সরে এসে কার্যকরভাবে কাজ করতে পারা মডেলের উপযোগিতার দিকে যাচ্ছি। ভরকেন্দ্র এখন সেই প্রোভাইডারদের দিকে সরছে যারা টেকসই মূল্যে উচ্চমানের ফলাফল দিতে পারে। এটি কেবল বর্তমান 2026 এর ট্রেন্ড নয়, বরং ডিজিটাল সেবা তৈরি ও ব্যবহারের দীর্ঘমেয়াদী পরিবর্তন। প্রথাগত সার্চ এবং দামী মডেল প্রোভাইডারদের ওপর চাপ বাড়বে কারণ এই চ্যালেঞ্জাররা তাদের প্রোডাক্ট আরও উন্নত করছে। ইউজারের জন্য এর মানে হলো আরও বেশি পছন্দ এবং ভালো টুল। ইন্ডাস্ট্রির জন্য এর মানে হলো ব্রুট ফোর্স কম্পিউটেশনের চেয়ে ইঞ্জিনিয়ারিং এক্সিলেন্সের ওপর নতুন করে মনোযোগ। আসল বিজয়ী তারাই হবে যারা হাইপ সাইকেলের শোরগোল এবং টেক ইকোনমির প্রকৃত কাঠামোগত পরিবর্তনের সংকেত আলাদা করতে পারবে।
সম্পাদকের মন্তব্য: আমরা এই সাইটটি একটি বহুভাষিক এআই সংবাদ এবং নির্দেশিকা কেন্দ্র হিসাবে তৈরি করেছি তাদের জন্য যারা কম্পিউটার বিশেষজ্ঞ নন, কিন্তু তবুও কৃত্রিম বুদ্ধিমত্তা বুঝতে চান, এটিকে আরও আত্মবিশ্বাসের সাথে ব্যবহার করতে চান এবং যে ভবিষ্যত ইতিমধ্যেই আসছে, তা অনুসরণ করতে চান।
কোনো ত্রুটি বা সংশোধনের প্রয়োজন এমন কিছু খুঁজে পেয়েছেন? আমাদের জানান।