২০২৬ সালে এলএলএম (LLM) বাজার যেভাবে বিভক্ত হচ্ছে
মনোলিথিক এআই মডেলের যুগ তার স্বাভাবিক সীমায় পৌঁছে গেছে। গত কয়েক বছর ধরে, প্রযুক্তি শিল্প একটি সাধারণ ধারণার ওপর ভিত্তি করে কাজ করেছে যে, আরও বেশি প্যারামিটার এবং ডেটা অনিবার্যভাবে প্রতিটি ব্যবহারের ক্ষেত্রে ভালো ফলাফল দেবে। সেই ধারণাটি 2026 সালে ভেঙে পড়ে, যখন বাজার দুটি ভিন্ন এবং বিপরীতমুখী দিকে বিভক্ত হতে শুরু করে। আমরা এখন আর লার্জ ল্যাঙ্গুয়েজ মডেলের জন্য একটি মাত্র পথ দেখছি না। পরিবর্তে, আমরা গভীর যুক্তিনির্ভর বিশাল ক্লাউড-ভিত্তিক সিস্টেম এবং ব্যক্তিগত হার্ডওয়্যারে চলা ছোট, অত্যন্ত দক্ষ মডেলের মধ্যে বিভাজন দেখতে পাচ্ছি। এই পরিবর্তনটি কেবল প্রযুক্তিগত মানদণ্ড সম্পর্কে নয়। এটি ব্যবসা এবং ব্যক্তিরা কীভাবে তাদের অর্থ ব্যয় করতে পছন্দ করে এবং তারা তাদের ডেটা কোথায় রাখতে ভরসা পায়, তা নিয়ে। পছন্দটি এখন আর কোনটি সবচেয়ে বুদ্ধিমান মডেল তা নয়, বরং কোনটি কাজের জন্য সঠিক আকারের মডেল। এই বিভাজন বোঝা যে কারো জন্যই অপরিহার্য, যারা সর্বশেষ এআই ইন্ডাস্ট্রি ট্রেন্ড ট্র্যাক করার চেষ্টা করছেন, কারণ খেলার নিয়ম চিরতরে বদলে গেছে।
জেনারেলিস্ট যুগের সমাপ্তি
এই বিভাজনের প্রথম অংশটি হলো ফ্রন্টিয়ার মডেল। এগুলো প্রাথমিক জিপিটি সিস্টেমের উত্তরসূরি, কিন্তু তারা অনেক বেশি বিশেষায়িত কিছুতে বিবর্তিত হয়েছে। OpenAI-এর মতো কোম্পানিগুলো এমন মডেলের দিকে এগিয়ে যাচ্ছে যা কেন্দ্রীয় যুক্তি ইঞ্জিন হিসেবে কাজ করে। এই সিস্টেমগুলো বিশাল সার্ভার ফার্ম ছাড়া অন্য কোথাও চালানোর জন্য খুব বড়। এগুলো জটিল সমস্যা সমাধানের জন্য ডিজাইন করা হয়েছে, যেমন মাল্টি-স্টেপ বৈজ্ঞানিক গবেষণা, উন্নত কোডিং আর্কিটেকচার এবং উচ্চ-স্তরের কৌশলগত পরিকল্পনা। এগুলো শিল্পের ব্যয়বহুল, উচ্চ-শক্তির মস্তিষ্ক। তবে, এই দানবগুলো শেষ পর্যন্ত প্রতিটি সাধারণ কাজ সামলাবে—এমন জনধারণা বাস্তবতার সাথে ক্রমশ অসামঞ্জস্যপূর্ণ হয়ে উঠছে। বেশিরভাগ মানুষের একটি সাধারণ মেমো তৈরি বা ক্যালেন্ডার গুছিয়ে রাখার জন্য ট্রিলিয়ন-প্যারামিটার মডেলের প্রয়োজন নেই। এই উপলব্ধিই বাজারের দ্বিতীয় অংশের জন্ম দিয়েছে: স্মল ল্যাঙ্গুয়েজ মডেল (SLM)।
স্মল ল্যাঙ্গুয়েজ মডেল বা এসএলএম হলো ২০২৬ সালের ইউটিলিটি প্লেয়ার। এই মডেলগুলো হালকা হওয়ার জন্য ডিজাইন করা হয়েছে। এগুলোর প্যারামিটার প্রায়ই দশ বিলিয়নের নিচে থাকে, যা তাদের একটি হাই-এন্ড স্মার্টফোন বা আধুনিক ল্যাপটপে স্থানীয়ভাবে চলার সুযোগ দেয়। শিল্পটি এখন এই ধারণা থেকে সরে এসেছে যে একটি মডেলকে কার্যকর হতে হলে বিশ্বের ইতিহাসের সবকিছু জানতে হবে। পরিবর্তে, ডেভেলপাররা এই ছোট সিস্টেমগুলোকে উচ্চ-মানের, কিউরেটেড ডেটাসেটে প্রশিক্ষণ দিচ্ছেন যা যৌক্তিক সিদ্ধান্ত বা পরিষ্কার গদ্যের মতো নির্দিষ্ট দক্ষতার ওপর ফোকাস করে। ফলাফল হলো এমন একটি বাজার যেখানে সবচেয়ে মূল্যবান টুলটি প্রায়শই সেটি, যা চালাতে সবচেয়ে কম খরচ হয়। এই বিভাজন কম্পিউটেশনের আকাশচুম্বী খরচ এবং গোপনীয়তার ক্রমবর্ধমান চাহিদার দ্বারা চালিত। ব্যবহারকারীরা বুঝতে শুরু করেছেন যে প্রতিটি কি-স্ট্রোক ক্লাউড সার্ভারে পাঠানো ধীরগতির এবং ঝুঁকিপূর্ণ উভয়ই।
সার্বভৌম কম্পিউটের ভূ-রাজনীতি
এই বাজার বিভাজনের বৈশ্বিক ক্ষমতার গতিশীলতার ওপর গভীর প্রভাব রয়েছে। আমরা সার্বভৌম কম্পিউটের উত্থান দেখছি, যেখানে দেশগুলো সিলিকন ভ্যালির মুষ্টিমেয় সরবরাহকারীদের ওপর নির্ভর করতে আর সন্তুষ্ট নয়। ইউরোপ এবং এশিয়ার দেশগুলো স্থানীয় মডেল হোস্ট করার জন্য তাদের নিজস্ব অবকাঠামোতে প্রচুর বিনিয়োগ করছে। লক্ষ্য হলো এটি নিশ্চিত করা যে সংবেদনশীল জাতীয় ডেটা যেন কখনোই তাদের সীমানা ছাড়িয়ে না যায়। এটি ফ্রন্টিয়ার মডেলের বিশাল শক্তি এবং হার্ডওয়্যারের চাহিদার সরাসরি প্রতিক্রিয়া। প্রতিটি দেশ বৃহত্তম সিস্টেমের জন্য প্রয়োজনীয় বিশাল ডেটা সেন্টার তৈরি করার সামর্থ্য রাখে না, তবে প্রায় যেকোনো দেশই ছোট, বিশেষায়িত মডেলের নেটওয়ার্ক সমর্থন করতে পারে। এটি একটি বৈচিত্র্যময় ইকোসিস্টেমের দিকে পরিচালিত করেছে যেখানে বিভিন্ন অঞ্চল তাদের নির্দিষ্ট অর্থনৈতিক চাহিদা এবং নিয়ন্ত্রক কাঠামোর ওপর ভিত্তি করে বিভিন্ন আর্কিটেকচারকে অগ্রাধিকার দেয়।
এই মডেলগুলোর সাপ্লাই চেইনও ভিন্নমুখী হচ্ছে। যদিও বিশাল মডেলগুলোর জন্য NVIDIA-এর সর্বশেষ এবং সবচেয়ে ব্যয়বহুল চিপ প্রয়োজন, ছোট মডেলগুলোকে কনজিউমার-গ্রেড হার্ডওয়্যারে চালানোর জন্য অপ্টিমাইজ করা হচ্ছে। এটি বুদ্ধিমত্তার অ্যাক্সেসকে এমনভাবে গণতান্ত্রিক করছে যা এআই বুমের শুরুর দিকে ছিল না। একটি উন্নয়নশীল অর্থনীতির স্টার্টআপ এখন ফ্রন্টিয়ার সিস্টেমের এপিআই সাবস্ক্রিপশনের খরচের ভগ্নাংশে একটি ছোট, ওপেন-সোর্স মডেল ফাইন-টিউন করতে পারে। এই পরিবর্তনটি ক্লাউড ক্রেডিটে বিশাল অগ্রিম বিনিয়োগ ছাড়াই স্থানীয় উদ্ভাবনকে বিকশিত করার সুযোগ দিয়ে ডিজিটাল বৈষম্য কমিয়ে আনছে। এর বৈশ্বিক প্রভাব হলো একটি কেন্দ্রীভূত এআই একচেটিয়া আধিপত্য থেকে সরে এসে মেশিন ইন্টেলিজেন্সের আরও বিতরণকৃত এবং স্থিতিস্থাপক নেটওয়ার্কের দিকে যাত্রা, যা স্থানীয় ভাষা এবং সাংস্কৃতিক সূক্ষ্মতাকে প্রতিফলিত করে।
হাইব্রিড ইন্টেলিজেন্সের যুগে একটি মঙ্গলবার
এটি বাস্তবে কীভাবে কাজ করে তা দেখতে, ২০২৬ সালের একজন পেশাজীবীর একটি সাধারণ দিনের কথা বিবেচনা করুন। মার্কাসের সাথে পরিচিত হোন, যিনি একটি মাঝারি আকারের ফার্মের সফটওয়্যার ইঞ্জিনিয়ার। মার্কাস যখন তার দিন শুরু করেন, তিনি তার কোড এডিটর খোলেন। তিনি তার রুটিন কাজের জন্য ক্লাউড-ভিত্তিক অ্যাসিস্ট্যান্ট ব্যবহার করেন না। পরিবর্তে, একটি ছোট, তিন-বিলিয়ন প্যারামিটার মডেল তার ওয়ার্কস্টেশনে স্থানীয়ভাবে চলে। এই মডেলটি বিশেষভাবে তার কোম্পানির প্রাইভেট কোডবেসের ওপর প্রশিক্ষণপ্রাপ্ত। এটি রিয়েল-টাইমে কোনো ল্যাটেন্সি ছাড়াই কোড সম্পূর্ণ করার পরামর্শ দেয় এবং সিনট্যাক্স ত্রুটি ঠিক করে। মডেলটি স্থানীয় হওয়ায়, মার্কাসকে তার কোম্পানির ইন্টেলেকচুয়াল প্রপার্টি তৃতীয় পক্ষের কাছে ফাঁস হওয়ার বিষয়ে চিন্তা করতে হয় না। এটি ছোট মডেলের কার্যকারিতা। এটি দ্রুত, ব্যক্তিগত এবং কোডিংয়ের পুনরাবৃত্তিমূলক প্রকৃতির জন্য নিখুঁতভাবে উপযুক্ত। এটি ইন্টারনেটে সংযোগ না করেই তার কাজের ৮০ শতাংশ সামলায়।
বিকেলের দিকে, মার্কাস একটি বাধার সম্মুখীন হন। তাকে একটি নতুন সিস্টেম আর্কিটেকচার ডিজাইন করতে হবে যাতে জটিল ডেটা মাইগ্রেশন এবং উচ্চ-স্তরের সিকিউরিটি প্রোটোকল জড়িত। এখানেই বাজারের বিভাজন দৃশ্যমান হয়। তার স্থানীয় মডেলটি এই উচ্চ-ঝুঁকিপূর্ণ আর্কিটেকচারাল সিদ্ধান্তগুলো নেওয়ার মতো যথেষ্ট শক্তিশালী নয়। মার্কাস তখন একটি ফ্রন্টিয়ার মডেলে স্যুইচ করেন। তিনি তার নির্দিষ্ট প্রয়োজনীয়তাগুলো একটি বিশাল রিজনিং ইঞ্জিনের সুরক্ষিত ক্লাউড ইনস্ট্যান্সে আপলোড করেন। এই সিস্টেমটি, যার প্রতি কুয়েরিতে খরচ উল্লেখযোগ্যভাবে বেশি, হাজার হাজার সম্ভাব্য ব্যর্থতার পয়েন্ট বিশ্লেষণ করে এবং একটি শক্তিশালী পরিকল্পনা প্রস্তাব করে। মার্কাস ৩০ মিনিটের গভীর কাজের জন্য ব্যয়বহুল, উচ্চ-শক্তির মডেলটি ব্যবহার করেন, তারপর বাস্তবায়নের জন্য আবার তার স্থানীয় মডেলে ফিরে আসেন। এই হাইব্রিড ওয়ার্কফ্লো আইনি পরিষেবা থেকে চিকিৎসা গবেষণা পর্যন্ত প্রতিটি শিল্পে স্ট্যান্ডার্ড হয়ে উঠছে।
চিকিৎসা ক্ষেত্রে, একজন ডাক্তার পরামর্শের সময় রোগীর নোট সংক্ষিপ্ত করতে একটি স্থানীয় মডেল ব্যবহার করতে পারেন। এটি নিশ্চিত করে যে সংবেদনশীল স্বাস্থ্য ডেটা ক্লিনিকের প্রাইভেট নেটওয়ার্কের মধ্যেই থাকে। তবে, যদি সেই একই ডাক্তারকে সর্বশেষ বৈশ্বিক অনকোলজি গবেষণার বিপরীতে রোগীর বিরল লক্ষণগুলো ক্রস-রেফারেন্স করতে হয়, তবে তারা একটি ফ্রন্টিয়ার মডেলের শরণাপন্ন হবেন। এই বিভাজন গতি এবং গভীরতার মধ্যে ভারসাম্য বজায় রাখার সুযোগ দেয়। মানুষ প্রায়শই দৈনন্দিন জীবনের জন্য বিশাল মডেলগুলোর প্রয়োজনীয়তাকে বাড়িয়ে দেখে, অথচ ছোট মডেলগুলো কতটা উন্নত হয়েছে তা কমিয়ে দেখে। বাস্তবতা হলো, 2026-এ সবচেয়ে চিত্তাকর্ষক অর্জনগুলো এসেছে বড় মডেলগুলোকে আরও বড় করার চেয়ে ছোট মডেলগুলোকে আরও স্মার্ট করার মাধ্যমে। এই প্রবণতা এআই-কে ভবিষ্যতের অভিনবত্বের চেয়ে বিদ্যুৎ বা হাই-স্পিড ইন্টারনেটের মতো একটি স্ট্যান্ডার্ড ইউটিলিটির মতো অনুভব করাচ্ছে।
BotNews.today কন্টেন্ট গবেষণা, লেখা, সম্পাদনা এবং অনুবাদের জন্য এআই টুল ব্যবহার করে। আমাদের দল তথ্যকে দরকারী, স্পষ্ট এবং নির্ভরযোগ্য রাখতে প্রক্রিয়াটি পর্যালোচনা ও তত্ত্বাবধান করে।
আপনার কি কোনো এআই গল্প, টুল, প্রবণতা, বা প্রশ্ন আছে যা আপনার মনে হয় আমাদের কভার করা উচিত? আপনার প্রবন্ধের ধারণা আমাদের পাঠান — আমরা তা শুনতে আগ্রহী।
সিন্থেটিক লজিকের লুকানো ট্যাক্স
আমরা যখন এই বিভক্ত বাজারের গভীরে প্রবেশ করছি, তখন আমাদের এই প্রযুক্তির দীর্ঘমেয়াদী ব্যয় সম্পর্কে কঠিন প্রশ্ন করতে হবে। একটি বড় উদ্বেগ হলো ফ্রন্টিয়ার মডেলের পরিবেশগত প্রভাব। যদিও ছোট মডেলগুলো দক্ষ, বিশাল সিস্টেমগুলো প্রচুর পরিমাণে জল এবং বিদ্যুৎ খরচ করে চলেছে। আমরা কি এমন একটি সিস্টেম তৈরি করছি যা টেকসই, নাকি আমরা দ্রুত সফটওয়্যারের বিনিময়ে আমাদের পরিবেশগত ভবিষ্যৎ বিসর্জন দিচ্ছি? ডেটা প্রোভেন্যান্সের প্রশ্নও রয়েছে। মডেলগুলো যত বেশি বিশেষায়িত হচ্ছে, উচ্চ-মানের ডেটার চাহিদাও তত বাড়ছে। এটি একটি গোপনীয় বাজারের দিকে পরিচালিত করেছে যেখানে ডেটা পণ্যের মতো কেনা-বেচা হয়। এই সিস্টেমগুলোকে প্রশিক্ষণ দেওয়া তথ্যের প্রকৃত মালিক কে? যদি একটি মডেল ইন্টারনেটের সম্মিলিত জ্ঞানের ওপর প্রশিক্ষণপ্রাপ্ত হয়, তবে সেই মডেলের সুবিধা কি একটি একক কর্পোরেশনের হওয়া উচিত?
আমাদের লজিক সাইলোর ঝুঁকিও বিবেচনা করতে হবে। যদি কোনো কোম্পানি তার নিজস্ব ডেটার ওপর প্রশিক্ষণপ্রাপ্ত একটি ছোট, স্থানীয় মডেলের ওপর সম্পূর্ণভাবে নির্ভর করে, তবে কি এটি উদ্ভাবনের ক্ষমতা হারায়? একটি বিপদ আছে যে এই বিশেষায়িত সিস্টেমগুলো চিন্তার ইকো চেম্বার তৈরি করবে, যেখানে এআই কেবল কোম্পানি যা জানে তা-ই শক্তিশালী করবে। অধিকন্তু, যারা ফ্রন্টিয়ার মডেল কিনতে পারে এবং যারা পারে না তাদের মধ্যে বিভাজন তথ্যের অসমতার একটি নতুন শ্রেণি তৈরি করতে পারে। MIT Technology Review অনুযায়ী, সবচেয়ে উন্নত সিস্টেমগুলো প্রশিক্ষণের খরচ প্রতি কয়েক মাসে দ্বিগুণ হচ্ছে। এটি এমন একটি ভবিষ্যতের দিকে নিয়ে যেতে পারে যেখানে কেবল ধনী দেশ এবং কর্পোরেশনগুলোর কাছেই মেশিন রিজনিংয়ের সর্বোচ্চ স্তরের অ্যাক্সেস থাকবে। আমাদের জিজ্ঞাসা করতে হবে যে স্থানীয় এআই-এর সুবিধা কি বৈশ্বিক জ্ঞানের সম্ভাব্য খণ্ডবিখণ্ড হওয়ার যোগ্য?
হুডের নিচের সিলিকন
পাওয়ার ইউজারদের জন্য, বাজারের বিভাজন প্রযুক্তিগত সীমাবদ্ধতা এবং ডেপ্লয়মেন্ট কৌশলের দ্বারা সংজ্ঞায়িত। সবচেয়ে উল্লেখযোগ্য পরিবর্তন হলো স্থানীয় ইনফারেন্সের দিকে স্থানান্তর। vLLM এবং llama.cpp-এর মতো টুলগুলো এমন হার্ডওয়্যারে অত্যাধুনিক মডেল চালানো সম্ভব করেছে যা আগে দুর্বল বলে বিবেচিত হতো। এটি কোয়ান্টাইজেশনের মাধ্যমে অর্জন করা হয়, এমন একটি প্রক্রিয়া যা মেমরি বাঁচাতে মডেলের ওজনের নির্ভুলতা হ্রাস করে। একটি মডেল যার জন্য মূলত ৪০জিবি ভিআরএএম (VRAM) প্রয়োজন ছিল, তা এখন নির্ভুলতার সামান্য ক্ষতিসহ ১২জিবি-তে চলতে পারে। এটি ডেভেলপারদের ওয়ার্কফ্লো বদলে দিয়েছে, যারা এখন তাদের স্থানীয় পরিবেশের জন্য মডেলের ৪-বিট বা ৮-বিট কোয়ান্টাইজড সংস্করণকে অগ্রাধিকার দেয়। ফোকাস এখন কাঁচা প্যারামিটার সংখ্যা থেকে কনজিউমার হার্ডওয়্যারে টোকেন-প্রতি-সেকেন্ড পারফরম্যান্সের দিকে সরে গেছে।
এপিআই লিমিট এবং রেট থ্রটলিংও কোম্পানিগুলো কীভাবে তাদের মডেল বেছে নেয় তার একটি বড় কারণ হয়ে দাঁড়িয়েছে। ফ্রন্টিয়ার সরবরাহকারীরা ক্রমশ টায়ার্ড অ্যাক্সেসের দিকে ঝুঁকছে, যেখানে সবচেয়ে সক্ষম মডেলগুলো উচ্চ-বেতনভোগী এন্টারপ্রাইজ ক্লায়েন্টদের জন্য সংরক্ষিত। এটি ছোট স্টার্টআপগুলোকে লোকাল-ফার্স্ট কৌশল গ্রহণ করতে বাধ্য করেছে। তারা তাদের প্রসেসিংয়ের বেশিরভাগের জন্য স্থানীয় মডেল ব্যবহার করে এবং শুধুমাত্র যখন একেবারে প্রয়োজন তখনই ব্যয়বহুল এপিআই ব্যবহার করে। এর জন্য একটি জটিল অর্কেস্ট্রেশন লেয়ার প্রয়োজন যা প্রম্পটের অসুবিধার ওপর ভিত্তি করে সবচেয়ে দক্ষ মডেলে কাজগুলো রুট করতে পারে। স্থানীয় স্টোরেজও ফিরে আসছে। ক্লাউড-ভিত্তিক ভেক্টর ডেটাবেসের ওপর নির্ভর করার পরিবর্তে, অনেক ব্যবহারকারী এখন স্থানীয় RAG (Retrieval-Augmented Generation) সিস্টেম চালাচ্ছেন। এটি তাদের নিজস্ব নথিপত্র অনুসন্ধান করতে এবং তৃতীয় পক্ষের কাছে সেই ডেটা না পাঠিয়েই তাদের মডেলগুলোকে কনটেক্সট প্রদান করতে দেয়। বাজারের গিক সেকশন এখন আর কার মডেল সবচেয়ে বড় তা নিয়ে আচ্ছন্ন নয়, বরং কার স্ট্যাক সবচেয়ে দক্ষ তা নিয়ে ব্যস্ত।
পছন্দের নতুন যুক্তি
এলএলএম বাজারের বিভাজন পরিপক্কতার লক্ষণ। আমরা সেই হানিমুন পর্যায় পার করেছি যেখানে প্রতিটি নতুন মডেলকে অবিবেচক বিস্ময়ের সাথে স্বাগত জানানো হতো। আজ, ব্যবহারকারীরা আরও বেশি সংশয়বাদী এবং বাস্তববাদী। তারা জানতে চায় যে একটি মডেল তাদের সময় বাঁচাবে কিনা এবং এটি তাদের গোপনীয়তা রক্ষা করবে কিনা। বিশাল ক্লাউড ইঞ্জিন এবং হালকা স্থানীয় মডেলের মধ্যে পার্থক্য এই চাহিদাগুলোর একটি প্রতিক্রিয়া। এটি একটি স্বীকৃতি যে বুদ্ধিমত্তা কোনো একক জিনিস নয়, বরং সক্ষমতার একটি বর্ণালী যা সঠিক পরিবেশের সাথে মেলানো আবশ্যক। সবচেয়ে সফল কোম্পানিগুলো তারাই হবে যারা এই বিভাজনটি নেভিগেট করতে পারবে, কৌশলের জন্য জায়ান্টদের এবং কার্যকর করার জন্য ছোট মডেলগুলোকে ব্যবহার করবে। যে প্রশ্নটি রয়ে গেছে তা হলো, এই দুই ধরনের মডেলের মধ্যে ব্যবধান কি বাড়তে থাকবে নাকি কোনো নতুন আর্কিটেকচারাল ব্রেকথ্রু শেষ পর্যন্ত তাদের পুনরায় একত্রিত করবে। আপাতত, বাজার তার পক্ষ বেছে নিচ্ছে এবং বিশেষায়িত মডেলের যুগ সত্যিই এসে গেছে।
সম্পাদকের মন্তব্য: আমরা এই সাইটটি একটি বহুভাষিক এআই সংবাদ এবং নির্দেশিকা কেন্দ্র হিসাবে তৈরি করেছি তাদের জন্য যারা কম্পিউটার বিশেষজ্ঞ নন, কিন্তু তবুও কৃত্রিম বুদ্ধিমত্তা বুঝতে চান, এটিকে আরও আত্মবিশ্বাসের সাথে ব্যবহার করতে চান এবং যে ভবিষ্যত ইতিমধ্যেই আসছে, তা অনুসরণ করতে চান।
কোনো ত্রুটি বা সংশোধনের প্রয়োজন এমন কিছু খুঁজে পেয়েছেন? আমাদের জানান।