প্রতিষ্ঠাতা, সমালোচক এবং গবেষক: যে আলোচনাগুলো পড়া জরুরি
অধিকাংশ মানুষ OpenAI-এর CEO-এর নাম জানেন। কিন্তু লার্জ ল্যাঙ্গুয়েজ মডেলের বর্তমান যুগকে সংজ্ঞায়িত করা গবেষণাপত্রগুলোর লেখকদের নাম খুব কম মানুষই জানেন। জ্ঞানের এই ঘাটতি প্রযুক্তি কীভাবে আসলে এগিয়ে যাচ্ছে, সে সম্পর্কে একটি বিকৃত ধারণা তৈরি করে। আমরা কৃত্রিম বুদ্ধিমত্তাকে একগুচ্ছ প্রোডাক্ট লঞ্চ হিসেবে দেখি, অথচ এটি আসলে গাণিতিক সাফল্যের একটি ধীর গতির সঞ্চয়। প্রতিষ্ঠাতারা মূলধন এবং পাবলিক ন্যারেটিভ বা জনমত নিয়ন্ত্রণ করেন। গবেষকরা নিয়ন্ত্রণ করেন ওয়েট এবং লজিক। এই পার্থক্য বোঝাটাই মার্কেটিংয়ের ধোঁয়াশা ভেদ করার একমাত্র উপায়। আপনি যদি কেবল প্রতিষ্ঠাতাদের অনুসরণ করেন, তবে আপনি একটি সিনেমা দেখছেন। আর যদি গবেষকদের অনুসরণ করেন, তবে আপনি স্ক্রিপ্টটি পড়ছেন। এই নিবন্ধটি আলোচনা করবে কেন এই পার্থক্যটি গুরুত্বপূর্ণ এবং কীভাবে এমন সংকেতগুলো শনাক্ত করা যায় যা আসলে ইন্ডাস্ট্রির ভবিষ্যৎ নির্ধারণ করে। আমরা চারিসম্যাটিক বক্তৃতার বাইরে গিয়ে ল্যাবের শীতল বাস্তবতার দিকে নজর দেব। এখন সময় এসেছে কেবল প্রেস রিলিজে স্বাক্ষরকারীদের নয়, বরং যারা কোড লেখেন তাদের ওপর মনোযোগ দেওয়ার।
মেশিন যুগের অদৃশ্য স্থপতিরা
প্রতিষ্ঠাতারা হলেন পাবলিক ফেস বা পরিচিত মুখ। তারা ওয়ার্ল্ড ইকোনমিক ফোরামে কথা বলেন এবং কংগ্রেসের সামনে সাক্ষ্য দেন। তাদের কাজ হলো বিলিয়ন বিলিয়ন ডলারের ফান্ডিং নিশ্চিত করা এবং এমন একটি ব্র্যান্ড তৈরি করা যা অনিবার্য মনে হয়। তারা এমন শব্দ ব্যবহার করেন যা জাদুর মতো শোনায়। গবেষকরা আলাদা। তারা Python এবং LaTeX-এ কাজ করেন। তারা লস ফাংশন এবং টোকেন এফিসিয়েন্সি নিয়ে ভাবেন। একজন প্রতিষ্ঠাতা হয়তো বলবেন তাদের মডেল চিন্তা করছে। একজন গবেষক আপনাকে বলবেন, এটি নির্দিষ্ট প্রবাবিলিটি ডিস্ট্রিবিউশনের ওপর ভিত্তি করে পরবর্তী সম্ভাব্য শব্দটি অনুমান করছে। বিভ্রান্তিটা তৈরি হয় কারণ মিডিয়া এই দুটি গ্রুপকে একই মনে করে। যখন একজন CEO বলেন যে একটি মডেল জলবায়ু পরিবর্তন সমাধান করবে, তখন এটি একটি সেলস পিচ। যখন একজন গবেষক স্পার্স অটোএনকোডার নিয়ে পেপার প্রকাশ করেন, তখন এটি একটি টেকনিক্যাল দাবি। একটি হলো আশা, অন্যটি হলো সত্য।
জনসাধারণ প্রায়ই আশাকে সত্য বলে ভুল করে। এটি অতিরিক্ত প্রতিশ্রুতি এবং কম ডেলিভারির একটি চক্র তৈরি করে। এই ক্ষেত্রটি বোঝার জন্য, আপনাকে গাড়ি বিক্রেতাকে গাড়িটির ইঞ্জিনের ডিজাইনার থেকে আলাদা করতে হবে। ইঞ্জিন ডিজাইনার জানেন কোথায় বোল্ট ঢিলে আছে। বিক্রেতা আপনাকে কখনোই ঢিলে বোল্টের কথা বলবে না কারণ তার কাজ হলো স্টকের দাম বেশি রাখা। প্রতিবার নতুন মডেল আসার সময় আমরা এটি ঘটতে দেখি। প্রতিষ্ঠাতা হাইপ তৈরি করতে একটি রহস্যময় টুইট করেন। গবেষক arXiv-এ একটি টেকনিক্যাল রিপোর্টের লিঙ্ক পোস্ট করেন। টুইটটি দশ লক্ষ ভিউ পায়। টেকনিক্যাল রিপোর্টটি পড়েন মাত্র কয়েক হাজার মানুষ যারা আসলে জিনিসপত্র তৈরি করেন। এটি একটি ফিডব্যাক লুপ তৈরি করে যেখানে সবচেয়ে উচ্চকণ্ঠরা বাকি সবার জন্য বাস্তবতা নির্ধারণ করে দেয়।
উদ্ভাবনের পাবলিক ফেসের বাইরে
এই বিভাজন বৈশ্বিক নীতির ওপর বিশাল প্রভাব ফেলে। সরকারগুলো বর্তমানে প্রতিষ্ঠাতাদের সতর্কবার্তার ওপর ভিত্তি করে আইন তৈরি করছে। এই প্রতিষ্ঠাতারা প্রায়ই অস্তিত্বের ঝুঁকির কথা বলেন যা সায়েন্স ফিকশনের মতো মনে হয়। এটি বর্তমান ক্ষতির চেয়ে কাল্পনিক ভবিষ্যতের ওপর মনোযোগ ধরে রাখে। এদিকে, গবেষকরা ডেটা বায়াস এবং শক্তি খরচের মতো তাৎক্ষণিক সমস্যাগুলোর দিকে আঙুল তুলছেন। বিখ্যাত নামগুলোর কথা শুনে আমরা ভুল বিষয়গুলোকে নিয়ন্ত্রণ করার ঝুঁকি নিচ্ছি। আমরা হয়তো ভবিষ্যতের কোনো সুপারইন্টেলিজেন্সকে নিষিদ্ধ করতে পারি, কিন্তু এটি উপেক্ষা করছি যে বর্তমান মডেলগুলো তাদের ডেটা সেন্টার ঠান্ডা রাখতে ছোট ছোট শহরের পানির স্তর শুকিয়ে ফেলছে। এটি কেবল আমেরিকার সমস্যা নয়। ইউরোপ এবং এশিয়ায় একই গতিশীলতা বিদ্যমান।
যাদের মার্কেটিং বাজেট সবচেয়ে বেশি, তাদের কণ্ঠস্বরই সবচেয়ে বেশি শোনা যায়। এটি একটি ‘উইনার টেক অল’ পরিবেশ তৈরি করে যেখানে কয়েকটি কোম্পানি পুরো পৃথিবীর এজেন্ডা নির্ধারণ করে। যদি আমরা আমাদের দৃষ্টিভঙ্গি প্রসারিত না করি, তবে আমরা সিলিকন ভ্যালির হাতেগোনা কয়েকজনকে নির্ধারণ করতে দিচ্ছি যে কী নিরাপদ এবং কী সম্ভব। ক্ষমতার এই কেন্দ্রীকরণ নিজেই একটি ঝুঁকি। এটি এমন একটি ক্ষেত্রে চিন্তার বৈচিত্র্যকে সীমাবদ্ধ করে যেখানে এটি সবচেয়ে বেশি প্রয়োজন। সান ফ্রান্সিসকোর মানুষের পাশাপাশি টরন্টো ইউনিভার্সিটি বা টোকিও ল্যাবের মানুষের কথা শোনাও আমাদের দরকার। বৈজ্ঞানিক অগ্রগতি একটি বৈশ্বিক প্রচেষ্টা, কিন্তু ন্যারেটিভটি বর্তমানে একটি স্থানীয় একচেটিয়া ব্যবসা। কর্পোরেট বোর্ডরুমের বাইরে যে প্রকৃত অগ্রগতি হচ্ছে তা দেখতে আমাদের Nature-এর মতো জার্নালগুলোর দিকে তাকাতে হবে।
পৃথিবী কেন ভুল মানুষের কথা শোনে
একটি বড় ল্যাবের প্রধান গবেষকের জীবনের একটি দিনের কথা ভাবুন। তারা ঘুম থেকে উঠে এমন একটি ট্রেনিং রানের ফলাফল দেখেন যার পেছনে খরচ হয়েছে ত্রিশ লক্ষ ডলার। তারা দেখেন মডেলটি প্রত্যাশার চেয়ে বেশি হ্যালুসিনেশন করছে। তারা দশ ঘণ্টা সময় ব্যয় করেন ডেটা ক্লাস্টারগুলো দেখে নয়েজ খুঁজে বের করতে। তারা ২০২৪ সালের নির্বাচন বা মানবতার ভাগ্য নিয়ে ভাবছেন না। তারা ভাবছেন কেন মডেলটি জটিল বাক্যে নেতিবাচকতা বুঝতে ব্যর্থ হচ্ছে। তারা নিউরন অ্যাক্টিভেশনের হিট ম্যাপ দেখছেন। তাদের সাফল্য পরিমাপ করা হয় বিট পার ক্যারেক্টার বা নির্দিষ্ট বেঞ্চমার্কের নির্ভুলতার মাধ্যমে। এবার একজন প্রতিষ্ঠাতার দিনের কথা ভাবুন। তারা রাষ্ট্রপ্রধানের সাথে দেখা করতে প্রাইভেট জেটে আছেন। তারা নতুন অর্থনীতির ট্রিলিয়ন ডলারের সুযোগ নিয়ে কথা বলছেন।
গবেষক কাজ করেন ‘কীভাবে’ নিয়ে। প্রতিষ্ঠাতা কাজ করেন কেন এটি টাকার মূল্যের। একজন ডেভেলপার যিনি অ্যাপ তৈরি করছেন, তার কাছে গবেষকই বেশি গুরুত্বপূর্ণ। গবেষক নির্ধারণ করেন API ল্যাটেন্সি এবং কনটেক্সট উইন্ডো। প্রতিষ্ঠাতা নির্ধারণ করেন দাম। আপনি যদি ব্যবসা শুরু করতে চান, তবে আপনার জানা দরকার প্রযুক্তিটি আসলে তা করতে পারে কিনা যা প্রতিষ্ঠাতা বলছেন। প্রায়ই, তা পারে না। আমরা অটোনোমাস ড্রাইভিংয়ের শুরুর দিনগুলোতে এটি দেখেছি। প্রতিষ্ঠাতারা বলেছিলেন 2026 সালের মধ্যে আমাদের লক্ষ লক্ষ রোবোট্যাক্সি থাকবে। গবেষকরা জানতেন যে ভারী বৃষ্টিতে এজ কেসগুলো তখনও একটি অমীমাংসিত সমস্যা। জনসাধারণ প্রতিষ্ঠাতাদের বিশ্বাস করেছিল। গবেষকরাই সঠিক ছিলেন।
একই প্যাটার্ন জেনারেটিভ AI স্পেসেও পুনরাবৃত্তি হচ্ছে। আমাদের বলা হচ্ছে মডেলগুলো শীঘ্রই আইনজীবী এবং ডাক্তারদের জায়গা নেবে। আপনি যদি টেকনিক্যাল পেপারগুলো পড়েন, তবে দেখবেন মডেলগুলো এখনও মৌলিক যৌক্তিক সামঞ্জস্য বজায় রাখতে হিমশিম খাচ্ছে। ডেমো এবং বাস্তবতার মাঝখানের এই ফাঁকটিতেই কোম্পানিগুলো টাকা হারায়। আপনি কৃত্রিম বুদ্ধিমত্তার ট্রেন্ডের গভীরে গিয়ে দেখতে পারেন কীভাবে এই টেকনিক্যাল সীমাবদ্ধতাগুলো আজ পরীক্ষা করা হচ্ছে। এই পার্থক্যটিই একটি সঠিক বিনিয়োগ এবং একটি ফটকা বুদবুদের মধ্যে পার্থক্য। যখন আপনি নতুন কোনো দাবি শুনবেন, নিজেকে জিজ্ঞাসা করুন এটি কি কোনো পেপার থেকে এসেছে নাকি প্রেস রিলিজ থেকে। উত্তরটিই বলে দেবে সেটিকে কতটা গুরুত্ব দেবেন। MIT Technology Review-এর সাংবাদিকরা প্রায়ই ল্যাব এবং লবির মধ্যকার এই ব্যবধান তুলে ধরেন। আমাদের মনে রাখতে হবে যে প্রতিষ্ঠাতাদের ত্রুটিগুলো লুকানোর প্রণোদনা থাকে, যেখানে গবেষকদের প্রণোদনা থাকে সেগুলো খুঁজে বের করার। প্রথমটি হাইপ তৈরি করে এবং দ্বিতীয়টি সত্য তৈরি করে। দীর্ঘমেয়াদে, সত্যই একমাত্র জিনিস যা টিকে থাকে। আমরা 2026 সালে এটি দেখেছি যখন হাইপের প্রথম ঢেউ টেকনিক্যাল বাস্তবতার চাপে ঠান্ডা হতে শুরু করেছিল।
ল্যাবে একটি মঙ্গলবার বনাম বোর্ডরুম
উন্নয়নের বর্তমান পথ নিয়ে আমাদের কঠিন প্রশ্ন করতে হবে। প্রতিষ্ঠাতারা যে গবেষণার কথা বলছেন যা সবার উপকারে আসবে, তার খরচ কে দিচ্ছে? শীর্ষ গবেষকদের অধিকাংশই একাডেমিক জগত ছেড়ে প্রাইভেট ল্যাবে চলে গেছেন। এর মানে হলো তারা যে জ্ঞান তৈরি করছেন তা আর পাবলিক গুড বা জনকল্যাণমূলক নয়। এটি এখন একটি কর্পোরেট গোপন বিষয়। যখন কোনো পয়েন্ট প্রমাণ করার জন্য ব্যবহৃত ডেটা পেওয়ালের পেছনে লুকিয়ে রাখা হয়, তখন বৈজ্ঞানিক পদ্ধতির কী হয়? আমরা ওপেন সায়েন্স থেকে সরে এসে ক্লোজড প্রতিযোগিতামূলক সুবিধার মডেলের দিকে যেতে দেখছি। কয়েকজন ব্যক্তির খ্যাতি কি ক্ষেত্রটিকে সাহায্য করছে নাকি এটি এমন একটি পার্সোনালিটি কাল্ট তৈরি করছে যা ভিন্নমতকে নিরুৎসাহিত করে? যদি কোনো গবেষক ফ্ল্যাগশিপ মডেলে বড় কোনো ত্রুটি খুঁজে পান, তবে কোম্পানির ভ্যালুয়েশন কমে যাওয়ার ভয়ে তিনি কি তা রিপোর্ট করতে নিরাপদ বোধ করবেন?
BotNews.today কন্টেন্ট গবেষণা, লেখা, সম্পাদনা এবং অনুবাদের জন্য এআই টুল ব্যবহার করে। আমাদের দল তথ্যকে দরকারী, স্পষ্ট এবং নির্ভরযোগ্য রাখতে প্রক্রিয়াটি পর্যালোচনা ও তত্ত্বাবধান করে।
এই ফার্মগুলোর ওপর আর্থিক চাপ প্রচণ্ড। আমাদের পরিবেশগত খরচের কথাও বিবেচনা করতে হবে। সামান্য ভালো বেঞ্চমার্কের পেছনে ছোটা কি এই মডেলগুলো ট্রেনিং করার বিশাল কার্বন ফুটপ্রিন্টের যোগ্য? আমরা প্রায়ই পরিবেশের জন্য AI-এর সুবিধার কথা বলি, কিন্তু আমরা খুব কমই এমন কোনো খতিয়ান দেখি যা দুটির ভারসাম্য বজায় রাখে। পরিশেষে, এই মডেলগুলো যে সংস্কৃতির ওপর ভিত্তি করে ট্রেনিং করা হয়েছে তার মালিক কে? গবেষকরা ইন্টারনেট থেকে সংগৃহীত আউটপুট ব্যবহার করে তাদের সিস্টেম তৈরি করেন। প্রতিষ্ঠাতারা তখন সেই একই আউটপুটের একটি ডিস্টিলড বা পরিমার্জিত সংস্করণ অ্যাক্সেস করার জন্য জনগণের কাছ থেকে চার্জ নেন। এটি সম্পদের এমন একটি স্থানান্তর যা শিরোনামে খুব কমই আলোচিত হয়। এগুলো কেবল টেকনিক্যাল সমস্যা নয়। এগুলো সামাজিক এবং নৈতিক সংকট যার সমাধানের জন্য কেবল একটি ভালো অ্যালগরিদমের চেয়েও বেশি কিছু প্রয়োজন।
টেকনিক্যাল সীমাবদ্ধতা এবং স্থানীয় বাস্তবায়ন
যারা এই প্ল্যাটফর্মগুলোর ওপর ভিত্তি করে তৈরি করছেন, তাদের কাছে দর্শনের চেয়ে টেকনিক্যাল ডিটেইলস বেশি গুরুত্বপূর্ণ। বর্তমান API লিমিটগুলো এন্টারপ্রাইজ গ্রহণের ক্ষেত্রে একটি বড় বাধা। অধিকাংশ প্রোভাইডারের কঠোর রেট লিমিট থাকে যা হাই ভলিউম রিয়েল টাইম প্রসেসিংকে বাধা দেয়। এ কারণেই অনেক ফার্ম লোকাল স্টোরেজ এবং লোকাল এক্সিকিউশনের দিকে ঝুঁকছে। লোকাল হার্ডওয়্যারে Llama 3-এর মতো মডেল ব্যবহার করলে ডেটা প্রাইভেসি ভালো থাকে এবং দীর্ঘমেয়াদী খরচ কমে। তবে, হার্ডওয়্যারের প্রয়োজনীয়তা অনেক বেশি। ভালো গতিতে ৭০ বিলিয়ন প্যারামিটারের মডেল চালানোর জন্য আপনার উল্লেখযোগ্য VRAM সহ হাই-এন্ড GPU প্রয়োজন। এখানেই গিক সেকশন এবং ফিন্যান্সিয়াল সেকশন মিলিত হয়। H100 ক্লাস্টারের খরচ এমন একটি বাধা যা ক্ষমতাকে ধনীদের হাতেই রাখে।
আমরা স্পেশালাইজড ফাইন টিউনিংয়ের দিকেও একটি পরিবর্তন দেখছি। সবকিছুর জন্য একটি জেনারেল মডেল ব্যবহার করার পরিবর্তে, ডেভেলপাররা নির্দিষ্ট ডেটাসেটে ট্রেনিং করা ছোট মডেল ব্যবহার করছেন। এটি নির্ভুলতা বাড়ায় এবং টোকেন কাউন্ট কমায়। এখানে টেকনিক্যাল চ্যালেঞ্জ হলো ডেটা কিউরেশন। ইনপুট ডেটা যদি দুর্বল হয়, তবে ফাইন টিউন করা মডেলটি জেনারেল মডেলের চেয়েও খারাপ হবে। আমরা Retrieval Augmented Generation (RAG)-এর ব্যবহারও বেশি দেখছি যাতে মডেলগুলোকে বাস্তব ডেটার ওপর ভিত্তি করে গড়ে তোলা যায়। এটি বিশাল কনটেক্সট উইন্ডোর প্রয়োজনীয়তা এড়িয়ে যায় এবং হ্যালুসিনেশন কমায়। কিন্তু RAG-এর নিজস্ব সীমাবদ্ধতা আছে, বিশেষ করে রিট্রিভ করা ডকুমেন্টের র্যাঙ্কিং কীভাবে হ্যান্ডেল করা হয় তা নিয়ে। যদি সার্চ ধাপটি ব্যর্থ হয়, তবে মডেলের আউটপুট অকেজো। অধিকাংশ ব্যবহারকারী বুঝতে পারেন না যে AI-এর পারফরম্যান্স মডেলের মতোই সেই ডেটাবেসের ওপর নির্ভর করে যা থেকে এটি কোয়েরি করে।
তথ্যের জন্য চূড়ান্ত ফিল্টার
AI-এর ভবিষ্যৎ কোনো একক ব্যক্তির বলা একক গল্প নয়। এটি যারা ভিশন বিক্রি করেন এবং যারা বাস্তবতা তৈরি করেন তাদের মধ্যে একটি অগোছালো, চলমান বিতর্ক। টেক নিউজের একজন স্মার্ট ভোক্তা হতে হলে, আপনাকে চারিসম্যাটিক প্রতিষ্ঠাতার বাইরে তাকাতে শিখতে হবে। পেপারগুলোতে থাকা নামগুলো খুঁজুন। এমন গবেষকদের খুঁজুন যারা তাদের মডেল কী করতে পারে না তা নিয়ে কথা বলতে ইচ্ছুক। ইন্ডাস্ট্রির এই বৈপরীত্যগুলো বাগ নয়। এগুলো গল্পের সবচেয়ে সৎ অংশ। ক্ষেত্রটি বিকশিত হতে থাকবে কারণ টেকনিক্যাল সমস্যাগুলো সমাধান থেকে অনেক দূরে। মূল প্রশ্নটি থেকেই যায়: বর্তমান যুগকে সংজ্ঞায়িত করা বিশাল সম্পদ খরচ ছাড়াই কি আমরা সত্যিই একটি বুদ্ধিমান সিস্টেম তৈরি করতে পারি? যতক্ষণ না আমরা এর উত্তর দিচ্ছি, হাইপ বিজ্ঞানকে ছাড়িয়ে যেতে থাকবে। এমন যেকোনো ন্যারেটিভ সম্পর্কে আমাদের সতর্ক থাকতে হবে যা কোনো ট্রেড-অফ বা সীমাবদ্ধতার কথা উল্লেখ না করেই একটি নিখুঁত সমাধানের প্রতিশ্রুতি দেয়।
সম্পাদকের মন্তব্য: আমরা এই সাইটটি একটি বহুভাষিক এআই সংবাদ এবং নির্দেশিকা কেন্দ্র হিসাবে তৈরি করেছি তাদের জন্য যারা কম্পিউটার বিশেষজ্ঞ নন, কিন্তু তবুও কৃত্রিম বুদ্ধিমত্তা বুঝতে চান, এটিকে আরও আত্মবিশ্বাসের সাথে ব্যবহার করতে চান এবং যে ভবিষ্যত ইতিমধ্যেই আসছে, তা অনুসরণ করতে চান।
কোনো ত্রুটি বা সংশোধনের প্রয়োজন এমন কিছু খুঁজে পেয়েছেন? আমাদের জানান।