প্রতিষ্ঠাতা, সমালোচক এবং গবেষক: যে আলোচনাগুলো পড়া জরুরি

অধিকাংশ মানুষ OpenAI-এর CEO-এর নাম জানেন। কিন্তু লার্জ ল্যাঙ্গুয়েজ মডেলের বর্তমান যুগকে সংজ্ঞায়িত করা গবেষণাপত্রগুলোর লেখকদের নাম খুব কম মানুষই জানেন। জ্ঞানের এই ঘাটতি প্রযুক্তি কীভাবে আসলে এগিয়ে যাচ্ছে, সে সম্পর্কে একটি বিকৃত ধারণা তৈরি করে। আমরা কৃত্রিম বুদ্ধিমত্তাকে একগুচ্ছ প্রোডাক্ট লঞ্চ হিসেবে দেখি, অথচ এটি আসলে গাণিতিক সাফল্যের একটি ধীর গতির সঞ্চয়। প্রতিষ্ঠাতারা মূলধন এবং পাবলিক ন্যারেটিভ বা জনমত নিয়ন্ত্রণ করেন। গবেষকরা নিয়ন্ত্রণ করেন ওয়েট এবং লজিক। এই পার্থক্য বোঝাটাই মার্কেটিংয়ের ধোঁয়াশা ভেদ করার একমাত্র উপায়। আপনি যদি কেবল প্রতিষ্ঠাতাদের অনুসরণ করেন, তবে আপনি একটি সিনেমা দেখছেন। আর যদি গবেষকদের অনুসরণ করেন, তবে আপনি স্ক্রিপ্টটি পড়ছেন। এই নিবন্ধটি আলোচনা করবে কেন এই পার্থক্যটি গুরুত্বপূর্ণ এবং কীভাবে এমন সংকেতগুলো শনাক্ত করা যায় যা আসলে ইন্ডাস্ট্রির ভবিষ্যৎ নির্ধারণ করে। আমরা চারিসম্যাটিক বক্তৃতার বাইরে গিয়ে ল্যাবের শীতল বাস্তবতার দিকে নজর দেব। এখন সময় এসেছে কেবল প্রেস রিলিজে স্বাক্ষরকারীদের নয়, বরং যারা কোড লেখেন তাদের ওপর মনোযোগ দেওয়ার।

মেশিন যুগের অদৃশ্য স্থপতিরা

প্রতিষ্ঠাতারা হলেন পাবলিক ফেস বা পরিচিত মুখ। তারা ওয়ার্ল্ড ইকোনমিক ফোরামে কথা বলেন এবং কংগ্রেসের সামনে সাক্ষ্য দেন। তাদের কাজ হলো বিলিয়ন বিলিয়ন ডলারের ফান্ডিং নিশ্চিত করা এবং এমন একটি ব্র্যান্ড তৈরি করা যা অনিবার্য মনে হয়। তারা এমন শব্দ ব্যবহার করেন যা জাদুর মতো শোনায়। গবেষকরা আলাদা। তারা Python এবং LaTeX-এ কাজ করেন। তারা লস ফাংশন এবং টোকেন এফিসিয়েন্সি নিয়ে ভাবেন। একজন প্রতিষ্ঠাতা হয়তো বলবেন তাদের মডেল চিন্তা করছে। একজন গবেষক আপনাকে বলবেন, এটি নির্দিষ্ট প্রবাবিলিটি ডিস্ট্রিবিউশনের ওপর ভিত্তি করে পরবর্তী সম্ভাব্য শব্দটি অনুমান করছে। বিভ্রান্তিটা তৈরি হয় কারণ মিডিয়া এই দুটি গ্রুপকে একই মনে করে। যখন একজন CEO বলেন যে একটি মডেল জলবায়ু পরিবর্তন সমাধান করবে, তখন এটি একটি সেলস পিচ। যখন একজন গবেষক স্পার্স অটোএনকোডার নিয়ে পেপার প্রকাশ করেন, তখন এটি একটি টেকনিক্যাল দাবি। একটি হলো আশা, অন্যটি হলো সত্য।

জনসাধারণ প্রায়ই আশাকে সত্য বলে ভুল করে। এটি অতিরিক্ত প্রতিশ্রুতি এবং কম ডেলিভারির একটি চক্র তৈরি করে। এই ক্ষেত্রটি বোঝার জন্য, আপনাকে গাড়ি বিক্রেতাকে গাড়িটির ইঞ্জিনের ডিজাইনার থেকে আলাদা করতে হবে। ইঞ্জিন ডিজাইনার জানেন কোথায় বোল্ট ঢিলে আছে। বিক্রেতা আপনাকে কখনোই ঢিলে বোল্টের কথা বলবে না কারণ তার কাজ হলো স্টকের দাম বেশি রাখা। প্রতিবার নতুন মডেল আসার সময় আমরা এটি ঘটতে দেখি। প্রতিষ্ঠাতা হাইপ তৈরি করতে একটি রহস্যময় টুইট করেন। গবেষক arXiv-এ একটি টেকনিক্যাল রিপোর্টের লিঙ্ক পোস্ট করেন। টুইটটি দশ লক্ষ ভিউ পায়। টেকনিক্যাল রিপোর্টটি পড়েন মাত্র কয়েক হাজার মানুষ যারা আসলে জিনিসপত্র তৈরি করেন। এটি একটি ফিডব্যাক লুপ তৈরি করে যেখানে সবচেয়ে উচ্চকণ্ঠরা বাকি সবার জন্য বাস্তবতা নির্ধারণ করে দেয়।

উদ্ভাবনের পাবলিক ফেসের বাইরে

এই বিভাজন বৈশ্বিক নীতির ওপর বিশাল প্রভাব ফেলে। সরকারগুলো বর্তমানে প্রতিষ্ঠাতাদের সতর্কবার্তার ওপর ভিত্তি করে আইন তৈরি করছে। এই প্রতিষ্ঠাতারা প্রায়ই অস্তিত্বের ঝুঁকির কথা বলেন যা সায়েন্স ফিকশনের মতো মনে হয়। এটি বর্তমান ক্ষতির চেয়ে কাল্পনিক ভবিষ্যতের ওপর মনোযোগ ধরে রাখে। এদিকে, গবেষকরা ডেটা বায়াস এবং শক্তি খরচের মতো তাৎক্ষণিক সমস্যাগুলোর দিকে আঙুল তুলছেন। বিখ্যাত নামগুলোর কথা শুনে আমরা ভুল বিষয়গুলোকে নিয়ন্ত্রণ করার ঝুঁকি নিচ্ছি। আমরা হয়তো ভবিষ্যতের কোনো সুপারইন্টেলিজেন্সকে নিষিদ্ধ করতে পারি, কিন্তু এটি উপেক্ষা করছি যে বর্তমান মডেলগুলো তাদের ডেটা সেন্টার ঠান্ডা রাখতে ছোট ছোট শহরের পানির স্তর শুকিয়ে ফেলছে। এটি কেবল আমেরিকার সমস্যা নয়। ইউরোপ এবং এশিয়ায় একই গতিশীলতা বিদ্যমান।

যাদের মার্কেটিং বাজেট সবচেয়ে বেশি, তাদের কণ্ঠস্বরই সবচেয়ে বেশি শোনা যায়। এটি একটি ‘উইনার টেক অল’ পরিবেশ তৈরি করে যেখানে কয়েকটি কোম্পানি পুরো পৃথিবীর এজেন্ডা নির্ধারণ করে। যদি আমরা আমাদের দৃষ্টিভঙ্গি প্রসারিত না করি, তবে আমরা সিলিকন ভ্যালির হাতেগোনা কয়েকজনকে নির্ধারণ করতে দিচ্ছি যে কী নিরাপদ এবং কী সম্ভব। ক্ষমতার এই কেন্দ্রীকরণ নিজেই একটি ঝুঁকি। এটি এমন একটি ক্ষেত্রে চিন্তার বৈচিত্র্যকে সীমাবদ্ধ করে যেখানে এটি সবচেয়ে বেশি প্রয়োজন। সান ফ্রান্সিসকোর মানুষের পাশাপাশি টরন্টো ইউনিভার্সিটি বা টোকিও ল্যাবের মানুষের কথা শোনাও আমাদের দরকার। বৈজ্ঞানিক অগ্রগতি একটি বৈশ্বিক প্রচেষ্টা, কিন্তু ন্যারেটিভটি বর্তমানে একটি স্থানীয় একচেটিয়া ব্যবসা। কর্পোরেট বোর্ডরুমের বাইরে যে প্রকৃত অগ্রগতি হচ্ছে তা দেখতে আমাদের Nature-এর মতো জার্নালগুলোর দিকে তাকাতে হবে।

পৃথিবী কেন ভুল মানুষের কথা শোনে

একটি বড় ল্যাবের প্রধান গবেষকের জীবনের একটি দিনের কথা ভাবুন। তারা ঘুম থেকে উঠে এমন একটি ট্রেনিং রানের ফলাফল দেখেন যার পেছনে খরচ হয়েছে ত্রিশ লক্ষ ডলার। তারা দেখেন মডেলটি প্রত্যাশার চেয়ে বেশি হ্যালুসিনেশন করছে। তারা দশ ঘণ্টা সময় ব্যয় করেন ডেটা ক্লাস্টারগুলো দেখে নয়েজ খুঁজে বের করতে। তারা ২০২৪ সালের নির্বাচন বা মানবতার ভাগ্য নিয়ে ভাবছেন না। তারা ভাবছেন কেন মডেলটি জটিল বাক্যে নেতিবাচকতা বুঝতে ব্যর্থ হচ্ছে। তারা নিউরন অ্যাক্টিভেশনের হিট ম্যাপ দেখছেন। তাদের সাফল্য পরিমাপ করা হয় বিট পার ক্যারেক্টার বা নির্দিষ্ট বেঞ্চমার্কের নির্ভুলতার মাধ্যমে। এবার একজন প্রতিষ্ঠাতার দিনের কথা ভাবুন। তারা রাষ্ট্রপ্রধানের সাথে দেখা করতে প্রাইভেট জেটে আছেন। তারা নতুন অর্থনীতির ট্রিলিয়ন ডলারের সুযোগ নিয়ে কথা বলছেন।

গবেষক কাজ করেন ‘কীভাবে’ নিয়ে। প্রতিষ্ঠাতা কাজ করেন কেন এটি টাকার মূল্যের। একজন ডেভেলপার যিনি অ্যাপ তৈরি করছেন, তার কাছে গবেষকই বেশি গুরুত্বপূর্ণ। গবেষক নির্ধারণ করেন API ল্যাটেন্সি এবং কনটেক্সট উইন্ডো। প্রতিষ্ঠাতা নির্ধারণ করেন দাম। আপনি যদি ব্যবসা শুরু করতে চান, তবে আপনার জানা দরকার প্রযুক্তিটি আসলে তা করতে পারে কিনা যা প্রতিষ্ঠাতা বলছেন। প্রায়ই, তা পারে না। আমরা অটোনোমাস ড্রাইভিংয়ের শুরুর দিনগুলোতে এটি দেখেছি। প্রতিষ্ঠাতারা বলেছিলেন 2026 সালের মধ্যে আমাদের লক্ষ লক্ষ রোবোট্যাক্সি থাকবে। গবেষকরা জানতেন যে ভারী বৃষ্টিতে এজ কেসগুলো তখনও একটি অমীমাংসিত সমস্যা। জনসাধারণ প্রতিষ্ঠাতাদের বিশ্বাস করেছিল। গবেষকরাই সঠিক ছিলেন।

একই প্যাটার্ন জেনারেটিভ AI স্পেসেও পুনরাবৃত্তি হচ্ছে। আমাদের বলা হচ্ছে মডেলগুলো শীঘ্রই আইনজীবী এবং ডাক্তারদের জায়গা নেবে। আপনি যদি টেকনিক্যাল পেপারগুলো পড়েন, তবে দেখবেন মডেলগুলো এখনও মৌলিক যৌক্তিক সামঞ্জস্য বজায় রাখতে হিমশিম খাচ্ছে। ডেমো এবং বাস্তবতার মাঝখানের এই ফাঁকটিতেই কোম্পানিগুলো টাকা হারায়। আপনি কৃত্রিম বুদ্ধিমত্তার ট্রেন্ডের গভীরে গিয়ে দেখতে পারেন কীভাবে এই টেকনিক্যাল সীমাবদ্ধতাগুলো আজ পরীক্ষা করা হচ্ছে। এই পার্থক্যটিই একটি সঠিক বিনিয়োগ এবং একটি ফটকা বুদবুদের মধ্যে পার্থক্য। যখন আপনি নতুন কোনো দাবি শুনবেন, নিজেকে জিজ্ঞাসা করুন এটি কি কোনো পেপার থেকে এসেছে নাকি প্রেস রিলিজ থেকে। উত্তরটিই বলে দেবে সেটিকে কতটা গুরুত্ব দেবেন। MIT Technology Review-এর সাংবাদিকরা প্রায়ই ল্যাব এবং লবির মধ্যকার এই ব্যবধান তুলে ধরেন। আমাদের মনে রাখতে হবে যে প্রতিষ্ঠাতাদের ত্রুটিগুলো লুকানোর প্রণোদনা থাকে, যেখানে গবেষকদের প্রণোদনা থাকে সেগুলো খুঁজে বের করার। প্রথমটি হাইপ তৈরি করে এবং দ্বিতীয়টি সত্য তৈরি করে। দীর্ঘমেয়াদে, সত্যই একমাত্র জিনিস যা টিকে থাকে। আমরা 2026 সালে এটি দেখেছি যখন হাইপের প্রথম ঢেউ টেকনিক্যাল বাস্তবতার চাপে ঠান্ডা হতে শুরু করেছিল।

ল্যাবে একটি মঙ্গলবার বনাম বোর্ডরুম

উন্নয়নের বর্তমান পথ নিয়ে আমাদের কঠিন প্রশ্ন করতে হবে। প্রতিষ্ঠাতারা যে গবেষণার কথা বলছেন যা সবার উপকারে আসবে, তার খরচ কে দিচ্ছে? শীর্ষ গবেষকদের অধিকাংশই একাডেমিক জগত ছেড়ে প্রাইভেট ল্যাবে চলে গেছেন। এর মানে হলো তারা যে জ্ঞান তৈরি করছেন তা আর পাবলিক গুড বা জনকল্যাণমূলক নয়। এটি এখন একটি কর্পোরেট গোপন বিষয়। যখন কোনো পয়েন্ট প্রমাণ করার জন্য ব্যবহৃত ডেটা পেওয়ালের পেছনে লুকিয়ে রাখা হয়, তখন বৈজ্ঞানিক পদ্ধতির কী হয়? আমরা ওপেন সায়েন্স থেকে সরে এসে ক্লোজড প্রতিযোগিতামূলক সুবিধার মডেলের দিকে যেতে দেখছি। কয়েকজন ব্যক্তির খ্যাতি কি ক্ষেত্রটিকে সাহায্য করছে নাকি এটি এমন একটি পার্সোনালিটি কাল্ট তৈরি করছে যা ভিন্নমতকে নিরুৎসাহিত করে? যদি কোনো গবেষক ফ্ল্যাগশিপ মডেলে বড় কোনো ত্রুটি খুঁজে পান, তবে কোম্পানির ভ্যালুয়েশন কমে যাওয়ার ভয়ে তিনি কি তা রিপোর্ট করতে নিরাপদ বোধ করবেন?

BotNews.today কন্টেন্ট গবেষণা, লেখা, সম্পাদনা এবং অনুবাদের জন্য এআই টুল ব্যবহার করে। আমাদের দল তথ্যকে দরকারী, স্পষ্ট এবং নির্ভরযোগ্য রাখতে প্রক্রিয়াটি পর্যালোচনা ও তত্ত্বাবধান করে।

আপনার কি কোনো এআই গল্প, টুল, প্রবণতা, বা প্রশ্ন আছে যা আপনার মনে হয় আমাদের কভার করা উচিত? আপনার প্রবন্ধের ধারণা আমাদের পাঠান — আমরা তা শুনতে আগ্রহী।

এই ফার্মগুলোর ওপর আর্থিক চাপ প্রচণ্ড। আমাদের পরিবেশগত খরচের কথাও বিবেচনা করতে হবে। সামান্য ভালো বেঞ্চমার্কের পেছনে ছোটা কি এই মডেলগুলো ট্রেনিং করার বিশাল কার্বন ফুটপ্রিন্টের যোগ্য? আমরা প্রায়ই পরিবেশের জন্য AI-এর সুবিধার কথা বলি, কিন্তু আমরা খুব কমই এমন কোনো খতিয়ান দেখি যা দুটির ভারসাম্য বজায় রাখে। পরিশেষে, এই মডেলগুলো যে সংস্কৃতির ওপর ভিত্তি করে ট্রেনিং করা হয়েছে তার মালিক কে? গবেষকরা ইন্টারনেট থেকে সংগৃহীত আউটপুট ব্যবহার করে তাদের সিস্টেম তৈরি করেন। প্রতিষ্ঠাতারা তখন সেই একই আউটপুটের একটি ডিস্টিলড বা পরিমার্জিত সংস্করণ অ্যাক্সেস করার জন্য জনগণের কাছ থেকে চার্জ নেন। এটি সম্পদের এমন একটি স্থানান্তর যা শিরোনামে খুব কমই আলোচিত হয়। এগুলো কেবল টেকনিক্যাল সমস্যা নয়। এগুলো সামাজিক এবং নৈতিক সংকট যার সমাধানের জন্য কেবল একটি ভালো অ্যালগরিদমের চেয়েও বেশি কিছু প্রয়োজন।

টেকনিক্যাল সীমাবদ্ধতা এবং স্থানীয় বাস্তবায়ন

যারা এই প্ল্যাটফর্মগুলোর ওপর ভিত্তি করে তৈরি করছেন, তাদের কাছে দর্শনের চেয়ে টেকনিক্যাল ডিটেইলস বেশি গুরুত্বপূর্ণ। বর্তমান API লিমিটগুলো এন্টারপ্রাইজ গ্রহণের ক্ষেত্রে একটি বড় বাধা। অধিকাংশ প্রোভাইডারের কঠোর রেট লিমিট থাকে যা হাই ভলিউম রিয়েল টাইম প্রসেসিংকে বাধা দেয়। এ কারণেই অনেক ফার্ম লোকাল স্টোরেজ এবং লোকাল এক্সিকিউশনের দিকে ঝুঁকছে। লোকাল হার্ডওয়্যারে Llama 3-এর মতো মডেল ব্যবহার করলে ডেটা প্রাইভেসি ভালো থাকে এবং দীর্ঘমেয়াদী খরচ কমে। তবে, হার্ডওয়্যারের প্রয়োজনীয়তা অনেক বেশি। ভালো গতিতে ৭০ বিলিয়ন প্যারামিটারের মডেল চালানোর জন্য আপনার উল্লেখযোগ্য VRAM সহ হাই-এন্ড GPU প্রয়োজন। এখানেই গিক সেকশন এবং ফিন্যান্সিয়াল সেকশন মিলিত হয়। H100 ক্লাস্টারের খরচ এমন একটি বাধা যা ক্ষমতাকে ধনীদের হাতেই রাখে।

আমরা স্পেশালাইজড ফাইন টিউনিংয়ের দিকেও একটি পরিবর্তন দেখছি। সবকিছুর জন্য একটি জেনারেল মডেল ব্যবহার করার পরিবর্তে, ডেভেলপাররা নির্দিষ্ট ডেটাসেটে ট্রেনিং করা ছোট মডেল ব্যবহার করছেন। এটি নির্ভুলতা বাড়ায় এবং টোকেন কাউন্ট কমায়। এখানে টেকনিক্যাল চ্যালেঞ্জ হলো ডেটা কিউরেশন। ইনপুট ডেটা যদি দুর্বল হয়, তবে ফাইন টিউন করা মডেলটি জেনারেল মডেলের চেয়েও খারাপ হবে। আমরা Retrieval Augmented Generation (RAG)-এর ব্যবহারও বেশি দেখছি যাতে মডেলগুলোকে বাস্তব ডেটার ওপর ভিত্তি করে গড়ে তোলা যায়। এটি বিশাল কনটেক্সট উইন্ডোর প্রয়োজনীয়তা এড়িয়ে যায় এবং হ্যালুসিনেশন কমায়। কিন্তু RAG-এর নিজস্ব সীমাবদ্ধতা আছে, বিশেষ করে রিট্রিভ করা ডকুমেন্টের র‍্যাঙ্কিং কীভাবে হ্যান্ডেল করা হয় তা নিয়ে। যদি সার্চ ধাপটি ব্যর্থ হয়, তবে মডেলের আউটপুট অকেজো। অধিকাংশ ব্যবহারকারী বুঝতে পারেন না যে AI-এর পারফরম্যান্স মডেলের মতোই সেই ডেটাবেসের ওপর নির্ভর করে যা থেকে এটি কোয়েরি করে।

তথ্যের জন্য চূড়ান্ত ফিল্টার

AI-এর ভবিষ্যৎ কোনো একক ব্যক্তির বলা একক গল্প নয়। এটি যারা ভিশন বিক্রি করেন এবং যারা বাস্তবতা তৈরি করেন তাদের মধ্যে একটি অগোছালো, চলমান বিতর্ক। টেক নিউজের একজন স্মার্ট ভোক্তা হতে হলে, আপনাকে চারিসম্যাটিক প্রতিষ্ঠাতার বাইরে তাকাতে শিখতে হবে। পেপারগুলোতে থাকা নামগুলো খুঁজুন। এমন গবেষকদের খুঁজুন যারা তাদের মডেল কী করতে পারে না তা নিয়ে কথা বলতে ইচ্ছুক। ইন্ডাস্ট্রির এই বৈপরীত্যগুলো বাগ নয়। এগুলো গল্পের সবচেয়ে সৎ অংশ। ক্ষেত্রটি বিকশিত হতে থাকবে কারণ টেকনিক্যাল সমস্যাগুলো সমাধান থেকে অনেক দূরে। মূল প্রশ্নটি থেকেই যায়: বর্তমান যুগকে সংজ্ঞায়িত করা বিশাল সম্পদ খরচ ছাড়াই কি আমরা সত্যিই একটি বুদ্ধিমান সিস্টেম তৈরি করতে পারি? যতক্ষণ না আমরা এর উত্তর দিচ্ছি, হাইপ বিজ্ঞানকে ছাড়িয়ে যেতে থাকবে। এমন যেকোনো ন্যারেটিভ সম্পর্কে আমাদের সতর্ক থাকতে হবে যা কোনো ট্রেড-অফ বা সীমাবদ্ধতার কথা উল্লেখ না করেই একটি নিখুঁত সমাধানের প্রতিশ্রুতি দেয়।

সম্পাদকের মন্তব্য: আমরা এই সাইটটি একটি বহুভাষিক এআই সংবাদ এবং নির্দেশিকা কেন্দ্র হিসাবে তৈরি করেছি তাদের জন্য যারা কম্পিউটার বিশেষজ্ঞ নন, কিন্তু তবুও কৃত্রিম বুদ্ধিমত্তা বুঝতে চান, এটিকে আরও আত্মবিশ্বাসের সাথে ব্যবহার করতে চান এবং যে ভবিষ্যত ইতিমধ্যেই আসছে, তা অনুসরণ করতে চান।

কোনো ত্রুটি বা সংশোধনের প্রয়োজন এমন কিছু খুঁজে পেয়েছেন? আমাদের জানান।

Frequently Asked Questions

পাঠকরা “সাক্ষাৎকার” নিবন্ধগুলো বাস্তবে কীভাবে ব্যবহার করতে পারেন?

উল্লেখযোগ্য এআই প্রতিষ্ঠাতা ও গবেষকদের সাক্ষাৎকার এবং এআই জগতের পরিবর্তন ও প্রভাব সম্পর্কে বিস্তারিত জানুন। টুল তুলনা করতে, ঝুঁকি বুঝতে, ভালো প্রশ্ন করতে এবং সময় বা টাকা খরচ করার আগে কী সত্যিই মনোযোগ পাওয়ার যোগ্য তা ঠিক করতে এই নিবন্ধগুলো ব্যবহার করুন।

“মূল চিন্তাবিদ” কার জন্য সবচেয়ে উপকারী?

এআই গবেষক, প্রতিষ্ঠাতা এবং প্রভাবশালী চিন্তাবিদদের ধারণা ও সিদ্ধান্ত সম্পর্কে জানুন যারা কৃত্রিম বুদ্ধিমত্তার ভবিষ্যৎ গঠন করছেন। এই কভারেজ সাধারণ পাঠক, ছোট দল, নির্মাতা, ব্যবসার মালিক, মার্কেটার, শিক্ষার্থী এবং hype ছাড়া পরিষ্কার AI প্রেক্ষাপট দরকার এমন সবার জন্য লেখা।