এআই-এর সেই গুরুত্বপূর্ণ সাক্ষাৎকারগুলো যা সবাই মিস করেছে
আর্টিফিশিয়াল ইন্টেলিজেন্সের ভবিষ্যৎ নিয়ে সবচেয়ে গুরুত্বপূর্ণ তথ্যগুলো সাধারণত চকচকে প্রেস রিলিজ বা বড় ইভেন্টে পাওয়া যায় না। বরং এগুলো লুকিয়ে থাকে দীর্ঘ সাক্ষাৎকারের সেই বিরতি, নার্ভাসনেস আর টেকনিক্যাল আলোচনার আড়ালে যা বেশিরভাগ মানুষ এড়িয়ে যায়। যখন একজন CEO কোনো টেকনিক্যাল পডকাস্টে তিন ঘণ্টা ধরে কথা বলেন, তখন তাদের কর্পোরেট মুখোশটা শেষ পর্যন্ত খুলে যায়। এই মুহূর্তগুলো এমন এক বাস্তবতাকে সামনে আনে যা পাবলিক মার্কেটিংয়ের ঠিক উল্টো। যেখানে অফিসিয়াল স্টেটমেন্টে নিরাপত্তা আর সবার জন্য সহজলভ্য করার কথা বলা হয়, সেখানে এই আনস্ক্রিপ্টেড মন্তব্যগুলো ইঙ্গিত দেয় ক্ষমতার এক উন্মত্ত লড়াইয়ের দিকে। গত এক বছরের উচ্চপর্যায়ের আলোচনা থেকে মূল শিক্ষা হলো, ইন্ডাস্ট্রি এখন সাধারণ চ্যাটবট থেকে সরে এসে বিশেষায়িত, হাই-কম্পিউট এজেন্টের দিকে ঝুঁকছে। আপনি যদি শুধু হেডলাইন পড়েন, তবে আপনি সেই স্বীকারোক্তিটা মিস করেছেন যে বর্তমান স্কেলিং পদ্ধতিগুলো হয়তো একটা দেয়ালের মুখে এসে দাঁড়িয়েছে। আসল গল্পটা লুকিয়ে আছে তাদের হার্ডওয়্যার সীমাবদ্ধতা আর বুদ্ধিমত্তার সংজ্ঞা পরিবর্তনের বর্ণনায়।
এই পরিবর্তনগুলো বুঝতে হলে OpenAI, Anthropic এবং Google DeepMind-এর লিডারদের নির্দিষ্ট কিছু আলাপচারিতা লক্ষ্য করতে হবে। সাম্প্রতিক দীর্ঘ আলোচনাগুলোতে ফোকাস এখন মডেল কী করতে পারে তা থেকে সরে গিয়ে কীভাবে সেগুলো তৈরি করা হচ্ছে তার দিকে চলে গেছে। উদাহরণস্বরূপ, Anthropic-এর দারিও আমোদেই যখন স্কেলিং ল নিয়ে কথা বলেন, তিনি শুধু মডেল বড় করার কথা বলছেন না। তিনি এমন এক ভবিষ্যতের ইঙ্গিত দিচ্ছেন যেখানে একটি মাত্র মডেল ট্রেনিং করার খরচ দশ বিলিয়ন ডলার ছাড়িয়ে যেতে পারে। ইন্ডাস্ট্রির শুরুর দিনগুলোর তুলনায় এটি এক বিশাল পরিবর্তন, যখন মাত্র কয়েক মিলিয়ন ডলার দিয়েই প্রতিযোগিতা করা যেত। এই সাক্ষাৎকারগুলো থেকে বোঝা যায়, যারা এই “compute tax” দিতে পারবে আর যারা পারবে না, তাদের মধ্যে এক বিশাল ব্যবধান তৈরি হচ্ছে। তাদের এড়িয়ে যাওয়া প্রশ্নগুলো উত্তরের মতোই অনেক কিছু বলে দেয়। যখন ট্রেনিং ডেটার উৎস নিয়ে প্রশ্ন করা হয়, এক্সিকিউটিভরা প্রায়ই সিন্থেটিক ডেটার কথা বলে প্রসঙ্গ ঘুরিয়ে দেন। এটি একটি কৌশলগত ইঙ্গিত যে ইন্টারনেটের রিসোর্স প্রায় শেষ হয়ে গেছে। ইন্ডাস্ট্রি এখন ভাবছে কীভাবে মডেলগুলোকে মানুষের টেক্সট নকল করার বদলে নিজস্ব লজিক থেকে শিখতে বাধ্য করা যায়। ব্লগ পোস্টে এই স্ট্র্যাটেজি পরিবর্তনের কথা খুব কমই বলা হয়, কিন্তু টেকনিক্যাল সার্কেলে এটাই এখন প্রধান আলোচনার বিষয়।
এই নীরব স্বীকারোক্তিগুলোর বৈশ্বিক প্রভাব অনেক গভীর। আমরা এখন যা দেখছি তাকে অনেকে “compute sovereignty” বা কম্পিউট সার্বভৌমত্ব বলছেন। দেশগুলো এখন আর শুধু সফটওয়্যার খুঁজছে না। তারা এই মডেলগুলো চালানোর জন্য ফিজিক্যাল ইনফ্রাস্ট্রাকচার খুঁজছে। সাক্ষাৎকারগুলো থেকে বোঝা যাচ্ছে যে, উন্নয়নের পরবর্তী ধাপটি শুধুমাত্র স্মার্ট কোডিং নয়, বরং এনার্জি প্রোডাকশন এবং চিপ সাপ্লাই চেইনের ওপর নির্ভর করবে। এটি সরকারি রেগুলেটর থেকে শুরু করে ছোট ব্যবসার মালিক—সবার ওপর প্রভাব ফেলবে। যদি লিডিং মডেলগুলো ট্রেনিং করতে একটি ছোট শহরের সমান বিদ্যুৎ লাগে, তবে ক্ষমতা স্বাভাবিকভাবেই গুটিকয়েক প্রতিষ্ঠানের হাতে চলে যাবে। এটি সেই ওপেন অ্যাক্সেসের গল্পের ঠিক উল্টো যা অনেক কোম্পানি এখনও প্রচার করে। টেকনিক্যাল আলোচনার কৌশলগত ইঙ্গিতগুলো বলছে যে, সবচেয়ে অ্যাডভান্সড সিস্টেমগুলোর জন্য এআই-এর “open” যুগ কার্যত শেষ। এই পরিবর্তন ইতিমধ্যেই ভেঞ্চার ক্যাপিটাল এবং ট্রেড পলিসিতে প্রভাব ফেলতে শুরু করেছে। সাধারণ মানুষ যখন লেটেস্ট চ্যাটবট ফিচার নিয়ে মেতে আছে, বিশ্ব তখন এই সাক্ষাৎকারের বাস্তবতার ওপর ভিত্তি করে প্রতিক্রিয়া দেখাচ্ছে। এই পরিবর্তনগুলো সম্পর্কে আরও গভীরে জানতে, আপনি লেটেস্ট AI industry analysis ফলো করতে পারেন।
বাস্তব প্রভাব বুঝতে একজন মিড-লেভেল সফটওয়্যার ফার্মের লিড ডেভেলপারের কথা ভাবুন। ২০২৪ সালে, এই ডেভেলপার শুধু কোড লিখছেন না। তিনি ঘণ্টার পর ঘণ্টা গবেষকদের ইন্টারভিউ ফুটেজ দেখছেন বোঝার জন্য যে কোন API-গুলো বন্ধ হয়ে যাবে আর কোনগুলো বেশি কম্পিউট পাবে। তিনি যখন শোনেন কোনো গবেষক বলছেন “reasoning tokens” এখন নতুন প্রায়োরিটি, তখন তিনি বুঝতে পারেন তার বর্তমান ইন্টিগ্রেশন স্ট্র্যাটেজি সেকেলে হয়ে গেছে। তাকে এখন সাধারণ র্যাপার তৈরির বদলে এমন সিস্টেম ডিজাইন করতে হবে যা দীর্ঘ লজিক্যাল স্টেপ হ্যান্ডেল করতে পারে। এটি কোনো তাত্ত্বিক পরিবর্তন নয়। একটি নিচ ইউটিউব চ্যানেলে দুই ঘণ্টার আলাপচারিতায় উঠে আসা টেকনিক্যাল ডিরেকশনের কারণে এটি একটি বাস্তব প্রয়োজন। বেশিরভাগ মানুষের বিভ্রান্তি হলো তারা মনে করে এআই একটি তৈরি পণ্য। আসলে এটি একটি মুভিং টার্গেট। যখন কোনো এক্সিকিউটিভ তাদের লেটেস্ট মডেলের এনার্জি খরচ নিয়ে প্রশ্ন এড়িয়ে যান, তখন তিনি আসলে আপনাকে বলছেন যে আপনার API কলের খরচ বাড়তে যাচ্ছে। যখন তারা কথা বলার আগে মডেলের “চিন্তা” করার ডেমো দেখায়, তারা আপনাকে এমন এক ভবিষ্যতের জন্য প্রস্তুত করছে যেখানে ল্যাটেন্সি বা ধীরগতি একটি ফিচার হিসেবে কাজ করবে। এই ইনফরমেশন সিগন্যালগুলোই কার্ভের সামনে থাকার একমাত্র উপায়।
এই সাক্ষাৎকারগুলোর ভিজ্যুয়াল ম্যাটেরিয়াল এমন কিছু প্রমাণ দেয় যা শুধু ট্রান্সক্রিপ্ট দিয়ে বোঝা সম্ভব নয়। যখন একজন CEO-কে নির্দিষ্ট কোনো সেক্টরে মানুষের চাকরি চলে যাওয়ার সম্ভাবনা নিয়ে প্রশ্ন করা হয়, তাদের বডি ল্যাঙ্গুয়েজ প্রায়ই এমন এক নিশ্চয়তা প্রকাশ করে যা তাদের শব্দগুলো নরম করার চেষ্টা করে। একটি নার্ভাস হাসি বা ক্যামেরা থেকে চোখ সরিয়ে নেওয়া ইঙ্গিত দিতে পারে যে তাদের ইন্টারনাল প্রজেকশন পাবলিক স্টেটমেন্টের চেয়ে অনেক বেশি অ্যাগ্রেসিভ। আমরা এটি দেখি যখন লিডাররা Artificial General Intelligence বা AGI-এর টাইমলাইন নিয়ে আলোচনা করেন। মুখে হয়তো বলছেন “এই দশকের মধ্যে,” কিন্তু আলোচনার তীব্রতা বলে দিচ্ছে তারা অনেক দ্রুত সময়ের মধ্যে কাজ করছেন। এটি জনসাধারণের প্রত্যাশা এবং কোম্পানিগুলো আসলে যা তৈরি করছে তার মধ্যে একটি দূরত্ব তৈরি করে। এর ফলাফল অনেক বড় হতে পারে। যদি ব্যবসাগুলো ধীরগতির পরিবর্তনের জন্য প্রস্তুতি নেয় আর প্রযুক্তি যদি দ্রুত গতিতে এগিয়ে যায়, তবে অর্থনৈতিক ধাক্কা হবে মারাত্মক। OpenAI o1 সিরিজের মতো নতুন প্রোডাক্টের উদাহরণ দেখায় যে “চিন্তা করা” মডেলের যুক্তি এখন বাস্তব। এটি আর শুধু উন্নত অটো-কমপ্লিট নয়। এটি মেশিন কীভাবে লজিক প্রসেস করে তার এক মৌলিক পরিবর্তন।
এই সাক্ষাৎকারগুলোতে সক্রেটিক সংশয়বাদ প্রয়োগ করলে বেশ কিছু লুকানো খরচ এবং অমীমাংসিত উত্তেজনা বেরিয়ে আসে। যদি এই মডেলগুলো আরও দক্ষ হয়ে ওঠে, তবে বিদ্যুতের চাহিদা কেন জ্যামিতিক হারে বাড়ছে? ইন্ডাস্ট্রির লিডাররা প্রায়ই দক্ষতার কথা বলেন, আবার একই সাথে নতুন ডেটা সেন্টারের জন্য শত শত বিলিয়ন ডলার দাবি করেন। এটি একটি বৈপরীত্য যা এখনও অস্পষ্ট। শেষ পর্যন্ত এই ইনফ্রাস্ট্রাকচারের বিল কে দেবে? লুকানো খরচ শুধু আর্থিক নয়, পরিবেশগত এবং সামাজিকও হতে পারে। এছাড়া “agentic” এআই-এর যুগে প্রাইভেসির প্রশ্নও আছে। যদি একটি এআই আপনার হয়ে কাজ করে, তবে আপনার সবচেয়ে সেনসিটিভ ডেটাতে তার অ্যাক্সেস প্রয়োজন। এই ডেটা কীভাবে সুরক্ষিত থাকবে তার কোনো পরিষ্কার উত্তর এই সাক্ষাৎকারগুলোতে পাওয়া যায় না। আমাদের সেই শ্রমের কথাও জিজ্ঞেস করতে হবে যা এই মডেলগুলোর পেছনে কাজ করে। “human in the loop” বলতে প্রায়ই উন্নয়নশীল দেশের স্বল্প বেতনের কর্মীদের বোঝায় যারা কঠিন পরিস্থিতিতে ডেটা লেবেলিং করছে। বড় বড় ভিশনারি আলোচনায় এই অংশটি প্রায় সবসময়ই বাদ পড়ে যায়।
BotNews.today কন্টেন্ট গবেষণা, লেখা, সম্পাদনা এবং অনুবাদের জন্য এআই টুল ব্যবহার করে। আমাদের দল তথ্যকে দরকারী, স্পষ্ট এবং নির্ভরযোগ্য রাখতে প্রক্রিয়াটি পর্যালোচনা ও তত্ত্বাবধান করে।
পাওয়ার ইউজার এবং ডেভেলপারদের জন্য এই সাক্ষাৎকারগুলোর গিক সেকশনটাই আসল ভ্যালু দেয়। আলোচনা প্রায়ই বর্তমান আর্কিটেকচারের নির্দিষ্ট সীমাবদ্ধতার দিকে মোড় নেয়। আমরা এখন “memory wall” সম্পর্কে বেশি শুনছি, যেখানে প্রসেসর এবং মেমরির মধ্যে ডেটা ট্রান্সফারের গতিই প্রধান বাধা হয়ে দাঁড়াচ্ছে। এই কারণেই লোকাল স্টোরেজ এবং এজ কম্পিউটিং এখন বড় আলোচনার বিষয় হয়ে উঠছে। যদি রিয়েল-টাইম অ্যাপ্লিকেশনের জন্য ক্লাউড খুব ধীর বা খুব ব্যয়বহুল হয়, তবে ইন্ডাস্ট্রিকে ছোট এবং দক্ষ মডেলের দিকে যেতে হবে যা সাধারণ হার্ডওয়্যারে চলতে পারে। সাক্ষাৎকারগুলো ইঙ্গিত দেয় যে আমরা একটি দ্বিমুখী মার্কেট দেখতে পাব। জটিল কাজের জন্য ক্লাউডে থাকবে বিশাল ট্রিলিয়ন-প্যারামিটার মডেল এবং দৈনন্দিন ব্যবহারের জন্য থাকবে হাইলি অপ্টিমাইজড মডেল। ডেভেলপারদের “quantization” এবং “speculative decoding”-এর মতো টেকনিকগুলোর দিকে নজর দিতে হবে। এই টেকনিকগুলোই ঠিক করবে আপনার অ্যাপ সাধারণ মানুষের ব্যবহারের উপযোগী কি না। API লিমিট আরেকটি গুরুত্বপূর্ণ বিষয়। মার্কেটিংয়ে অসীম সম্ভাবনার কথা বলা হলেও টেকনিক্যাল বাস্তবতা হলো রেট লিমিট আর টোকেন খরচের বিরুদ্ধে নিরন্তর লড়াই। গবেষকদের বলা ওয়ার্কফ্লো ইন্টিগ্রেশনগুলো বোঝা টেকসই প্রোডাক্ট তৈরির চাবিকাঠি। তারা এখন এমন এক বিশ্বের দিকে যাচ্ছে যেখানে মডেলটি একটি বড় “compound AI system”-এর অংশ মাত্র, যার মধ্যে ডেটাবেস, সার্চ টুল এবং এক্সটারনাল কোড এক্সিকিউটরও থাকবে।
- সিঙ্গেল-মডেল লজিক থেকে কম্পাউন্ড সিস্টেমে রূপান্তর যা উত্তর যাচাই করতে একাধিক টুল ব্যবহার করে।
- ইনফারেন্স-টাইম কম্পিউটের ক্রমবর্ধমান গুরুত্ব যেখানে মডেল একটি কোয়েরি প্রসেস করতে বেশি সময় নেয়।
মূল কথা হলো, এআই জগতের সবচেয়ে গুরুত্বপূর্ণ তথ্যগুলো চোখের সামনেই লুকিয়ে আছে। দীর্ঘ সাক্ষাৎকারগুলো এড়িয়ে গিয়ে শুধু হাইলাইটস দেখলে আপনি বর্তমানে চলমান স্ট্র্যাটেজিক পরিবর্তনগুলো মিস করবেন। ইন্ডাস্ট্রি এখন আবিষ্কারের ধাপ থেকে বিশাল ইন্ডাস্ট্রিয়ালাইজেশনের ধাপে প্রবেশ করছে। এর জন্য ভিন্ন দক্ষতা এবং প্রযুক্তি নিয়ে ভিন্নভাবে ভাবার প্রয়োজন। এই খাতের লিডারদের এড়িয়ে যাওয়া কথা বা বৈপরীত্যগুলো শুধু কর্পোরেট পিআর নয়। এগুলোই সেই চ্যালেঞ্জের ম্যাপ যা আগামী পাঁচ বছরকে সংজ্ঞায়িত করবে। আমরা এমন এক ভবিষ্যতের দিকে যাচ্ছি যেখানে “ইন্টেলিজেন্স” হবে বিদ্যুৎ বা তেলের মতো একটি পণ্য যা খনি থেকে তোলা হয়, রিফাইন করা হয় এবং বিক্রি করা হয়। এটি একটি উৎপাদনশীল সমাজ তৈরি করবে নাকি আরও বেশি কেন্দ্রীভূত সমাজ, তা নির্ভর করবে আমরা কীভাবে এই প্রাথমিক সিগন্যালগুলো ব্যাখ্যা করি এবং এখন কী প্রশ্ন করি তার ওপর। যারা হাইপের বাইরে গিয়ে শুনতে আগ্রহী, তাদের জন্য সিগন্যালগুলো ওখানেই আছে।
সম্পাদকের মন্তব্য: আমরা এই সাইটটি একটি বহুভাষিক এআই সংবাদ এবং নির্দেশিকা কেন্দ্র হিসাবে তৈরি করেছি তাদের জন্য যারা কম্পিউটার বিশেষজ্ঞ নন, কিন্তু তবুও কৃত্রিম বুদ্ধিমত্তা বুঝতে চান, এটিকে আরও আত্মবিশ্বাসের সাথে ব্যবহার করতে চান এবং যে ভবিষ্যত ইতিমধ্যেই আসছে, তা অনুসরণ করতে চান।
কোনো ত্রুটি বা সংশোধনের প্রয়োজন এমন কিছু খুঁজে পেয়েছেন? আমাদের জানান।