আমাদের সাম্প্রতিক এআই টুল পরীক্ষার আসল বিজয়ীরা
হাইপ এবং উপযোগিতার মধ্যকার ঘর্ষণ
বর্তমান কৃত্রিম বুদ্ধিমত্তা বা এআই টুলের ঢেউ এমন এক পৃথিবীর প্রতিশ্রুতি দিচ্ছে যেখানে কাজগুলো আপনাআপনিই সম্পন্ন হবে। মার্কেটিং বিভাগগুলো দাবি করছে যে তাদের সফটওয়্যার আপনার ইমেইল সামলাবে, কোড লিখবে এবং আপনার শিডিউল ম্যানেজ করবে। 2026-এর সবচেয়ে জনপ্রিয় রিলিজগুলো পরীক্ষা করার পর, বাস্তবতা কিন্তু অনেক বেশি মাটির কাছাকাছি। এই টুলগুলোর বেশিরভাগই মানুষের তত্ত্বাবধান ছাড়া কাজ করার জন্য প্রস্তুত নয়। এগুলো মূলত অত্যাধুনিক অটো-কমপ্লিট ইঞ্জিন, যেগুলোকে সবসময় নজরে রাখতে হয়। আপনি যদি আশা করেন যে কোনো টুল আপনার চাকরি দখল করে নেবে, তবে আপনি হতাশ হবেন। কিন্তু যদি আপনি কোনো আইডিয়া থেকে ড্রাফট তৈরির দূরত্ব কমাতে এগুলো ব্যবহার করেন, তবে কিছুটা সুবিধা পেতে পারেন। এই ক্ষেত্রে তারাই বিজয়ী যারা বিদ্যমান ওয়ার্কফ্লোতে কোনো ঝামেলা ছাড়াই খাপ খাইয়ে নিতে পারে। আমরা দেখেছি যে, সাধারণ ব্যবহারকারীদের জন্য সবচেয়ে দামী সাবস্ক্রিপশনগুলো প্রায়ই সবচেয়ে কম কার্যকর হয়।
অনেক ব্যবহারকারী বর্তমানে অটোমেশন ফ্যাটিগ বা ক্লান্তি অনুভব করছেন। তারা এমন প্রম্পট থেকে ক্লান্ত যা কেবল সাধারণ ফলাফল দেয়। তারা হ্যালুসিনেশন বা ভুল তথ্যের দিকে নজর রাখতে রাখতে ক্লান্ত। যে টুলগুলো আসলে কাজ করে, সেগুলো একটি নির্দিষ্ট এবং সংকীর্ণ কাজের ওপর ফোকাস করে। অডিও পরিষ্কার করার একটি টুল প্রায়ই এমন একটি সাধারণ অ্যাসিস্ট্যান্টের চেয়ে বেশি মূল্যবান, যে সবকিছু করার দাবি করে। এই বছরটি দেখিয়েছে যে কর্পোরেট ডেমো এবং দৈনন্দিন ব্যবহারের মধ্যে ব্যবধান এখনো অনেক বড়। আমরা সাধারণ চ্যাটবট থেকে বিশেষায়িত এজেন্টের দিকে সরে আসতে দেখছি। তবে, এই এজেন্টগুলো এখনো সাধারণ যুক্তিতে হোঁচট খায়। তারা টোস্টার নিয়ে কবিতা লিখতে পারে, কিন্তু ভুল না করে তিনটি টাইম জোনে মিটিং শিডিউল করতে পারে না। যেকোনো টুলের আসল পরীক্ষা হলো, এটি আউটপুট যাচাই করার সময়ের চেয়ে বেশি সময় বাঁচাতে পারে কি না।
আধুনিক ইনফারেন্সের মেকানিজম
বেশিরভাগ আধুনিক এআই টুল লার্জ ল্যাঙ্গুয়েজ মডেলের ওপর নির্ভর করে যা টোকেন প্রসেস করে সিকোয়েন্সের পরবর্তী যৌক্তিক ধাপ অনুমান করে। এটি একটি পরিসংখ্যানগত প্রক্রিয়া, জ্ঞানীয় নয়। আপনি যখন Claude বা ChatGPT-এর মতো টুলের সাথে কথা বলেন, তখন আপনি কোনো মনের সাথে কথা বলছেন না। আপনি মানুষের ভাষার একটি উচ্চ-মাত্রিক মানচিত্রের সাথে ইন্টারঅ্যাক্ট করছেন। এই পার্থক্যটি বোঝা জরুরি যে কেন এই টুলগুলো ব্যর্থ হয়। তারা বাস্তব পৃথিবী বা আপনার ব্যবসার সূক্ষ্ম বিষয়গুলো বোঝে না। তারা শুধু বোঝে কীভাবে একটি শব্দের পর আরেকটি শব্দ সাধারণত বসে। সাম্প্রতিক আপডেটগুলো কনটেক্সট উইন্ডো বাড়ানোর দিকে মনোযোগ দিয়েছে। এটি মডেলকে একটি সেশনের মধ্যে আরও তথ্য ‘মনে রাখতে’ সাহায্য করে। এটি শুনতে ভালো মনে হলেও, এটি প্রায়ই ‘লস্ট ইন দ্য মিডল’ নামক সমস্যার সৃষ্টি করে। মডেলটি আপনার প্রম্পটের শুরু এবং শেষের দিকে মনোযোগ দেয়, কিন্তু মাঝখানের অংশটি এড়িয়ে যায়।
মাল্টিমোডাল সক্ষমতার দিকে যাত্রা সাম্প্রতিক মাসগুলোর সবচেয়ে বড় পরিবর্তন। এর মানে হলো একই মডেল টেক্সট, ইমেজ এবং কখনো কখনো ভিডিও বা অডিও একসাথে প্রসেস করতে পারে। আমাদের পরীক্ষায়, এখানেই সবচেয়ে কার্যকর অ্যাপ্লিকেশনগুলো পাওয়া গেছে। একটি ভাঙা যন্ত্রাংশের ছবি আপলোড করে মেরামত করার গাইড চাওয়া একটি বাস্তব সুবিধা। তবে, এই ভিজ্যুয়াল ইন্টারপ্রিটেশনের নির্ভরযোগ্যতা এখনো পুরোপুরি নিশ্চিত নয়। একটি মডেল হয়তো গাড়িটি সঠিকভাবে চিনতে পারবে কিন্তু লাইসেন্স প্লেট নম্বর ভুল বলবে। এই অসামঞ্জস্যতার কারণে গুরুত্বপূর্ণ কাজের জন্য এআই-এর ওপর নির্ভর করা কঠিন। কোম্পানিগুলো Retrieval-Augmented Generation ব্যবহার করে এটি ঠিক করার চেষ্টা করছে। এই কৌশলটি এআই-কে উত্তর দেওয়ার আগে নির্দিষ্ট কিছু ডকুমেন্ট দেখতে বাধ্য করে। এটি হ্যালুসিনেশন কমায় কিন্তু পুরোপুরি দূর করে না। এটি সেটআপ প্রক্রিয়ায় জটিলতার একটি স্তর যোগ করে যা অনেক সাধারণ ব্যবহারকারীর কাছে বিরক্তিকর মনে হয়।
কাদের এই টুলগুলো ব্যবহার করা উচিত? আপনি যদি প্রতিদিন চার ঘণ্টা দীর্ঘ ডকুমেন্ট সামারি করতে বা রিপিটেটিভ কোড লিখতে ব্যয় করেন, তবে বর্তমানের অ্যাসিস্ট্যান্টগুলো আপনাকে সাহায্য করবে। আপনি যদি একজন সৃজনশীল পেশাদার হন যিনি একটি ইউনিক ভয়েস খুঁজছেন, তবে এই টুলগুলো সম্ভবত আপনার কাজকে হালকা করে দেবে। এগুলো গড়পড়তা ফলাফলের দিকে ঝুঁকে থাকে। এগুলো সবচেয়ে সাধারণ শব্দ এবং অনুমানযোগ্য কাঠামো ব্যবহার করে। এটি কর্পোরেট মেমোর জন্য চমৎকার কিন্তু সাহিত্যের জন্য জঘন্য। আপনার কাজ যদি নিখুঁত তথ্যের ওপর নির্ভর করে, তবে বর্তমান হাইপ এড়িয়ে চলাই ভালো। এআই-এর কাজ যাচাই করার খরচ প্রায়ই এটি ব্যবহার করে বাঁচানো সময়ের চেয়ে বেশি হয়। আমরা এমন এক পর্যায়ে আছি যেখানে প্রযুক্তিটি চিত্তাকর্ষক কিন্তু এর বাস্তবায়ন প্রায়ই আনাড়ি। সফটওয়্যারটি একজন মানুষ হওয়ার চেষ্টা করছে, যখন এর কেবল একটি ভালো টুল হওয়া উচিত ছিল।
সিলিকন ভ্যালি বাবল ছাড়িয়ে অর্থনৈতিক পরিবর্তন
এই টুলগুলোর বৈশ্বিক প্রভাব সবচেয়ে বেশি অনুভূত হচ্ছে আউটসোর্সিং সেক্টরে। যেসব দেশ কল সেন্টার এবং সাধারণ ডাটা এন্ট্রিকে কেন্দ্র করে অর্থনীতি গড়ে তুলেছিল, তারা বিশাল পরিবর্তনের মুখোমুখি। যখন একটি কোম্পানি প্রতি ঘণ্টায় কয়েক পয়সায় একটি বট নিয়োগ করতে পারে, তখন অন্য দেশে মানুষ নিয়োগ করার উৎসাহ হারিয়ে যায়। এটি কেবল ভবিষ্যতের হুমকি নয়, এটি এখনই ঘটছে। আমরা দক্ষিণ-পূর্ব এশিয়া এবং পূর্ব ইউরোপের মতো অঞ্চলে ছোট ছোট টিমকে দেখছি যারা এআই ব্যবহার করে বড় বড় ফার্মের সাথে প্রতিযোগিতা করছে। তিনজন মানুষের একটি এজেন্সি এখন এমন কাজের চাপ সামলাতে পারে যার জন্য আগে বিশ জন মানুষের প্রয়োজন হতো। উৎপাদনের এই গণতন্ত্রীকরণ একটি দ্বি-ধারী তলোয়ার। এটি প্রবেশের বাধা কমায় কিন্তু সাধারণ ডিজিটাল সার্ভিসের বাজারমূল্যও কমিয়ে দেয়। কাজের সক্ষমতা থেকে এখন মূল্য সরে যাচ্ছে কাজ বিচার করার সক্ষমতার দিকে।
শক্তির ব্যবহার আরেকটি বৈশ্বিক উদ্বেগ যা মার্কেটিং ব্রোশিওরে খুব কমই দেখা যায়। আপনার পাঠানো প্রতিটি প্রম্পটের জন্য প্রচুর বিদ্যুৎ এবং ডাটা সেন্টার ঠান্ডা করার জন্য পানির প্রয়োজন হয়। যেহেতু লাখ লাখ মানুষ এই টুলগুলোকে তাদের দৈনন্দিন রুটিনে যুক্ত করছে, তাই সামগ্রিক পরিবেশগত খরচ বাড়ছে। কিছু অনুমান অনুযায়ী, একটি এআই সার্চ প্রথাগত গুগল সার্চের চেয়ে দশ গুণ বেশি শক্তি ব্যবহার করে। এটি কর্পোরেট সাসটেইনেবিলিটি লক্ষ্য এবং নতুন প্রযুক্তি গ্রহণের তাড়াহুড়োর মধ্যে একটি টানাপোড়েন তৈরি করে। সরকারগুলো বিষয়টি লক্ষ্য করতে শুরু করেছে। আমরা আশা করছি এআই ট্রেনিং ডাটার স্বচ্ছতা এবং বড় আকারের ইনফারেন্সের কার্বন ফুটপ্রিন্ট নিয়ে আরও নিয়মকানুন আসবে। বৈশ্বিক দর্শকদের বিবেচনা করা উচিত যে এআই সামারির সুবিধা কি পরিবেশগত লুকানো ট্যাক্সের চেয়ে বেশি মূল্যবান কি না।
প্রাইভেসি আইনগুলোও তাল মিলিয়ে চলতে হিমশিম খাচ্ছে। যুক্তরাষ্ট্রে, দৃষ্টিভঙ্গি মূলত শিথিল। ইউরোপীয় ইউনিয়নে, এআই অ্যাক্ট ঝুঁকি অনুযায়ী টুলগুলোকে শ্রেণীবদ্ধ করার চেষ্টা করছে। এটি বৈশ্বিক কোম্পানিগুলোর জন্য একটি খণ্ডিত অভিজ্ঞতা তৈরি করে। যে টুল নিউইয়র্কে বৈধ, তা প্যারিসে নিষিদ্ধ হতে পারে। এই রেগুলেটরি ঘর্ষণ নির্দিষ্ট ফিচারের রোলআউট ধীর করে দেবে। এটি এমন ব্যবহারকারীদের মধ্যে বিভাজন তৈরি করে যাদের এই মডেলগুলোর পূর্ণ শক্তির অ্যাক্সেস আছে এবং যারা কঠোর প্রাইভেসি নিয়মের মাধ্যমে সুরক্ষিত। বেশিরভাগ মানুষ বুঝতে পারে না যে তাদের ব্যক্তিগত ডাটার কতটা এই মডেলগুলোর পরবর্তী প্রজন্মকে ট্রেনিং দেওয়ার জন্য ব্যবহার করা হচ্ছে। প্রতিবার আপনি যখন এআই-এর ভুল সংশোধন করে তাকে ‘সাহায্য’ করেন, আপনি আসলে একটি মাল্টি-বিলিয়ন ডলার কর্পোরেশনকে বিনামূল্যে শ্রম এবং ডাটা দিচ্ছেন। এটি পাবলিক থেকে প্রাইভেট এনটিটিতে মেধা সম্পদের একটি বিশাল স্থানান্তর।
অটোমেটেড অফিসে টিকে থাকার উপায়
আসুন এই টুলগুলো ব্যবহারকারী একজন প্রজেক্ট ম্যানেজারের দৈনন্দিন জীবন দেখি। সকালে, তিনি মিস করা তিনটি মিটিংয়ের ট্রান্সক্রিপ্ট সামারি করার জন্য এআই ব্যবহার করেন। সামারিটি ৯০ শতাংশ সঠিক, কিন্তু বাজেটের কাটছাঁট নিয়ে একটি গুরুত্বপূর্ণ তথ্য বাদ পড়ে গেছে। তিনি তবুও অডিওটি ডাবল চেক করতে বিশ মিনিট ব্যয় করেন। পরে, তিনি একটি কোডিং অ্যাসিস্ট্যান্ট ব্যবহার করেন এমন একটি স্ক্রিপ্ট লিখতে যা দুটি স্প্রেডশিটের মধ্যে ডাটা স্থানান্তর করে। সিনট্যাক্স এরর ঠিক করার পর তৃতীয় চেষ্টায় স্ক্রিপ্টটি কাজ করে। বিকেলে, তিনি প্রেজেন্টেশনের হেডার তৈরি করতে ইমেজ জেনারেটর ব্যবহার করেন। এমন একটি ছবি পেতে পনেরোটি প্রম্পট লাগে যার হাতে ছয়টি আঙুল নেই। ব্যবহারকারী একটি নোটিফিকেশন পান যে তার ব্যবহারের সীমা শেষ হয়ে গেছে, যার ফলে তাকে দিনের বাকি সময়ের জন্য কম সক্ষম একটি মডেলে স্যুইচ করতে হয়। এটিই ‘এআই পাওয়ারড’ কর্মদিবসের বাস্তবতা। এটি ছোট ছোট জয়ের পর ক্লান্তিকর ট্রাবলশুটিংয়ের একটি সিরিজ।
যারা সবচেয়ে বেশি উপকৃত হন, তারা হলেন যারা এআই ছাড়াই কাজটি কীভাবে করতে হয় তা জানেন। একজন সিনিয়র ডেভেলপার সেকেন্ডের মধ্যে এআই জেনারেটেড কোডে বাগ খুঁজে পেতে পারেন। একজন জুনিয়র ডেভেলপার হয়তো ঘণ্টার পর ঘণ্টা ব্যয় করবেন কোড কেন রান করছে না তা বুঝতে। এটি একটি ‘সিনিয়রটি ট্র্যাপ’ তৈরি করে যেখানে বিশেষজ্ঞ হওয়ার পথটি এমন টুল দ্বারা অবরুদ্ধ হয়ে যায় যা এন্ট্রি-লেভেল কাজগুলোকে অটোমেট করে। আমরা এআই-এর বিশেষজ্ঞ প্রতিস্থাপনের ক্ষমতাকে বাড়িয়ে দেখছি এবং এটি নতুনদের প্রশিক্ষণে কতটা ক্ষতি করবে তা কমিয়ে দেখছি। যদি ‘বোরিং’ কাজগুলো অটোমেট হয়ে যায়, তবে নতুন কর্মীরা মৌলিক বিষয়গুলো কীভাবে শিখবে? আইন থেকে গ্রাফিক ডিজাইন পর্যন্ত প্রতিটি শিল্পে এটি একটি অমীমাংসিত সমস্যা। টুলগুলো মূলত বিদ্যমান মেধার জন্য একটি ফোর্স মাল্টিপ্লায়ার। আপনি যদি শূন্যকে গুণ করেন, তবে ফলাফল শূন্যই পাবেন।
আমরা সহযোগিতামূলক পরিবেশে অনেক ঘর্ষণ দেখতে পাচ্ছি। যখন একজন ব্যক্তি তাদের ইমেইল লেখার জন্য এআই ব্যবহার করেন, তখন এটি পুরো অফিসের টোন বদলে দেয়। কথোপকথনগুলো আরও আনুষ্ঠানিক এবং কম মানবিক হয়ে ওঠে। এটি একটি অদ্ভুত চক্রের দিকে নিয়ে যায় যেখানে এআই জেনারেটেড টেক্সট সামারি করার জন্য এআই ব্যবহার করা হয়। কেউ আসলে পড়ছে না, এবং কেউ আসলে লিখছে না। আমাদের যোগাযোগের তথ্যের ঘনত্ব কমে যাচ্ছে। আমরা আগের চেয়ে বেশি কন্টেন্ট তৈরি করছি, কিন্তু তার খুব কমই পড়ার যোগ্য। এই পরিবেশে টিকে থাকতে হলে, আপনাকে সেই ব্যক্তি হতে হবে যিনি মানবিক ‘সেনিটি চেক’ প্রদান করেন। পৃথিবী যখন সিন্থেটিক ডাটা দিয়ে প্লাবিত হচ্ছে, তখন মানবিক দৃষ্টিভঙ্গির মূল্য বাড়ছে। যেসব কোম্পানি অটোমেশনের দিকে খুব বেশি ঝুঁকে পড়ে, তারা প্রায়ই তাদের ব্র্যান্ড ভয়েসকে বাসি এবং অনুমানযোগ্য করে ফেলে। তারা সেই ‘অদ্ভুততা’ হারিয়ে ফেলে যা একটি ব্র্যান্ডকে স্মরণীয় করে তোলে।
আপনার কি কোনো এআই গল্প, টুল, প্রবণতা, বা প্রশ্ন আছে যা আপনার মনে হয় আমাদের কভার করা উচিত? আপনার প্রবন্ধের ধারণা আমাদের পাঠান — আমরা তা শুনতে আগ্রহী।এখানে এমন ব্যক্তিদের তালিকা দেওয়া হলো যাদের এখনই এই টুলগুলো এড়িয়ে চলা উচিত:
- চিকিৎসা পেশাজীবী যারা মানুষের তত্ত্বাবধান ছাড়া রোগ নির্ণয়ের সিদ্ধান্ত নিচ্ছেন।
- আইনি গবেষক যারা এমন কেস নিয়ে কাজ করছেন যেখানে একটি ভুল সাইটেশন ডিসবারমেন্টের দিকে নিয়ে যায়।
- সৃজনশীল লেখক যারা একটি ইউনিক এবং পরিচিত ব্যক্তিগত শৈলীকে গুরুত্ব দেন।
- ছোট ব্যবসার মালিক যাদের প্রতিটি আউটপুট ভুলের জন্য অডিট করার সময় নেই।
- ডাটা সেনসিটিভ শিল্প যারা তাদের অভ্যন্তরীণ ডকুমেন্ট ট্রেনিংয়ের জন্য ব্যবহার হওয়ার ঝুঁকি নিতে পারে না।
অ্যালগরিদমিক নিশ্চয়তার মূল্য
আমাদের এই প্রযুক্তির লুকানো খরচ সম্পর্কে কঠিন প্রশ্ন করতে হবে। যদি একটি এআই মডেল পুরো ইন্টারনেটে ট্রেনিং পায়, তবে এটি ইন্টারনেটের পক্ষপাত এবং ভুলগুলো উত্তরাধিকার সূত্রে পায়। আমরা মূলত মানবিক কুসংস্কারকে ডিজিটাইজ এবং প্রসারিত করছি। যখন এআই ব্যাংক লোন বা নিয়োগের বিষয়ে সিদ্ধান্ত নিতে শুরু করবে তখন কী হবে? এই মডেলগুলোর ‘ব্ল্যাক বক্স’ প্রকৃতির মানে হলো আমরা প্রায়ই জানি না কেন একটি নির্দিষ্ট সিদ্ধান্ত নেওয়া হয়েছে। স্বচ্ছতার এই অভাব নাগরিক স্বাধীনতার জন্য একটি বড় ঝুঁকি। আমরা দক্ষতার বিনিময়ে জবাবদিহিতা বিসর্জন দিচ্ছি। এটি কি এমন কোনো বাণিজ্য যা আমরা করতে ইচ্ছুক?
BotNews.today কন্টেন্ট গবেষণা, লেখা, সম্পাদনা এবং অনুবাদের জন্য এআই টুল ব্যবহার করে। আমাদের দল তথ্যকে দরকারী, স্পষ্ট এবং নির্ভরযোগ্য রাখতে প্রক্রিয়াটি পর্যালোচনা ও তত্ত্বাবধান করে।
ডাটা সার্বভৌমত্বের প্রশ্নও রয়েছে। যখন আপনি আপনার কোম্পানির মালিকানাধীন ডাটা ক্লাউড-ভিত্তিক এআই-তে আপলোড করেন, তখন আপনি সেই তথ্যের নিয়ন্ত্রণ হারিয়ে ফেলেন। ‘এন্টারপ্রাইজ’ চুক্তি থাকা সত্ত্বেও, ডাটা লিক বা পরিষেবার শর্ত পরিবর্তনের ঝুঁকি সবসময় থাকে। এই কারণে আমরা স্থানীয়ভাবে এক্সিকিউশনের দিকে সরে আসতে দেখছি। আপনার নিজের হার্ডওয়্যারে একটি মডেল চালানোই একমাত্র উপায় নিশ্চিত হওয়ার যে আপনার ডাটা আপনারই থাকবে। তবে, এর জন্য দামী জিপিইউ এবং প্রযুক্তিগত দক্ষতার প্রয়োজন যা বেশিরভাগ মানুষের নেই। ‘ডাটা রিচ’ এবং ‘ডাটা পুওর’-এর মধ্যে বিভাজন বাড়ছে। বড় কর্পোরেশনগুলোর নিজস্ব প্রাইভেট মডেল তৈরির সম্পদ আছে। ছোট ব্যবসাগুলো পাবলিক টুল ব্যবহার করতে বাধ্য হয় যা তাদের গোপন তথ্য খনি করতে পারে। এটি এক ধরনের নতুন প্রতিযোগিতামূলক অসুবিধা তৈরি করে যা অতিক্রম করা কঠিন।
পরিশেষে, আমাদের ‘ডেড ইন্টারনেট থিওরি’ বিবেচনা করতে হবে। এটি এমন একটি ধারণা যেখানে ইন্টারনেটের বেশিরভাগ অংশ শীঘ্রই বটদের সাথে কথা বলা বট হয়ে যাবে। যদি এআই এমন কন্টেন্ট তৈরি করে যা দিয়ে পরবর্তী এআই ট্রেনিং পায়, তবে মডেলগুলো শেষ পর্যন্ত ভেঙে পড়বে। একে বলা হয় মডেল কোলাপস। প্রতিটি প্রজন্মের সাথে আউটপুটগুলো আরও বিকৃত এবং কম দরকারী হয়ে ওঠে। আমরা ইমেজ জেনারেশনে এর লক্ষণ দেখতে পাচ্ছি, যেখানে নির্দিষ্ট স্টাইলগুলো প্রভাবশালী হয়ে উঠছে কারণ মডেলগুলো তাদের নিজেদের আগের আউটপুট থেকে খাচ্ছে। সিন্থেটিক ফিডব্যাক লুপের পৃথিবীতে আমরা কীভাবে মানবিক স্ফুলিঙ্গ ধরে রাখব? এটি একটি জীবন্ত প্রশ্ন যা প্রযুক্তির পরবর্তী দশককে সংজ্ঞায়িত করবে। আমরা বর্তমানে ‘হানিমুন ফেজ’-এ আছি যেখানে জিনিসগুলোকে আকর্ষণীয় রাখার জন্য পর্যাপ্ত মানবিক ডাটা আছে। তা হয়তো চিরকাল থাকবে না।
আর্কিটেকচারাল সীমাবদ্ধতা এবং লোকাল এক্সিকিউশন
পাওয়ার ইউজারদের জন্য, আসল কাজ ঘটছে লোকাল এক্সিকিউশন এবং ওয়ার্কফ্লো ইন্টিগ্রেশনে। সাধারণ মানুষ ওয়েব ইন্টারফেস ব্যবহার করলেও, প্রফেশনালরা এপিআই এবং লোকাল রানার ব্যবহার করছেন। Ollama এবং LM Studio-এর মতো টুলগুলো আপনাকে সরাসরি আপনার মেশিনে মডেল চালাতে দেয়। এটি সাবস্ক্রিপশন ফি এবং প্রাইভেসি উদ্বেগগুলোকে এড়িয়ে যায়। তবে, আপনি আপনার হার্ডওয়্যারের দ্বারা সীমাবদ্ধ। ৭০ বিলিয়ন প্যারামিটারসহ একটি উচ্চ মানের মডেল চালানোর জন্য আপনার প্রচুর ভি-র্যাম প্রয়োজন। এটি হাই-এন্ড ওয়ার্কস্টেশনের চাহিদায় একটি ঢেউ তুলেছে। বাজারের গিক সেকশন ‘চ্যাটিং’ থেকে সরে এসে ‘ফাংশন কলিং’-এর দিকে যাচ্ছে। এখানেই এআই আসলে আপনার নির্দেশের ভিত্তিতে কোড ট্রিগার করতে পারে বা আপনার ফাইল সিস্টেমের সাথে ইন্টারঅ্যাক্ট করতে পারে।
এপিআই সীমাবদ্ধতা ডেভেলপারদের জন্য একটি বড় বাধা। বেশিরভাগ প্রোভাইডারের কঠোর রেট লিমিট আছে যা একটি প্রোডাক্ট স্কেল করা কঠিন করে তোলে। আপনাকে ‘মডেল ড্রিফট’-এর সাথেও মোকাবিলা করতে হয়, যেখানে প্রোভাইডার পর্দার আড়ালে মডেল আপডেট করে এবং আপনার প্রম্পটগুলো হঠাৎ কাজ করা বন্ধ করে দেয়। এটি এআই-এর ওপর ভিত্তি করে কিছু তৈরি করাকে অনেকটা বালির ওপর বাড়ি তৈরির মতো করে তোলে। এটি প্রশমিত করতে, অনেকে ছোট, ‘ডিস্টিলড’ মডেলের দিকে ঝুঁকছেন যা দ্রুত এবং চালানো সস্তা। নির্দিষ্ট কাজের যেমন সেন্টিমেন্ট অ্যানালাইসিস বা ডাটা এক্সট্রাকশনের জন্য এই মডেলগুলো প্রায়ই দানবদের মতোই ভালো। কৌশলটি হলো কাজের জন্য সম্ভাব্য ক্ষুদ্রতম মডেল ব্যবহার করা। এটি অর্থ বাঁচায় এবং ল্যাটেন্সি কমায়। আমরা ‘ভেক্টর ডাটাবেস’-এর উত্থানও দেখছি যা এআই-কে প্রম্পটের জন্য সঠিক কনটেক্সট খুঁজে পেতে মিলিসেকেন্ডে লাখ লাখ ডকুমেন্ট সার্চ করতে দেয়।
লোকাল সেটআপের জন্য প্রযুক্তিগত প্রয়োজনীয়তার মধ্যে সাধারণত থাকে:
- মৌলিক মডেলের জন্য কমপক্ষে ১২জিবি ভি-র্যাম বা ভালো মডেলের জন্য ২৪জিবি ভি-র্যামসহ একটি এনভিডিয়া জিপিইউ।
- সিপিইউ এবং জিপিইউ-এর মধ্যে ডাটা ট্রান্সফার সামলানোর জন্য কমপক্ষে ৩২জিবি সিস্টেম র্যাম।
- দ্রুত বড় মডেল ফাইল মেমরিতে লোড করার জন্য দ্রুত এনভিএমই স্টোরেজ।
- পাইথন বা ডকারের মতো কন্টেইনার এনভায়রনমেন্ট সম্পর্কে মৌলিক ধারণা।
- একটি নির্ভরযোগ্য কুলিং সিস্টেম কারণ ঘণ্টার পর ঘণ্টা ইনফারেন্স চালালে প্রচুর তাপ উৎপন্ন হয়।
প্রোডাক্টিভিটির ওপর চূড়ান্ত রায়
আমাদের সাম্প্রতিক পরীক্ষার আসল বিজয়ীরা হলেন সেই ব্যবহারকারীরা যারা এআই-কে বিশেষজ্ঞের বিকল্প হিসেবে না দেখে একজন জুনিয়র ইন্টার্ন হিসেবে দেখেন। প্রযুক্তিটি ‘ব্ল্যাঙ্ক পেজ’ সমস্যা সমাধানের জন্য একটি শক্তিশালী টুল। এটি ব্রেইনস্টর্মিং এবং ডিজিটাল জীবনের ক্লান্তিকর অংশগুলো সামলানোর জন্য চমৎকার। তবে, এটি এমন যেকোনো পরিস্থিতিতে একটি দায়বদ্ধতা হিসেবে থেকে যায় যেখানে সূক্ষ্মতা, গভীর যুক্তি বা পরম সত্যের প্রয়োজন হয়। আমরা যে সবচেয়ে সফল বাস্তবায়ন দেখেছি তা হলো এআই ব্যবহার করে একাধিক অপশন তৈরি করা যা একজন মানুষ পরে কিউরেট করেছেন। এই ‘হিউম্যান ইন দ্য লুপ’ মডেলই গুণমান নিশ্চিত করার একমাত্র উপায়। আমরা যত এগিয়ে যাব, ফোকাস মডেলের আকার থেকে ইন্টিগ্রেশনের গুণমানের দিকে সরে যাবে। সেরা এআই হলো সেটি যা আপনি ব্যবহার করছেন তা আপনি টেরও পান না। এটি এমন একটি যা আপনার বিদ্যমান সফটওয়্যারকে একটু স্মার্ট করে তোলে। আপাতত, আপনার প্রত্যাশা কম রাখুন এবং সংশয় বেশি রাখুন। ভবিষ্যৎ এসে গেছে, কিন্তু এর এখনো প্রচুর প্রুফরিডিং প্রয়োজন।
সম্পাদকের মন্তব্য: আমরা এই সাইটটি একটি বহুভাষিক এআই সংবাদ এবং নির্দেশিকা কেন্দ্র হিসাবে তৈরি করেছি তাদের জন্য যারা কম্পিউটার বিশেষজ্ঞ নন, কিন্তু তবুও কৃত্রিম বুদ্ধিমত্তা বুঝতে চান, এটিকে আরও আত্মবিশ্বাসের সাথে ব্যবহার করতে চান এবং যে ভবিষ্যত ইতিমধ্যেই আসছে, তা অনুসরণ করতে চান।
কোনো ত্রুটি বা সংশোধনের প্রয়োজন এমন কিছু খুঁজে পেয়েছেন? আমাদের জানান।