এআই বুমের সংক্ষিপ্ত ইতিহাস: আমরা যেভাবে এখানে পৌঁছালাম
আর্টিফিশিয়াল ইন্টেলিজেন্স বা এআই-এর বর্তমান জোয়ার কিন্তু ২০২২ সালের শেষের দিকে কোনো ভাইরাল চ্যাটবট দিয়ে শুরু হয়নি। এর শুরুটা হয়েছিল ২০১৭ সালে গুগল ইঞ্জিনিয়ারদের একটি বিশেষ রিসার্চ পেপার থেকে, যার শিরোনাম ছিল “Attention Is All You Need”। এই ডকুমেন্টটি ট্রান্সফরমার আর্কিটেকচারের সাথে পরিচয় করিয়ে দেয়, যা মেশিন কীভাবে মানুষের ভাষা প্রসেস করে তা পুরোপুরি বদলে দিয়েছে। এর আগে, কম্পিউটার দীর্ঘ বাক্যের প্রেক্ষাপট মনে রাখতে হিমশিম খেত। একটি অনুচ্ছেদের শেষ পর্যন্ত পৌঁছাতে পৌঁছাতে তারা শুরুর দিকের কথা প্রায়ই ভুলে যেত। ট্রান্সফরমার এই সমস্যার সমাধান করেছে মডেলকে একই সাথে বিভিন্ন শব্দের গুরুত্ব নির্ধারণ করার ক্ষমতা দিয়ে। এই একটিমাত্র টেকনিক্যাল পরিবর্তনই হলো মূল কারণ, যার ফলে আধুনিক টুলগুলোকে রোবটিক মনে না হয়ে বেশ সাবলীল মনে হয়। আমরা এখন সেই সিকোয়েন্সিয়াল প্রসেসিং থেকে সরে আসার সিদ্ধান্তের ফলাফল দেখছি। এই ইতিহাস কেবল ভালো কোড লেখার গল্প নয়, এটি বিশ্বজুড়ে তথ্যের সাথে আমাদের মিথস্ক্রিয়ার মৌলিক পরিবর্তনের গল্প। উত্তর খোঁজার পরিবর্তে উত্তর তৈরি করার এই পরিবর্তন আজকের প্রতিটি ইন্টারনেট ব্যবহারকারীর প্রত্যাশাকে বদলে দিয়েছে।
যুক্তির চেয়ে পরিসংখ্যানগত অনুমান
প্রযুক্তির বর্তমান অবস্থা বুঝতে হলে, এই সিস্টেমগুলো চিন্তা করতে পারে—এই ধারণাটি ঝেড়ে ফেলতে হবে। এরা মোটেও চিন্তা করে না। এরা হলো বিশাল পরিসংখ্যানগত ইঞ্জিন, যা একটি সিকোয়েন্সের পরবর্তী অংশ অনুমান করে। আপনি যখন কোনো প্রম্পট টাইপ করেন, সিস্টেমটি তার ট্রেনিং ডেটা দেখে নির্ধারণ করে যে আপনার ইনপুটের পরে কোন শব্দটি আসার সম্ভাবনা সবচেয়ে বেশি। এটি অতীতের লজিক-ভিত্তিক প্রোগ্রামিং থেকে সম্পূর্ণ আলাদা। আগের দশকগুলোতে সফটওয়্যার কঠোর ‘ইফ-দেন’ নিয়ম মেনে চলত। ব্যবহারকারী কোনো বাটনে ক্লিক করলে সফটওয়্যার নির্দিষ্ট একটি কাজ করত। আজ আউটপুটগুলো প্রোবাবিলিস্টিক বা সম্ভাব্য। এর মানে হলো, মডেলের সেটিংসের ওপর ভিত্তি করে একই ইনপুট থেকে ভিন্ন ভিন্ন আউটপুট আসতে পারে। এই পরিবর্তন এমন এক নতুন ধরনের সফটওয়্যার তৈরি করেছে যা নমনীয়, কিন্তু আবার এমন সব ভুল করার প্রবণতা রাখে যা সাধারণ ক্যালকুলেটর কখনোই করবে না।
এই ট্রেনিংয়ের বিশাল স্কেলই ফলাফলগুলোকে বুদ্ধিমত্তার মতো মনে করায়। কোম্পানিগুলো এই মডেলগুলোকে ফিড দেওয়ার জন্য প্রায় পুরো পাবলিক ইন্টারনেট স্ক্র্যাপ করেছে। এর মধ্যে রয়েছে বই, আর্টিকেল, কোড রিপোজিটরি এবং ফোরাম পোস্ট। বিলিয়ন বিলিয়ন প্যারামিটার বিশ্লেষণ করে মডেলগুলো মানুষের চিন্তার কাঠামো শিখে ফেলে, কিন্তু শব্দের প্রকৃত অর্থ কখনোই বোঝে না। এই বোঝাপড়ার অভাবের কারণেই একটি মডেল নিখুঁত আইনি নথি লিখতে পারলেও সাধারণ গণিত সমস্যায় আটকে যায়। এটি হিসাব করছে না, বরং যারা আগে গণিত করেছে তাদের প্যাটার্ন নকল করছে। পেশাগত কাজে যারা এই টুলগুলো ব্যবহার করছেন, তাদের জন্য এই পার্থক্য বোঝা খুবই জরুরি। এটি স্পষ্ট করে দেয় যে কেন সিস্টেমগুলো ভুল হওয়ার পরেও এত আত্মবিশ্বাসের সাথে উত্তর দেয়।
BotNews.today কন্টেন্ট গবেষণা, লেখা, সম্পাদনা এবং অনুবাদের জন্য এআই টুল ব্যবহার করে। আমাদের দল তথ্যকে দরকারী, স্পষ্ট এবং নির্ভরযোগ্য রাখতে প্রক্রিয়াটি পর্যালোচনা ও তত্ত্বাবধান করে।
সিলিকনের জন্য বৈশ্বিক লড়াই
এই প্রযুক্তিগত পরিবর্তনের প্রভাব সফটওয়্যারের চেয়ে অনেক বেশি। এটি হার্ডওয়্যারের জন্য একটি বিশাল ভূ-রাজনৈতিক লড়াই শুরু করেছে। বিশেষ করে, বিশ্ব এখন হাই-এন্ড গ্রাফিক্স প্রসেসিং ইউনিট বা GPU-এর ওপর নির্ভরশীল। এই চিপগুলো মূলত ভিডিও গেমের জন্য তৈরি করা হয়েছিল, কিন্তু একসাথে অনেক ছোট ছোট হিসাব করার ক্ষমতা থাকায় এগুলো এআই-এর জন্য একদম উপযুক্ত। একটি কোম্পানি, NVIDIA, এখন বিশ্ব অর্থনীতিতে কেন্দ্রীয় ভূমিকা পালন করছে কারণ তারাই এই মডেলগুলো ট্রেনিং করার জন্য প্রয়োজনীয় চিপ তৈরি করে। দেশগুলো এখন এই চিপগুলোকে তেল বা সোনার মতো গুরুত্ব দিচ্ছে। এগুলো হলো কৌশলগত সম্পদ, যা নির্ধারণ করবে আগামী দশকে অর্থনৈতিক প্রবৃদ্ধিতে কোন দেশ এগিয়ে থাকবে।
এই নির্ভরশীলতা তাদের মধ্যে বিভাজন তৈরি করেছে যারা বিশাল কম্পিউট পাওয়ার কিনতে পারে এবং যারা পারে না। একটি টপ-টিয়ার মডেল ট্রেনিং করতে এখন বিদ্যুৎ এবং হার্ডওয়্যার মিলিয়ে কোটি কোটি ডলার খরচ হয়। প্রবেশের এই উচ্চ বাধা মানে হলো, যুক্তরাষ্ট্র এবং চীনের কয়েকটি বড় কর্পোরেশন ক্ষমতার সিংহভাগ ধরে রেখেছে। প্রভাবের এই কেন্দ্রীভূত হওয়া বিশ্বজুড়ে নিয়ন্ত্রকদের জন্য বড় উদ্বেগের বিষয়। এটি ডেটা কীভাবে সংরক্ষিত হয় থেকে শুরু করে একটি স্টার্টআপকে মৌলিক টুল ব্যবহারের জন্য কত খরচ করতে হবে—সবকিছুকেই প্রভাবিত করে। শিল্পের অর্থনৈতিক মাধ্যাকর্ষণ এখন ডেটা সেন্টারের মালিকদের দিকে ঝুঁকেছে। এটি শুরুর দিকের ইন্টারনেটের চেয়ে অনেক আলাদা, যখন ছোট একটি টিমও খুব কম বাজেটে বিশ্বমানের পণ্য তৈরি করতে পারত। 2026-এ, প্রবেশের খরচ আগের যেকোনো সময়ের চেয়ে অনেক বেশি।
বিমূর্ত যখন দৈনন্দিন কাজ
অধিকাংশ মানুষের কাছে এই প্রযুক্তির ইতিহাসের চেয়ে এর দৈনন্দিন উপযোগিতা বেশি গুরুত্বপূর্ণ। ধরুন সারা নামের একজন মার্কেটিং ম্যানেজারের কথা। কয়েক বছর আগে, তার দিনের অনেকটা সময় লাগত ম্যানুয়াল রিসার্চ এবং ড্রাফটিংয়ের পেছনে। তাকে ট্রেন্ড খুঁজতে হতো, ডজন ডজন আর্টিকেল পড়তে হতো এবং তারপর সেগুলোকে একটি রিপোর্টে রূপ দিতে হতো। আজ তার কাজের ধরন আলাদা। সে একটি মডেল ব্যবহার করে সেরা ট্রেন্ডগুলোর সারসংক্ষেপ তৈরি করে এবং একটি প্রাথমিক আউটলাইন লিখে ফেলে। সে এখন আর শুধু লেখক নয়, সে মেশিন-জেনারেটেড কন্টেন্টের একজন এডিটর। এই পরিবর্তন কিবোর্ড ব্যবহার করা প্রতিটি শিল্পে ঘটছে। এটি শুধু গতির কথা নয়, এটি সাদা পৃষ্ঠার ভীতি দূর করার বিষয়। মেশিন প্রথম খসড়াটি দেয়, আর মানুষ তার দিকনির্দেশনা দেয়।
এই পরিবর্তনের প্রভাব চাকরির নিরাপত্তা এবং দক্ষতা উন্নয়নের ওপরও পড়ছে। যদি একজন জুনিয়র অ্যানালিস্ট এখন এই টুলগুলো ব্যবহার করে তিনজনের কাজ একা করতে পারে, তবে এন্ট্রি-লেভেল জব মার্কেটের কী হবে? আমরা একটি “সুপার-ইউজার” মডেলের দিকে যাচ্ছি যেখানে একজন ব্যক্তি জটিল কাজ সম্পন্ন করার জন্য একাধিক এআই এজেন্ট পরিচালনা করেন। সফটওয়্যার ইঞ্জিনিয়ারিংয়ে এটি স্পষ্ট, যেখানে GitHub Copilot-এর মতো টুল পুরো কোড ব্লক সাজেস্ট করে। ডেভেলপার এখন টাইপ করার চেয়ে অডিট করার পেছনে বেশি সময় ব্যয় করেন। এই নতুন বাস্তবতায় ভিন্ন ধরনের দক্ষতার প্রয়োজন। আপনাকে এখন আর প্রতিটি সিনট্যাক্স নিয়ম মনে রাখতে হবে না। আপনাকে জানতে হবে কীভাবে সঠিক প্রশ্ন করতে হয় এবং নিখুঁত দেখতে টেক্সটের মাঝে সূক্ষ্ম ভুল কীভাবে ধরতে হয়। 2026-এ একজন পেশাজীবীর জীবন এখন প্রম্পট এবং ভেরিফাই করার এক অবিরাম চক্র। অনুশীলনে এটি যেভাবে কাজ করে:
- সফটওয়্যার ডেভেলপাররা রিপিটেটিভ ইউনিট টেস্ট এবং বয়লারপ্লেট কোড লিখতে মডেল ব্যবহার করেন।
- আইনি সহকারীরা নির্দিষ্ট কি-ওয়ার্ডের জন্য হাজার হাজার পৃষ্ঠার নথি স্ক্যান করতে এগুলো ব্যবহার করেন।
- মেডিকেল গবেষকরা বিভিন্ন প্রোটিন স্ট্রাকচার কীভাবে মিথস্ক্রিয়া করতে পারে তা অনুমান করতে এগুলো ব্যবহার করেন।
- কাস্টমার সার্ভিস টিম মানুষের হস্তক্ষেপ ছাড়াই সাধারণ প্রশ্নের উত্তর দিতে এগুলো ব্যবহার করে।
ব্ল্যাক বক্সের নীরব খরচ
আমরা যত বেশি এই সিস্টেমগুলোর ওপর নির্ভর করছি, আমাদের তাদের লুকানো খরচ সম্পর্কে কঠিন প্রশ্ন করতে হবে। প্রথমটি হলো পরিবেশগত প্রভাব। একটি বড় ল্যাঙ্গুয়েজ মডেলে একটি সাধারণ কুয়েরি করতে সাধারণ গুগল সার্চের চেয়ে অনেক বেশি বিদ্যুৎ প্রয়োজন হয়। লাখ লাখ ব্যবহারকারীর ক্ষেত্রে এই কার্বন ফুটপ্রিন্ট অনেক বড় হয়ে দাঁড়ায়। পানির ব্যবহারের বিষয়টিও আছে। ডেটা সেন্টারগুলোতে সার্ভার ঠান্ডা রাখার জন্য প্রচুর পানি লাগে। আমরা কি দ্রুত ইমেইল লেখার জন্য স্থানীয় পানির নিরাপত্তা বিসর্জন দিতে রাজি আছি? ডেটা সেন্টারের কাছাকাছি অনেক কমিউনিটি এখন এই প্রশ্ন করতে শুরু করেছে। আমাদের ডেটার দিকেও তাকাতে হবে। অধিকাংশ মডেল কপিরাইট করা উপাদানের ওপর ট্রেনিং করা হয়েছে, যা নির্মাতাদের অনুমতি ছাড়াই করা হয়েছে। এর ফলে শিল্পী এবং লেখকদের পক্ষ থেকে মামলার ঢেউ উঠেছে, যারা দাবি করছেন যে তাদের কাজ চুরি করে এমন পণ্য তৈরি করা হয়েছে যা হয়তো ভবিষ্যতে তাদেরই প্রতিস্থাপন করবে।
এরপর আছে ব্ল্যাক বক্সের সমস্যা। এমনকি যারা এই মডেলগুলো তৈরি করেন, তারাও পুরোপুরি বোঝেন না কেন এগুলো নির্দিষ্ট সিদ্ধান্ত নেয়। যখন এআই নিয়োগ বা লোন অনুমোদনের মতো সংবেদনশীল কাজে ব্যবহৃত হয়, তখন এই স্বচ্ছতার অভাব বিপজ্জনক। যদি কোনো মডেল নির্দিষ্ট গোষ্ঠীর বিরুদ্ধে পক্ষপাত তৈরি করে, তবে তার মূল কারণ খুঁজে বের করা এবং ঠিক করা কঠিন হতে পারে। আমরা মূলত গুরুত্বপূর্ণ সামাজিক সিদ্ধান্তগুলো এমন একটি সিস্টেমের হাতে ছেড়ে দিচ্ছি যা তার নিজের যুক্তির ব্যাখ্যা দিতে পারে না। আমরা কীভাবে একটি মেশিনকে জবাবদিহিতার আওতায় আনব? আমরা কীভাবে নিশ্চিত করব যে এই সিস্টেমগুলো ট্রেনিং করার ডেটা পুরনো কুসংস্কারকে উসকে দিচ্ছে না? এগুলো তাত্ত্বিক সমস্যা নয়। এগুলো সক্রিয় সমস্যা যা সর্বশেষ এআই ডেভেলপমেন্টগুলো বিভিন্ন মাত্রার সাফল্যের সাথে সমাধান করার চেষ্টা করছে।
আপনার কি কোনো এআই গল্প, টুল, প্রবণতা, বা প্রশ্ন আছে যা আপনার মনে হয় আমাদের কভার করা উচিত? আপনার প্রবন্ধের ধারণা আমাদের পাঠান — আমরা তা শুনতে আগ্রহী।
ল্যাটেন্সি এবং টোকেন ইকোনমি
যারা এই টুলগুলো পেশাগত কাজে যুক্ত করতে চান, তাদের জন্য টেকনিক্যাল খুঁটিনাটি জানা জরুরি। এই মডেলগুলোর সাথে অধিকাংশ মিথস্ক্রিয়া হয় অ্যাপ্লিকেশন প্রোগ্রামিং ইন্টারফেস বা API-এর মাধ্যমে। এখানেই আপনি টোকেনের ধারণাটি পাবেন। একটি টোকেন মানে প্রায় চারটি ইংরেজি অক্ষরের টেক্সট। মডেলগুলো শব্দ পড়ে না, তারা টোকেন পড়ে। এটি গুরুত্বপূর্ণ কারণ অধিকাংশ প্রোভাইডার প্রসেস করা টোকেনের সংখ্যার ওপর ভিত্তি করে চার্জ করে। আপনি যদি এমন টুল তৈরি করেন যা দীর্ঘ ডকুমেন্ট বিশ্লেষণ করে, তবে আপনার খরচ দ্রুত বাড়তে পারে। আপনাকে কন্টেক্সট উইন্ডোও ম্যানেজ করতে হবে। এটি হলো তথ্যের সেই পরিমাণ যা মডেল একবারে “মনে রাখতে” পারে। শুরুর দিকের মডেলগুলোর উইন্ডো ছোট ছিল, কিন্তু নতুন ভার্সনগুলো একটি প্রম্পটেই পুরো বই প্রসেস করতে পারে। তবে, বড় উইন্ডো প্রায়ই ল্যাটেন্সি বাড়িয়ে দেয় এবং টেক্সটের মাঝখানে মডেলের খেই হারিয়ে ফেলার সম্ভাবনা বাড়িয়ে দেয়।
আরেকটি গুরুত্বপূর্ণ ক্ষেত্র হলো লোকাল স্টোরেজ এবং প্রাইভেসি। অনেক এন্টারপ্রাইজ সংবেদনশীল ডেটা থার্ড-পার্টি সার্ভারে পাঠাতে দ্বিধা বোধ করে। এর ফলে Llama 3-এর মতো লোকাল মডেলের উত্থান ঘটেছে, যা ইন্টারনাল হার্ডওয়্যারে চালানো যায়। লোকালভাবে একটি মডেল চালানোর জন্য আপনার GPU-তে প্রচুর VRAM প্রয়োজন। উদাহরণস্বরূপ, একটি ৭০ বিলিয়ন প্যারামিটার মডেল চালানোর জন্য সাধারণত দুটি হাই-এন্ড কার্ড লাগে। এখানেই কোয়ান্টাইজেশন কাজে আসে। এটি এমন একটি কৌশল যা হিসাবের জন্য ব্যবহৃত সংখ্যার প্রিসিশন কমিয়ে মডেলের সাইজ ছোট করে ফেলে। এটি একটি শক্তিশালী মডেলকে সামান্য নির্ভুলতা কমিয়ে সাধারণ কনজিউমার হার্ডওয়্যারে চালানোর সুযোগ দেয়। ডেভেলপারদের এই বিষয়গুলোর মধ্যে ভারসাম্য রাখতে হয়:
- API খরচ বনাম লোকালভাবে মডেল চালানোর হার্ডওয়্যার খরচ।
- ছোট মডেলের গতি বনাম বড় মডেলের যুক্তিবোধের ক্ষমতা।
- ডেটা অন-প্রিমিজে রাখার নিরাপত্তা বনাম ক্লাউডের সুবিধা।
- পিক আওয়ারে পাবলিক API-এর রেট-থ্রটলিং লিমিট।
সামনের পথ
এআই বুমের ইতিহাস হলো একটি ভালো আইডিয়াকে স্কেল করার গল্প। ট্রান্সফরমার আর্কিটেকচার নিয়ে তাতে প্রচুর ডেটা এবং কম্পিউট পাওয়ার ঢেলে আমরা এমন কিছু তৈরি করেছি যা কম্পিউটিংয়ের নতুন যুগের মতো মনে হয়। কিন্তু আমরা এখনো প্রাথমিক পর্যায়ে আছি। প্রযুক্তি যা করতে পারে এবং আমরা যা আশা করি—তার মধ্যকার ব্যবধান থেকেই আজকের এই বিভ্রান্তি। এটি মানুষের বিচারবুদ্ধির বিকল্প নয়, বরং এটি মানুষের সক্ষমতা বৃদ্ধির একটি টুল। আগামী বছরগুলোতে তারাই সবচেয়ে সফল হবেন যারা এই সিস্টেমগুলোর পরিসংখ্যানগত প্রকৃতি বোঝেন। তারা জানবেন কখন মেশিনকে বিশ্বাস করতে হবে এবং কখন তার কাজ যাচাই করতে হবে। আমরা এমন এক ভবিষ্যতের দিকে যাচ্ছি যেখানে এআই ম্যানেজ করার ক্ষমতা ওয়ার্ড প্রসেসর ব্যবহার করার মতোই মৌলিক দক্ষতা হয়ে উঠবে।
সম্পাদকের মন্তব্য: আমরা এই সাইটটি একটি বহুভাষিক এআই সংবাদ এবং নির্দেশিকা কেন্দ্র হিসাবে তৈরি করেছি তাদের জন্য যারা কম্পিউটার বিশেষজ্ঞ নন, কিন্তু তবুও কৃত্রিম বুদ্ধিমত্তা বুঝতে চান, এটিকে আরও আত্মবিশ্বাসের সাথে ব্যবহার করতে চান এবং যে ভবিষ্যত ইতিমধ্যেই আসছে, তা অনুসরণ করতে চান।
কোনো ত্রুটি বা সংশোধনের প্রয়োজন এমন কিছু খুঁজে পেয়েছেন? আমাদের জানান।