بانیان، ناقدین اور محققین: وہ گفتگو جو پڑھنے کے لائق ہے
زیادہ تر لوگ OpenAI کے CEO کا نام جانتے ہیں۔ لیکن بہت کم لوگ ان محققین کے نام جانتے ہیں جنہوں نے بڑے لینگویج ماڈلز (large language models) کے موجودہ دور کی بنیاد رکھی۔ علم کا یہ خلا اس بات کو مسخ کر دیتا ہے کہ ٹیکنالوجی دراصل کیسے ترقی کرتی ہے۔ ہم مصنوعی ذہانت (AI) کو پروڈکٹ لانچ کے ایک سلسلے کے طور پر دیکھتے ہیں، حالانکہ یہ ریاضیاتی کامیابیوں کا ایک سست عمل ہے۔ بانیان سرمایہ اور عوامی بیانیے کو سنبھالتے ہیں، جبکہ محققین وزن (weights) اور منطق کو۔ ان کے درمیان فرق کو سمجھنا ہی مارکیٹنگ کے دھوکے سے بچنے کا واحد طریقہ ہے۔ اگر آپ صرف بانیان کو فالو کرتے ہیں، تو آپ ایک فلم دیکھ رہے ہیں۔ اگر آپ محققین کو فالو کرتے ہیں، تو آپ اسکرپٹ پڑھ رہے ہیں۔ یہ مضمون اس بات کا جائزہ لیتا ہے کہ یہ فرق کیوں اہم ہے اور ان اشاروں کی شناخت کیسے کی جائے جو صنعت کے مستقبل کا تعین کرتے ہیں۔ ہم کرشماتی تقاریر سے آگے بڑھ کر لیب کی سرد حقیقت کو دیکھیں گے۔ اب وقت آگیا ہے کہ ان لوگوں پر توجہ دی جائے جو کوڈ لکھتے ہیں، نہ کہ صرف ان پر جو پریس ریلیز پر دستخط کرتے ہیں۔
مشین دور کے پوشیدہ معمار
بانیان عوامی چہرہ ہوتے ہیں۔ وہ World Economic Forum میں بولتے ہیں اور کانگریس کے سامنے گواہی دیتے ہیں۔ ان کا کام اربوں کی فنڈنگ حاصل کرنا اور ایک ایسا برانڈ بنانا ہے جو ناگزیر لگے۔ وہ ایسے الفاظ استعمال کرتے ہیں جو جادو کا تاثر دیں۔ محققین مختلف ہوتے ہیں۔ وہ Python اور LaTeX میں کام کرتے ہیں۔ وہ لاس فنکشنز اور ٹوکن کی کارکردگی کی پرواہ کرتے ہیں۔ ایک بانی کہہ سکتا ہے کہ ان کا ماڈل سوچ رہا ہے۔ ایک محقق آپ کو بتائے گا کہ یہ ایک مخصوص پراببلٹی ڈسٹری بیوشن کی بنیاد پر اگلا ممکنہ لفظ بتا رہا ہے۔ الجھن اس لیے پیدا ہوتی ہے کیونکہ میڈیا ان دونوں گروپس کو ایک سمجھتا ہے۔ جب کوئی CEO کہتا ہے کہ ایک ماڈل موسمیاتی تبدیلی کو حل کر دے گا، تو یہ ایک سیلز پچ ہے۔ جب کوئی محقق sparse autoencoders پر مقالہ شائع کرتا ہے، تو یہ ایک تکنیکی دعویٰ ہے۔ ایک امید ہے، دوسرا حقیقت۔
عوام اکثر امید کو حقیقت سمجھ لیتے ہیں۔ یہ حد سے زیادہ وعدوں اور کم نتائج کے چکر کو جنم دیتا ہے۔ اس فیلڈ کو سمجھنے کے لیے، آپ کو کار بیچنے والے کو انجن ڈیزائن کرنے والے سے الگ کرنا ہوگا۔ انجن ڈیزائنر کو معلوم ہوتا ہے کہ بولٹ کہاں ڈھیلے ہیں۔ سیلز مین آپ کو کبھی نہیں بتائے گا کیونکہ اس کا کام اسٹاک کی قیمت کو اونچا رکھنا ہے۔ ہم ہر بار یہ دیکھتے ہیں جب کوئی نیا ماڈل آتا ہے۔ بانی ہائپ بنانے کے لیے ایک مبہم ٹویٹ کرتا ہے۔ محقق arXiv پر ایک تکنیکی رپورٹ کا لنک پوسٹ کرتا ہے۔ ٹویٹ کو لاکھوں ویوز ملتے ہیں۔ تکنیکی رپورٹ کو چند ہزار لوگ پڑھتے ہیں جو دراصل چیزیں بناتے ہیں۔ یہ ایک فیڈبیک لوپ بناتا ہے جہاں سب سے بلند آوازیں باقی سب کے لیے حقیقت کا تعین کرتی ہیں۔
جدت کے عوامی چہرے سے پرے
یہ تقسیم عالمی پالیسی کے لیے بڑے مضمرات رکھتی ہے۔ حکومتیں اس وقت بانیوں کی وارننگ کی بنیاد پر قوانین بنا رہی ہیں۔ یہ بانی اکثر ایسے وجودی خطرات کے بارے میں خبردار کرتے ہیں جو سائنس فکشن کی طرح لگتے ہیں۔ اس سے توجہ موجودہ نقصانات کے بجائے فرضی مستقبل پر مرکوز رہتی ہے۔ دریں اثنا، محققین ڈیٹا کے تعصب اور توانائی کی کھپت جیسے فوری مسائل کی نشاندہی کر رہے ہیں۔ صرف مشہور ناموں کو سننے سے، ہم غلط چیزوں کو ریگولیٹ کرنے کا خطرہ مول لیتے ہیں۔ ہم شاید مستقبل کی سپر انٹیلی جنس پر پابندی لگا دیں جبکہ اس حقیقت کو نظر انداز کر دیں کہ موجودہ ماڈلز اپنے ڈیٹا سینٹرز کو ٹھنڈا کرنے کے لیے چھوٹے قصبوں کا پانی ختم کر رہے ہیں۔ یہ صرف امریکی مسئلہ نہیں ہے۔ یورپ اور ایشیا میں بھی یہی صورتحال ہے۔
جن آوازوں کو سب سے زیادہ سنا جاتا ہے وہ وہ ہیں جن کے پاس مارکیٹنگ کا سب سے بڑا بجٹ ہے۔ یہ ایک ایسا ماحول بناتا ہے جہاں چند کمپنیاں پورے سیارے کے لیے ایجنڈا طے کرتی ہیں۔ اگر ہم اپنا نقطہ نظر وسیع نہیں کرتے، تو ہم سلیکون ویلی کے چند لوگوں کو یہ طے کرنے دیتے ہیں کہ کیا محفوظ ہے اور کیا ممکن ہے۔ طاقت کا یہ ارتکاز خود ایک خطرہ ہے۔ یہ اس شعبے میں فکر کے تنوع کو محدود کرتا ہے جس کی اسے ضرورت ہے۔ ہمیں ٹورنٹو یونیورسٹی یا ٹوکیو کی لیبز کے لوگوں کو بھی اتنا ہی سننا چاہیے جتنا ہم سان فرانسسکو کے لوگوں کو سنتے ہیں۔ سائنسی ترقی ایک عالمی کوشش ہے، لیکن بیانیہ فی الحال ایک مقامی اجارہ داری ہے۔ ہمیں Nature جیسے جرائد کو دیکھنا چاہیے تاکہ کارپوریٹ بورڈ رومز سے باہر ہونے والی حقیقی پیش رفت کو سمجھ سکیں۔
دنیا غلط لوگوں کی بات کیوں سنتی ہے
ایک بڑی لیب میں لیڈ محقق کی زندگی کا ایک دن تصور کریں۔ وہ اٹھتے ہیں اور ٹریننگ رن کے نتائج چیک کرتے ہیں جس پر تیس لاکھ ڈالر خرچ ہوئے ہیں۔ وہ دیکھتے ہیں کہ ماڈل توقع سے زیادہ ہالوسینیشن (غلط معلومات) پیدا کر رہا ہے۔ وہ ڈیٹا کلسٹرز کو دیکھنے میں دس گھنٹے گزارتے ہیں تاکہ شور (noise) کو تلاش کر سکیں۔ وہ 2024 کے انتخابات یا انسانیت کی تقدیر کے بارے میں نہیں سوچ رہے۔ وہ اس بارے میں سوچ رہے ہیں کہ ماڈل پیچیدہ جملوں میں نفی (negation) کو سمجھنے میں کیوں ناکام ہے۔ وہ نیوران ایکٹیویشن کے ہیٹ میپس دیکھ رہے ہیں۔ ان کی کامیابی کا پیمانہ بٹس فی کریکٹر یا کسی مخصوص بینچ مارک پر درستگی ہے۔ اب ایک بانی کا دن تصور کریں۔ وہ کسی سربراہ مملکت سے ملنے کے لیے نجی جیٹ پر ہیں۔ وہ نئی معیشت کے ٹریلین ڈالر کے مواقع کے بارے میں بات کر رہے ہیں۔
محقق ‘کیسے’ (how) سے نمٹتا ہے۔ بانی اس بات سے نمٹتا ہے کہ یہ پیسے کے قابل کیوں ہے۔ ایک ایپ بنانے والے ڈویلپر کے لیے، محقق زیادہ اہم شخصیت ہے۔ محقق API لیٹنسی اور کانٹیکسٹ ونڈو کا تعین کرتا ہے۔ بانی قیمت کا تعین کرتا ہے۔ اگر آپ کاروبار بنانے کی کوشش کر رہے ہیں، تو آپ کو یہ جاننے کی ضرورت ہے کہ کیا ٹیکنالوجی واقعی وہ کر سکتی ہے جو بانی کہتا ہے۔ اکثر، یہ نہیں کر سکتی۔ ہم نے خودکار ڈرائیونگ کے ابتدائی دنوں میں یہ دیکھا۔ بانیوں نے کہا کہ 2026 تک ہمارے پاس لاکھوں روبوٹیکسیاں ہوں گی۔ محققین جانتے تھے کہ شدید بارش میں ایج کیسز ابھی بھی ایک حل طلب مسئلہ تھا۔ عوام نے بانیوں پر یقین کیا۔ محققین درست تھے۔
یہی پیٹرن جنریٹو AI کی جگہ میں دہرایا جا رہا ہے۔ ہمیں بتایا جاتا ہے کہ ماڈل جلد ہی وکلاء اور ڈاکٹروں کی جگہ لے لیں گے۔ اگر آپ تکنیکی مقالے پڑھیں، تو آپ دیکھیں گے کہ ماڈل ابھی بھی بنیادی منطقی مستقل مزاجی کے ساتھ جدوجہد کر رہے ہیں۔ ڈیمو اور حقیقت کے درمیان کا خلا وہ جگہ ہے جہاں کمپنیاں پیسے کھوتی ہیں۔ آپ مصنوعی ذہانت کے رجحانات کا گہرا جائزہ تلاش کر سکتے ہیں تاکہ یہ دیکھ سکیں کہ ان تکنیکی حدود کو آج کیسے پرکھا جا رہا ہے۔ یہ فرق ایک درست سرمایہ کاری اور قیاس آرائی پر مبنی بلبلے کے درمیان کا فرق ہے۔ جب آپ کوئی نیا دعویٰ سنیں، تو خود سے پوچھیں کہ کیا یہ کسی مقالے سے آیا ہے یا پریس ریلیز سے۔ جواب آپ کو بتائے گا کہ اسے کتنی اہمیت دینی ہے۔ MIT Technology Review کے صحافی اکثر لیب اور لابی کے درمیان اس فرق کو اجاگر کرتے ہیں۔ ہمیں یاد رکھنا چاہیے کہ بانیوں کو خامیاں چھپانے کی ترغیب دی جاتی ہے جبکہ محققین کو انہیں تلاش کرنے کی۔ پہلا ہائپ بناتا ہے اور دوسرا سچائی۔ طویل مدت میں، سچائی ہی واحد چیز ہے جو قائم رہتی ہے۔ ہم نے 2026 میں یہ دیکھا جب ہائپ کی پہلی لہر تکنیکی حقیقت کے بوجھ تلے ٹھنڈی ہونے لگی۔
لیب میں ایک منگل بمقابلہ بورڈ روم
ہمیں ترقی کے موجودہ راستے کے بارے میں مشکل سوالات پوچھنے چاہئیں۔ اس تحقیق کے لیے کون ادائیگی کر رہا ہے جس کے بارے میں بانی دعویٰ کرتے ہیں کہ اس سے سب کو فائدہ ہوگا؟ زیادہ تر اعلیٰ محققین نے اکیڈمیا چھوڑ کر نجی لیبز کا رخ کیا ہے۔ اس کا مطلب ہے کہ وہ جو علم پیدا کرتے ہیں وہ اب عوامی بھلائی نہیں رہا۔ یہ ایک کارپوریٹ راز ہے۔ سائنسی طریقہ کار کا کیا ہوتا ہے جب کسی نکتے کو ثابت کرنے کے لیے استعمال ہونے والا ڈیٹا پے وال کے پیچھے چھپا ہو؟ ہم اوپن سائنس سے دور ہو کر بند مسابقتی فائدے کے ماڈل کی طرف بڑھ رہے ہیں۔ کیا چند افراد کی شہرت فیلڈ کی مدد کر رہی ہے یا یہ شخصیت پرستی کا کلٹ بنا رہی ہے جو اختلاف رائے کی حوصلہ شکنی کرتا ہے؟ اگر کوئی محقق کسی فلیگ شپ ماڈل میں بڑی خامی تلاش کرتا ہے، تو کیا وہ اسے رپورٹ کرنے میں محفوظ محسوس کرتا ہے اگر اس سے کمپنی کی ویلیویشن گر سکتی ہے؟
BotNews.today مواد کی تحقیق، تحریر، تدوین اور ترجمہ کے لیے AI ٹولز کا استعمال کرتا ہے۔ ہماری ٹیم معلومات کو مفید، واضح اور قابل اعتماد رکھنے کے لیے اس عمل کا جائزہ لیتی ہے اور اس کی نگرانی کرتی ہے۔
ان فرموں پر مالی دباؤ بہت زیادہ ہے۔ ہمیں ماحولیاتی لاگت پر بھی غور کرنا ہوگا۔ کیا تھوڑے بہتر بینچ مارکس کے حصول کے لیے ان ماڈلز کی ٹریننگ کا بھاری کاربن فٹ پرنٹ برداشت کرنا درست ہے؟ ہم اکثر ماحول کے لیے AI کے فوائد کے بارے میں بات کرتے ہیں، لیکن ہم شاذ و نادر ہی کوئی ایسا لیجر دیکھتے ہیں جو دونوں کا توازن برقرار رکھے۔ آخر میں، اس کلچر کا مالک کون ہے جس پر یہ ماڈلز ٹرین کیے جاتے ہیں؟ محققین اپنے سسٹمز بنانے کے لیے انٹرنیٹ کی اجتماعی آؤٹ پٹ کا استعمال کرتے ہیں۔ پھر بانی اسی آؤٹ پٹ کے کشیدہ ورژن تک رسائی کے لیے عوام سے چارج لیتے ہیں۔ یہ دولت کی منتقلی ہے جس پر سرخیوں میں شاذ و نادر ہی بات کی جاتی ہے۔ یہ صرف تکنیکی مسائل نہیں ہیں۔ یہ سماجی اور اخلاقی مخمصے ہیں جنہیں حل کرنے کے لیے صرف ایک بہتر الگورتھم سے زیادہ کی ضرورت ہے۔
تکنیکی رکاوٹیں اور مقامی نفاذ
ان پلیٹ فارمز پر تعمیر کرنے والوں کے لیے، تکنیکی تفصیلات فلسفے سے زیادہ اہم ہیں۔ موجودہ API کی حدود انٹرپرائز اپنانے کے لیے ایک بڑی رکاوٹ ہیں۔ زیادہ تر فراہم کنندگان کے پاس سخت ریٹ کی حدود ہیں جو ہائی والیوم ریئل ٹائم پروسیسنگ کو روکتی ہیں۔ اسی لیے بہت سی فرمیں مقامی اسٹوریج اور مقامی عمل درآمد پر غور کر رہی ہیں۔ مقامی ہارڈ ویئر پر Llama 3 جیسے ماڈلز کا استعمال بہتر ڈیٹا پرائیویسی اور کم طویل مدتی اخراجات کی اجازت دیتا ہے۔ تاہم، ہارڈ ویئر کی ضروریات سخت ہیں۔ 70 بلین پیرامیٹر ماڈل کو مناسب رفتار سے چلانے کے لیے، آپ کو کافی VRAM کے ساتھ ہائی اینڈ GPUs کی ضرورت ہے۔ یہ وہ جگہ ہے جہاں گیک سیکشن مالی سیکشن سے ملتا ہے۔ H100 کلسٹر کی قیمت داخلے کی ایک ایسی رکاوٹ ہے جو طاقت کو امیروں کے ہاتھوں میں رکھتی ہے۔
ہم خصوصی فائن ٹیوننگ کی طرف بھی منتقلی دیکھ رہے ہیں۔ ہر چیز کے لیے ایک عام ماڈل استعمال کرنے کے بجائے، ڈویلپرز مخصوص ڈیٹا سیٹس پر ٹرین کیے گئے چھوٹے ماڈلز استعمال کر رہے ہیں۔ یہ درستگی کو بہتر بناتا ہے اور ٹوکن کی تعداد کو کم کرتا ہے۔ یہاں تکنیکی چیلنج ڈیٹا کی کیوریشن ہے۔ اگر ان پٹ ڈیٹا ناقص ہے، تو فائن ٹیونڈ ماڈل عام ماڈل سے بھی بدتر ہوگا۔ ہم حقائق پر مبنی ڈیٹا میں ماڈلز کو گراؤنڈ کرنے کے لیے Retrieval Augmented Generation (RAG) کا زیادہ استعمال بھی دیکھ رہے ہیں۔ یہ بڑی کانٹیکسٹ ونڈوز کی ضرورت کو ختم کرتا ہے اور ہالوسینیشن کو کم کرتا ہے۔ لیکن RAG کی اپنی حدود ہیں، خاص طور پر اس بات میں کہ یہ بازیافت شدہ دستاویزات کی درجہ بندی کو کیسے ہینڈل کرتا ہے۔ اگر سرچ کا مرحلہ ناکام ہو جاتا ہے، تو ماڈل آؤٹ پٹ بیکار ہے۔ زیادہ تر صارفین کو یہ احساس نہیں ہوتا کہ AI کی کارکردگی اتنی ہی ڈیٹا بیس پر منحصر ہے جس سے وہ استفسار کرتا ہے جتنا کہ خود ماڈل پر۔
معلومات کے لیے حتمی فلٹر
AI کا مستقبل کسی ایک شخص کی سنائی گئی ایک کہانی نہیں ہے۔ یہ ان لوگوں کے درمیان ایک گڑبڑ، جاری بحث ہے جو ایک وژن بیچتے ہیں اور وہ جو حقیقت بناتے ہیں۔ ٹیک نیوز کا ایک سمجھدار صارف بننے کے لیے، آپ کو کرشماتی بانی سے آگے دیکھنا سیکھنا ہوگا۔ مقالوں پر نام تلاش کریں۔ ان محققین کو تلاش کریں جو اس بارے میں بات کرنے کے لیے تیار ہیں کہ ان کے ماڈل کیا نہیں کر سکتے۔ صنعت میں تضادات بگز نہیں ہیں۔ وہ کہانی کا سب سے ایماندار حصہ ہیں۔ یہ فیلڈ ارتقاء پذیر رہے گی کیونکہ تکنیکی مسائل حل ہونے سے بہت دور ہیں۔ زندہ سوال یہ ہے: کیا ہم موجودہ دور کی بھاری وسائل کی کھپت کے بغیر ایک واقعی ذہین نظام بنا سکتے ہیں؟ جب تک ہم اس کا جواب نہیں دیتے، ہائپ سائنس سے آگے نکلتی رہے گی۔ ہمیں کسی بھی ایسے بیانیے کے بارے میں شکی رہنا چاہیے جو شامل نقصانات کا ذکر کیے بغیر ایک بہترین حل کا وعدہ کرتا ہے۔
ایڈیٹر کا نوٹ: ہم نے یہ سائٹ ایک کثیر لسانی AI خبروں اور گائیڈز کے مرکز کے طور پر ان لوگوں کے لیے بنائی ہے جو کمپیوٹر گیکس نہیں ہیں، لیکن پھر بھی مصنوعی ذہانت کو سمجھنا چاہتے ہیں، اسے زیادہ اعتماد کے ساتھ استعمال کرنا چاہتے ہیں، اور اس مستقبل کی پیروی کرنا چاہتے ہیں جو پہلے ہی آ رہا ہے۔
کوئی غلطی یا اصلاح طلب چیز ملی ہے؟ ہمیں بتائیں۔