Kurucular, Eleştirmenler ve Araştırmacılar: Okumaya Değer Sohbetler
Çoğu insan OpenAI CEO’sunun adını söyleyebilir. Ancak büyük dil modellerinin mevcut dönemini tanımlayan makalenin yazarlarını bilenlerin sayısı çok daha az. Bu bilgi boşluğu, teknolojinin gerçekte nasıl ilerlediğine dair çarpık bir bakış açısı yaratıyor. Yapay zekayı, aslında matematiksel atılımların yavaş bir birikimi olmasına rağmen, bir dizi ürün lansmanı gibi görüyoruz. Kurucular sermayeyi ve kamuoyu algısını yönetir. Araştırmacılar ise ağırlıkları ve mantığı yönetir. Aradaki farkı anlamak, pazarlama bulutlarının ardını görmenin tek yoludur. Sadece kurucuları takip ediyorsanız bir film izliyorsunuz demektir. Araştırmacıları takip ediyorsanız, senaryoyu okuyorsunuz demektir. Bu makale, bu ayrımın neden önemli olduğunu ve endüstrinin geleceğini gerçekten belirleyen sinyallerin nasıl tanımlanacağını inceliyor. Karizmatik konuşmaların ötesine geçip laboratuvarın soğuk gerçekliğine bakacağız. Sadece basın bültenlerini imzalayanlara değil, kodu yazan insanlara odaklanmanın zamanı geldi.
Makine Çağının Görünmez Mimarları
Kurucular halkın yüzüdür. Dünya Ekonomik Forumu’nda konuşurlar ve Kongre’de ifade verirler. İşleri, milyarlarca dolarlık fon sağlamak ve kaçınılmaz hissettiren bir marka inşa etmektir. Sihri çağrıştıran kelimeler kullanırlar. Araştırmacılar ise farklıdır. Python ve LaTeX ile çalışırlar. Kayıp fonksiyonları ve token verimliliği ile ilgilenirler. Bir kurucu, modelinin düşündüğünü söyleyebilir. Bir araştırmacı ise size, modelin belirli bir olasılık dağılımına dayanarak bir sonraki en olası kelimeyi tahmin ettiğini söyleyecektir. Kafa karışıklığı, medyanın bu iki grubu tek bir grup gibi görmesinden kaynaklanıyor. Bir CEO, bir modelin iklim değişikliğini çözeceğini söylediğinde bu bir satış konuşmasıdır. Bir araştırmacı, seyrek oto kodlayıcılar (sparse autoencoders) üzerine bir makale yayınladığında ise bu teknik bir iddiadır. Biri umuttur, diğeri ise gerçektir.
Halk genellikle umudu gerçekle karıştırır. Bu da aşırı vaat ve yetersiz teslimat döngüsüne yol açar. Bu alanı anlamak için arabayı satan kişi ile motoru tasarlayan kişiyi birbirinden ayırmalısınız. Motor tasarımcısı, cıvataların nerede gevşek olduğunu tam olarak bilir. Satış temsilcisi ise size asla gevşek cıvatalardan bahsetmez çünkü işi hisse senedi fiyatını yüksek tutmaktır. Yeni bir model çıktığında bunun her seferinde yaşandığını görüyoruz. Kurucu, heyecan yaratmak için gizemli bir tweet atar. Araştırmacı ise arXiv üzerindeki teknik rapora bir bağlantı gönderir. Tweet bir milyon görüntülenme alır. Teknik rapor ise sadece bir şeyler inşa eden birkaç bin kişi tarafından okunur. Bu durum, en yüksek seslerin herkes için gerçekliği tanımladığı bir geri bildirim döngüsü yaratır.
İnovasyonun Halka Açık Yüzünün Ötesinde
Bu ayrımın küresel politika üzerinde büyük etkileri var. Hükümetler şu anda kurucuların uyarılarına dayanarak yasalar yazıyor. Bu kurucular genellikle bilim kurgu gibi hissettiren varoluşsal riskler hakkında uyarıda bulunuyorlar. Bu da odağı mevcut zararlardan ziyade varsayımsal geleceklere çeviriyor. Bu arada araştırmacılar, veri yanlılığı ve enerji tüketimi gibi acil sorunlara dikkat çekiyorlar. Öncelikle ünlü isimleri dinleyerek, yanlış şeyleri düzenleme riskiyle karşı karşıya kalıyoruz. Gelecekteki bir süper zekayı yasaklayabiliriz ancak mevcut modellerin veri merkezlerini soğutmak için küçük kasabaların su kaynaklarını tükettiği gerçeğini görmezden gelebiliriz. Bu sadece bir Amerikan meselesi değil. Avrupa ve Asya’da da aynı dinamik mevcut.
En çok yayın süresi alan sesler, en büyük pazarlama bütçesine sahip olanlardır. Bu, birkaç şirketin tüm gezegenin gündemini belirlediği, kazananın her şeyi aldığı bir ortam yaratır. Bakış açımızı genişletmezsek, Silikon Vadisi’ndeki bir avuç insanın neyin güvenli ve neyin mümkün olduğunu tanımlamasına izin vermiş oluruz. Bu güç yoğunlaşması başlı başına bir risktir. Bunu gerektiren bir alanda düşünce çeşitliliğini sınırlar. Toronto Üniversitesi’ndeki veya Tokyo’daki laboratuvarlardaki insanların sesini, San Francisco’dakiler kadar duymamız gerekiyor. Bilimsel ilerleme küresel bir çabadır, ancak anlatı şu anda yerel bir tekeldir. Kurumsal yönetim kurulu odalarının dışında kaydedilen gerçek ilerlemeyi görmek için Nature gibi dergilere bakmalıyız.
Dünya Neden Yanlış İnsanları Dinliyor?
Büyük bir laboratuvarda baş araştırmacının bir gününü düşünün. Uyanıyor ve üç milyon dolara mal olan bir eğitim çalışmasının sonuçlarını kontrol ediyor. Modelin beklenenden daha fazla halüsinasyon gördüğünü fark ediyor. Gürültüyü bulmak için on saatini veri kümelerine bakarak geçiriyor. 2024 seçimlerini veya insanlığın kaderini düşünmüyor. Modelin neden karmaşık cümlelerde olumsuzluğu anlamakta başarısız olduğunu düşünüyor. Nöron aktivasyonunun ısı haritalarına bakıyor. Başarısı, karakter başına bit veya belirli bir benchmark üzerindeki doğrulukla ölçülüyor. Şimdi bir kurucunun gününü düşünün. Bir devlet başkanıyla görüşmek için özel jetiyle seyahat ediyor. Yeni ekonominin trilyon dolarlık fırsatından bahsediyor.
Araştırmacı