Pengasas, Pengkritik dan Penyelidik: Perbualan yang Wajib Dibaca
Kebanyakan orang tahu siapa CEO OpenAI. Namun, tidak ramai yang tahu siapa penulis kertas kajian yang mendefinisikan era model bahasa besar (large language models) masa kini. Jurang pengetahuan ini mewujudkan pandangan yang terpesong tentang bagaimana teknologi sebenarnya berkembang. Kita sering menganggap kecerdasan buatan (AI) sebagai siri pelancaran produk, sedangkan ia sebenarnya adalah pengumpulan kejayaan matematik yang perlahan. Pengasas menguruskan modal dan naratif awam. Penyelidik pula menguruskan ‘weights’ dan logik. Memahami perbezaan ini adalah satu-satunya cara untuk melihat di sebalik awan pemasaran. Jika anda hanya mengikuti pengasas, anda sedang menonton filem. Jika anda mengikuti penyelidik, anda sedang membaca skripnya. Artikel ini mengupas mengapa perbezaan ini penting dan cara mengenal pasti isyarat yang sebenarnya menentukan masa depan industri. Kita akan melangkaui ucapan berkarisma untuk melihat realiti sebenar di dalam makmal. Sudah tiba masanya untuk memberi tumpuan kepada mereka yang menulis kod, bukan sekadar mereka yang menandatangani kenyataan media.
Arkitek Halimunan Zaman Mesin
Pengasas adalah wajah awam. Mereka berucap di World Economic Forum dan memberi keterangan di hadapan Kongres. Tugas mereka adalah untuk mendapatkan pembiayaan berbilion dolar dan membina jenama yang terasa seperti sesuatu yang tidak dapat dielakkan. Mereka menggunakan kata-kata yang membayangkan keajaiban. Penyelidik pula berbeza. Mereka bekerja dengan Python dan LaTeX. Mereka mementingkan fungsi kerugian (loss functions) dan kecekapan token. Seorang pengasas mungkin berkata model mereka sedang ‘berfikir’. Seorang penyelidik akan memberitahu anda bahawa ia sebenarnya meramalkan perkataan seterusnya yang paling mungkin berdasarkan taburan kebarangkalian tertentu. Kekeliruan timbul kerana media melayan kedua-dua kumpulan ini sebagai satu. Apabila seorang CEO berkata model mereka akan menyelesaikan perubahan iklim, itu adalah taktik jualan. Apabila seorang penyelidik menerbitkan kertas kajian tentang sparse autoencoders, itu adalah tuntutan teknikal. Satu adalah harapan, yang satu lagi adalah fakta.
Orang ramai sering tersalah anggap harapan sebagai fakta. Ini membawa kepada kitaran janji berlebihan dan penyampaian yang kurang. Untuk memahami bidang ini, anda mesti memisahkan orang yang menjual kereta daripada orang yang mereka bentuk enjinnya. Pereka enjin tahu dengan tepat di mana skru yang longgar. Jurujual tidak akan memberitahu anda tentang skru yang longgar kerana tugas mereka adalah untuk memastikan harga saham kekal tinggi. Kita melihat perkara ini berlaku setiap kali model baharu dilancarkan. Pengasas memuat naik tweet samar untuk membina ‘hype’. Penyelidik memuat naik pautan ke laporan teknikal di arXiv. Tweet itu mendapat sejuta tontonan. Laporan teknikal itu dibaca oleh beberapa ribu orang yang sebenarnya membina sesuatu. Ini mewujudkan gelung maklum balas di mana suara yang paling lantang menentukan realiti untuk orang lain.
Melangkaui Wajah Awam Inovasi
Perpecahan ini mempunyai implikasi besar terhadap dasar global. Kerajaan kini sedang menggubal undang-undang berdasarkan amaran pengasas. Pengasas ini sering memberi amaran tentang risiko kewujudan yang terasa seperti fiksyen sains. Ini mengekalkan fokus pada masa depan hipotetikal dan bukannya bahaya semasa. Sementara itu, penyelidik menunjukkan isu segera seperti bias data dan penggunaan tenaga. Dengan mendengar terutamanya kepada nama-nama terkenal, kita berisiko mengawal selia perkara yang salah. Kita mungkin mengharamkan superintelligence masa depan sambil mengabaikan fakta bahawa model semasa sedang mengeringkan bekalan air di bandar-bandar kecil untuk menyejukkan pusat data mereka. Ini bukan sekadar isu Amerika. Di Eropah dan Asia, dinamik yang sama wujud.
Suara yang mendapat paling banyak perhatian adalah mereka yang mempunyai bajet pemasaran terbesar. Ini mewujudkan persekitaran ‘pemenang mengambil semua’ di mana segelintir syarikat menetapkan agenda untuk seluruh planet. Jika kita tidak meluaskan perspektif, kita membenarkan segelintir orang di Silicon Valley menentukan apa yang selamat dan apa yang mungkin. Penumpuan kuasa ini adalah risiko itu sendiri. Ia mengehadkan kepelbagaian pemikiran dalam bidang yang memerlukannya. Kita perlu mendengar daripada orang di University of Toronto atau makmal di Tokyo seperti mana kita mendengar daripada orang di San Francisco. Kemajuan saintifik adalah usaha global, tetapi naratifnya kini merupakan monopoli tempatan. Kita perlu melihat jurnal seperti Nature untuk melihat kemajuan sebenar yang dibuat di luar bilik lembaga korporat.
Mengapa Dunia Mendengar Orang yang Salah
Bayangkan kehidupan seorang penyelidik utama di makmal besar. Mereka bangun dan menyemak keputusan larian latihan yang menelan belanja tiga juta dolar. Mereka melihat model tersebut mengalami ‘hallucination’ lebih daripada jangkaan. Mereka menghabiskan sepuluh jam melihat kluster data untuk mencari gangguan (noise). Mereka tidak memikirkan tentang pilihan raya 2024 atau nasib manusia. Mereka memikirkan mengapa model itu gagal memahami penafian dalam ayat yang kompleks. Mereka melihat peta haba pengaktifan neuron. Kejayaan mereka diukur dalam bit per aksara atau ketepatan pada penanda aras tertentu. Sekarang, bayangkan hari seorang pengasas. Mereka menaiki jet peribadi untuk bertemu dengan ketua negara. Mereka bercakap tentang peluang trilion dolar ekonomi baharu.
Penyelidik berurusan dengan ‘bagaimana’. Pengasas berurusan dengan ‘mengapa ia bernilai wang’. Bagi pembangun yang membina app, penyelidik adalah tokoh yang lebih penting. Penyelidik menentukan kependaman API dan tetingkap konteks. Pengasas menentukan harga. Jika anda cuba membina perniagaan, anda perlu tahu sama ada teknologi itu benar-benar boleh melakukan apa yang dikatakan oleh pengasas. Selalunya, ia tidak boleh. Kita melihat ini pada zaman awal pemanduan autonomi. Pengasas berkata kita akan mempunyai berjuta-juta robotaxi menjelang 2026. Penyelidik tahu bahawa kes-kes luar biasa dalam hujan lebat masih menjadi masalah yang belum selesai. Orang ramai mempercayai pengasas. Penyelidik adalah yang betul.
Corak yang sama berulang dalam ruang AI generatif. Kita diberitahu bahawa model akan segera menggantikan peguam dan doktor. Jika anda membaca kertas teknikal, anda akan melihat bahawa model tersebut masih bergelut dengan konsistensi logik asas. Jurang antara demo dan realiti adalah tempat syarikat kehilangan wang. Anda boleh mencari analisis mendalam tentang trend kecerdasan buatan untuk melihat bagaimana had teknikal ini diuji hari ini. Perbezaan ini adalah perbezaan antara pelaburan yang kukuh dan gelembung spekulatif. Apabila anda mendengar tuntutan baharu, tanya diri anda sama ada ia datang daripada kertas kajian atau kenyataan media. Jawapannya akan memberitahu anda betapa pentingnya tuntutan tersebut. Wartawan di MIT Technology Review sering menonjolkan jurang antara makmal dan lobi ini. Kita mesti ingat bahawa pengasas mempunyai insentif untuk menyembunyikan kelemahan manakala penyelidik mempunyai insentif untuk mencarinya. Yang pertama membina ‘hype’ dan yang kedua membina kebenaran. Dalam jangka masa panjang, kebenaran adalah satu-satunya perkara yang kekal. Kita melihat ini pada 2026 apabila gelombang pertama ‘hype’ mula reda di bawah beban realiti teknikal.
Selasa di Makmal berbanding Bilik Lembaga
Kita mesti bertanya soalan sukar tentang laluan pembangunan semasa. Siapa yang membayar untuk penyelidikan yang didakwa oleh pengasas akan memberi manfaat kepada semua orang? Kebanyakan penyelidik terkemuka telah meninggalkan akademik untuk makmal swasta. Ini bermakna pengetahuan yang mereka hasilkan bukan lagi barangan awam. Ia adalah rahsia korporat. Apa yang berlaku kepada kaedah saintifik apabila data yang digunakan untuk membuktikan sesuatu perkara disembunyikan di sebalik ‘paywall’? Kita melihat peralihan daripada sains terbuka ke arah model kelebihan daya saing tertutup. Adakah kemasyhuran segelintir individu membantu bidang ini atau adakah ia mewujudkan kultus personaliti yang menghalang perbezaan pendapat? Jika seorang penyelidik menemui kelemahan besar dalam model utama, adakah mereka berasa selamat untuk melaporkannya jika ia boleh menjatuhkan penilaian syarikat?
BotNews.today menggunakan alat AI untuk menyelidik, menulis, mengedit, dan menterjemah kandungan. Pasukan kami menyemak dan menyelia proses tersebut untuk memastikan maklumat berguna, jelas, dan boleh dipercayai.
Tekanan kewangan ke atas firma-firma ini sangat besar. Kita juga perlu mempertimbangkan kos alam sekitar. Adakah usaha untuk mendapatkan penanda aras yang lebih baik berbaloi dengan jejak karbon yang besar daripada melatih model ini? Kita sering bercakap tentang manfaat AI untuk alam sekitar, tetapi kita jarang melihat lejar yang mengimbangkan kedua-duanya. Akhir sekali, siapa yang memiliki budaya yang menjadi asas latihan model ini? Penyelidik menggunakan output kolektif internet untuk membina sistem mereka. Pengasas kemudian mengenakan bayaran kepada orang ramai untuk mengakses versi sulingan daripada output yang sama. Ini adalah pemindahan kekayaan yang jarang dibincangkan dalam tajuk utama. Ini bukan sekadar masalah teknikal. Ia adalah dilema sosial dan etika yang memerlukan lebih daripada sekadar algoritma yang lebih baik untuk diselesaikan.
Kekangan Teknikal dan Pelaksanaan Tempatan
Bagi mereka yang membina di atas platform ini, butiran teknikal lebih penting daripada falsafah. Had API semasa adalah penyempitan utama untuk penggunaan perusahaan. Kebanyakan penyedia mempunyai had kadar yang ketat yang menghalang pemprosesan masa nyata volum tinggi. Inilah sebabnya banyak firma melihat kepada storan tempatan dan pelaksanaan tempatan. Menggunakan model seperti Llama 3 pada perkakasan tempatan membolehkan privasi data yang lebih baik dan kos jangka panjang yang lebih rendah. Walau bagaimanapun, keperluan perkakasan adalah tinggi. Untuk menjalankan model 70 bilion parameter dengan kelajuan yang baik, anda memerlukan GPU mewah dengan VRAM yang signifikan. Di sinilah bahagian ‘geek’ bertemu dengan bahagian kewangan. Kos kluster H100 adalah halangan untuk masuk yang memastikan kuasa kekal di tangan mereka yang kaya.
Kita juga melihat peralihan ke arah ‘fine tuning’ khusus. Daripada menggunakan model umum untuk segala-galanya, pembangun menggunakan model yang lebih kecil yang dilatih pada set data tertentu. Ini meningkatkan ketepatan dan mengurangkan kiraan token. Cabaran teknikal di sini ialah penyusunan data. Jika data input lemah, model yang telah di-‘fine tune’ akan menjadi lebih teruk daripada model umum. Kita juga melihat lebih banyak penggunaan Retrieval Augmented Generation (RAG) untuk mengasaskan model dalam data fakta. Ini memintas keperluan untuk tetingkap konteks yang besar dan mengurangkan ‘hallucination’. Tetapi RAG mempunyai hadnya sendiri, terutamanya dalam cara ia mengendalikan kedudukan dokumen yang diambil. Jika langkah carian gagal, output model tidak berguna. Kebanyakan pengguna tidak menyedari bahawa prestasi AI bergantung sama banyak pada pangkalan data yang disoal seperti model itu sendiri.
Penapis Akhir untuk Maklumat
Masa depan AI bukanlah satu cerita yang diceritakan oleh seorang individu. Ia adalah perdebatan yang berterusan antara mereka yang menjual visi dan mereka yang membina realiti. Untuk menjadi pengguna berita teknologi yang bijak, anda mesti belajar melihat melepasi pengasas yang berkarisma. Cari nama pada kertas kajian. Cari penyelidik yang sanggup bercakap tentang apa yang model mereka tidak boleh lakukan. Percanggahan dalam industri bukanlah ‘bug’. Ia adalah bahagian yang paling jujur dalam cerita ini. Bidang ini akan terus berkembang kerana masalah teknikal jauh daripada selesai. Soalan yang masih hidup kekal: bolehkah kita membina sistem yang benar-benar pintar tanpa penggunaan sumber yang besar yang mendefinisikan era semasa? Sehingga kita menjawabnya, ‘hype’ akan terus mengatasi sains. Kita mesti kekal skeptikal terhadap sebarang naratif yang menjanjikan penyelesaian sempurna tanpa menyebut tentang pertukaran (trade-offs) yang terlibat.
Nota editor: Kami mencipta laman web ini sebagai hab berita dan panduan AI berbilang bahasa untuk orang yang bukan pakar komputer, tetapi masih ingin memahami kecerdasan buatan, menggunakannya dengan lebih yakin, dan mengikuti masa depan yang sudah tiba.
Menemui ralat atau sesuatu yang perlu diperbetulkan? Beritahu kami.