DeepSeek, Perplexity dan Gelombang Pencabar AI Seterusnya

Era monopoli kecerdasan buatan (AI) yang mahal kini hampir berakhir. Selama dua tahun kebelakangan ini, industri beroperasi dengan tanggapan bahawa prestasi tahap tinggi memerlukan kos berbilion dolar untuk pengkomputeran dan penggunaan tenaga yang besar. DeepSeek dan Perplexity kini membuktikan bahawa kecekapan boleh menewaskan skala yang besar. DeepSeek mengejutkan pasaran dengan melancarkan model yang menandingi prestasi peneraju industri pada sebahagian kecil daripada kos latihan. Sementara itu, Perplexity mengubah secara asasnya cara orang berinteraksi dengan internet dengan menggantikan senarai pautan tradisional kepada jawapan terus yang bersumberkan petikan. Peralihan ini bukan sekadar tentang alat baharu. Ia adalah tentang perubahan asas dalam ekonomi kecerdasan. Fokus telah beralih daripada betapa besarnya sesebuah model kepada betapa rendah kos untuk menjalankannya. Apabila pencabar ini semakin mendapat tempat, gergasi yang sedia ada terpaksa mempertahankan model perniagaan margin tinggi mereka terhadap gelombang pesaing yang lebih tangkas dan khusus yang mengutamakan utiliti berbanding gembar-gembur.

Kejutan Kecekapan kepada Pasaran Kecerdasan

DeepSeek mewakili peralihan dalam realiti produk dunia AI. Walaupun banyak syarikat fokus untuk membina rangkaian neural yang sebesar mungkin, pasukan ini fokus pada pengoptimuman seni bina. Model DeepSeek-V3 mereka menggunakan pendekatan ‘Mixture of Experts’ yang hanya mengaktifkan sebahagian kecil daripada jumlah parameter untuk sebarang tugasan. Ini membolehkan model mengekalkan prestasi tinggi sambil mengurangkan kuasa pengkomputeran yang diperlukan untuk setiap perkataan yang dijana secara drastik. Naratif mengenai syarikat ini sering tertumpu pada bajet latihan yang rendah, yang dilaporkan di bawah enam juta dolar. Angka ini mencabar idea bahawa hanya negara dan syarikat paling kaya yang boleh membina model sempadan (frontier models). Ia mencadangkan bahawa halangan untuk memasuki bidang pembelajaran mesin tahap tinggi adalah lebih rendah daripada yang disangka sebelum ini.

Perplexity mendekati masalah ini dari perspektif antara muka pengguna. Ia adalah enjin jawapan dan bukannya enjin carian tradisional. Ia menggunakan model bahasa besar yang sedia ada untuk mengimbas web secara langsung, mengekstrak maklumat yang relevan, dan membentangkannya dalam perenggan yang kohesif dengan nota kaki. Pilihan reka bentuk ini menangani kelemahan utama model AI standard, iaitu kecenderungan mereka untuk menyatakan fakta yang sudah lapuk atau direka-reka sepenuhnya. Dengan menyandarkan setiap respons pada data web masa nyata, Perplexity telah mencipta alat yang terasa lebih dipercayai untuk penyelidikan profesional berbanding bot sembang standard. Produknya bukan sekadar model itu sendiri, tetapi sistem perolehan dan petikan yang mengelilinginya. Pendekatan ini memberi tekanan yang besar kepada penyedia carian tradisional yang bergantung pada hasil iklan daripada pengguna yang mengklik melalui berbilang halaman hasil carian.

BotNews.today menggunakan alat AI untuk menyelidik, menulis, mengedit, dan menterjemah kandungan. Pasukan kami menyemak dan menyelia proses tersebut untuk memastikan maklumat berguna, jelas, dan boleh dipercayai.

Jika pengguna mendapat jawapan mereka pada percubaan pertama, mereka tiada sebab untuk melayari senarai pautan tajaan atau menavigasi laman web yang berserabut. Ini mewujudkan konflik langsung antara utiliti alat tersebut dan struktur ekonomi web semasa.

Geopolitik Pengkomputeran Murah

Kesan global pencabar ini berakar umbi dalam pendemokrasian inferens berprestasi tinggi. Apabila kos menjalankan model turun sebanyak sembilan puluh peratus, potensi untuk integrasi ke dalam perisian harian berkembang secara eksponen. Pembangun di pasaran baru muncul yang sebelum ini tidak mampu menggunakan API tahap tinggi kini boleh membina aplikasi yang canggih. Ini mengubah pusat graviti bagi keseluruhan industri. Jika model yang paling cekap datang dari luar hab Silicon Valley yang tradisional, kelebihan strategik ladang pelayan domestik yang besar mula berkurangan. Ia memaksa perbincangan tentang kedaulatan model dan sama ada negara harus bergantung pada beberapa penyedia berpusat atau melabur dalam seni bina cekap mereka sendiri. Ini adalah isyarat yang wajar diikuti kerana ia mengalihkan industri daripada dinamik ‘pemenang mengambil semua’ kepada pasaran yang lebih berpecah dan kompetitif.

Pembeli perusahaan mula merasai peralihan ini pada keuntungan mereka. Naratif inferens kos rendah mengubah cara syarikat merancang susunan teknologi jangka panjang mereka. Jika model seperti DeepSeek boleh memberikan lapan puluh peratus utiliti daripada pesaing yang lebih mahal pada sepuluh peratus harga, kes perniagaan untuk pilihan yang lebih mahal itu hilang untuk kebanyakan tugasan rutin. Ini mewujudkan pasaran bertingkat di mana model yang paling mahal dikhaskan untuk penaakulan yang sangat kompleks, manakala sebahagian besar kerja dikendalikan oleh pencabar yang cekap. Realiti ekonomi ini juga menjejaskan dunia pengiklanan. Perplexity sedang bereksperimen dengan model di mana iklan disepadukan ke dalam proses penyelidikan dan bukannya menjadi gangguan. Ini boleh mentakrifkan semula cara jenama mendekati pengguna dalam era di mana orang ramai tidak lagi melawat halaman utama atau menatal hasil carian. Kesannya dirasai oleh semua orang, daripada jurutera perisian yang memilih API sehinggalah eksekutif pemasaran yang cuba mencari khalayak dalam dunia jawapan segera.

Selasa bersama Enjin Jawapan

Untuk memahami kesan dunia sebenar, pertimbangkan satu hari dalam kehidupan seorang penganalisis kewangan bernama Sarah. Pada masa lalu, Sarah akan memulakan paginya dengan membuka sepuluh tab berbeza untuk menyemak pergerakan pasaran dan laporan berita. Dia akan menghabiskan masa berjam-jam mensintesis data menjadi taklimat pagi. Hari ini, dia menggunakan enjin jawapan untuk menanyakan titik data khusus merentasi berbilang sumber secara serentak. Dia meminta perbandingan tiga laporan suku tahunan yang berbeza dan menerima ringkasan bersumberkan petikan dalam beberapa saat. Ejaan data yang diterimanya adalah tepat kerana sistem menarik terus daripada teks sumber. Dia tidak lagi menghabiskan masanya mencari maklumat. Dia menghabiskan masanya untuk mengesahkannya dan membuat keputusan berdasarkan maklumat tersebut. Inilah kisah pengedaran carian yang sedang berlaku. Antara muka telah menjadi penyelidik, dan Sarah telah menjadi editor. Aliran kerjanya lebih pantas, tetapi ia juga lebih bergantung pada ketepatan petikan yang disediakan oleh enjin tersebut.

Kemudian pada hari itu, Sarah perlu menulis skrip tersuai untuk mengautomasikan tugasan kemasukan data. Daripada menggunakan pembantu tujuan umum yang mungkin mengenakan bayaran premium, dia menggunakan model pengekodan khusus daripada pencabar seperti DeepSeek. Model tersebut menyediakan kod dengan serta-merta, dan kerana kos inferens yang sangat rendah, syarikatnya membenarkan dia menggunakannya untuk beribu-ribu tugasan kecil sepanjang hari tanpa perlu risau tentang bajet. Beginilah cara pasaran model berubah. Ia menjadi utiliti latar belakang dan bukannya sumber yang berharga. Tekanan terhadap tingkah laku carian tradisional dapat dilihat apabila Sarah menyedari dia tidak menggunakan bar carian standard selama tiga hari. Dia tidak memerlukan senarai pautan apabila dia boleh mendapatkan dokumen berstruktur. Perkara berikut menggambarkan peralihan dalam rutin hariannya:

Sarah menggantikan pengumpulan berita manual dengan ringkasan bersumberkan petikan automatik yang dikemas kini dalam masa nyata.
Dia menggunakan model kos rendah untuk tugasan pengekodan berulang yang sebelum ini terlalu mahal untuk diautomasikan secara berskala.
Kebergantungannya pada enjin carian disokong iklan tradisional jatuh kepada hampir sifar kerana dia mendapati lebih banyak nilai dalam jawapan terus.
Masa yang dijimatkan membolehkannya fokus pada strategi tahap tinggi dan hubungan pelanggan berbanding memburu data.

Harga Tersembunyi Kecerdasan Percuma

Skeptisisme Socrates memerlukan kita bertanya apa yang kita korbankan sebagai pertukaran untuk kecekapan ini. Jika sesebuah model jauh lebih murah untuk dilatih dan dijalankan, dari manakah datangnya penjimatan tersebut? Kita mesti bertanya sama ada data yang digunakan untuk melatih model cekap ini diperoleh dengan tahap penelitian yang sama seperti rakan sejawat yang lebih mahal. Terdapat risiko bahawa perlumbaan ke arah harga terendah akan membawa kepada perlumbaan ke arah tahap terendah dalam privasi data dan hak harta intelek. Jika sesebuah syarikat tidak mengenakan bayaran yang tinggi untuk modelnya, adakah ia sebaliknya mengewangkan data yang dimasukkan oleh pengguna ke dalamnya? Kita juga mesti mempertimbangkan kos tersembunyi model enjin jawapan. Apabila Perplexity meringkaskan laman web, laman web tersebut kehilangan pelawat. Jika pencipta kandungan asal tidak diberi pampasan, maklumat yang menjadi sandaran enjin ini mungkin akhirnya hilang. Siapa yang akan membiayai kewartawanan dan penyelidikan 2026 jika pembaca tidak pernah melawat sumbernya?

Satu lagi soalan sukar melibatkan kebolehpercayaan seni bina yang tangkas ini. Adakah pendekatan ‘Mixture of Experts’ memperkenalkan jenis ralat baharu yang lebih sukar dikesan? Kita mesti bertanya sama ada kita mengorbankan kedalaman demi kelajuan. Terdapat bahaya bahawa pengguna akan menjadi terlalu bergantung pada petikan ringkas tanpa pernah menyemak konteks asal. Ini boleh membawa kepada pemahaman cetek tentang topik kompleks di mana nuansa hilang dalam usaha mendapatkan jawapan yang ringkas. Kita juga harus skeptikal terhadap dakwaan mengenai kos latihan. Adakah angka ini telus sepenuhnya, atau adakah ia mengabaikan kos tenaga kerja manusia dan kesan alam sekitar perkakasan tersebut? Sambil kita bergerak ke arah dunia kecerdasan murah, kita mesti kekal berwaspada tentang kualiti dan etika sistem yang kita integrasikan ke dalam kehidupan kita. Bunyi bising pelancaran produk baharu selalunya boleh menenggelamkan isyarat akibat jangka panjangnya.

Di Sebalik Tabir Pencabar Baharu

Bagi pengguna berkuasa (power user), tarikan pencabar ini terletak pada fleksibiliti teknikal dan keupayaan integrasi mereka. DeepSeek-V3 menggunakan rangka kerja latihan yang mengoptimumkan ketepatan FP8, yang membolehkan pengkomputeran lebih pantas tanpa kehilangan ketepatan yang ketara. Ini adalah pencapaian teknikal utama yang membantu menjelaskan kecekapan kos mereka. Mekanisme ‘Multi-head Latent Attention’ mereka mengurangkan jejak memori model semasa inferens, yang merupakan faktor kritikal bagi pembangun yang ingin mengehoskan model ini pada perkakasan mereka sendiri. Banyak model baharu ini dikeluarkan dengan ‘open weights’, bermakna ia boleh dijalankan secara setempat atau pada instans awan peribadi. Ini adalah kelebihan utama bagi perusahaan yang tidak boleh mengambil risiko menghantar data sensitif kepada API pihak ketiga. Keupayaan untuk memperhalusi (fine-tune) model ini pada set data khusus meningkatkan lagi nilainya untuk aplikasi khusus dalam sektor undang-undang, perubatan atau kewangan.

Ada cerita, alat, trend, atau soalan AI yang anda fikir kami patut liputi? Hantar idea artikel anda kepada kami — kami ingin mendengarnya.

Perplexity menawarkan jenis nilai teknikal yang berbeza melalui API-nya, yang membolehkan pembangun membina keupayaan carian terus ke dalam aplikasi mereka sendiri. Ini memintas keperluan untuk indeks carian berasingan dan model bahasa berasingan. Sistem mengendalikan penyandaran dan petikan secara automatik. Walau bagaimanapun, terdapat had yang perlu dipertimbangkan. Had kadar API dan kependaman carian web masa nyata boleh menjadi kesesakan untuk aplikasi volum tinggi. Pengguna juga mesti menguruskan pertukaran antara kelajuan carian dan kedalaman analisis. Storan setempat bagi hasil carian ini adalah satu lagi pertimbangan untuk pengguna berkuasa yang perlu mengekalkan jejak audit dari mana maklumat mereka datang. Faktor teknikal berikut kini menentukan kelebihan daya saing untuk alat ini:

Penggunaan ‘Multi-head Latent Attention’ untuk mengurangkan penggunaan memori cache KV semasa tugasan konteks panjang.
Sokongan untuk latihan dan inferens FP8 bagi memaksimumkan daya pemprosesan perkakasan GPU moden.
Integrasi saluran paip RAG masa nyata yang boleh mengendalikan beribu-ribu pertanyaan web serentak.
Ketersediaan ‘open weights’ untuk penggunaan setempat dalam persekitaran yang selamat.

Masa Depan Kecerdasan Selektif

Kebangkitan DeepSeek dan Perplexity menandakan permulaan pasaran AI yang lebih matang. Kita beralih daripada kebaharuan model yang boleh bercakap kepada utiliti model yang boleh bekerja dengan cekap. Pusat graviti beralih ke arah penyedia yang boleh memberikan hasil berkualiti tinggi pada titik harga yang mampan. Ini bukan sekadar trend untuk 2026 semasa tetapi peralihan jangka panjang dalam cara kita membina dan menggunakan perkhidmatan digital. Tekanan terhadap carian tradisional dan penyedia model kos tinggi hanya akan meningkat apabila pencabar ini memperhalusi produk mereka. Bagi pengguna, ini bermakna lebih banyak pilihan dan alat yang lebih baik. Bagi industri, ini bermakna fokus yang diperbaharui pada kecemerlangan kejuruteraan berbanding pengkomputeran kekerasan (brute force). Pemenang sebenar adalah mereka yang boleh membezakan antara bunyi bising kitaran gembar-gembur dan isyarat perubahan struktur sebenar dalam ekonomi teknologi.

Nota editor: Kami mencipta laman web ini sebagai hab berita dan panduan AI berbilang bahasa untuk orang yang bukan pakar komputer, tetapi masih ingin memahami kecerdasan buatan, menggunakannya dengan lebih yakin, dan mengikuti masa depan yang sudah tiba.

Menemui ralat atau sesuatu yang perlu diperbetulkan? Beritahu kami.

Frequently Asked Questions

Bagaimana pembaca boleh menggunakan artikel “Chip Watch” secara praktikal?

Ikuti berita semikonduktor, pelancaran GPU, dan perkembangan terkini syarikat pengkomputeran AI melalui Chip Watch. Gunakan artikel ini untuk membandingkan alat, memahami risiko, bertanya soalan yang lebih baik dan menentukan perkara yang layak diberi perhatian sebelum menghabiskan masa atau wang.

Mengapa “Pemerhatian Syarikat” penting untuk pembaca AI biasa?

Ikuti perkembangan utama syarikat, strategi produk, perkongsian, dan perubahan model perniagaan dalam kategori Pemerhatian Syarikat kami. Ini penting kerana ia menghubungkan berita AI dengan pilihan praktikal tentang kerja, privasi, kos, kepercayaan dan alat yang benar-benar digunakan orang.