Global Technology Editor

Klaim sebuah startup muda yang telah memecahkan bottleneck matematika pada model bahasa besar pantas mendapat perhatian karena satu alasan utama: jika klaim itu benar, ini tidak hanya akan memperbaiki sebuah model, tetapi juga mengubah ekonomi cara model dibu[1] Subquadratic muncul dari fase rahasia bulan lalu dengan pesan semacam itu, dan pertanyaan langsungnya bukan apakah perusahaan dapat menarik minat, melainkan apakah tumpukan AI yang lebih luas dapat mengadopsi terobosan ini jika lolos dari pengujian.[1] Taruhannya lebih besar daripada satu siklus peluncuran.

Laporan yang tersedia masih terbatas, dan hal itu penting.[1] Dari informasi yang ada, diketahui bahwa perusahaan tersebut mengatakan telah mengatasi bottleneck yang terkait dengan LLM, dan klaim itu terkait dengan karya teknis terbaru yang beredar di ekosistem riset.[1][2][3][4] Materi referensi mencakup beberapa makalah arXiv, yang menunjukkan diskusi ini masih berakar pada ide-ide tahap pra-cetak daripada standar industri yang mapan.[2][3][4][5] Biasanya, perubahan bermakna dimulai dari sini, tetapi ini juga tempat klaim ambisius paling mudah dibesar-besarkan.

Taruhan teknisnya cukup sederhana untuk dijelaskan, meskipun implementasinya tidak.[1] Model bahasa besar mahal karena matematika dalam perhatian, pergerakan memori, atau operasi internal lainnya dapat meningkat tajam ketika model dan konteks membesar.[1][2][3][4] Jika sebuah tim menemukan cara mengurangi biaya tersebut, kemenangan ini tidak hanya bersifat akademis.[1] Ini dapat mempengaruhi latensi, anggaran pelatihan, jumlah server, dan akhirnya produk mana yang bisa ditawarkan dengan harga konsumen, bukan harga perusahaan.[1] Dengan kata lain, jalan pintas matematika bisa menjadi benteng komersial.

Itulah sebabnya klaim-klaim ini sering tersebar lebih cepat daripada buktinya.[1] Pasar AI selama dua tahun terakhir telah menghargai skala, tetapi sekarang sama antusiasnya terhadap efisiensi.[1] Investor dan pembuat produk tahu bahwa struktur biaya industri saat ini tidak berkelanjutan jika setiap fitur baru memerlukan lebih banyak chip, energi, dan kapasitas pusat data.[1] Oleh karena itu, pengurangan bottleneck yang kredibel memiliki daya tarik strategis: menjanjikan bukan hanya model yang lebih baik, tapi juga model bisnis yang tidak seberat bagi siapa pun yang bisa mengoperasionalkannya terlebih dahulu.[1] Retorika terobosan juga merupakan retorika biaya satuan yang lebih rendah.

Namun, beban pembuktian tetap tinggi.[1] Informasi yang tersedia tidak menjelaskan apakah klaim Subquadratic telah direproduksi secara independen, apakah teknologi ini bekerja secara luas di berbagai keluarga model, atau apakah keuntungannya bertahan pada beban kerja dunia nyata, bukan hanya benchm[1][2][3][4] Perbedaan tersebut penting. Banyak ide yang terlihat elegan di kertas jadi rapuh ketika menghadapi prompt yang rumit, konteks panjang, trafik produksi, dan kompromi rekayasa yang mendefinisikan sistem komersial.[2][3][4][5] Bukti yang harus diperhatikan bukan hanya hasil teoretis yang bersih, tapi juga validasi eksternal dalam kode dan penerapan.[1][2][3][4]

Kehadiran banyak referensi penelitian terkait sendiri memberikan pelajaran.[2][3][4][5] Ini menunjukkan klaim tersebut berada dalam percakapan teknis yang lebih luas, bukan pengumuman terisolasi.[1][2][3][4] Inilah biasanya bentuk kemajuan nyata di AI: satu kelompok mengidentifikasi batasan, kelompok lain menyusun ulang, dan kelompok ketiga mencoba mengubah wawasan itu menjadi infrastruktur yang bisa digunakan. Namun, ini juga cara narasi mengeras sebelum bidang tersebut sepakat apa yang benar-benar baru.[1] Bagi pembaca, pertanyaan penting adalah apakah ini pergeseran metode yang asli atau penyempurnaan modest yang dikemas dengan bahasa terobosan.

Insentif bisnisnya jelas.[1] Startup yang dapat secara kredibel menurunkan biaya model tidak perlu mengalahkan laboratorium frontier dalam hal skala untuk penting; cukup membuat sebagian tumpukan lebih murah, lebih cepat, atau lebih andal.[1] Itu sudah cukup untuk menarik pelanggan, bakat, dan modal.[1] Ini juga dapat menekan penyedia cloud dan vendor model, karena peningkatan efisiensi cenderung menyebar cepat setelah dikemas dalam perangkat lunak yang bisa diadopsi oleh orang lain.[1] Persaingan nyata kini bukan hanya soal model; melainkan tentang lapisan efisiensi di bawahnya.

Ada implikasi industri yang lebih luas di sini yang pantas mendapat perhatian lebih dari sekadar judul berita.[1] Jika model bahasa besar menjadi secara materi lebih murah dijalankan, keunggulan mungkin bergeser ke perusahaan yang dapat mendistribusikan inferensi secara luas, mengintegrasikan AI ke dalam alur kerja sehari-hari, dan menyematkannya ke dalam produk tanpa men[1] Jika sebaliknya terjadi dan klaim itu tidak terbukti, pasar akan terus mengarah ke konsentrasi: sejumlah kecil perusahaan dengan neraca keuangan yang mampu membiayai tagihan komputasi besar.[1] Bagaimanapun, ekonomi komputasi tetap menjadi kekuatan pengatur.[1] Pemenangnya mungkin bukan perusahaan dengan model terbesar, melainkan perusahaan dengan kurva biaya yang lebih efisien.

Inilah juga sebabnya cerita ini penting di luar Silicon Valley.[1] Infrastruktur AI semakin menjadi infrastruktur geopolitik.[1] Negara dan perusahaan yang dapat mengurangi kebutuhan komputasi mendapatkan ruang gerak di pasar yang terbatas energi, dalam rantai pasokan yang dikontrol ekspor, dan di wilayah di mana pembangunan pusat data berjalan lambat atau sulit secara politik.[1] Terobosan efisiensi nyata tidak akan menghilangkan pentingnya chip dan daya; melainkan akan mengubah pengaruhnya.[1] Itu adalah cerita yang lebih tahan lama daripada narasi asal-usul satu startup, karena ini berbicara tentang siapa yang dapat berpartisipasi dalam gelombang berikutnya adopsi AI dan dengan syarat apa.