Consumer AI & Startup Reporter
Selama bertahun-tahun internet mengalami masalah kelebihan muatan: terlalu banyak halaman, terlalu banyak konten yang berulang, terlalu sulit untuk menentukan apa yang benar-benar layak mendapat perhatian.[1][2][5] AI generatif menjanjikan untuk mengurangi kekacauan ini, namun sekarang pertanyaan yang lebih menarik hampir sebaliknya: jika web dipenuhi oleh teks yang dihasilkan secara otomatis, alat yang seharusnya membantu kita menavigasi web bisa menjadi kurang dapat di
Analisis dari Graphite menemukan bahwa pada November 2024, artikel yang dihasilkan AI telah melampaui artikel yang ditulis oleh manusia, setelah pertumbuhan sangat cepat yang mulai sejak peluncuran ChatGPT pada November 2022.[2] Namun dalam studi yang sama, ditemukan juga penghambatan: pertumbuhan belakangan melambat dan konten sintetis tidak tampak otomatis mendapatkan keuntungan dalam hasil pencarian.[2] Ini detail penting karena menunjukkan bahwa penyebaran tidak selalu sejalan dengan visibilitas.
Sebuah makalah tentang Web dan teks yang dihasilkan AI mengamati bahwa porsi konten sintetis atau asistensi sekitar 35% sudah mengubah lingkungan informasi, terutama dalam hal variasi semantik.[8] Para penulis tidak menyatakan bahwa kebenaran daring runtuh secara total; malah menggambarkan web yang lebih homogen, di mana gaya penulisan cenderung menyatu.[8] Bagi pembaca harian, homogenitas ini memberikan efek halus tapi nyata: setelah waktu tertentu, semuanya terasa seperti ditulis dengan suara yang sama.
Studi tentang yang disebut retrieval collapse menggambarkan risiko dua tahap: pertama, hasil pencarian dibanjiri materi yang dihasilkan AI, lalu materi itu masuk ke sistem retrieval dan aliran RAG yang menggunakannya kembali seolah sebagai basis netral.[1][3] Dalam pengujian yang dilaporkan penulis, pencemaran 67% pada kumpulan SEO menyebabkan lebih dari 80% pencemaran pada eksposur.[1][3] Diterjemahkan secara sederhana: dibutuhkan massa kritis tertentu agar sistem mulai hampir selalu melihat apa yang sudah dihasilkannya sendiri.
Penerbit dan situs yang menggunakan AI untuk memproduksi lebih cepat berburu trafik, efisiensi, dan margin; sistem pencarian mengejar cakupan, kesegaran, dan relevansi; model, pada akhirnya, memerlukan volume data besar agar tetap kompetitif.[5][8][11] Hasilnya bisa berupa perlombaan di mana semua pihak punya alasan rasional untuk meningkatkan produksi, namun tidak ada yang punya insentif kuat untuk melambat dan melindungi keragaman sumber. Begitulah keunggulan taktis berubah menjadi kerentanan struktural.
Beberapa analisis tentang keberadaan konten AI di hasil pencarian masih menunjukkan gambaran yang lebih kompleks: dalam berbagai konteks, hasil pencarian dan kutipan dalam sistem generatif masih didominasi manusia.[6][11] Bahkan Google, dalam panduan untuk pemilik situs, menekankan pentingnya konten unik dan tak dapat digantikan, serta memperkenalkan alat seperti Preferred Sources dan badge Highly Cited untuk menonjolkan sumber asli.[4][7] Ini tidak menyelesaikan masalah, tapi menunjukkan bahwa pertempuran juga berlangsung di tingkat antarmuka dan prioritas peringkat.
Bagian tersulit untuk diverifikasi saat ini adalah batas di mana mesin mulai memberi makan dirinya sendiri secara sistematis. Sumber yang tersedia menunjukkan sinyal yang semakin mendekati, tetapi belum ada ukuran pasti titik patahnya.[1][5][8][11] Oleh karena itu pertanyaan yang tepat bukan sekadar “seberapa banyak AI ada online?”, melainkan “berapa besar bagian dari AI itu yang masuk ke hasil, ringkasan, dataset, dan jawaban yang pada akhirnya digunakan sistem lain?”. Di situlah peningkatan kuantitatif sederhana bisa berubah menjadi penurunan kualitas.
Ada juga aspek budaya yang perlu diperhatikan, karena seringkali publik melihat tema ini sebagai pertarungan antara teks yang baik dan teks yang buruk. Jika orang makin jarang mengklik sumber asli, makin banyak mengandalkan jawaban sintetis, dan gampang menerima konten yang “cukup kredibel”, sistem justru memberi hadiah pada hal yang paling mudah direplikasi.[4][6][7] Konsumen jarang mengadopsi teknologi untuk alasan yang dibayangkan perusahaan; di sini mungkin terjadi hal serupa, dengan akses cepat yang mengalahkan pencarian atas kompleksitas.
Ide lama tentang “Dead Internet” kini mesti dibaca dengan hati-hati. Dahulu itu hampir jadi teori konspirasi; sekarang beberapa riset mencoba memperlakukannya sebagai metafora yang berguna untuk membaca web di mana produksi otomatis meningkat dan perbedaan.[9][10] Namun metafora itu hanya berlaku sampai batas tertentu: web tidak hilang, malah sedang mengalami stratifikasi dengan cara baru, dengan zona kelimpahan, zona kebisingan, dan zona di mana sumber asli masih tetap sangat kuat. Menyatukan ketiga hal ini adalah pendekatan yang lebih jujur dan juga lebih berguna untuk memahami masa depan digital sehari-hari.
Referensi
Referensi
Tag angka kecil dalam isi artikel merujuk ke sumber di bawah ini.
- Retrieval Collapses When AI Pollutes the Web
- More Articles Are Now Created by AI Than Humans
- [PDF] Retrieval Collapses When AI Pollutes the Web - arXiv
- New opportunities, control and insights for website owners
- Sociotechnical Implications of Generative Artificial Intelligence for Information Access
- AI Content In Search & LLMs
- How Google Search helps you find original, quality content
- The Impact of AI-Generated Text on the Internet
- Is computational creativity flourishing on the dead internet?
- [PDF] The Impact of AI-Generated Text on the Internet - arXiv
- AI Content & Search