Wikipedia server dirambah Bot Ai parasit bikin web crash

   Shortstory 4 April 2025

Server Wikipedia sedang berjuang di bawah tekanan dari bot pengikis AI
Mirip sebuah situs yang memiliki data konten besar, bot pencarian akan mengambil data.
Dan itu hal wajar, bot hanya mencari data baru untuk dimasukan ke database mereka. Memudahkan orang mencari informasi mengunakan Search Engine.

Masalah sekarang, banyak bot Ai sedang mengkoleksi data.
Bot AI baru-baru ini menjadi momok situs web yang berurusan dengan konten tertulis atau jenis media lainnya.
Bot mencuri semua informasi yang ada di situs internet, dan pengumpulan data yang sangat agresif.

Dari situs data yang sangat besar Wikipedia hingga blog pribadi yang sederhana, tidak ada yang aman dari Scrawler OpenAI dan raksasa teknologi lainnya dalam mencari konten baru untuk mengumpulkan dan melatih model AI bagi data mereka.

Wikimedia Foundation, organisasi nirlaba Wikipedia dan situs web populer lainnya, mengatakan kekhawatiran tentang bot pengikis AI dan dampaknya bandwidth internet. Permintaan konten yang disimpan di server Wikimedia tumbuh secara signifikan sejak awal tahun 2024, perusahaan AI secara aktif mengonsumsi sejumlah besar lalu lintas untuk melatih produk mereka.

Proyek-proyek Wikimedia, mencakup koleksi pengetahuan dan media yang dapat diakses secara bebas di internet, digunakan miliaran orang di seluruh dunia.
Wikimedia Commons sendiri menampung 144 juta gambar, video, dan berkas lain yang dibagikan di bawah domain publik.

wikipedia server load desember 2024

Wikimedia Foundation mengalami peningkatan 50 persen dalam bandwidth yang digunakan untuk unduhan multimedia sejak Januari 2024, tapi lalu lintas sebagian besar berasal dari bot (bukan dibaca manusia).
Program otomatis sedang mengikis katalog gambar Wikimedia Commons untuk memasukkan konten ke model AI, masalahnya server Wikimedia tidak dibangun untuk menahan jenis lalu lintas internet parasit ini.

Tim Wikimedia memiliki bukti yang jelas tentang dampak pengikisan AI pada Desember 2024, ketika mantan Presiden AS Jimmy Carter meninggal dunia, dan jutaan pemirsa mengakses halamannya di Wikipedia edisi bahasa Inggris.
2,8 juta orang yang membaca biografi dan prestasi presiden, banyak pengguna juga menonton streaming video berdurasi 1,5 jam tentang debat Carter tahun 1980 dengan Ronald Reagan.

Karena ada 2 jaringan antara bot dan manusia yang menonton bersamaan. Jaringan Wikipedia mengalam kemacetan selama 1 jam.
Penanganan dialihkan untuk trafik internet dalam pemulihan, masalah ini seharusnya tidak akan terjadi.


Dengan memeriksa masalah bandwidth selama migrasi sistem, Wikimedia menemukan setidaknya 65 persen lalu lintas yang paling intensif berasal dari Bot, melewati infrastruktur cache dan secara langsung memengaruhi data center Core Wikimedia.

Perusahaan AI dan teknologi secara aktif mengumpulkan setiap konten buatan manusia yang mereka temukan di internet.
Wikipedia mempromosikan pendekatan yang lebih bertanggung jawab terhadap akses infrastruktur melalui koordinasi bagi pengembang AI.
API khusus dapat meringankan beban bandwidth, membuat identifikasi dan perlawanan terhadap "aktor jahat" dalam industri AI menjadi lebih mudah.

Ini menjadi tantangan bagi siapa saja yang memasukan data ke internet.
Bot dapat mengambil apa saja, dengan membaca seperti manusia, lalu mengumpulkan informasi di dalam big data mereka.


Fujikura adalah perusahaan serat optik, nyaris tidak lewat di era Pandemi tahun 2020. Tapi di tahun 2024 perusahaan ini sangat dibutuhkan, khususnya bidang Ai. Jaringan dengan serat lebih kecil, memuat kabel lebih banyak, dibutuhkan untuk data center.

Eksodus massal dari X benar-benar meningkat pertengahan November 2024. Member khawatir dengan Ai yang membaca postingan mereka, data member di panen untuk melatih Ai dan mengumpulkan data sebagai pelatihan Machine Learning. Masalah privasi menjadi pelanggaran bagi penguna internet.

Tiba tiba perusahaan raksasa membangun pusat data center di berbagai tempat. Amerika, Eropa sampai Asia Tenggara. Agar tidak tertinggal pasar, nama Amazon, Google, Microsoft bersaing memberi layanan Cloud Compute. China sudah kena batunya, VGA lama dijual kembali.

The Tow Center for Digital Journalism menguji 8 layanan Ai, dan 60% tidak akurat. Meta Microsoft masih memanen data anda (April 2025). Kualitas pencarian Google Search menurun, survei VOX 2024. Disable Ai di Google.com Ai. Ai menjawab 100% benar, di medis jawaban salah dan itu masalah.

Google terapkan Ai dimana mana yang bikin pusing, sekarang diketahui alasan lain adalah uang Juli 2024. Link sementara sudah mulai mereda Juni 2024. Pencarian Google semakin buruk, diulas WashingtonPost tahun 2020, di teliti kembali oleh WalletHub tentang perbankan. Bila mencari di Google terasa ngak relevan, anda tidak sendirian.



Youtube Obengplus