Memblokir Internet Archive Tidak Akan Menghentikan Pelatihan AI — Itu Akan Menghapus Memori Web

Memblokir Internet Archive Tidak Akan Menghentikan Pelatihan AI — Itu Akan Menghapus Memori Web
Penerbit besar mulai memblokir perayap Internet Archive, yang paling menonjol adalah The New York Times, yang bergerak melampaui kontrol robots.txt tradisional untuk mencegah Wayback Machine menangkap dan melestarikan halamannya. Internet Archive — operator Wayback Machine dan perpustakaan digital terbesar di web dengan lebih dari satu triliun halaman yang diarsipkan — adalah alat penelitian harian bagi jurnalis, sejarawan, pengadilan, dan publik. Dengan memotong akses ke perayap arsip nirlaba, penerbit berisiko meruntuhkan satu-satunya catatan publik yang konsisten tentang bagaimana berita muncul secara online, termasuk suntingan, koreksi, dan pencabutan yang jika tidak akan hilang dari web yang aktif.
Penerbit mengatakan tindakan mereka merupakan respons terhadap kekhawatiran atas perusahaan AI yang melakukan scraping konten berita untuk melatih large language models dan sistem lainnya, dan beberapa organisasi berita telah menempuh litigasi atas penggunaan materi berhak cipta dalam pelatihan AI. Bahkan jika pengadilan akhirnya memihak penerbit, menghapus akses arsip dari institusi yang melestarikan sejarah adalah respons yang tidak proporsional. Internet Archive bukan pelatih AI komersial; fungsinya lebih mirip perpustakaan yang membuat salinan untuk pelestarian dan penemuan. Perpustakaan dan arsip sejak lama diperlakukan berbeda dalam hukum hak cipta ketika penyalinannya melayani penelitian, akses, dan kepentingan publik. Kerusakan sampingan dari blok teknis menyeluruh adalah hilangnya bertahap catatan bukti yang banyak pihak andalkan untuk memahami bagaimana pelaporan dan diskursus publik berkembang.
Menghapus kemampuan Archive untuk melestarikan berita menciptakan biaya jangka panjang yang melampaui perselisihan langsung tentang data pelatihan AI. Jurnalis akan kehilangan sumber yang stabil untuk mencari sumber dan memverifikasi klaim historis, peneliti akan menghadapi celah dalam studi longitudinal media, dan pengadilan mungkin kekurangan catatan kontemporer publikasi online. Alih-alih mendirikan penghalang teknis, penerbit dan arsip sebaiknya mengeksplorasi kesepakatan bertarget yang melindungi kepentingan komersial tanpa menghapus catatan publik.
Implikasi utama
- Catatan historis berisiko: Memblokir perayap arsip menghilangkan satu-satunya cuplikan independen dari banyak halaman berita.
- Solusi yang keliru: Blok teknis menargetkan pelestarian nirlaba, bukan pembuat model komersial.
- Gesekan hukum dan kebijakan: Gugatan yang sedang berlangsung tentang pelatihan AI bisa menentukan norma akses, tetapi kehilangan arsip sementara tidak dapat dikembalikan.
- Kebutuhan solusi: Akses yang dinegosiasikan, embargo selektif, dan klarifikasi hukum bisa menyeimbangkan hak dan pelestarian.
Tetap terhubung dan jelajah dengan aman menggunakan Doppler VPN.
Sumber:
Siap melindungi privasi Anda?
Unduh Doppler VPN dan mulai menjelajah dengan aman hari ini.

