การบล็อกอินเทอร์เน็ตอาร์ไคฟ์จะไม่หยุดการฝึก AI — แต่จะลบความทรงจำของเว็บ

การบล็อกอินเทอร์เน็ตอาร์ไคฟ์จะไม่หยุดการฝึก AI — แต่จะลบความทรงจำของเว็บ
สำนักพิมพ์รายใหญ่เริ่มบล็อกตัวรวบรวมข้อมูลของอินเทอร์เน็ตอาร์ไคฟ์ โดยเด่นชัดที่สุดคือ เดอะ นิวยอร์ก ไทม์ส ที่ก้าวข้ามการควบคุมแบบ robots.txt แบบดั้งเดิมเพื่อป้องกันไม่ให้เวย์แบ็คแมชชีนจับภาพและเก็บสำเนาหน้าข่าวของตน อินเทอร์เน็ตอาร์ไคฟ์ — ผู้ดูแลเวย์แบ็คแมชชีนและหอสมุดดิจิทัลที่ใหญ่ที่สุดของเว็บซึ่งมีหน้าที่ถูกเก็บสำเนามากกว่าหนึ่งล้านล้านหน้า — เป็นเครื่องมือการวิจัยประจำวันสำหรับผู้สื่อข่าว นักประวัติศาสตร์ ศาล และสาธารณชน โดยการตัดการเข้าถึงตัวรวบรวมข้อมูลเชิงอนุรักษ์ขององค์กรไม่แสวงหากำไร สื่อมวลชนเสี่ยงทำลายบันทึกสาธารณะเพียงชุดเดียวที่สม่ำเสมอของรูปแบบการรายงานข่าวออนไลน์ รวมถึงการแก้ไข ข้อแก้ไข และการถอนข่าวที่โดยปกติแล้วจะหายไปจากเว็บที่ออนไลน์อยู่
สำนักพิมพ์กล่าวว่าการกระทำของพวกเขาเป็นการตอบสนองต่อความกังวลว่า บริษัทด้าน AI จะสแครปเนื้อหาข่าวเพื่อใช้ฝึกโมเดลภาษาขนาดใหญ่และระบบอื่นๆ และหลายองค์กรข่าวได้ดำเนินคดีเกี่ยวกับการใช้วัสดุที่มีลิขสิทธิ์ในการฝึก AI แม้ว่าศาลจะตัดสินให้สำนักพิมพ์เป็นฝ่ายชนะ การเอาการเข้าถึงสำหรับสถาบันที่อนุรักษ์ประวัติศาสตร์ออกไปก็เป็นการตอบโต้ที่ไม่สัดส่วน อินเทอร์เน็ตอาร์ไคฟ์ไม่ใช่ผู้ฝึกโมเดลเชิงพาณิชย์ แต่ทำหน้าที่คล้ายห้องสมุดที่ทำสำเนาเพื่อการอนุรักษ์และการค้นคว้า หอสมุดและสถาบันเอกสารได้ถูกปฏิบัติแตกต่างกันในกฎหมายลิขสิทธิ์มายาวนานเมื่อการคัดลอกของพวกเขามีวัตถุประสงค์เพื่อการวิจัย การเข้าถึง และประโยชน์สาธารณะ ความเสียหายจากการบล็อกทางเทคนิคอย่างทั่วถึงคือการสูญเสียบันทึกพยานที่ค่อยๆ เกิดขึ้น ซึ่งหลายฝ่ายต้องพึ่งพาเพื่อเข้าใจว่าการรายงานข่าวและวิธีการสื่อสารสาธารณะมีวิวัฒนาการอย่างไร
การเอาความสามารถของอาร์ไคฟ์ในการเก็บรักษาข่าวออกไปสร้างต้นทุนระยะยาวที่ไกลกว่าสงครามทางกฎหมายเรื่องข้อมูลฝึกของ AI ในทันที ผู้สื่อข่าวจะเสียแหล่งที่มาที่มั่นคงสำหรับการอ้างอิงและยืนยันข้อกล่าวหาในอดีต นักวิจัยจะพบช่องว่างในการศึกษาระยะยาวเกี่ยวกับสื่อ และศาลอาจขาดบันทึกประจุบันของสิ่งพิมพ์ออนไลน์ แทนที่จะตั้งแนวป้องกันทางเทคนิค สื่อและสถาบันเก็บเอกสารควรสำรวจข้อตกลงแบบกำหนดเป้าหมายที่ปกป้องผลประโยชน์เชิงพาณิชย์โดยไม่ลบทิ้งบันทึกสาธารณะ
ผลกระทบสำคัญ
- บันทึกประวัติศาสตร์มีความเสี่ยง: การบล็อกตัวรวบรวมข้อมูลเชิงอนุรักษ์จะเอาภาพเก็บสำเนาอิสระของหลายหน้าข่าวออกไป
- ทางแก้ที่ผิดจุด: การบล็อกทางเทคนิคมุ่งเป้าไปที่การอนุรักษ์แบบไม่แสวงหากำไร ไม่ใช่ผู้สร้างโมเดลเชิงพาณิชย์
- ความตึงเครียดทางกฎหมายและนโยบาย: คดีที่กำลังดำเนินเกี่ยวกับการฝึก AI อาจตัดสินมาตรฐานการเข้าถึงได้ แต่ความสูญเสียของสถาบันเก็บเอกสารในช่วงกลางทางเป็นสิ่งที่ไม่สามารถย้อนกลับได้
- ความจำเป็นของแนวทางแก้: การเข้าถึงที่เจรจาตกลงกัน การกำหนดระยะเวลาปิดกั้นแบบเลือกได้ และการชี้แจงทางกฎหมายอาจสร้างสมดุลระหว่างสิทธิและการอนุรักษ์ได้
เชื่อมต่ออยู่และท่องเว็บอย่างปลอดภัยด้วย Doppler VPN.
แหล่งข้อมูล:
พร้อมที่จะปกป้องความเป็นส่วนตัวของคุณหรือยัง?
ดาวน์โหลด Doppler VPN และเริ่มท่องเว็บอย่างปลอดภัยวันนี้

