حظر الأرشيف الرقمي للإنترنت لن يوقف تدريب الذكاء الاصطناعي — بل سيمحو ذاكرة الويب

حظر الأرشيف الرقمي للإنترنت لن يوقف تدريب الذكاء الاصطناعي — بل سيمحو ذاكرة الويب
بدأ عدد من الناشرين بحظر زواحف الأرشيف الرقمي للإنترنت، وعلى رأسهم صحيفة نيويورك تايمز، التي انتقلت إلى ما هو أبعد من تحكمات robots.txt التقليدية لمنع أداة استرجاع الويب من التقاط وحفظ صفحاتها. الأرشيف الرقمي للإنترنت — المشغل لأداة استرجاع الويب وأكبر مكتبة رقمية على الويب بأكثر من تريليون صفحة مؤرشفة — هو أداة بحث يومية للصحفيين والمؤرخين والمحاكم والجمهور. من خلال قطع الوصول إلى زواحف الأرشفة غير الربحية، يخاطر الناشرون بتفكيك السجل العام المتسق الوحيد لكيفية ظهور الأخبار على الإنترنت، بما في ذلك التعديلات والتصحيحات والتراجعات التي تختفي خلاف ذلك من الويب الحي.
يقول الناشرون إن إجراءاتهم تستجيب للقلق من قيام شركات الذكاء الاصطناعي بتجريف محتوى الأخبار لتدريب نماذج لغوية كبيرة وأنظمة أخرى، وقد رفعت عدة مؤسسات إعلامية قضايا قانونية بشأن استخدام المواد المحمية بحقوق الطبع والنشر في تدريب الذكاء الاصطناعي. حتى لو انحازت المحاكم في نهاية المطاف للناشرين، فإن إزالة الوصول الأرشيفي عن المؤسسات التي تحفظ التاريخ يعتبر رد فعل غير متناسب. الأرشيف الرقمي للإنترنت ليس مدرّبًا تجاريًا للذكاء الاصطناعي؛ فهو يعمل أشبه بمكتبة تقوم بنسخ المواد للحفظ والاكتشاف. لقد تم معاملة المكتبات والأرشيفات بمرور الوقت بشكل مختلف في قانون حقوق الطبع والنشر عندما تخدم نسخها أغراض البحث والوصول والمصلحة العامة. والأضرار الجانبية للحظرات التقنية الشاملة هي الفقدان التدريجي لسجل إثباتي يعتمد عليه الكثيرون لفهم كيفية تطور التغطية الصحفية والخطاب العام.
إزالة قدرة الأرشيف على حفظ الأخبار تخلق تكاليف طويلة الأمد تتجاوز الخلاف الفوري حول بيانات تدريب الذكاء الاصطناعي. سيفقد الصحفيون مصدرًا ثابتًا للتحقق من الادعاءات التاريخية، وسيواجه الباحثون ثغرات في الدراسات الطولية لوسائل الإعلام، وقد تفتقر المحاكم إلى سجلات معاصرة للمنشورات عبر الإنترنت. بدلاً من إقامة حواجز تقنية، ينبغي على الناشرين والأرشيفات استكشاف اتفاقيات مستهدفة تحمي المصالح التجارية دون محو السجل العام.
الآثار الرئيسية
- السجل التاريخي معرض للخطر: حظر زواحف الأرشفة يزيل لقطات المستقلة الوحيدة للعديد من صفحات الأخبار.
- حل غير مناسب: الحظرات التقنية تستهدف الحفظ غير الربحي، لا بناة النماذج التجاريين.
- احتكاك قانوني وسياسي: القضايا المرفوعة حول تدريب الذكاء الاصطناعي قد تقرر أعراف الوصول، لكن الفقدان الأرشيفي الوسيط لا يمكن عكسه.
- الحاجة إلى حلول: الوصول المتفاوض عليه، والحجب الانتقائي المؤقت، والتوضيحات القانونية يمكن أن توازن بين الحقوق والحفظ.
ابق متصلاً وتصفح بأمان مع Doppler VPN.
المصادر:
مستعد لحماية خصوصيتك؟
حمّل Doppler VPN وابدأ التصفح الآمن اليوم.

