- 1990 के दशक के मध्य से वेब और अख़बारों को संरक्षित करने वाला Internet Archive अपनी Wayback Machine के जरिए 1 ट्रिलियन से अधिक वेबपेज सहेज चुका है
- हाल में The New York Times और The Guardian जैसे प्रमुख मीडिया संस्थानों ने AI scraping की चिंता के कारण आर्काइव की crawling को ब्लॉक करना शुरू कर दिया है
- ऐसे कदम वेब के ऐतिहासिक रिकॉर्ड में टूट पैदा करते हैं, और लेखों में संपादन या हटाए जाने से पहले और बाद के बदलावों की पुष्टि करने वाला एकमात्र रिकॉर्ड भी खो सकता है
- AI training को लेकर चल रहे कानूनी विवादों से अलग, गैर-लाभकारी संरक्षण संस्थान को ब्लॉक करना सार्वजनिक हित को नुकसान पहुंचाना माना जा रहा है
- search और web archiving पहले से ही fair use के तहत कानूनी रूप से स्थापित क्षेत्र हैं, और इन्हें रोकने का मतलब है कि भविष्य के शोधकर्ता वेब का ऐतिहासिक रिकॉर्ड खो देंगे
Internet Archive को ब्लॉक करना AI को नहीं रोकेगा, लेकिन वेब के ऐतिहासिक रिकॉर्ड को मिटा देगा
- Internet Archive 1990 के दशक के मध्य से वेब और अख़बारों को संरक्षित करने वाली दुनिया की सबसे बड़ी डिजिटल लाइब्रेरी है, और Wayback Machine के जरिए 1 ट्रिलियन से अधिक वेबपेज सहेजती है
- पिछले कुछ महीनों में The New York Times ने AI content scraping को लेकर चिंता जताते हुए आर्काइव की crawling को ब्लॉक करना शुरू किया, और The Guardian सहित अन्य मीडिया संस्थान भी उसी दिशा में बढ़ते दिख रहे हैं
- यह ब्लॉकिंग सिर्फ एक तकनीकी पाबंदी नहीं है, बल्कि ऐतिहासिक रिकॉर्ड में टूट पैदा करती है
- कई बार Internet Archive ही लेखों में संपादन या हटाए जाने से पहले और बाद के बदलावों की पुष्टि करने वाला एकमात्र रिकॉर्ड होता है
- अगर मीडिया संस्थान पहुंच रोकते हैं, तो दशकों में जमा वेब रिकॉर्ड के गायब होने का खतरा है
- AI training को लेकर कानूनी विवाद जारी हैं, लेकिन गैर-लाभकारी संरक्षण संस्थान को ब्लॉक करना गलत प्रतिक्रिया माना जा रहा है
- Internet Archive व्यावसायिक AI systems विकसित नहीं करता, बल्कि ऐतिहासिक संरक्षण के सार्वजनिक हित वाले उद्देश्य को निभाता है
- AI access को नियंत्रित करने की प्रक्रिया में लाइब्रेरी की रिकॉर्ड-संरक्षण भूमिका तक को नुकसान पहुंच सकता है
Archiving और search की कानूनी वैधता
- किसी सामग्री को search योग्य बनाना fair use के रूप में लंबे समय से कानूनी मान्यता प्राप्त है
- अदालतों ने माना है कि search index बनाने के लिए मूल सामग्री की प्रतिलिपि बनाना अपरिहार्य है
- Google द्वारा पूरी पुस्तकों की प्रतिलिपि बनाकर search database तैयार करने के मामले में भी इसे transformative purpose माना गया था
- Internet Archive भी इसी सिद्धांत पर काम करता है
- जैसे कोई भौतिक लाइब्रेरी अख़बारों को संरक्षित करती है, वैसे ही आर्काइव वेब के ऐतिहासिक रिकॉर्ड को संरक्षित करता है
- शोधकर्ता और पत्रकार इसका रोज़ इस्तेमाल करते हैं, और Wikipedia भी 249 भाषाओं में 26 लाख news articles को आर्काइव से लिंक करती है
- अनगिनत blogger, researcher और journalist इसे स्थिर और भरोसेमंद स्रोत के रूप में इस्तेमाल करते हैं
-
search engine की रक्षा करने वाले कानूनी सिद्धांत archive और library पर भी समान रूप से लागू होने चाहिए
- भले ही अदालतें AI training पर कुछ सीमाएँ तय करें, search और web archiving की वैधता पहले ही स्थापित हो चुकी है
ऐतिहासिक रिकॉर्ड के संरक्षण पर संकट
- Internet Archive लगभग 30 वर्षों से वेब के ऐतिहासिक रिकॉर्ड को संभाले हुए है
- अगर प्रमुख मीडिया संस्थान इसे ब्लॉक करना शुरू कर देते हैं, तो भविष्य के शोधकर्ताओं के विशाल रिकॉर्ड खो देने की आशंका बहुत बढ़ जाएगी
- AI training से जुड़े कानूनी विवादों का समाधान अदालतों में होना चाहिए, लेकिन सार्वजनिक रिकॉर्ड की बलि चढ़ाना एक गंभीर और अपरिवर्तनीय गलती होगी, ऐसी चेतावनी दी गई है
अभी कोई टिप्पणी नहीं है.