- Meta का कहना है कि AI मॉडल ट्रेनिंग के लिए BitTorrent के जरिए अवैध किताबें डाउनलोड और अपलोड करना fair use के दायरे में आता है
- कंपनी ने कहा कि BitTorrent का upload फ़ंक्शन तकनीकी रूप से अपरिहार्य प्रक्रिया है और डेटा हासिल करने का यही एकमात्र और सबसे कुशल तरीका था
- लेखकों की ओर से कहा गया कि नई fair use defense मुकदमे की समय-सीमा के बाद पेश की गई, इसलिए यह प्रक्रियात्मक उल्लंघन है, लेकिन Meta ने जवाब दिया कि वह यह defense पहले ही स्पष्ट कर चुकी थी
- Meta ने यह भी ज़ोर देकर कहा कि लेखक यह साबित नहीं कर पाए कि उसके AI मॉडल ने किताबों की सामग्री की नकल की या बाज़ार को नुकसान पहुँचाया
- इस बहस को AI ट्रेनिंग डेटा संग्रह और copyright की सीमा तय करने वाले एक अहम मिसाल के रूप में देखा जा रहा है
Meta के fair use दावे की पृष्ठभूमि
- Meta और अन्य टेक कंपनियों ने Anna’s Archive जैसी shadow libraries से BitTorrent के जरिए किताबें जुटाईं और उनका उपयोग AI मॉडल ट्रेनिंग में किया
- इसी प्रक्रिया में copyright holder की अनुमति के बिना कृतियों का उपयोग किए जाने के आधार पर 2023 में कई लेखकों ने class action lawsuit दायर किया
- वादियों में Richard Kadrey, Sarah Silverman, Christopher Golden आदि शामिल हैं
- 2025 की गर्मियों में अदालत ने माना कि अवैध किताबों को training data के रूप में इस्तेमाल करना अपने आप में fair use है
- लेकिन BitTorrent के जरिए डाउनलोड और अपलोड करने की कार्रवाई पर फैसला अभी बाकी था
BitTorrent upload के fair use का तर्क
- Meta ने हाल ही में California federal court में एक supplemental brief दाखिल कर कहा कि upload की कार्रवाई भी fair use में शामिल है
- BitTorrent की संरचना ऐसी है कि फ़ाइल डाउनलोड करते समय सिस्टम अपने-आप कुछ डेटा दूसरों को अपलोड करता है
- इसलिए upload कोई विकल्प नहीं, बल्कि protocol का मूलभूत फ़ंक्शन है
- Meta ने स्पष्ट कहा कि Anna’s Archive का dataset केवल torrent फ़ॉर्म में उपलब्ध था, इसलिए BitTorrent का उपयोग करना अनिवार्य था
- वकीलों के अनुसार, यह “dataset हासिल करने का कुशल और विश्वसनीय साधन” था
- upload की प्रक्रिया को AI ट्रेनिंग जैसे transformative fair use उद्देश्य के लिए आवश्यक कदम माना गया
लेखकों की आपत्ति और प्रक्रियात्मक विवाद
- लेखकों की ओर से Meta पर मुकदमे की समय-सीमा के बाद नई defense जोड़ने का आरोप लगाते हुए अदालत को आपत्ति-पत्र भेजा गया
- उनका कहना है कि Meta को 2024 के नवंबर से upload से जुड़ी दलीलों की जानकारी थी, फिर भी उसने fair use defense पेश नहीं की
- federal rule (Rule 26(e)) साक्ष्य पूरक करने की ज़िम्मेदारी देता है, लेकिन यह नई defense जोड़ने का कोई ‘loophole’ नहीं है
- इसके जवाब में Meta ने कहा कि 2025 के दिसंबर में संयुक्त case management document में यह defense पहले ही दर्ज की जा चुकी थी
- Meta का यह भी दावा है कि लेखकों के वकील ने उस समय अदालत में इसका उल्लेख किया था
लेखकों की गवाही और बाज़ार-नुकसान का सवाल
- Meta ने लेखकों की गवाही का हवाला देते हुए कहा कि बाज़ार को कोई नुकसान नहीं हुआ
- सभी वादियों ने कहा कि उन्हें ऐसा कोई उदाहरण नहीं पता जिसमें Meta मॉडल के output में उनकी किताबों की सामग्री कॉपी हुई हो
- Sarah Silverman ने गवाही में कहा, “अगर मॉडल किताब की सामग्री आउटपुट नहीं करता, तो मुझे फर्क नहीं पड़ता”
- Meta ने इसके आधार पर कहा कि लेखक वास्तविक नुकसान या बिक्री में गिरावट साबित नहीं कर पाए
- इसलिए कंपनी के अनुसार यह मुकदमा किताबों की सुरक्षा से ज़्यादा ट्रेनिंग प्रक्रिया पर सवाल उठाने तक सीमित है
अमेरिकी AI प्रतिस्पर्धा और आगे के सवाल
- Meta ने अपने brief में कहा कि AI निवेश और डेटा उपयोग ने अमेरिका की वैश्विक AI leadership को मजबूत किया है
- कंपनी का रुख है कि ऐसी तकनीकी प्रगति राष्ट्रीय संपत्ति के रूप में संरक्षण के योग्य है
- अदालत को आगे यह तय करना है कि ‘तकनीकी अपरिहार्यता के आधार पर fair use’ वाले तर्क को मान्यता दी जाए या नहीं
- यह फैसला AI training data संग्रह और copyright की सीमा तय करने वाली एक महत्वपूर्ण मिसाल बन सकता है
- फिलहाल बाकी मुख्य मुद्दा BitTorrent वितरण कार्रवाई में प्रत्यक्ष उल्लंघन की मौजूदगी है, और अब न्यायाधीश के फैसले पर नज़र है
1 टिप्पणियां
Hacker News की राय
मुझे वो समय याद है जब RIAA बच्चों पर Metallica albums को file-sharing से डाउनलोड करने के लिए मुकदमा करती थी
वे एक गाने पर 100,000 डॉलर तक मांगते थे, जबकि अगर किसी ने physical CD चुराई होती तो वास्तविक नुकसान शायद प्रति गाना करीब 1 डॉलर होता
अदालतों ने इस रकम को गंभीरता से लिया, और आम तौर पर करीब 3,000 डॉलर में समझौता होता था, जो फिर भी वास्तविक नुकसान का 30 गुना था
यहाँ तक कि जब फिल्म Wolverine का rough cut लीक हुआ था, तब भी कानूनी रूप से मांगी जा सकने वाली अधिकतम रकम 150,000 डॉलर थी
सिर्फ RIAA या record labels ही निर्दयी नहीं थे, Metallica खुद अपने fans के खिलाफ लड़ रही थी
YouTube लिंक
अगर ऐसा बदलाव सिर्फ corporations पर नहीं बल्कि आम लोगों पर भी लागू हो, तो copyright समाज की प्रगति को कम रोकेगा
copyright की कमजोरी innovation की मुक्ति बन सकती है
copyright आखिरकार ‘copy करने के अधिकार को कुछ खास समूहों तक सीमित करने वाला कानून’ है, और दूर से देखने पर यह सच में एक बेतुकी व्यवस्था लगती है
BitTorrent मूल रूप से ऐसा है कि file डाउनलोड करते समय आप अपने-आप upload भी करते हैं
यानी, दावा यह है कि upload कोई विकल्प नहीं बल्कि protocol की प्रकृति है, हालांकि अदालत में इसे साबित करना मुश्किल होगा
ज़्यादातर users settings नहीं बदलते, इसलिए वे अनजाने में seeding करते रहते हैं
लेकिन protocol खुद इसे मजबूर नहीं करता, और upload को 0 पर सीमित करना या tracker से झूठ बोलना भी संभव है
यानी seeding कोई तकनीकी अनिवार्यता नहीं, बल्कि community norm के ज़्यादा करीब है
तो क्या पुराने BitTorrent music download cases की भी फिर से सुनवाई होनी चाहिए?
पहले कभी कल्पना नहीं की थी कि बड़ी कंपनियाँ अदालत में pro-piracy रुख अपनाएँगी
दूसरी ओर, जो activist पहले piracy का बचाव करते थे, अब वही बड़ी कंपनियों द्वारा वही काम करने पर विरोध कर रहे हैं
“information free होनी चाहिए” वाली सोच और “artists की आजीविका” को महत्व देने वाली सोच अलग है
AI कंपनियाँ और publishers दोनों ‘बड़ी कंपनियाँ’ हैं, लेकिन उनके मुनाफे के ढाँचे अलग हैं
अगर Meta Nintendo IP और OpenAI Netflix IP को torrent से डाउनलोड करें, तो शायद किसी को फर्क नहीं पड़ेगा
भले मैंने कुछ copy न किया हो, मैं पहले ही पैसे दे चुका हूँ, इसलिए नैतिक रूप से illegal download को लेकर अपराधबोध नहीं है
इसी तर्क से, AI कंपनियों को भी data scraping पर शिकायत करने का हक नहीं है
पहले वाले जेल गए, बाद वाले पैसा कमा रहे हैं
अदालतें सिर्फ rectifier diode की तरह हैं, जो उसे एक ही दिशा में बहने देती हैं
सोचता हूँ कि क्या बड़ी कंपनियाँ अब Anna’s Archive जैसी shadow libraries को सीधे पैसे देकर access लेंगी
अफवाह है कि Nvidia ने ऐसा किया था
Meta के लिए कुछ दसियों हज़ार डॉलर कोई बड़ी रकम नहीं है, और अगर मामला Anthropic case जैसा बढ़े तो यह संभव है
बेशक लेखक अब भी LLM से अपनी किताबों की सामग्री पूछ सकेंगे, लेकिन अगर सबूत कम हो जाएँ तो मुकदमे की संभावना भी घटेगी
Meta की मौजूदा दलील कोने में फँसकर दिया गया बहाना लगती है
अदालत के इसे मानने की संभावना कम है, और अंत में मामला शायद class action settlement पर खत्म होगा
lead plaintiffs को शायद अच्छी-खासी रकम मिल जाए, लेकिन बाकी लेखकों को लगभग छुट्टे पैसे ही मिलेंगे
अगर plaintiffs कोई बड़ी media company होती, तो यह लड़ाई कहीं ज़्यादा महंगी पड़ती
अगर Meta सच में इस तर्क को सफल बना देती है, तो क्या मैं भी किताबें चुराकर share कर सकता हूँ?
क्या यही तर्क music, movies, और games पर भी लागू होगा?
किसी न किसी दिन “कानून निष्पक्ष है” वाले आदर्श और “कानून ताकत के आगे झुक जाता है” वाली हकीकत के विरोधाभास को सुलझाना होगा
Copyright Term Extension Act देखें
कमजोर लोग न मानें तो उन्हें सज़ा मिलती है
“हत्या”, “धोखाधड़ी”, “चोरी” जैसे विचार भी अस्पष्ट हैं
समाधान सिर्फ बेहतर नागरिक शिक्षा में दिखता है
यह आश्चर्य की बात है कि Meta इस मुकदमे को लड़ ही रही है
तर्क खुद हास्यास्पद लगता है, लेकिन कंपनी के नज़रिए से कानून तोड़कर जुर्माना भरना,
कानून मानकर मुनाफा खोने से सस्ता पड़ता है
आखिरकार ऐसे मुकदमों की लागत भी business expense के रूप में ही गिनी जाएगी
90s~2000s में FBI सड़कों पर illegal VHS/DVD बेचने वाले बेघर लोगों पर कार्रवाई करती थी
फिर भी वे child exploitation जैसे अपराधों में शामिल नहीं थे
सवाल उठाया गया कि अगर आज ICE या FBI को ऐसा मामला मिले, तो वे सबसे पहले किससे संपर्क करेंगे
जब अदालतें निरंतरता खो देती हैं, और हमेशा corporations को इंसानों जैसा मानती हैं,
जबकि वास्तविक मनुष्यों या दूसरे जीवों को सामान की तरह मानती हैं, तो वे सम्मान खो देती हैं
व्यवस्था और प्रगति बनाए रखने के लिए कोई बेहतर तरीका चाहिए