2 पॉइंट द्वारा GN⁺ 2025-05-13 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • अमेरिकी Copyright Office ने हाल ही में AI कंपनियों द्वारा copyright infringement के मामलों को आधिकारिक रूप से स्वीकार किया
  • इसने संकेत दिया कि AI algorithms विशाल मात्रा में copyrighted सामग्री का उपयोग करते हैं और इसके लिए creators की सहमति और मुआवज़ा आवश्यक है
  • रिपोर्ट ने निष्कर्ष निकाला कि कुछ परिस्थितियों में fair use defense लागू नहीं होती
  • OpenAI, Google, Meta, Microsoft जैसी प्रमुख कंपनियां इस मुद्दे पर मुकदमों का सामना कर रही हैं
  • AI-friendly नीतियों और राजनीतिक पदच्युति के एक साथ आने से स्थिति और जटिल हो गई है

अमेरिकी Copyright Office की रिपोर्ट और प्रमुख की बर्खास्तगी का सार

  • अमेरिकी Copyright Office की प्रमुख को उस रिपोर्ट के निष्कर्ष के तुरंत बाद हटा दिया गया, जिसमें कहा गया था कि AI मॉडल विकसित करने वाली कंपनियों ने copyrighted सामग्री के उपयोग में पारंपरिक fair use की सीमा पार कर दी
  • यह रिपोर्ट copyright और AI पर तीसरी रिपोर्ट के मसौदे में शामिल राय है
  • पहली रिपोर्ट digital replication के मुद्दे पर थी, और दूसरी generative AI outputs की copyright-योग्यता की समीक्षा पर

रिपोर्ट मसौदे के मुख्य बिंदु

  • 9 मई को, generative AI systems के विकास में कृतियों के उपयोग पर एक रिपोर्ट मसौदा (PDF) जारी किया गया
  • यह स्पष्ट रूप से सामने आया कि AI systems विशाल डेटा, यानी copyrighted सामग्री, का उपयोग करते हैं
  • इससे यह सवाल उठा कि क्या AI को copyright holders की सहमति या मुआवज़ा लेना चाहिए
  • यही वास्तव में कई मुकदमों का केंद्रीय विवाद है
  • AI डेवलपर कंपनियों ने माना है कि उन्होंने इंटरनेट आदि की सामग्री का बिना अनुमति उपयोग कर अपने उत्पादों को प्रशिक्षित किया

fair use से जुड़े उदाहरण और निर्णय के मानदंड

  • AI कंपनियां दावा करती हैं कि copyright law के fair use clause के आधार पर उनके खिलाफ कोई कानूनी समस्या नहीं है
  • लेकिन न्यायाधीशों ने इस बात पर ज़ोर दिया है कि fair use का एक मानदंड यह है कि “क्या इससे मूल कृति के संभावित बाज़ार या मूल्य पर असर पड़ता है”
  • अगर असर बड़ा नहीं है, तो उसे fair use माना जा सकता है
  • संबंधित रिपोर्ट स्पष्ट करती है कि कुछ परिस्थितियों में AI कंपनियों की fair use defense मान्य नहीं हो सकती

रिपोर्ट का प्रभाव और अकादमिक प्रतिक्रिया

  • अंतिम रिपोर्ट जल्द ही बिना बड़े बदलाव के प्रकाशित होने वाली है
  • विधि विशेषज्ञ Blake. E Reid ने इस रिपोर्ट को “AI कंपनियों के लिए बेहद प्रतिकूल” बताया और कहा कि यह “अदालत में हार का सीधा कारण बन सकती है”
  • फिलहाल Google, Meta, OpenAI, Microsoft आदि copyright-संबंधी मुकदमों के पक्षकार हैं

बर्खास्तगी की पृष्ठभूमि और राजनीतिक संदर्भ

  • प्रमुख की बर्खास्तगी के समय और रिपोर्ट के प्रकाशन के एक साथ आने से, “Congress और हितधारकों के सवालों के जवाब में प्रकाशन” वाले आधिकारिक रुख पर सवाल उठे हैं
  • प्रोफेसर Reid ने कहा कि Copyright Office द्वारा रिपोर्ट को इतनी जल्दी जारी करना संगठन के भीतर personnel action (‘purge’) का संकेत हो सकता है
  • वास्तव में, रिपोर्टों के अनुसार Trump प्रशासन ने प्रमुख Shira Perlmutter को हटा दिया

राजनीतिक असर और Elon Musk से जुड़ाव

  • प्रतिनिधि सभा के सदस्य Joe Morelle ने इस बात पर ध्यान दिलाया कि यह बर्खास्तगी ठीक उसके बाद हुई जब Elon Musk द्वारा AI मॉडल training के लिए copyrighted सामग्री के उपयोग की मांग पर Copyright Office की प्रमुख ने सहमति नहीं दी
  • Musk और Jack Dorsey जैसे लोग “सभी intellectual property (IP) laws को हटाने” की बात करते रहे हैं, और X (पूर्व Twitter) पोस्टों के जरिए AI training को आगे बढ़ाने जैसे नीति-परिवर्तन के संकेत भी दिखे हैं

बर्खास्तगी के अन्य संभावित कारण

  • यह भी उल्लेख किया गया कि Copyright Office, Library of Congress के अधीन एक संस्था है, इसलिए हाल में Library की प्रमुख को diversity (DEI) नीति और बच्चों की पुस्तकों के चयन के मुद्दे पर हटाए जाने की घटना से इसका संबंध हो सकता है
  • इसलिए, यह बर्खास्तगी AI नीति, प्रमुख donors, या DEI नीति जैसे कई आंतरिक और राजनीतिक कारकों से जुड़ी एक जटिल घटना हो सकती है

1 टिप्पणियां

 
GN⁺ 2025-05-13
Hacker News राय
  • यह बात कही गई कि अगर अमेरिका LLMs को copyrighted सामग्री इस्तेमाल करने से रोकता है या सभी copyright holders को मुआवज़ा देने को कहता है, तो चीन जैसे दूसरे देश ऐसा नहीं करेंगे। तब अमेरिकी LLM कंपनियां प्रतिस्पर्धा में पीछे रह जाएंगी या लागत के बोझ से नुकसान में होंगी। आखिरकार AI की उपयोगिता के लिहाज़ से चीन जैसे दूसरे देश आगे निकल सकते हैं। बेशक सही काम करना चाहिए, लेकिन AI regulation पर सरकारी फैसलों में यह चिंता छिपी रहती है कि भविष्य की दुनिया में नेतृत्व किसके हाथ में होगा
    • उस तर्क से तो यह निष्कर्ष निकलता है कि आम नागरिक भी corporate intellectual property को धो सकते हैं क्योंकि चीन कभी उसका पालन नहीं करेगा। अगर सामने वाला कर सकता है तो मैं भी शामिल हो जाऊँगा
    • कुल मिलाकर मैं इस बात से सहमत हूँ कि copyrighted सामग्री तक पूरी पहुँच देने से AI अधिक शक्तिशाली हो सकता है। लेकिन "अधिक शक्तिशाली" से ठीक-ठीक मतलब क्या है, यह सवाल है। national security के लिहाज़ से मैं LLMs को academic, scientific, और technical जानकारी पूरी तरह उपलब्ध कराने के पक्ष में हूँ। proprietary code को लेकर थोड़ी शंका है, लेकिन मुझे लगता है कि code data पहले से ही काफी है। लेकिन अगर LLMs को copyrighted सामग्री तक भी पूरी पहुँच मिल जाए, तो papers, technical data, और license के जरिए उपलब्ध copyrighted सामग्री तक पहुँच की तुलना में क्या वास्तविक फायदा होगा, यह साफ नहीं है। नतीजतन LLMs कहीं ज़्यादा ताकतवर plagiarism machine बन जाएंगे, वास्तव में ज़्यादा बुद्धिमान नहीं। images और video models पर भी यही तर्क लागू होता है। copyrighted सामग्री तक पहुँच मिलने पर model और ज़्यादा images बना सकता है या Mario और Luigi को अनगिनत scenarios में फिर से बना सकता है, लेकिन उससे कोई वास्तविक लाभ नहीं मिलता, इसलिए ऐसे models पर रोक होनी चाहिए। कोई महत्वपूर्ण security या economic advantage नहीं है
    • असली समस्या यह है कि AI कंपनियां पुरानी बड़ी कंपनियों की तरह खुद कानून बदलवाने की कोशिश नहीं कर रही हैं
    • दूसरी ओर, अगर कोई राष्ट्रपति चीन पर 145% tariff लगा सकता है, तो वह Chinese internet chatbots पर 1000% tariff भी लगा सकता है, या national emergency का हवाला देकर internet cables तक काट सकता है। चीन आगे क्या करेगा यह अनिश्चित है, लेकिन कम-से-कम नाबालिगों के लिए AI के इस्तेमाल पर रोक लग सकती है। military use का सवाल copyright से अलग है
    • अगर AI सच में इतना महत्वपूर्ण है, तो इसे सरकार के स्वामित्व में होना चाहिए और सभी नागरिकों के लिए मुफ्त उपलब्ध होना चाहिए
    • यही तर्क सिर्फ AI पर नहीं, हर तरह के intellectual property violation पर लागू किया जा सकता है
    • मुझे व्यक्तिगत रूप से भरोसा नहीं कि LLMs सच में दुनिया पर राज करने में योगदान देंगे, लेकिन इस बहस के पीछे मूल प्रतिस्पर्धी मानसिकता मौजूद है
    • पहले भी pirated Windows install करने में कोई खास दिक्कत नहीं थी। BSA आया था, लेकिन अब Microsoft को जब अपने हित में लगता है तो वह आँखें मूँद लेता है
  • किसी को इस वजह से निकाल देना बहुत अजीब है। यह कानून की व्याख्या पर censorship की कोशिश जैसा लगता है। मेरे हिसाब से copyright वाली सामग्री से model train करना पारंपरिक नज़रिए से साफ़ तौर पर illegal है। हाँ, इंसान किताबें पढ़कर प्रेरित होकर नई किताब लिखे तो उस पर मुकदमा नहीं होता। कई fantasy novels को देखकर पता चलता है कि सब पूरी तरह स्वतंत्र रचनाएँ नहीं हैं। AI जितना उपयोगी और innovative है, उतना ही यह मानना भी चाहिए कि कानून ने इस मामले को ठीक से नहीं सोचा था, इसलिए कानून बदलना चाहिए
    • यह कहा गया कि इंसान किताब पढ़कर प्रेरित होकर लिखे तो मुकदमा नहीं होता, लेकिन वास्तव में "बहुत ज़्यादा प्रेरित" मामलों में मुकदमे अक्सर होते हैं। music plagiarism disputes इसके मशहूर उदाहरण हैं
    • कानून ने इस मुद्दे को काफी हद तक कवर किया है, लेकिन बार-बार यह दिखता है कि ताकतवर लोग कानून से ऊपर खड़े हो जाते हैं। पुराने release हुए materials, Creative Commons सामग्री, या ऐसे outputs देना जो original से एक तय editing distance से ज़्यादा दूर हों, या संबंधित copyright holder से संपर्क कर अनुमति लेना—इन सब से इसे रोका जा सकता था। लेकिन AI कंपनियां यह सब बिल्कुल नहीं करतीं
    • AI इंसानों से अलग है। सिर्फ इसलिए कि इंसानों के अधिकार हैं, यह नहीं मान सकते कि मशीनों के भी वैसे ही अधिकार हैं। उस तर्क से तो कार को scrap करना हत्या हो जाएगा
    • इंसान भी वह नहीं कर सकते जो AI कंपनियां करना चाहती हैं। जैसे कोई student library जाकर यह नहीं कह सकता कि "मैं पढ़ाई के लिए सारी किताबों की copy बनाना चाहता हूँ"। इंसान भी उपयोगी और innovative हैं
    • यह भी मानना चाहिए कि कोई चीज़ उपयोगी है, इसका मतलब यह नहीं कि वह अपने-आप अच्छा विचार है
    • अगर copyright खत्म हो गया, तो कंपनियां बहुत नाराज़ होंगी और patent system भी टूट जाएगा। अमेरिकी कंपनियां अपनी वैश्विक पकड़ खो देंगी। फिर media piracy को copyright बनाए रखने की एकमात्र वजह की तरह परिभाषित किया जा सकता है, और मौजूदा संस्थाएँ नियंत्रण एजेंसियों में बदलकर censorship bureau बन सकती हैं
    • प्रेरित होकर दूसरी novel लिखना आज़ाद हो सकता है, लेकिन उदाहरण के लिए "Hairy Plotter and the Philosophizer's Rock" को आधिकारिक रूप से publish करने की अनुमति नहीं होगी
    • विश्लेषण की समस्या यह है कि वह copyright के अस्तित्व के मूल कारण पर चर्चा ही नहीं करता। 'बिना अनुमति LLMs को सामग्री पर train करने देना चाहिए' और 'copyright का मतलब है'—ये दोनों मान्यताएँ साथ नहीं चल सकतीं। अमेरिकी संविधान में copyright का उद्देश्य science और arts की प्रगति है, जबकि EU में लक्ष्य creators की रक्षा और creativity को बढ़ावा देना है। अगर मैं किताब प्रकाशित करूँ और tech कंपनियां उसे copy करके training में इस्तेमाल करें और फिर वही चीज़ consumers को लौटा दें, तो कोई मेरी किताब खरीदेगा ही नहीं। तब investment रुक जाएगी और किताबें बननी बंद हो जाएंगी
    • बिना license intellectual property को बेचने के उद्देश्य से model में डालकर उपलब्ध कराना कोई exception नहीं है
    • अगर कानून बदला जाए, तो वह सभी पर लागू होना चाहिए, सिर्फ AI कंपनियों के लिए special treatment नहीं होना चाहिए
    • अगर इंसान द्वारा copyrighted काम से प्रेरित होकर कुछ बनाना infringement नहीं माना गया, तो यह साफ़ समझाना होगा कि robot के मामले में यह समस्या क्यों है। अगर robot के मामले में व्याख्या के स्तर पर कोई मूल रूप से नया movement पैदा होता है, तो उसके लिए enforceable तर्क गढ़ना होगा
    • मुझे नहीं लगता AI इतनी उपयोगी technology है। इसकी शुरुआत 1950s में हुई थी, और अब जाकर थोड़ी काम की बनी है, फिर भी अभी ठीक से काम नहीं करती
    • फिल्म को pirated तरीके से देखना भी उपयोगी हो सकता है, लेकिन इसलिए वह legal नहीं हो जाता। इंसान और AI पूरी तरह अलग हैं, और इंसान प्रेरित होते हैं—यह तर्क बिना आधार का दावा है
    • cover song गाने के लिए permission चाहिए, और बिना अनुमति यह illegal हो सकता है। दूसरी ओर, प्रेरित होकर गीत लिखना legal है। अगर AI द्वारा बनाई गई रचना पर्याप्त नई और transformative है तो समस्या नहीं, लेकिन अगर वह किसी और के काम को ज्यों का त्यों copy करके निकालती है, तो समस्या है। कानून को soul या inspiration जैसी धुंधली अवधारणाओं से नहीं, बल्कि वास्तविक output के फर्क से फैसला करना चाहिए
    • कंपनी और AI न इंसान हैं, न गिलहरी। फिर इंसानों से तुलना का मतलब ही क्या है
    • मैं उन creators की भावना समझता हूँ जो software द्वारा IP को बिना अनुमति पुनर्प्राप्त किए जाने का विरोध करते हैं। बस सामग्री पढ़ना अपने-आप copyright infringement है या नहीं, इस पर संदेह है। पढ़ना या सार बनाना मौजूदा कानून के तहत नियंत्रित नहीं था। "लोग मेरी वितरित की गई किताब पढ़ नहीं सकते", "लोग मेरी writing style में fanfic नहीं लिख सकते", "लोग museum में महान चित्रों की नकल का अभ्यास नहीं कर सकते"—ऐसे दावे वास्तविकता से कटे हुए लगते हैं। यहाँ हमें अधिक तर्कसंगत सामाजिक बहस और दिशा-निर्देश की ज़रूरत है
  • Minnesota की एक महिला पर 24 गानों की illegal downloading के लिए $220,000 का जुर्माना लगाया गया
    • यह बताया गया कि वह मामला AI कंपनियों की model training से अलग है। AI कंपनी का data learning किसी गीत को हूबहू दूसरों के साथ share/distribute करने जैसा नहीं है
  • अब तक मैंने किसी को transformer model training की तकनीकी संरचना और copyright infringement के दावे—दोनों को एक साथ विस्तार से समझाते नहीं देखा। यानी model training mechanism और copyright violation logic दोनों को समझने वाले मामले कम हैं। यहाँ बात training process की हो रही है, generated results यानी inference की नहीं
    • समस्या तब होती है जब transformer ऐसी सामग्री reproduce करता है जिसके लिए उसे अनुमति नहीं मिली थी, और सिर्फ यही बात मुकदमे का आधार बन सकती है। विशाल copyrighted सामग्री को छूना ही copyright infringement है या नहीं, यह अनिश्चित है। creators और artists का अपने works से निकले products में स्वाभाविक हित भी है। अगर मेरा काम अनावश्यक है तो उसे बाहर कर दो
    • model को चलाना अपने-आप copyright infringement नहीं है, और analysis या research purpose के लिए training ठीक हो सकती है। लेकिन commercial use, market substitution जैसी बातें fair use की सीमा से बाहर मानी जाती हैं
    • यह भी जिज्ञासा है कि training का तरीका video codec के transformer से कैसे अलग है, और lossy compression का copyright infringement से क्या अंतर है
    • जब इंसानी व्यवहार, जैसे वही वाक्य लिख देना, खुद संरचनात्मक रूप से पूरी तरह समझाया नहीं जा सकता, तब AI training infringement क्यों है इस पर भी कोई साफ़ बहस नहीं दिखती। यानी पढ़ना और plagiarism—दोनों को साथ लेकर चलने वाली चर्चा नहीं है
    • इस बहस का सार यह है कि AI कंपनियां किताबों का इस्तेमाल training purpose के लिए कर रही हैं, लेकिन उसके लिए fees नहीं दे रहीं और unauthorized downloading से काम चला रही हैं
    • यह वास्तव में कैसे काम करता है, इससे ज़्यादा महत्व इस बात का है कि नतीजे में वह क्या करता है
    • programmer + copyright lawyer का मेल कम मिलता है, लेकिन बिल्कुल नहीं है ऐसा भी नहीं। फिर भी आखिरकार अहम बात यह है कि अदालत क्या फैसला देती है। इस मामले में यह तकनीकी विवरण शायद वास्तव में निर्णायक न भी हो
    • अगर मशीन किसी और के काम की नकल करती है, तो वह copyright infringement है। इंसान और मशीन एक जैसे नहीं हैं, और जब तक यह साबित न हो, कानून इसे अनुमति नहीं देता
    • एक व्यक्ति ने कहा कि उसके पास infringement के सबूत हैं और उसने reference materials साझा किए
    • training method की संरचना को जानने वाले लोग उलटे यह मानते हैं कि यह copyright infringement नहीं है
  • public draft report सिर्फ copyright holders की शिकायतों की सूची जैसा लगता है। दावों के समर्थन में गहराई नहीं दिखती
    • गहरी दलील की ज़रूरत नहीं। अगर AI 100 papers पढ़कर नया paper निकालता है, तो वह plagiarism है। अगर किसी की memory perfect हो और वह पुराने लेखों को फेरबदल करके नया लेख प्रकाशित करे, तब भी वह copyright infringement है। सिर्फ बड़ी कंपनियों को ही अपवाद बना दिया जाता है
    • यह सिर्फ शिकायतों की सूची नहीं है। बल्कि यह देखने का नज़रिया है कि copyright holders अदालत में अपने खिलाफ़ जाती स्थिति को fair use सिद्धांत को कमजोर करके बायपास करना चाहते हैं
    • मुझे खास सहानुभूति नहीं है
  • अगर AI व्यावसायिक रूप से विशाल copyrighted works का इस्तेमाल करके ऐसा content बनाता है जो मौजूदा बाजार से प्रतिस्पर्धा करे, तो यह fair use से बाहर है—इस निष्कर्ष से सहमत होना कठिन है। अलग-अलग स्रोतों से थोड़ा-थोड़ा लेकर रचनात्मक ढंग से बनाना fair use क्यों नहीं होना चाहिए, यह सवाल है। यह तर्क अंततः public interest और copyright के मूल उद्देश्य पर सवाल उठाता है
  • यह भी कहा गया कि मौजूदा प्रशासन में special interest groups के लिए बहुत कुछ किया जा रहा है
  • "Copyright and Artificial Intelligence Part 3: Generative AI Training" PDF सामग्री देखने की सलाह दी गई
  • ऐसा महसूस होता है कि intellectual property law बड़े corporations के मुकदमों का औज़ार बनती जा रही है, जो ideas के प्रसार को दबाती है। अगर किसी किताब की पूरी सामग्री जानना illegal है, तो फिर उस सामग्री की कितनी encoded समझ तक प्रतिबंध लगाया जा सकता है, यह धुंधला हो जाता है। यहाँ judge जब फैसला करेगा, तो मामला सिर्फ commercial copying का नहीं बल्कि मानवता के सामूहिक ज्ञान के नियंत्रण का भी होगा
  • पिछले विवादों में जो बात उठी थी, वही मुद्दा इस बार फिर दोहराया जा रहा है