1 पॉइंट द्वारा GN⁺ 2023-12-29 | 1 टिप्पणियां | WhatsApp पर शेयर करें

न्यूयॉर्क टाइम्स ने OpenAI पर कॉपीराइट मुकदमा दायर किया

  • न्यूयॉर्क टाइम्स ने OpenAI और उसके साझेदार Microsoft के खिलाफ कॉपीराइट उल्लंघन का मुकदमा दायर किया है.
  • यह सबूत पेश किया गया कि OpenAI द्वारा विकसित GPT-आधारित सिस्टम न्यूयॉर्क टाइम्स के लेखों को पुन: प्रस्तुत कर सकते हैं.
  • न्यूयॉर्क टाइम्स ने बातचीत सुचारु रूप से आगे न बढ़ने पर लाइसेंसिंग मुद्दे को लेकर OpenAI पर मुकदमा करने का फैसला किया.

पत्रकारिता महंगी होती है

  • न्यूयॉर्क टाइम्स विभिन्न क्षेत्रों के पत्रकारों के माध्यम से महत्वपूर्ण खोजी पत्रकारिता करने सहित काफी खर्च करता है.
  • यह अखबार मजबूत paywall के जरिए राजस्व कमाता है और copyright notices तथा terms of use के माध्यम से अपनी सामग्री के उपयोग को सीमित करता है.
  • मुकदमे में दावा किया गया है कि OpenAI द्वारा विकसित टूल्स इन राजस्व मॉडलों का उल्लंघन कर रहे हैं.

सिर्फ training ही नहीं

  • कॉपीराइट वाली सामग्री को AI सिस्टम की training में उपयोग करने को लेकर कई मुकदमे दायर किए गए हैं.
  • न्यूयॉर्क टाइम्स का मुकदमा दिखाता है कि training के दौरान अवशोषित सामग्री उपयोग के समय फिर से कैसे सामने आती है.
  • मुकदमे में ऐसे उदाहरण शामिल हैं जिनमें GPT-4 ने न्यूयॉर्क टाइम्स के लेखों को लगभग ज्यों का त्यों पुन: प्रस्तुत किया.

प्रतिष्ठा और अन्य नुकसान

  • मुकदमे में कहा गया है कि AI की 'hallucination' न्यूयॉर्क टाइम्स की प्रतिष्ठा को नुकसान पहुंचा सकती है और मानव स्वास्थ्य पर नकारात्मक प्रभाव डाल सकती है.
  • न्यूयॉर्क टाइम्स के स्वामित्व वाले Wirecutter लेखों में भी कॉपीराइट सामग्री का बिना अनुमति उपयोग किया गया और monetized links हटा दिए गए.
  • मुकदमे में OpenAI और Microsoft पर कॉपीराइट उल्लंघन, DMCA और ट्रेडमार्क उल्लंघन सहित कई आरोप लगाए गए हैं.

GN⁺ की राय:

  • यह लेख अच्छी तरह दिखाता है कि AI तकनीक की प्रगति कॉपीराइट जैसे मौजूदा कानूनी ढांचे से टकराने पर कैसी समस्याएं पैदा करती है.
  • कॉपीराइट धारकों और AI डेवलपर्स के बीच तनाव AI के भविष्य से जुी महत्वपूर्ण कानूनी और नैतिक बहस को जन्म दे सकता है.
  • न्यूयॉर्क टाइम्स जैसे प्रमुख मीडिया संस्थानों द्वारा AI तकनीक के खिलाफ कानूनी कार्रवाई करना AI की content generation और distribution के लिए regulation और guidelines तय करने में एक महत्वपूर्ण मिसाल बन सकता है.

1 टिप्पणियां

 
GN⁺ 2023-12-29
Hacker News राय
  • क्या NYT लेखों को स्क्रैप करके प्रोडक्ट बनाना fair use के अंतर्गत आता है?

    • यह सवाल उठाया गया है कि कानूनी रूप से स्क्रैप किए गए NYT लेखों का उपयोग करके प्रोडक्ट बनाना, फिर उन्हें summarize और rewrite करके paid रूप में उपलब्ध कराना, क्या fair use माना जा सकता है।
    • search engine से अंतर बताते हुए कहा गया कि search engine मूल सामग्री का विकल्प नहीं बनते, बल्कि संदर्भ देते हैं, जबकि summary products का उपयोग NYT subscription की जगह किया जा सकता है।
  • NYT के copyright lawsuit पर संभावित दृष्टिकोण

    • यह तर्क दिया गया कि अगली पीढ़ी के LLM (large language model) केवल copyright-मुक्त 'synthetic' data पर train किए जाएंगे, इसलिए copyright infringement की समस्या नहीं होगी।
    • यह राय भी दी गई कि अमेरिका इस तरह की तकनीकी प्रगति को रोक नहीं पाएगा और दूसरे देश आगे निकल जाएंगे।
    • यह भी कहा गया कि AI models का जटिल विकास और data sources की अस्पष्टता के कारण copyright law के लिए इसके साथ कदम मिलाना कठिन होगा।
  • ChatGPT/Bing Copilot द्वारा NYT सामग्री की नकल पर मूल्यांकन

    • यह माना गया कि ChatGPT और Bing Copilot के NYT लेखों को लगभग ज्यों का त्यों कॉपी करने के मामले fair use के अंतर्गत नहीं आते।
    • lawsuit केवल सीधी copying तक सीमित नहीं है, बल्कि यह भी दावा करता है कि LLM training के लिए लेखों की बिना अनुमति की गई copying copyright infringement है।
    • यह राय दी गई कि कानूनी बहस का केंद्र इस बात पर होना चाहिए कि क्या model को 'transformative' माना जा सकता है।
  • lawmuit में उठाई गई 'fair use' संबंधी चिंताएँ

    • इस बात पर चिंता जताई गई कि कुछ गिनी-चुनी कंपनियाँ इंटरनेट के मूल्य पर एकाधिकार जमा सकती हैं।
    • यह इच्छा भी व्यक्त की गई कि अदालतें इस क्षेत्र के लिए नियम तय करें।
  • NYT copyright lawsuit दस्तावेज़ लिंक और उसका सार

    • एक ऐसे दस्तावेज़ का लिंक साझा किया गया जो स्पष्ट रूप से दिखाता है कि ChatGPT copyrighted सामग्री को verbatim उद्धृत करता है।
    • यह सवाल उठाया गया कि किसी copyrighted सामग्री को कितना transform करना होगा ताकि उस पर copyright लागू न रहे।
    • यह भी चर्चा हुई कि क्या OpenAI web interface के माध्यम से copyrighted सामग्री के leakage को रोक सकता है।
  • LLM को इंसानों जैसा मानने वाले developers की सोच की आलोचना

    • उन developers की सोच की आलोचना की गई जो मानते हैं कि LLM, इंसानों की तरह, NYT लेखों का उपयोग केवल educational material की तरह करते हैं।
    • यह इंगित किया गया कि LLM का जटिल होना इस तथ्य को नहीं बदलता कि copyrighted content source code में integrate हो गया है।
  • content companies की कमाई की अपेक्षाएँ

    • यह कहा गया कि NYT सहित content companies उम्मीद कर रही हैं कि LLM training में उनके content के उपयोग के बदले उन्हें fee मिले।
    • Reddit, Discord, Twitter आदि के बारे में कहा गया कि वे AI training के लिए content बेचने पर विचार कर रहे हैं या पहले से ऐसा कर रहे हैं।
  • LLM उपयोग पर NYT के कानूनी दावों का विश्लेषण

    • इस बात का विश्लेषण किया गया कि NYT यह दावा कर रहा है कि LLM training में उसका content जिस तरह उपयोग हो रहा है, वह copyright infringement है।
    • बड़े enterprises द्वारा LLM access बेचने की आलोचना की गई, और इसकी तुलना personal या academic research उपयोग के प्रति अपेक्षाकृत उदार रवैये से की गई।
  • भविष्य में LLM उपयोग को लेकर अनुमान

    • यह दावा किया गया कि भविष्य में जब LLM को physical world के साथ interact करने वाली मशीनों में integrate किया जाएगा, तब copyrighted सामग्री को पढ़ना ही अवैध माना जा सकता है।
    • यह दृष्टिकोण भी रखा गया कि robots को TV देखने, library की किताबें पढ़ने या internet search के माध्यम से copyrighted content याद रखने की अनुमति नहीं होगी।
  • यह राय कि LLM को 'transformative work' मानकर fair use के अंतर्गत आना चाहिए

    • एक व्यक्तिगत राय के रूप में कहा गया कि LLM को transformative work माना जाना चाहिए और इसलिए fair use के अंतर्गत आना चाहिए।
    • साथ ही यह जानने में रुचि जताई गई कि कानूनी व्यवस्था इस पर क्या फैसला देगी।