New York Times ने कॉपीराइट उल्लंघन के आरोप में OpenAI और Microsoft पर मुकदमा दायर किया

(theverge.com)

3 पॉइंट द्वारा GN⁺ 2023-12-28 | 2 टिप्पणियां | WhatsApp पर शेयर करें

New York Times ने OpenAI और Microsoft पर कॉपीराइट उल्लंघन के आरोप में मुकदमा दायर किया
दावा है कि इन कंपनियों ने ChatGPT और Copilot को चलाने वाले language models को train करने के लिए New York Times के लाखों लेखों की कॉपी की
इससे New York Times के अपने पाठकों के साथ संबंध को नुकसान पहुंचा और subscription, licensing, advertising तथा affiliate revenue में कमी आई

मुकदमे में किए गए दावे

मुकदमे के अनुसार, ये AI models New York Times की content को ज्यों का त्यों उद्धृत करते हैं, उसका सारांश बनाते हैं, और उसकी अभिव्यक्ति शैली की नकल करते हैं, जिससे उच्च-गुणवत्ता वाली पत्रकारिता को खतरा है
New York Times का कहना है कि उसने कई महीनों तक बातचीत की कोशिश की, लेकिन कोई समाधान नहीं निकल सका
OpenAI के प्रवक्ता ने कहा कि वे इस दिशा में काम कर रहे हैं कि content creators को AI technology और नए revenue models से लाभ मिल सके

GN⁺ की राय

यह मामला AI technology की प्रगति और कॉपीराइट मुद्दों के टकराव वाले एक आधुनिक प्रश्न को दिखाता है.
कॉपीराइट उल्लंघन से जुड़ा यह मुकदमा इस पर महत्वपूर्ण कानूनी और नैतिक बहस को जन्म दे सकता है कि AI को मानव-निर्मित रचनाओं का उपयोग कैसे करना चाहिए.
New York Times जैसे बड़े news organizations का AI कंपनियों के खिलाफ खड़ा होना, AI technology के भविष्य और content creators के अधिकारों की सुरक्षा के लिए एक महत्वपूर्ण turning point बन सकता है.

2 टिप्पणियां

xguru 2023-12-29

दूसरे लेख के अनुसार, मुकदमे में न्यूयॉर्क टाइम्स की सामग्री का उपयोग करके प्रशिक्षित सभी GPT इंस्टेंस को हटाने और प्रशिक्षण में इस्तेमाल किए गए dataset को नष्ट करने की मांग की गई है। साथ ही, भविष्य में इसी तरह की कार्रवाइयों को रोकने के लिए एक स्थायी निषेधाज्ञा की भी मांग की गई है.
इसके अलावा, इसमें भारी लागत की मांग वाला हिस्सा भी शामिल है. "वैधानिक हर्जाना, प्रतिपूरक हर्जाना, disgorgement, punitive damages, और कानून या equity के तहत अनुमत अन्य सभी उपाय"

GN⁺ 2023-12-28

Hacker News की राय

New York Times (NYT) का समर्थन करने वाला दृष्टिकोण
- ऐसा लगता है कि रचनात्मक संगठन एक बार फिर प्रतिस्पर्धा में पीछे छूट रहे हैं, जैसा आधुनिक search engine के जन्म के समय हुआ था.
- OpenAI ने शुरुआत में license agreement के बिना model को train करने का जो फैसला किया, उसके लिए उसकी निंदा नहीं करता/करती. अगर ऐसा नहीं किया गया होता, तो शायद AI क्रांति हुई ही नहीं होती.
- लेकिन अब OpenAI को यह स्वीकार करना चाहिए कि वह content creators की ऋणी है और इसकी भरपाई करनी चाहिए. नहीं तो उसे और बड़ा नुकसान हो सकता है और प्रतिस्पर्धियों को मौका मिल सकता है.
copyright content को उपभोग कर उसे नए रूप में फिर से बनाने वाले LLM के बारे में मिश्रित भावनाएँ
- एक software developer और लेखक के रूप में, LLM की प्रगति दिलचस्प है, लेकिन इस बात की चिंता है कि मेरी रचनाओं का उपयोग LLM द्वारा किया गया.
- फिलहाल LLM उन निम्न-स्तरीय websites जैसे हैं जो मूल research के बिना content को फिर से लिखती हैं. यह तकनीकी रूप से कानूनी हो सकता है, लेकिन मूल्य नहीं जोड़ने वाला परजीवी व्यवहार है.
- विशेषज्ञों के लिए LLM की गलतियाँ और citation की कमी समस्या हैं, और आम लोग SEO के लिए कम-मेहनत वाला content बनाने में LLM का उपयोग करेंगे, जिससे LLM की गुणवत्ता गिर सकती है.
AI training के लिए fair use के विस्तार की आशा
- AI training के लिए fair use किसी एक media outlet से अधिक, मानवता के भविष्य के लिए महत्वपूर्ण है.
- भले ही NYT गायब हो जाए, उसकी जगह लेने वाले कई media मौजूद हैं, लेकिन अगर AI शुरुआती intellectual property (IP) विवादों के कारण क्षतिग्रस्त हो गया, तो यह महत्वपूर्ण प्रगति को रोक सकता है.
New York Times की शैली की नकल को लेकर कमजोर दावा और OpenAI के लिए नकारात्मक दृष्टिकोण
- New York Times के content को ज्यों का त्यों आउटपुट करना OpenAI के लिए प्रतिकूल है.
- LLM से किसी खास content को हटाना कठिन है, और यह संकेत देता है कि LLM की उम्र छोटी हो सकती है.
LLM पर copyright infringement के आधार पर रोक लगाना विज्ञान और उपयोगी कलाओं की प्रगति को बढ़ावा नहीं देता
- LLM को regulation की ज़रूरत है, लेकिन copyright नहीं बल्कि किसी और प्रकार के regulation की.
- OpenAI की शुरुआती open concept अच्छी थी, लेकिन अब public intervention की ज़रूरत है.
एक कंपनी द्वारा समूची मानव-उत्पादित सामग्री पर एकाधिकार करने की आलोचना
- ऐसा व्यवहार कम-से-कम बेशर्मी भरा और गलत है, और संभवतः अपमानजनक भी.
- OpenAI के इतने अधिक पीड़ित हैं कि मुकदमे अव्यावहारिक हो जाते हैं, इसलिए अदालतें पहले से ही यह तय कर सकती हैं कि पीड़ितों को मुआवज़ा न दिया जाए.
इंटरनेट पर सार्वजनिक रूप से उपलब्ध content तक मुक्त पहुँच और मशीनों द्वारा data उपयोग की वैधता
- जिस content तक इंसान पहुँच सकते हैं, उसी तक मशीनों को भी पहुँच होनी चाहिए.
- मशीनें इंसानों की जगह वे काम कर सकती हैं, ताकि इंसान अधिक दिलचस्प कामों पर समय दे सकें.
LLM के परजीवी व्यवहार और patent troll से उसकी तुलना
- LLM प्रशिक्षण के लिए उन text corpora के भाषा पैटर्न का उपयोग करते हैं, जिन्हें रचनाकार स्वयं उस तरह इस्तेमाल नहीं कर रहे थे.
- इससे समाज को लाभ नहीं होता और सिर्फ trolls को फायदा मिलता है. अदालतों के पास इसे लागू कराने का कोई कारण नहीं है.
New York Times द्वारा OpenAI और Microsoft पर दायर मुकदमे का उल्लेख
- New York Times का दावा है कि उनकी लाखों articles की नकल कर उनका उपयोग AI model बनाने में किया गया.