2 पॉइंट द्वारा GN⁺ 2023-12-31 | 1 टिप्पणियां | WhatsApp पर शेयर करें

रचनात्मक AI के लिए दृष्टिकोण निराशाजनक

  • रचनात्मक AI सिस्टम कॉपीराइट वाले सामग्री पर ट्रेन होते हैं और कॉपीराइट का उल्लंघन कर सकने वाली सामग्री उत्पन्न कर सकते हैं.
  • OpenAI इस बारे में पारदर्शी नहीं है कि उसके सिस्टम ने किन सामग्रियों पर प्रशिक्षण लिया है.
  • उपयोगकर्ता जनरेट की गई इमेज के स्रोत की जानकारी के बिना कॉपीराइट का उल्लंघन कर सकते हैं.

सिस्टम की सीमाएँ

  • DALL-E और ChatGPT जैसे सिस्टम मूलतः 'ब्लैक बॉक्स' हैं, इसलिए अभी के लिए उनमें स्रोत को ट्रैक करने या उपलब्ध कराने की क्षमता की कमी है.
  • जब तक स्रोत-ट्रैकिंग सक्षम करने वाली नई आर्किटेक्चर विकसित नहीं होती, तब तक उपयोगकर्ता की मंशा चाहे जो भी हो, कॉपीराइट उल्लंघन जारी रहेगा.

कानूनी और वित्तीय जोखिम

  • New York Times का मुकदमा रचनात्मक AI के खिलाफ कई मुकदमों में केवल पहला है, और इसके सुलझने पर भी इसकी लागत लाखों डॉलर से अधिक होने की उम्मीद है.
  • केवल OpenAI ही नहीं, बल्कि Bing के जरिए DALL-E का उपयोग करने वाली Microsoft भी कानूनी जोखिम का सामना कर रही है.

GN⁺ की राय

  • रचनात्मक AI तकनीक की प्रगति कॉपीराइट उल्लंघन के जोखिम को बढ़ा रही है, और यह तकनीक तथा कानूनी ढांचे के बीच तनाव पैदा करने वाला एक महत्वपूर्ण मुद्दा है.
  • उपयोगकर्ता यह नहीं जान पाते कि जनरेटेड कंटेंट का स्रोत क्या है, और यही AI ethics तथा transparency पर चर्चा को प्रेरित करने वाला एक प्रमुख तत्व है.
  • यह लेख AI तकनीक के तेज़ विकास से पैदा हो सकने वाले अप्रत्याशित दुष्प्रभावों और संबंधित उद्योगों पर उनके प्रभाव के बारे में रोचक अंतर्दृष्टि प्रदान करता है.

1 टिप्पणियां

 
GN⁺ 2023-12-31
Hacker News टिप्पणियाँ
  • पहली टिप्पणी का सार:

    • Disney के सफल होने के कारणों में से एक यह था कि उसने पीढ़ियों से चली आ रही लोककथाओं जैसी पहले से मौजूद कहानियों को अपनाकर रूपांतरित किया।
    • संस्कृति समुदाय की संपत्ति है, और साझा storytelling तथा पुनर्व्याख्या के माध्यम से विकसित होती है और बढ़ती है।
    • AI और copyright infringement पर मौजूदा बहस इस सांस्कृतिक विकास के इसी बुनियादी पहलू को नज़रअंदाज़ करने की प्रवृत्ति रखती है।
    • रचनात्मक समाज की प्रकृति को समझने में कानूनी निहितार्थों और सांस्कृतिक storytelling के ऐतिहासिक संदर्भ को नज़रअंदाज़ नहीं करना चाहिए।
  • दूसरी टिप्पणी का सार:

    • यूरोपीय संघ (EU) में "Digital Single Market Copyright Directive" की धारा 3 और 4 इस मुद्दे को पहले से ही विनियमित करती हैं।
    • commercial machine learning (ML) developers सहित सभी लोग केवल उन्हीं कानूनी रूप से सुलभ कृतियों का उपयोग कर सकते हैं, जिनके copyright holders ने text और data mining उद्देश्यों के लिए उपयोग को स्पष्ट रूप से आरक्षित नहीं किया है।
    • training के लिए नहीं होने वाली सामग्री को चिह्नित करने के लिए "robots.txt" जैसी किसी व्यवस्था पर चर्चा हो रही है, और अंतिम उपयोगकर्ताओं को generated content के उपयोग में सावधानी रखनी चाहिए।
  • तीसरी टिप्पणी का सार:

    • यह पहले से ज्ञात है कि copyrighted material पर प्रशिक्षित AI उससे मिलते-जुलते output बना सकता है।
    • बड़ी कंपनियाँ पहले ही इस तरीके को अपना चुकी हैं, और अब स्थिति ऐसी है कि इसे वापस पलटना संभव नहीं लगता।
    • क्योंकि आम जनता AI के निर्माण के तरीके या copyright के बारे में ज़्यादा नहीं जानती, इसलिए अब महत्वपूर्ण सवाल है: 'अब क्या किया जाए?'
  • चौथी टिप्पणी का सार:

    • copyright का उल्लंघन न हो, यह सुनिश्चित करने की ज़िम्मेदारी उस व्यक्ति की है जो कृति प्रकाशित करता है।
    • यह मान लेना कि ChatGPT या कोई अन्य tool copyrighted content generate नहीं करेगा, भोली सोच है।
  • पाँचवीं टिप्पणी का सार:

    • कला और प्रकाशन का मूल उद्देश्य संस्कृति और समाज को प्रभावित करना होना चाहिए, सिर्फ पैसा कमाना नहीं।
    • रचनात्मक कृतियों को संरक्षण की आवश्यकता है, लेकिन उनका public domain में जाना कहीं अधिक जल्दी होना चाहिए ताकि रचनात्मकता और प्रेरणा को बढ़ावा मिले।
  • छठी टिप्पणी का सार:

    • समस्या का समाधान उतना कठिन नहीं लगता।
    • "video game plumber" जैसी अभिव्यक्ति किसी विशेष entity के लिए shorthand है, और अधिकांश लोग इसे "Mario" के समान मानते हैं।
    • AI tools का उपयोग करके Mario जैसी छवि का वर्णन करना, और "video game plumber" माँगने पर मिलने वाले परिणामों से ऐसे output को हटाना बहुत कठिन नहीं है।
  • सातवीं टिप्पणी का सार:

    • generative AI के लिए कानूनी precedent वही है जो Google द्वारा websites को scrape करके search के लिए index करने में स्थापित हुआ।
    • कोई यह नहीं कहता कि Google द्वारा websites की मूल सामग्री को जस का तस दिखाना copyright infringement है।
    • अगर generative AI को सांस्कृतिक references और लोकप्रिय intellectual property (IP) दोनों को पूरी तरह हटाना पड़े, तो वह बेकार हो जाएगा।
  • आठवीं टिप्पणी का सार:

    • इसमें उस copyright infringement प्रश्न पर विचार किया गया है, जहाँ session musicians को किसी प्रसिद्ध गीत के हिस्से बजाने के लिए रखा जाता है और फिर उसे sample के रूप में उपयोग किया जाता है।
    • इससे यह सवाल उठता है कि copyright infringement की ज़िम्मेदारी आखिर किसकी होनी चाहिए।
  • नौवीं टिप्पणी का सार:

    • इसमें एक संबंधित ongoing thread का उल्लेख है, जिसमें The New York Times अपने data पर प्रशिक्षित सभी large language models (LLMs) को नष्ट करने की माँग कर रहा है।
  • दसवीं टिप्पणी का सार:

    • Llama2 मॉडल text को कितना अच्छी तरह compress करता है, इस पर किए गए एक प्रयोग से पता चला कि उस मॉडल में Harry Potter पुस्तक के पहले अध्याय का बड़ा हिस्सा शामिल है।