1 पॉइंट द्वारा GN⁺ 2023-09-08 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • अगर कोई commercial ग्राहक Copilot या उसके आउटपुट के उपयोग के कारण कॉपीराइट उल्लंघन के मुकदमे का सामना करता है, तो Microsoft उसकी ओर से बचाव करेगा और प्रतिकूल फ़ैसले या सेटलमेंट की राशि वहन करेगा
  • यह वादा मौजूदा intellectual property indemnification support को commercial Copilot services तक बढ़ाता है, और इसमें Microsoft 365 Copilot, GitHub Copilot, और Bing Chat Enterprise शामिल हैं
  • ग्राहकों को प्रोडक्ट में मौजूद content filters और guardrails का उपयोग करना होगा, और ऐसे इनपुट से उल्लंघनकारी सामग्री बनाने की कोशिश नहीं करनी होगी जिनके अधिकार उनके पास नहीं हैं
  • 5 जनवरी 2024 के अपडेट के अनुसार, इस वादे का नाम Customer Copyright Commitment कर दिया गया और इसे Azure OpenAI Service के commercial ग्राहकों तक भी बढ़ाया गया
  • Microsoft Copilot आउटपुट पर intellectual property rights का दावा नहीं करता, और उसका मानना है कि generative AI से जुड़े कॉपीराइट, creators के compensation, और competition के सवालों को साथ में संबोधित किया जाना चाहिए

Copilot कॉपीराइट जिम्मेदारी का वादा

  • Microsoft ने उन ग्राहक चिंताओं के जवाब में Copilot Copyright Commitment पेश किया कि generative AI आउटपुट का उपयोग copyright infringement claims तक पहुंच सकता है
  • अगर कोई commercial ग्राहक Microsoft Copilot services या उनके आउटपुट के कारण किसी third party से कॉपीराइट उल्लंघन का मुकदमा झेलता है, तो Microsoft उसकी ओर से बचाव करेगा और प्रतिकूल फ़ैसले या सेटलमेंट की राशि चुकाएगा
  • इसके दायरे में आने के लिए ग्राहकों को Microsoft प्रोडक्ट्स में मौजूद guardrails और content filters का उपयोग करना होगा
  • Microsoft का रुख है कि जब वह commercial ग्राहकों से Copilot के लिए शुल्क लेता है, तो उपयोग के दौरान उत्पन्न कानूनी जोखिम भी ग्राहक नहीं बल्कि Microsoft को उठाने चाहिए

लागू दायरा और ग्राहक शर्तें

  • Copilot Copyright Commitment, Microsoft की मौजूदा IP indemnification गारंटी को AI-आधारित Copilot उपयोग और उसके आउटपुट से जुड़े कॉपीराइट दावों तक बढ़ाता है
  • इसका दायरा paid Microsoft commercial Copilot services और Bing Chat Enterprise तक है
    • Microsoft 365 Copilot: Word, Excel, PowerPoint आदि में generative AI देता है, और उपयोगकर्ताओं को अपने डेटा के आधार पर reasoning करने या दस्तावेज़ों को presentation में बदलने देता है
    • GitHub Copilot: डेवलपर्स को दोहराव वाले coding समय को कम करने और नए व transformative परिणामों पर अधिक समय देने में मदद करता है
  • ग्राहकों को प्रोडक्ट में मौजूद content filters और अन्य safety systems का उपयोग करना होगा
  • वे उल्लंघनकारी सामग्री बनाने की कोशिश नहीं कर सकते, और Copilot services को ऐसा इनपुट नहीं दे सकते जिनके उपयोग के उचित अधिकार उनके पास न हों
  • यह लाभ Microsoft के उस मौजूदा रुख को नहीं बदलता कि वह Copilot service आउटपुट पर intellectual property rights का दावा नहीं करता

कॉपीराइट चिंताएँ और नीतिगत संतुलन

  • Generative AI ग्राहकों की efficiency और creativity बढ़ाता है, लेकिन यह सवाल भी पैदा करता है कि उसके आउटपुट का उपयोग IP infringement claims तक पहुंच सकता है या नहीं
  • लेखक और कलाकार सार्वजनिक रूप से यह सवाल उठाते रहे हैं कि उनकी कृतियों का AI models और services में कैसे उपयोग हो रहा है, और Microsoft मानता है कि ऐसी ग्राहक चिंताएँ समझ में आने वाली हैं
  • भले ही मौजूदा copyright law के कुछ क्षेत्र स्पष्ट हों, generative AI नए public policy सवाल पैदा करता है
  • Microsoft तीन लक्ष्यों को साथ लेकर चलने की बात करता है
    • AI को ज्ञान के प्रसार और सामाजिक चुनौतियों के समाधान में योगदान देना चाहिए
    • creators को copyright law के तहत अपने अधिकारों पर नियंत्रण और अपनी रचनाओं से स्वस्थ आय मिलनी चाहिए
    • AI model training और grounding के लिए आवश्यक content कुछ गिनी-चुनी कंपनियों के भीतर बंद नहीं हो जाना चाहिए, जिससे competition और innovation रुक जाए

Copilot में मौजूद सुरक्षा उपाय

  • Microsoft ने Copilot द्वारा उल्लंघनकारी content लौटाने की संभावना कम करने के लिए filters और अन्य तकनीकों को एकीकृत किया है
  • ये सुरक्षा उपाय digital safety, security, और privacy के लिए उसके मौजूदा काम के साथ जुड़े हुए हैं
  • इस्तेमाल होने वाले guardrails में classifiers, meta-prompts, content filtering, operational monitoring, और abuse detection शामिल हैं
  • Abuse detection में ऐसा उपयोग भी शामिल है जो third-party content का उल्लंघन कर सकता है
  • Copilot Copyright Commitment ग्राहकों से इन तकनीकों के उपयोग की मांग करके कॉपीराइट चिंताओं के प्रति बेहतर सम्मान का प्रोत्साहन देता है

Azure OpenAI Service तक विस्तार

  • 5 जनवरी 2024 के अपडेट के अनुसार, Microsoft ने 15 नवंबर 2023 को Copilot Copyright Commitment को बढ़ाकर Customer Copyright Commitment कर दिया
  • इस विस्तार में Azure OpenAI Service का उपयोग करने वाले commercial ग्राहक शामिल हैं
  • अगर Azure OpenAI Service आउटपुट के उपयोग के कारण कॉपीराइट उल्लंघन का मुकदमा होता है, तो Microsoft ग्राहक की ओर से बचाव करेगा और प्रतिकूल फ़ैसले की राशि चुकाएगा
  • यह विस्तार Microsoft Copilot और Azure OpenAI Service आउटपुट के उपयोग से उत्पन्न संभावित IP infringement liability को लेकर ग्राहक चिंताओं को और संबोधित करने के लिए किया गया कदम है
  • Customer Copyright Commitment का लाभ पाने के लिए ग्राहकों को Microsoft द्वारा दिए गए आवश्यक guardrails और mitigations लागू करने होंगे
  • Microsoft, Azure OpenAI Service के लिए responsible AI उपयोग और copyright content infringement risk को कम करने वाले दस्तावेज़ और tools उपलब्ध कराता है

AI का विस्तार और रचनाओं की सुरक्षा

  • Microsoft इस कदम को पहला चरण मानता है, और उसका कहना है कि AI से जुड़े कानूनी सवालों को उद्योग को कई stakeholders के साथ मिलकर सुलझाना होगा
  • ग्राहकों के लिए यह इस वादे की तरह काम करता है कि प्रोडक्ट की कॉपीराइट जिम्मेदारी Microsoft उठाएगा
  • Microsoft AI के फ़ायदों को सकारात्मक रूप से देखता है, लेकिन रचनाओं की सुरक्षा सहित चुनौतियों और जोखिमों को भी पहचानता है
  • उसका मानना है कि risk management के लिए tech industry, लेखक और कलाकार तथा उनके प्रतिनिधि, government officials, academia, और civil society के साथ सहयोग ज़रूरी है
  • आगे चलकर वह ऐसी नई initiatives की दिशा में बढ़ना चाहता है जो AI के ज़रिए ज्ञान के प्रसार को आगे बढ़ाते हुए creators के अधिकारों और ज़रूरतों की रक्षा करें

1 टिप्पणियां

 
GN⁺ 2023-09-08
Hacker News की राय
  • Microsoft को पहले Azure, Windows, Office के आंतरिक codebase पर trained Copilot model सार्वजनिक करना चाहिए
    तभी यह माना जा सकेगा कि Microsoft सच में Copilot को copyright infringement नहीं करने वाली technology मानता है

    • Microsoft के लिए ऐसा करना शायद ज़्यादा पैसा कमाने वाला कदम होगा
      आंतरिक engineers के लिए Copilot पहले से ही data structures, code style आदि से परिचित होगा, जिससे productivity बढ़ेगी और accuracy भी काफी बेहतर होगी
      साथ ही दुनिया भर का third-party code धीरे-धीरे Microsoft style के करीब आएगा, जिससे hiring और training भी आसान हो सकती है
      बाहरी लोगों को Microsoft source के बारे में छोटे-मोटे संकेत मिल सकते हैं—यह कमी ज़्यादा मायने नहीं रखती लगती, क्योंकि binaries को decompile करके पहले ही उससे कहीं अधिक जानकारी निकाली जा सकती है
    • Microsoft यह दावा नहीं कर रहा कि Copilot code को जस का तस output नहीं कर सकता
      बल्कि वह कह रहा है कि इन सभी शर्तों के साथ ही वह ज़िम्मेदारी लेगा: वास्तव में ऐसा output आया हो, user ने इसे रोकने वाले filters बंद न किए हों, जानबूझकर ऐसा output न कराया गया हो, और उस उपयोग को अवैध माना गया हो
      वह code जिसे malicious actors से private रखना ज़रूरी है, और वह code जो public तो है लेकिन usage restrictions के साथ है और जिसे पाने वाले को यह पता होना चाहिए—दोनों अलग चीज़ें हैं
      यह उस तरह के तर्क जैसा है: “अगर आपको लगता है कि license agreement कानूनी रूप से valid है, तो अपना user password public करके उस पर ऐसा license लगा दें कि कोई उसे इस्तेमाल न करे”
    • sensitive data leak और copyright infringement अलग-अलग हैं, लेकिन संबंधित चिंताएँ हैं
      भले ही infringement का जोखिम बिल्कुल न हो, Microsoft ऐसी disclosure नहीं चाह सकता
    • दुनिया को जिसकी सबसे आखिर में ज़रूरत है, वह Win32 API style में लिखा code है
    • यहां शायद Microsoft portfolio के भीतर भी अलग product GitHub Copilot की बात हो रही है
      GitHub Copilot GPT-3 based था, जिसे public code repositories पर fine-tune किया गया था, और यही हिस्सा विवाद का मुख्य मुद्दा था
      यह blog post व्यापक Microsoft Copilot ecosystem पर बात करता है
      अधिकांश tools backend में Azure OpenAI API services का उपयोग करते हैं और code generation के लिए खास तौर पर specialized नहीं हैं
  • Generative AI में आम तौर पर transformative प्रकृति होती है, इसलिए इसे fair use माना जाने की संभावना ज़्यादा है
    अगर सच में उकसाया जाए तो मौजूदा code या image जैसा result निकाला जा सकता है, लेकिन अदालतें कुल मिलाकर इसे ऐसा नया content बनाना मान सकती हैं जो पहले मौजूद नहीं था, और images के मामले में यह और भी अधिक हो सकता है
    Google Books ने किताबों को शाब्दिक रूप से copy करके online database में डाला था, फिर भी उसे fair use माना गया; इसलिए उससे कहीं ज़्यादा transformative Generative AI के fair use के दायरे में व्यापक रूप से आने की संभावना अधिक है
    Google Books भले ही non-commercial था, लेकिन अदालतें आम तौर पर मानती हैं कि जितनी अधिक transformability होगी, fair use के मानदंड उतने कम सख्ती से लागू किए जा सकते हैं
    https://ogc.harvard.edu/pages/copyright-and-fair-use

    • लोग अक्सर कहते हैं कि “Generative AI को कुल मिलाकर fair use माना जाने की संभावना ज़्यादा है”, लेकिन मुझे लगता है कि सच में ऐसा होने की संभावना 50% भी नहीं है
      Google Books fair use इसलिए था क्योंकि उसमें public interest था, उसने publishers या authors को नुकसान नहीं पहुँचाया, बल्कि लोगों को copyrighted works खोजने में मदद की
      इसके उलट Generative AI लोगों के works से सार निकालकर style आदि में मिलते-जुलते outputs बना सकता है, और मूल authors को पूरी तरह बाहर कर उनकी मेहनत का फल छीन सकता है
      खासकर यह पूरी तरह mechanical process है, और दूसरे authors से निकाले गए हिस्सों के अलावा इसमें मानव रचनात्मकता शामिल नहीं होती। साधारण prompt को creativity मानना मुश्किल है
      अंततः यह तर्क “copyrighted works इस्तेमाल कर रहे हैं, लेकिन बड़े पैमाने पर मिला दिया है इसलिए ठीक है” के करीब है
    • अगर आपने हालिया Warhol v. Goldsmith Supreme Court फैसला देखा है, तो पता होगा कि fair use में transformability के अर्थ को काफ़ी हद तक फिर से परिभाषित किया गया है
      यह Generative AI को fair use बताने वाले तर्क के लिए प्रतिकूल दिशा है
      खासकर क्योंकि transformability को market impact से जोड़ा गया, इसलिए ऐसे outputs बनाने वाले Generative AI को, जो input works से सीधे compete करते हैं, अदालतों के लिए transformative मानना कहीं ज़्यादा मुश्किल हो गया है
      image generation के मामले में यह और भी सच है, क्योंकि यह stock images से साफ़ तौर पर compete करता है
    • fair use इस तरह काम नहीं करता
      “Generative AI कुल मिलाकर fair use है” जैसी व्यापक guarantee नहीं हो सकती, और output transformative है या नहीं यह भी कई factors में से सिर्फ़ एक है
      audio sampling या remix के मामलों को देखकर यह समझा जा सकता है
    • Google Books उपयोग और प्रकृति के लिहाज़ से transformative हो सकता है, लेकिन Google Books के search results उठाकर अपनी किताब में paste कर देने से वह fair use नहीं बन जाता
      research paper में किताब का citation देने जैसी exceptions हो सकती हैं, लेकिन ऐसे खास मामलों को उठाकर internet discussions में सिर्फ़ नुक्ताचीनी की जा सकती है
      Copilot खुद एक ऐसा transformative work हो सकता है जिसका अस्तित्व वैध हो, लेकिन इससे यह निष्कर्ष नहीं निकलता कि developer जब उसके output को अपने काम में डालता है तो उस पर copyright infringement liability नहीं होगी
      यह वैसा ही है कि किसी और द्वारा बनाए गए हर result को copyright issues से मुक्त नहीं माना जा सकता। कोई व्यक्ति किसी दूसरे work को देख ले, तो हम उस व्यक्ति को ही infringing work नहीं कहते, लेकिन output अलग चीज़ है
    • आपत्तियाँ बहुत हैं, लेकिन EU इस दृष्टिकोण से काफ़ी सहमत लगता है: https://creativecommons.org/wp-content/uploads/2021/12/CC-St...
      https://www.notion.so/DSM-Directive-Implementation-Tracker-3...
      https://eur-lex.europa.eu/eli/dir/2019/790/oj
      TDM4 copyright exception अधिकारधारक के पास opt-out करने की व्यवस्था होने तक copyrighted works से बने datasets बनाने की अनुमति देता है
      dataset transparent होंगे, अधिकारधारक अपने rights लागू कर सकेंगे, और कुछ AI companies copyrighted material पर training कर सकेंगी, इसलिए यह सबसे अच्छा समझौता लगता है
      बेशक यह trained model के commercial rights नहीं देता, केवल scientific और academic research rights देता है। उदाहरण के लिए, Meta का किताबों पर trained LLaMA model को train और release करना, अगर वह commercial लाभ नहीं लेता और authors के पास opt-out mechanism है, तो ठीक है
      https://spawning.ai के Jordan के साथ इस पर चर्चा चल रही है कि क्या किताबों के लिए उपयुक्त opt-out system बनाया जा सकता है, और music के लिए भी इसी तरह का तरीका सोचा जा सकता है
      यह European law है, लेकिन EU की दूसरी अतिशय regulations के उलट यह बहुत reasonable compromise लगता है
      संशोधन: Jordan ने correction mail भेजा, जिसमें कहा कि यह समझ सही है कि opt-out right केवल commercial research पर लागू होता है। यानी Eleuther जैसी जगहों के लिए datasets बनाना शायद opt-out procedure की ज़रूरत के बिना हो सकता है, और OpenAI द्वारा GPT-5 में इस्तेमाल कर शुल्क लेने के मामले में इसकी ज़रूरत पड़ेगी
      तब यह कानून वास्तव में machine learning के commercial use पर लागू होता है, और LLaMA जैसे non-commercial use में opt-out right तक की ज़रूरत नहीं रहती
      researchers को legal shield देता है और commercial use के लिए dataset transparency मांगता है, इसलिए यह शानदार है
  • सोच रहा हूँ कि इस घोषणा के असली details मौजूद हैं या नहीं
    पता है कि यह एक blog post है, लेकिन page के सारे links सिर्फ दूसरी blog posts पर ही जाते हैं, इसलिए बहुत-से सवाल बाकी रह जाते हैं
    क्या यह blog post कानूनी रूप से लागू होने वाला contract है? क्या Microsoft Copilot के इस्तेमाल से पैदा होने वाले copyright infringement claims के लिए सभी users को खास तौर पर indemnify कर रहा है?
    blog post कहता है कि “इस program में महत्वपूर्ण conditions हैं” और कुछ conditions गिनाता है, लेकिन साफ़ नहीं है कि वे conditions पूरी हैं या post में न लिखी गई और भी conditions हैं
    उदाहरण के लिए, यह भी नहीं पता कि यह सिर्फ कुछ देशों पर लागू होता है या दुनिया भर की सभी legal systems पर
    क्या guarantee है कि Microsoft इस program को बंद नहीं करेगा? अगर courts बार-बार प्रतिकूल फैसले देते हैं, और Microsoft को एहसास होता है कि Copilot जब भी copyrighted code के बड़े chunks को license-launder करता है तब compensation देने की क्षमता नहीं है, तो क्या users के पास Microsoft से अपना वादा निभवाने का कोई तरीका है?

    • इसलिए अब तक यह वास्तविक legal protection नहीं, बल्कि PR के ज़्यादा करीब है
      वकील Brad Smith भी यह बात समझते होंगे
      वरना 2.5 trillion dollar की company Microsoft को unlimited liability guarantee के जोखिम में क्यों डालेंगे?
    • “क्या यह blog post कानूनी रूप से लागू होने वाला contract है?” के बारे में, हो सकता है
      promissory estoppel नाम की एक concept होती है
      https://www.nolo.com/dictionary/promissory-estoppel-term.htm...
    • वकील के तौर पर मैंने यह नई wording ढूँढी, लेकिन जिन legal documents को मैंने देखा उनमें से कोई भी इस बात को reflect करने के लिए update हुआ नहीं लगा
      Microsoft documents कई तरह के हैं, इसलिए थोड़ा confusion है, लेकिन Copilot से जुड़े documents अपेक्षाकृत साफ़ हैं और spring के बाद से indemnity clause नहीं बदला है
  • Microsoft की बहुत चालाक move
    मूल रूप से वे आने वाले lawsuits के लिए अपनी पीठ पर एक बड़ा target बना रहे हैं, और उनका आकलन है कि उनके पास इससे लड़ने के resources हैं। यह आकलन गलत भी नहीं है
    AI जिस दिशा में जा रहा है, उसे देखते हुए जल्द ही महत्वपूर्ण precedent बनेगा
    Microsoft के लिए इस market को जितनी जल्दी हो सके बढ़ाना और उसके center में रहना बहुत अहम है
    यह कदम छोटी organizations के generated code अपनाने में आने वाली मुख्य बाधा को कम करता है: “अगर यह product copyrighted code generate कर दे तो क्या मुझ पर lawsuit होगा?” वाली चिंता

    • सही। core point यही है
      Microsoft मानो चुनौती देते हुए कह रहा है कि “विशाल Microsoft legal machine लड़ेगी”
      बुनियादी तौर पर यह “case करना है तो कर लो, देखते हैं। नहीं तो घर जाओ” जैसा show of force है
    • Microsoft के पास पैसा भी है, इसलिए वह sue करने लायक party है
    • यह भी हो सकता है कि Microsoft इसे बस कम बुरा option मान रहा हो
      संभाले जा सकने वाले tax की तरह कुछ पैसा white-collar side को देकर, वे यह रोकना चाहते हों कि सरकार पर उन्हें बहुत ज़्यादा constrain करने का pressure बहुत जल्दी न बढ़े
    • मेरा अनुमान है कि वे cloud deployment का इस्तेमाल करके महत्वपूर्ण GPL हिस्सों को fork कर सकते हैं, और जरूरी security updates को सिर्फ अपने fork और implementation तक सीमित रख सकते हैं
      कुछ साल तक public को control करते हुए और press releases निकालते हुए समय खींचेंगे, और इस बीच अपनी position मजबूत कर लेंगे
  • इस पर बड़ा asterisk लगा है: “customers को infringing material generate करने की कोशिश नहीं करनी चाहिए”
    आखिरकार यह इस पर निर्भर करता है कि Microsoft infringing material generate करने की कोशिश का मतलब कैसे तय करता है
    उम्मीद तो यही होगी कि इसका मतलब सिर्फ ऐसे use को exclude करना है जहाँ user जानबूझकर infringement कर रहा हो, जैसे “Half-Life 2 का पूरा source code reproduce करो”, लेकिन असल में पता नहीं

    • सच कहूँ तो इस मामले में मैं Microsoft पर भरोसा करता हूँ
      मुझे भरोसा नहीं कि वे fair competition करेंगे, और employer के तौर पर भी उन पर भरोसा नहीं
      यह भी भरोसा नहीं कि वे national politics के आसपास corrupt काम नहीं करेंगे, और मैं किसी meaningful project में उन्हें partner भी नहीं बनाना चाहूँगा
      लेकिन Microsoft जिस एक चीज़ में वाकई अच्छा है, वह है भरोसेमंद और long-term sustainable business-to-business transactions
      business customer के तौर पर मैं भरोसा करता हूँ। अगर वे ऐसी loophole का दुरुपयोग करेंगे तो उनकी reputation ढह जाएगी
      Google Cloud Platform customers को अक्सर नुकसान पहुँचाता है, इसलिए मैं उसे use नहीं करता, लेकिन AWS और Azure ऐसा नहीं करते, इसलिए उन पर भरोसा करता हूँ
      infringement की cost चुकाना, उस trust को खोने की cost से काफी कम होने की संभावना है
    • अंत में “infringing material generate करने की कोशिश” का मतलब Microsoft नहीं, बल्कि उस promise को enforce करने वाली court कैसे देखती है, इस पर निर्भर करेगा
      हालांकि Microsoft के पास यह lobby करने की और भी बड़ी वजह होगी कि ऐसे tools के use में liability लगभग पैदा ही न हो, इस तरह law shape हो
    • वह सिर्फ legal wording है जिसका मतलब है “अगर copyright infringement हुआ तो सब तुम्हारी जिम्मेदारी”
      लेकिन यह सवाल फिर भी बचता है कि क्या Microsoft लोगों का code चुराकर resell कर रहा है
    • वह इतनी बड़ी loophole है कि उसमें से truck निकल जाए
    • मुझे यह कोई बहुत चौंकाने वाली या restrictive condition नहीं लगती
      अगर आप company documents पर सवालों के जवाब देने के लिए LLM इस्तेमाल करते हैं, तो अनजाने में pre-trained copyrighted material generate हो सकता है
  • बात इतनी simple नहीं हो सकती
    Microsoft liability ले भी ले, तो infringer पर अलग से lawsuit हो सकता है। उसके बाद Microsoft lawsuit की cost उठा सकता है
    लेकिन वह product users को categorically lawsuits से बचा नहीं सकता
    मुख्य wording यह है: “अगर कोई third party Microsoft Copilot या generated output के use की वजह से commercial customer पर copyright infringement का lawsuit करती है, तो customer ने product में built-in safeguards और content filters इस्तेमाल किए हों तो Microsoft defense करेगा और adverse judgment amount या settlement pay करेगा”
    यहाँ “defense करेगा” अहम है, और शायद इसका मतलब है कि user अपने lawyer के बजाय Microsoft के lawyers इस्तेमाल करेगा
    ये in-house हो सकते हैं, इसलिए hourly billing करने वाले external lawyers से सस्ते पड़ सकते हैं
    साथ ही product को कैसे use करना है इस पर conditions हैं, और निर्णायक रूप से user को यह document करना होगा कि उसने उसी तरीके से use किया
    दिलचस्प development है। enterprise customers शायद इस tool को use करते हुए गलती से copyright infringement करने के डर से सावधान थे, और इसी वजह से adoption धीमा हुआ होगा

    • lawsuits Microsoft जैसी companies भी लगभग हमेशा external law firms को सौंपती हैं
      खासकर ऐसे cases में जहाँ damages बड़े हो सकते हैं
      key point legal risk से पैदा होने वाली adoption resistance को कम करना है
  • यह केवल तभी लागू है जब सुरक्षा उपाय चालू रखे गए हों
    उन सुरक्षा उपायों में से एक यह है कि Copilot ऐसा code output न करे जो किसी भी GitHub repository में मौजूद हो
    सुरक्षा उपाय चालू करके Copilot को टेस्ट किया, और वह असल में सिर कटा हुआ हो जैसे उतना निष्क्रिय हो गया
    वैसे यह कोई नया बदलाव नहीं है। Copilot Product Specific Terms में पहले से ही “अगर मुकदमा हुआ तो Microsoft जिम्मेदारी लेगा” वाला प्रावधान था: https://github.com/customer-terms/github-copilot-product-spe...

  • दूसरे community में इस जवाब की वजह से काफी आलोचना हुई, लेकिन अगर कोई statistical model मूल रूप से next best token predictor के करीब एक mathematical model के रूप में पूरी तरह derivative चीजें बनाता है, तो क्या वह सच में “चोरी” है?
    next best token को समझना, या यहां तक कि GitHub पर सबसे ज्यादा बार आने वाले token को जानना “चोरी” है?
    यह तर्क भी दिया जा सकता है कि सभी मूल्यवान ideas पहले ही आ चुके हैं और लिखने लायक सभी text पहले ही लिखे जा चुके हैं, इसलिए सभी AI को अवैध कर देना चाहिए; लेकिन फिर हम कहां रह जाएंगे?
    उदाहरण के लिए, किसी string को uppercase से lowercase में बदलने वाला function धरती पर कहीं किसी और व्यक्ति द्वारा लिखे function जैसा होने की संभावना रखता है, और error handling code या div को center align करने की आधुनिक technique के साथ भी यही है

    • मैं copyright lawyer नहीं हूं, लेकिन AI को अलग रखकर भी देखें तो derivative works और fair use पहले से ही gray area हैं
      अदालत में इन पर हमेशा बहस होती रहती है
      अगर किसी model को “When Mr. Bilbo Baggins” input पर प्रतिक्रिया में Lord of the Rings trilogy पूरी output करने के लिए train करके public कर दिया गया हो, तो शायद उसने copyright का उल्लंघन किया होगा
      इसके उलट, अगर वह “पहाड़” और “dragon” पर सामान्य paragraph बनाता है और उसमें कोई meaningful direct quotation या expression नहीं है, तो अपने-आप में वह उल्लंघन न होने की संभावना ज्यादा है। ऐसे शब्द Tolkien की रचनाओं में आते हैं, लेकिन शब्द खुद copyright के दायरे में नहीं आते
      हालांकि अगर यह साबित हो जाए कि model को train करने के लिए Tolkien की रचनाओं को ऐसे तरीके से copy किया गया जो copyright license अनुमति नहीं देता, तो भले ही model output अब original की copy जैसा न दिखे, intermediate stage में copyright infringement हुआ हो सकता है
      मुझे नहीं लगता कि यहां कोई black-and-white जवाब है। किसी copyrighted work को छोटे-छोटे टुकड़ों में तोड़कर statistical रूप देने के बाद किस बिंदु से वह अब copyrighted work नहीं रह जाता? क्या किसी चीज को पहले copyright law का उल्लंघन करने वाले तरीके से copy किए बिना model train किया जा सकता है?
      यह अदालतों और legislative bodies में इंसानों द्वारा तय की जाने वाली एक नरम-सी मानवीय अवधारणा है, और mathematical details अंतिम परिणाम में बहुत बड़ा फर्क डालेंगी, ऐसा नहीं लगता
    • मैं lawyer नहीं हूं, लेकिन यह चोरी नहीं है
      हालांकि यहां मामला theft का नहीं, बल्कि copyright infringement का है, और दोनों अलग अवधारणाएं हैं
      इस सूक्ष्म लेकिन बुनियादी अंतर की वजह से प्रतिक्रिया कुछ ठंडी रही होगी
    • “सभी मूल्यवान ideas पहले ही आ चुके हैं, इसलिए सभी AI illegal होने चाहिए” वाले हिस्से पर, https://en.wikipedia.org/wiki/Copyright में यह लिखा है
      copyright का उद्देश्य creative work के रूप में व्यक्त idea की original expression की रक्षा करना है, idea खुद की नहीं
    • अंदरूनी काम करने का तरीका महत्वपूर्ण नहीं है
      encryption या compression algorithms के बारे में भी इसी तरह की दलील बनाई जा सकती है
  • सोचता हूं कि ऐसे public promise कितने binding होते हैं
    यह कुछ वैसा ही है जैसे Musk ने हाल ही में public तौर पर कहा था कि platform पर कही बातों की वजह से जिन लोगों को नौकरी या legal problem होगी, उनका खर्च वे उठाएंगे, लेकिन अब उस वादे को निभाने से इनकार कर रहे हैं

  • अगर codebase ने GPL का उल्लंघन किया है, तो remedy यह है कि विवादित source code सार्वजनिक किया जाए या distribution बंद की जाए
    जब Microsoft third-party code की बात करता है, तो मुझे नहीं लगता कि इन दोनों में से किसी की भी उसे खास चिंता होगी
    open source project में damages पर precedents कैसे हैं, मुझे नहीं पता, लेकिन शायद यह Microsoft के लिए बड़ी चिंता बनने लायक नहीं होगा
    दूसरे शब्दों में, Microsoft का downside lawyers को लगाना है, और upside code generation tool को बेहतर बनाना है
    मैं lawyer नहीं हूं