10 पॉइंट द्वारा GN⁺ 2024-10-28 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • Facebook के CEO Mark Zuckerberg दावा करते हैं कि Meta का large language model Llama 3 open source है, लेकिन वास्तव में यह open source नहीं है
  • Open Source Initiative (OSI) की open source definition के अनुसार Llama 3 का license कई मायनों में open source की शर्तों को पूरा नहीं करता
  • Meta इस तरह की चाल चलने वाली अकेली कंपनी नहीं है। इसे "openwashing" कहा जाता है
    • openwashing एक भ्रामक प्रथा है, जिसमें वास्तव में open न होने वाले product या service को "open" जैसा पेश किया जाता है
    • 2009 में internet policy researcher Michelle Thorne ने "greenwashing" से प्रेरित होकर यह शब्द गढ़ा
  • AI क्षेत्र में openwashing व्यापक है। Radboud University के शोधकर्ताओं द्वारा जांचे गए 45 models में Google, Meta, Microsoft जैसी बड़ी कंपनियों के models वास्तव में open source नहीं थे

कंपनियां openwashing क्यों करती हैं

  • पहले कंपनियां open source से कतराती थीं, लेकिन अब उसके प्रति धारणा सकारात्मक हो चुकी है
    • 2001 में Steve Ballmer ने कहा था कि "Linux एक cancer है", और दावा किया था कि open source software का उपयोग करने पर बाकी software भी open source बनाना पड़ेगा
  • कंपनियां open source की सकारात्मक छवि का लाभ उठाती हैं, जबकि वास्तव में उसके प्रति प्रतिबद्ध नहीं होतीं
    • इससे उनकी public image बेहतर होती है और वे transparency तथा openness को महत्व देने वाले consumers को आकर्षित कर पाती हैं
    • कुछ कंपनियां openwashing के जरिए "open" टैग का लाभ लेती हैं, जबकि अपने models और practices को scientific तथा regulatory scrutiny से बचाए रखती हैं
    • EU AI Act "open source" models को विशेष छूट देता है, इसलिए यह openwashing के लिए मजबूत प्रोत्साहन बनता है

open source AI के लिए स्पष्ट परिभाषा का अभाव

  • EU अब तक open source AI की स्पष्ट परिभाषा तय नहीं कर पाया है, और सच कहें तो अभी तक कोई भी ऐसा नहीं कर पाया है
    • OSI आने वाले कुछ दिनों में open source AI की परिभाषा जारी करने वाला है
    • मौजूदा openwashing licenses निर्माता पक्ष को छोड़कर लगभग हर परिभाषा से टकराते हैं
  • हालांकि, सभी बड़ी AI कंपनियां open source के बारे में झूठ नहीं बोल रही हैं
    • उदाहरण के लिए IBM का Granite 3.0 LLM वास्तव में Apache 2 license के तहत open source के रूप में उपलब्ध है
  • OSI कोई सरकार या regulator नहीं है, फिर भी open source शब्द का सही उपयोग क्यों जरूरी है?
    • OSI सिर्फ एक non-profit organization है, जिसने उपयोगी guidelines बनाई हैं
  • Chainguard के CEO Dan Lorenc ने हाल ही में Atlanta में आयोजित SOSS conference के keynote में कहा
    • कोई भी लोगों को OSI की definition अपनाने के लिए मजबूर नहीं कर सकता, लेकिन बहुत से लोग, खासकर वकील, इस definition पर भरोसा करते हैं
    • वे OSI के काम पर भरोसा करते हैं, और समझते हैं कि जब कंपनियां open source मानकों को पूरा करने वाले licenses का उपयोग करती हैं तो उन्हें कैसी सुरक्षा मिलती है
    • यही कारण है कि दुनिया भर की बड़ी कंपनियों के procurement contracts में यह definition दिखाई देती है

open source सिर्फ कानूनी या व्यावसायिक मुद्दा नहीं है

  • open source developers को काम करने की आजादी देता है
    • open source के बिना लोग यह जाने या उसकी चिंता किए बिना कि license की बारीकियां क्या हैं, code का स्वतंत्र रूप से उपयोग करने का लाभ खो देंगे
    • अगर हर code का license अलग से जांचना पड़े, तो developers को हर नई library इस्तेमाल करने से पहले legal review कराना पड़ेगा
    • अगर source code सार्वजनिक करने पर जिम्मेदारियां अस्पष्ट हों, तो कंपनियां internet पर कुछ भी publish करने से डरेंगी
  • Lorenc ने जोर देकर कहा कि यह केवल बड़ी कंपनियों की समस्या नहीं, बल्कि साझा समस्या है
    • open source का उपयोग करने वाला हर व्यक्ति इससे प्रभावित होगा
    • पूरे projects काम करना बंद कर सकते हैं, security bugs ठीक नहीं होंगे, और maintenance कहीं अधिक कठिन हो जाएगी
    • open source की definition को बचाने और उसकी रक्षा करने के लिए मिलकर कार्रवाई करनी होगी, नहीं तो वकील फिर से बीच में आ जाएंगे
  • कई intellectual property lawyers भी इस तरह का सिरदर्द नहीं चाहते
    • असली open source licenses कंपनियों, programmers और lawyers तीनों की जिंदगी आसान बनाते हैं
    • "उन लोगों को छोड़कर open जो हमसे compete कर सकते हैं" या "उन लोगों को छोड़कर open जो cloud में code deploy कर सकते हैं" जैसी शर्तें जोड़ना मुसीबत को न्योता देना है

openwashing सबको नुकसान पहुंचाती है

  • आखिरकार openwashing कानून, business और development से जुड़ा हर काम सबके लिए खराब कर देगी
  • विडंबना यह है कि इस समय इस तरह के approach का समर्थन करने वाली अल्पदर्शी कंपनियां भी नुकसान उठाएंगी
  • आखिरकार उनका लगभग सारा काम, खासकर AI में, open source पर ही आधारित है

GN⁺ की राय

  • open source की परिभाषा को कमजोर करने वाली openwashing प्रथाएं सिर्फ AI क्षेत्र ही नहीं, बल्कि पूरे software उद्योग पर नकारात्मक असर डाल सकती हैं। यह developers की गतिविधियों को सीमित करती हैं और कंपनियों के कानूनी जोखिम बढ़ाती हैं
  • कंपनियों का सिर्फ open source की सकारात्मक छवि का उपयोग करना अल्पदर्शी रवैया है। लंबे समय में यह खुद कंपनियों के लिए भी नुकसानदेह हो सकता है
  • AI तकनीक के विकास के लिए open source भावना पर आधारित सहयोग और साझा करना अनिवार्य है। कंपनियों को वास्तविक open source संस्कृति बनाने में अग्रणी भूमिका निभानी चाहिए
  • open source AI के लिए स्पष्ट परिभाषा और मानक तय करना बेहद जरूरी है। OSI की open source AI definition जल्द आने वाली है, और उसके आधार पर कंपनियों, सरकारों और developer community को मिलकर आगे बढ़ना चाहिए
  • openwashing को रोकने के लिए consumers और developers के बीच जागरूकता बढ़ाने की भी जरूरत है। कंपनियों के "open" दावों को ज्यों का त्यों स्वीकार करने के बजाय, वास्तविक licenses और practices को ध्यान से जांचने की आदत जरूरी है

2 टिप्पणियां

 
ndrgrd 2024-10-28

प्रोजेक्ट को open source के तौर पर जारी करके शुरुआती bug fixes और feature improvements कम्युनिटी पर छोड़ देना, और फिर जब वह स्थिर हो जाए तो उसे दोबारा exclusive license के तहत खींच लेना — ऐसा ट्रेंड अक्सर दिख रहा है.

कुछ लोग कहते हैं कि fork कर लो, लेकिन आखिर में पहले से बनी हुई image और name value तो कंपनी ही हड़प लेती है.

 
GN⁺ 2024-10-28
Hacker News राय
  • जब दो प्रोग्राम या AI मॉडल में से एक चुनना होता है, तो open source को पसंद करने वालों और न करने वालों के बीच बहस होती है। लक्ष्य यह है कि non-open-source प्रोग्राम भी open source जैसे दिखें.

  • open source कंपनियों के अनुकूल एक समझौता था, लेकिन कुछ प्रतिभागियों के पास उच्च नैतिक मानदंड थे। ऐसे नैतिकता वाले लोगों को open source के दुरुपयोग को रोकना चाहिए.

  • अगर इसे trademark, certification, license आदि के ज़रिए हल नहीं किया जा सकता, तो संदेश को mainstream media के माध्यम से पहुँचाना चाहिए। <i>The Register</i> के पास आंतरिक जानकारी है, लेकिन यह आम जनता तक व्यापक रूप से पहुँचना चाहिए.

  • कई कंपनियाँ open source की आलोचना करती हैं, फिर भी Linux, Java, Debian जैसे open source software पर निर्भर होकर अपना व्यवसाय चलाती हैं। ज़्यादातर कंपनियाँ योगदान या समर्थन देने की कोई ज़िम्मेदारी महसूस नहीं करतीं.

  • OSI एक विवादास्पद open source AI definition तैयार कर रहा है.

  • thirdweb तकनीकी रूप से open source है, लेकिन API key के बिना काम नहीं करता, और SAAS में API call limit की जाँच करता है। यह सचमुच open source विकल्प बनाने की कोशिश कर रही टीमों को हतोत्साहित करता है.

  • fair source जैसी अवधारणाओं को लोकप्रिय न बना पाने के परिणामस्वरूप, छोटी non-SAAS कंपनियाँ open source के साथ टिक नहीं सकतीं.

  • open source में free software वाली नैतिकता या दर्शन नहीं है। free software, open source से श्रेष्ठ है.

  • बड़े मॉडलों के मामले में training cost अधिक होती है, binary artifact क़ीमती होते हैं और उनमें बदलाव किया जा सकता है। अगर OSI कोई definition स्थापित करता है, तो चाहे Meta उसका पालन करे या नहीं, उनके प्रयास की सराहना की जानी चाहिए.

  • OSI को यह पहचानना चाहिए कि बड़े cloud providers के युग में उसे market participants से सुरक्षा की आवश्यकता है। Mongo, Elastic, Redis जैसे विवादों से बचने के लिए स्पष्ट license विकल्पों की ज़रूरत है.

  • "Open <something>" जैसे शब्दों को इस तरह संरक्षित किया जाना चाहिए कि वे जनता को गुमराह न करें। "OpenAI" जैसी उलझन को रोका जाना चाहिए.

  • "Open Source" शब्द का गलत उपयोग करने से भी बदतर वह स्थिति है जब community का योगदान स्वीकार करने के बाद license वापस ले लिया जाए। इसे धोखाधड़ी माना जाना चाहिए और इसके लिए civil liability होनी चाहिए.

  • AI मॉडल के लिए अगर reproducible training script और data साझा नहीं किए जाते, तो "Open Weights" नाम अधिक उपयुक्त है.