2 पॉइंट द्वारा GN⁺ 2024-01-08 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Phi-2 के Hugging Face repository के commit 7e10f3e में LICENSE, NOTICE.md, README.md ये 3 फ़ाइलें बदली गईं और लाइसेंस संकेत MIT में बदल गया
  • नया LICENSE अब पूरे MIT License टेक्स्ट से बदला गया है, जो उपयोग, कॉपी, संशोधन, वितरण, relicense और बिक्री की व्यापक अनुमति देता है
  • पहले के Microsoft Research License में मौजूद reverse engineering पर रोक, स्वतंत्र hosting पर पाबंदी, व्यक्तिगत जानकारी के प्रबंधन, arbitration, और damages liability limits जैसी कई शर्तें हटा दी गई हैं
  • README metadata अब license_name: microsoft-research-license की जगह license: mit का उपयोग करता है, जबकि पुराना LICENSE लिंक बना हुआ है
  • नया NOTICE.md, flash-attention को third-party component के रूप में बताता है, और BSD 3-Clause License के साथ LGPL लाइब्रेरी बदलावों की debugging के उद्देश्य से सीमित reverse engineering की अनुमति वाला वाक्य शामिल करता है

commit में बदली गई फ़ाइलें

  • Hugging Face के microsoft/phi-2 repository का commit “Upload 3 files” के रूप में दिखता है, और बदलाव LICENSE, NOTICE.md, README.md इन 3 फ़ाइलों में हैं
  • Browse files में उस commit state की फ़ाइल सूची देखी जा सकती है

LICENSE: Microsoft Research License से MIT License में बदलाव

  • LICENSE फ़ाइल से पुराना लाइसेंस टेक्स्ट हटाकर पूरा MIT License टेक्स्ट रखा गया है
  • नए LICENSE में PhyAGI. और Copyright (c) Microsoft Corporation. के बाद MIT License शामिल है
  • MIT License सॉफ़्टवेयर और उससे जुड़े documentation files पाने वाले किसी भी व्यक्ति को मुफ़्त में ये अधिकार देता है
    • उपयोग, कॉपी, संशोधन, merge
    • publish, distribute, relicense
    • सॉफ़्टवेयर की प्रतियां बेचना
    • सॉफ़्टवेयर पाने वाले अन्य लोगों को भी वही अधिकार देना
  • शर्त यह है कि copyright notice और permission notice को सॉफ़्टवेयर की सभी प्रतियों या उसके महत्वपूर्ण हिस्सों में शामिल किया जाए
  • warranty disclaimer AS IS रूप में शामिल है, और merchantability, किसी विशेष उद्देश्य के लिए उपयुक्तता, तथा non-infringement सहित किसी भी स्पष्ट या निहित warranty नहीं देता
  • copyright holder और अधिकारधारी सॉफ़्टवेयर के उपयोग या अन्य लेनदेन से उत्पन्न किसी भी claim, damage या liability के लिए ज़िम्मेदार नहीं हैं

हटाई गई पुरानी प्रतिबंध शर्तें

  • पुराने LICENSE से कई प्रतिबंध और कानूनी शर्तें हटा दी गईं
  • हटाई गई शर्तों में ये बातें शामिल थीं
    • सामग्री का reverse engineering, decompile, disassemble करना मना था
    • Microsoft या supplier के notices को हटाना, छोटा करना, ब्लॉक करना या बदलना मना था
    • कानून-विरुद्ध तरीके से या malware बनाने/फैलाने के उद्देश्य से उपयोग मना था
    • सामग्री को share, publish, distribute, rent करना, स्वतंत्र hosting solution देना, या third party को transfer करना मना था
  • व्यक्तिगत जानकारी से जुड़ी पाबंदियां भी हटा दी गईं
    • किसी व्यक्ति की पहचान करने योग्य data को स्वीकृत/सहमति वाले उद्देश्य के अलावा उपयोग नहीं करना था
    • इसका उपयोग व्यक्तियों से संपर्क करने के लिए नहीं करना था
    • research पूरा होते ही personal information और उसके backups/copies नष्ट करने थे
  • Microsoft को modifications देने पर Microsoft को व्यापक लाइसेंस देने वाली शर्त भी हटा दी गई
  • इसके अलावा publishing, feedback, export restrictions, support services, अमेरिका में arbitration और class action waiver, governing law, consumer rights, warranty disclaimer, और damages limitation से जुड़ी शर्तें भी हटा दी गईं

README metadata में बदलाव

  • README.md के front matter में लाइसेंस संकेत बदला गया
  • हटाए गए आइटम ये हैं
    • license:
    • license_name: microsoft-research-license
  • नया आइटम license: mit है
  • license_link: https://huggingface.co/microsoft/phi-2/resolve/main/LICENSE बना हुआ है
  • inference: false और language: - en आइटम दिखाए गए diff में बने हुए हैं

NOTICE.md और third-party component notice

  • नई NOTICE.md फ़ाइल “NOTICES AND INFORMATION” और “Do Not Translate or Localize” वाक्य से शुरू होती है
  • Microsoft बताता है कि यह सॉफ़्टवेयर third-party सामग्री शामिल करता है
  • Microsoft के कुछ open source code https://3rdpartysource.microsoft.com पर उपलब्ध हैं, या product name, open source component name, platform, और version number के साथ US $5.00 का cheque या money order भेजकर इन्हें माँगा जा सकता है
  • अन्य शर्तों की परवाह किए बिना, GNU Lesser General Public License के तहत लाइसेंस प्राप्त लाइब्रेरी बदलावों की debugging के लिए जितनी आवश्यकता हो, उतनी सीमा तक इस सॉफ़्टवेयर का reverse engineering किया जा सकता है
  • इसमें flash-attention component शामिल है
  • flash-attention notice में BSD 3-Clause License शामिल है
    • source redistribution में copyright notice, conditions list, और disclaimer बनाए रखना होगा
    • binary redistribution में documentation या अन्य सामग्री में वही notice, conditions, और disclaimer शामिल करने होंगे
    • बिना पूर्व लिखित अनुमति के copyright holder या contributors के नाम का उपयोग derived products के promotion में नहीं किया जा सकता
  • BSD 3-Clause notice यह भी कहता है कि संबंधित सॉफ़्टवेयर “AS IS” आधार पर दिया जाता है, और direct, indirect, incidental, special, exemplary, या consequential damages के लिए कोई ज़िम्मेदारी नहीं ली जाती

1 टिप्पणियां

 
GN⁺ 2024-01-08
Hacker News की रायें
  • ऐसे open models का आना वाकई उत्साहजनक है
    दिलचस्प बात यह है कि AI “ethicists” सुरक्षा के नाम पर machine learning models तक पहुंच को नियंत्रित करने वाले उच्च पुरोहित वर्ग जैसा व्यवहार करना चाहते हैं। लेकिन मुझे लगता है कि AI का सबसे बड़ा जोखिम उन लोगों में है जो models को नियंत्रित करते हैं और उनसे यह भी नियंत्रित व censor करते हैं कि लोग क्या लिख सकते हैं
    आम लोगों के हाथों में open source models ही AI के वास्तविक जोखिमों के खिलाफ सबसे अच्छा बचाव हैं, और इसे आगे बढ़ाने के लिए Facebook, Microsoft, Mistral को मेरी सराहना

    • AI “ethicists” को इस तरह देखना बहुत दुर्भावनापूर्ण व्याख्या है
      social media summaries के बजाय असली तर्क पढ़ना बेहतर होगा। वहां आपकी सोच से कहीं गहरी चर्चा है, और जिन जोखिमों की चिंता की जा रही है उन पर भी व्यापक रूप से बात होती है, साथ ही प्रस्तावित समाधान भी हैं। वे समाधान “सबसे अच्छा बचाव” वाले दावे की तुलना में असल में काम करने की ज्यादा संभावना रखते हैं
    • “सभी” AI ethicists को model access रोकने की कोशिश करने वाले पुरोहित वर्ग के रूप में दिखाना नुकसानदेह लगता है
      बहुत से लोग ऐसे भी हैं जो इन tools के लोकतंत्रीकरण और उनके सुरक्षित व नैतिक उपयोग, दोनों को महत्वपूर्ण मानते हैं
    • अब तो मुझे लगता है कि बिल्ली थैले से बाहर आ चुकी है
      खराब इरादों वाले लोग license की भाषा का पालन करेंगे, यह उम्मीद करना शुरुआत से ही नियंत्रण के साधन के रूप में कमजोर था। यह केवल उन नेक-नीयत लोगों की प्रगति और innovation रोकता है जो कानून मानने को तैयार हैं; रूस, उत्तर कोरिया, चीन जैसी जगहों के अलग इरादों वाले लोग, अपराधी संगठन और ठग ऐसी धारणाओं से बंधे नहीं हैं
      सही open source license के तहत काम करने वाली community बढ़ रही है, और दिलचस्प चीजें और तेजी से हो रही हैं। वैकल्पिक licenses कम प्रभावी हैं, उस community से रिश्ता काटते हैं, सहयोग को जटिल बनाते हैं, और कुल research में धीरे-धीरे अल्पमत बनते जा रहे हैं। इसलिए ऐसे licenses लगातार अर्थहीन होते जा रहे हैं
      इसे ठीक करने पर कानूनी दृष्टि से स्थिति सरल और standard हो जाती है, जिससे commercialization, collaboration और research आसान हो जाते हैं। Microsoft ने शायद वाजिब तौर पर माना है कि इसमें value है और वह reality के अनुसार खुद को adjust कर रहा है
    • कौन गारंटी दे सकता है कि इस पागलपन भरे AI investment का असली छिपा मकसद बड़े पैमाने का censorship infrastructure बनाना नहीं है
    • जहां भी value इकट्ठी होती है, वहां एक barnacle industry पैदा हो जाती है, जो अगर योगदान न देने वाले लोगों की फौज को tax न दो तो brake pedal पर पैर रख देती है
  • पहले यह non-commercial license था, इसलिए उत्साह थोड़ा कम हो गया था
    performance और size को देखते हुए, commercial-friendly license में बदलाव काफी बड़ी घटना है

  • इस model की अहम बात यह है कि इसकी reasoning ability मजबूत है
    हालांकि इसे जानबूझकर बड़े web-crawling dataset पर train नहीं किया गया, ताकि यह बम बनाने के तरीके वगैरह न सीखे या “बुरे काम” न करे
    इसलिए समान श्रेणी के, या उससे बड़े parameter models की तुलना में भी यह “सबसे समझदारी से सोचने वाला” model है, लेकिन दुनिया की जानकारी या trivia अपेक्षाकृत कम है
    आगे यह बदल सकता है, लेकिन फिलहाल स्थिति ऐसी ही लगती है

    • फिर भी RAG applications के लिए यह शानदार है
      क्योंकि मैं चाहता हूं कि जवाब web से सीखी बातों पर नहीं, बल्कि मेरे दिए हुए data पर आधारित हों
    • अगर large language models को दो गुणों में देखें—natural language इस्तेमाल करने की क्षमता और सवालों के जवाब देने का ज्ञान—तो small language models को natural language processing में बहुत सक्षम models माना जा सकता है
      कई कामों के लिए general knowledge की जरूरत नहीं होती, और खासकर RAG में यह फायदा बड़ा है
    • उम्मीद है model का focus data को अंदर embed करने पर नहीं होगा
      data को search के जरिए उपलब्ध कराना बेहतर है, और इससे “विश्वसनीय रूप से intelligent दिखने वाले लेकिन पूरी तरह गलत” जवाब कम होते हैं
      embedded data कम हो तो chat assistant के दायरे से बाहर भी इसे ज्यादा general-purpose तरीके से इस्तेमाल किया जा सकता है। अक्सर आप चाहते हैं कि model केवल वही data जाने जो user ने दिया है
      उदाहरण के लिए, medieval fantasy game में कोई किरदार अचानक American politics पर बात करने लगे तो यह बहुत अजीब होगा। Phi-2 भी fine-tuning के बिना इसे पूरी तरह हल नहीं करेगा, लेकिन मूल बात यही दिशा है
    • web-crawling data पर train न करना शायद Microsoft के लिए यह कम खुलकर दिखाने का तरीका है कि वह संपत्ति और निजी जानकारी चुराकर उसे monetize करता है
  • model से ज्यादा dataset को लेकर उत्सुकता है

    • शायद यह phi-1/1.5 की “Textbooks are all you Need” training method का विकसित रूप है: https://arxiv.org/abs/2309.05463
  • यह बेहतरीन बदलाव है, और यह भी दिखाता है कि स्वतंत्र open source projects क्यों महत्वपूर्ण हैं
    यह मानना मुश्किल है कि TinyLlama का Apache 2.0 license के तहत release होना इस बदलाव को प्रभावित नहीं कर गया

    • TinyLlama release का असर पड़ा, ऐसा मानने का आधार क्या है?
  • यह संकेत लगता है कि Phi-3 और अगली पीढ़ी के models Phi-2 को पुराना बना देंगे

  • यह model काफी समय से top पर था, इसमें ऐसा क्या अच्छा है?

    • इस model के size और inference cost के मुकाबले performance बेहतरीन है
      यह ऐसा सबसे अच्छा model है जो phone जैसे छोटे devices पर भी चल सकता है और GPT-3.5 के करीब performance देता है
      architecture और training data भी दिलचस्प हैं। यह curated synthetic data इस्तेमाल करने वाला sparse model है, इसलिए random internet text पर train किए गए models की तुलना में कहीं ज्यादा accuracy हासिल करता है