Microsoft Phi-2 मॉडल का लाइसेंस MIT में बदला
(huggingface.co)- Phi-2 के Hugging Face repository के commit
7e10f3eमें LICENSE, NOTICE.md, README.md ये 3 फ़ाइलें बदली गईं और लाइसेंस संकेत MIT में बदल गया - नया LICENSE अब पूरे MIT License टेक्स्ट से बदला गया है, जो उपयोग, कॉपी, संशोधन, वितरण, relicense और बिक्री की व्यापक अनुमति देता है
- पहले के Microsoft Research License में मौजूद reverse engineering पर रोक, स्वतंत्र hosting पर पाबंदी, व्यक्तिगत जानकारी के प्रबंधन, arbitration, और damages liability limits जैसी कई शर्तें हटा दी गई हैं
- README metadata अब
license_name: microsoft-research-licenseकी जगहlicense: mitका उपयोग करता है, जबकि पुराना LICENSE लिंक बना हुआ है - नया NOTICE.md, flash-attention को third-party component के रूप में बताता है, और BSD 3-Clause License के साथ LGPL लाइब्रेरी बदलावों की debugging के उद्देश्य से सीमित reverse engineering की अनुमति वाला वाक्य शामिल करता है
commit में बदली गई फ़ाइलें
- Hugging Face के
microsoft/phi-2repository का commit “Upload 3 files” के रूप में दिखता है, और बदलाव LICENSE, NOTICE.md, README.md इन 3 फ़ाइलों में हैं - Browse files में उस commit state की फ़ाइल सूची देखी जा सकती है
LICENSE: Microsoft Research License से MIT License में बदलाव
- LICENSE फ़ाइल से पुराना लाइसेंस टेक्स्ट हटाकर पूरा MIT License टेक्स्ट रखा गया है
- नए LICENSE में
PhyAGI.औरCopyright (c) Microsoft Corporation.के बाद MIT License शामिल है - MIT License सॉफ़्टवेयर और उससे जुड़े documentation files पाने वाले किसी भी व्यक्ति को मुफ़्त में ये अधिकार देता है
- उपयोग, कॉपी, संशोधन, merge
- publish, distribute, relicense
- सॉफ़्टवेयर की प्रतियां बेचना
- सॉफ़्टवेयर पाने वाले अन्य लोगों को भी वही अधिकार देना
- शर्त यह है कि copyright notice और permission notice को सॉफ़्टवेयर की सभी प्रतियों या उसके महत्वपूर्ण हिस्सों में शामिल किया जाए
- warranty disclaimer AS IS रूप में शामिल है, और merchantability, किसी विशेष उद्देश्य के लिए उपयुक्तता, तथा non-infringement सहित किसी भी स्पष्ट या निहित warranty नहीं देता
- copyright holder और अधिकारधारी सॉफ़्टवेयर के उपयोग या अन्य लेनदेन से उत्पन्न किसी भी claim, damage या liability के लिए ज़िम्मेदार नहीं हैं
हटाई गई पुरानी प्रतिबंध शर्तें
- पुराने LICENSE से कई प्रतिबंध और कानूनी शर्तें हटा दी गईं
- हटाई गई शर्तों में ये बातें शामिल थीं
- सामग्री का reverse engineering, decompile, disassemble करना मना था
- Microsoft या supplier के notices को हटाना, छोटा करना, ब्लॉक करना या बदलना मना था
- कानून-विरुद्ध तरीके से या malware बनाने/फैलाने के उद्देश्य से उपयोग मना था
- सामग्री को share, publish, distribute, rent करना, स्वतंत्र hosting solution देना, या third party को transfer करना मना था
- व्यक्तिगत जानकारी से जुड़ी पाबंदियां भी हटा दी गईं
- किसी व्यक्ति की पहचान करने योग्य data को स्वीकृत/सहमति वाले उद्देश्य के अलावा उपयोग नहीं करना था
- इसका उपयोग व्यक्तियों से संपर्क करने के लिए नहीं करना था
- research पूरा होते ही personal information और उसके backups/copies नष्ट करने थे
- Microsoft को modifications देने पर Microsoft को व्यापक लाइसेंस देने वाली शर्त भी हटा दी गई
- इसके अलावा publishing, feedback, export restrictions, support services, अमेरिका में arbitration और class action waiver, governing law, consumer rights, warranty disclaimer, और damages limitation से जुड़ी शर्तें भी हटा दी गईं
README metadata में बदलाव
- README.md के front matter में लाइसेंस संकेत बदला गया
- हटाए गए आइटम ये हैं
license:license_name: microsoft-research-license
- नया आइटम
license: mitहै license_link: https://huggingface.co/microsoft/phi-2/resolve/main/LICENSEबना हुआ हैinference: falseऔरlanguage: - enआइटम दिखाए गए diff में बने हुए हैं
NOTICE.md और third-party component notice
- नई NOTICE.md फ़ाइल “NOTICES AND INFORMATION” और “Do Not Translate or Localize” वाक्य से शुरू होती है
- Microsoft बताता है कि यह सॉफ़्टवेयर third-party सामग्री शामिल करता है
- Microsoft के कुछ open source code
https://3rdpartysource.microsoft.comपर उपलब्ध हैं, या product name, open source component name, platform, और version number के साथ US $5.00 का cheque या money order भेजकर इन्हें माँगा जा सकता है - अन्य शर्तों की परवाह किए बिना, GNU Lesser General Public License के तहत लाइसेंस प्राप्त लाइब्रेरी बदलावों की debugging के लिए जितनी आवश्यकता हो, उतनी सीमा तक इस सॉफ़्टवेयर का reverse engineering किया जा सकता है
- इसमें flash-attention component शामिल है
- flash-attention notice में BSD 3-Clause License शामिल है
- source redistribution में copyright notice, conditions list, और disclaimer बनाए रखना होगा
- binary redistribution में documentation या अन्य सामग्री में वही notice, conditions, और disclaimer शामिल करने होंगे
- बिना पूर्व लिखित अनुमति के copyright holder या contributors के नाम का उपयोग derived products के promotion में नहीं किया जा सकता
- BSD 3-Clause notice यह भी कहता है कि संबंधित सॉफ़्टवेयर “AS IS” आधार पर दिया जाता है, और direct, indirect, incidental, special, exemplary, या consequential damages के लिए कोई ज़िम्मेदारी नहीं ली जाती
1 टिप्पणियां
Hacker News की रायें
ऐसे open models का आना वाकई उत्साहजनक है
दिलचस्प बात यह है कि AI “ethicists” सुरक्षा के नाम पर machine learning models तक पहुंच को नियंत्रित करने वाले उच्च पुरोहित वर्ग जैसा व्यवहार करना चाहते हैं। लेकिन मुझे लगता है कि AI का सबसे बड़ा जोखिम उन लोगों में है जो models को नियंत्रित करते हैं और उनसे यह भी नियंत्रित व censor करते हैं कि लोग क्या लिख सकते हैं
आम लोगों के हाथों में open source models ही AI के वास्तविक जोखिमों के खिलाफ सबसे अच्छा बचाव हैं, और इसे आगे बढ़ाने के लिए Facebook, Microsoft, Mistral को मेरी सराहना
social media summaries के बजाय असली तर्क पढ़ना बेहतर होगा। वहां आपकी सोच से कहीं गहरी चर्चा है, और जिन जोखिमों की चिंता की जा रही है उन पर भी व्यापक रूप से बात होती है, साथ ही प्रस्तावित समाधान भी हैं। वे समाधान “सबसे अच्छा बचाव” वाले दावे की तुलना में असल में काम करने की ज्यादा संभावना रखते हैं
बहुत से लोग ऐसे भी हैं जो इन tools के लोकतंत्रीकरण और उनके सुरक्षित व नैतिक उपयोग, दोनों को महत्वपूर्ण मानते हैं
खराब इरादों वाले लोग license की भाषा का पालन करेंगे, यह उम्मीद करना शुरुआत से ही नियंत्रण के साधन के रूप में कमजोर था। यह केवल उन नेक-नीयत लोगों की प्रगति और innovation रोकता है जो कानून मानने को तैयार हैं; रूस, उत्तर कोरिया, चीन जैसी जगहों के अलग इरादों वाले लोग, अपराधी संगठन और ठग ऐसी धारणाओं से बंधे नहीं हैं
सही open source license के तहत काम करने वाली community बढ़ रही है, और दिलचस्प चीजें और तेजी से हो रही हैं। वैकल्पिक licenses कम प्रभावी हैं, उस community से रिश्ता काटते हैं, सहयोग को जटिल बनाते हैं, और कुल research में धीरे-धीरे अल्पमत बनते जा रहे हैं। इसलिए ऐसे licenses लगातार अर्थहीन होते जा रहे हैं
इसे ठीक करने पर कानूनी दृष्टि से स्थिति सरल और standard हो जाती है, जिससे commercialization, collaboration और research आसान हो जाते हैं। Microsoft ने शायद वाजिब तौर पर माना है कि इसमें value है और वह reality के अनुसार खुद को adjust कर रहा है
पहले यह non-commercial license था, इसलिए उत्साह थोड़ा कम हो गया था
performance और size को देखते हुए, commercial-friendly license में बदलाव काफी बड़ी घटना है
इस model की अहम बात यह है कि इसकी reasoning ability मजबूत है
हालांकि इसे जानबूझकर बड़े web-crawling dataset पर train नहीं किया गया, ताकि यह बम बनाने के तरीके वगैरह न सीखे या “बुरे काम” न करे
इसलिए समान श्रेणी के, या उससे बड़े parameter models की तुलना में भी यह “सबसे समझदारी से सोचने वाला” model है, लेकिन दुनिया की जानकारी या trivia अपेक्षाकृत कम है
आगे यह बदल सकता है, लेकिन फिलहाल स्थिति ऐसी ही लगती है
क्योंकि मैं चाहता हूं कि जवाब web से सीखी बातों पर नहीं, बल्कि मेरे दिए हुए data पर आधारित हों
कई कामों के लिए general knowledge की जरूरत नहीं होती, और खासकर RAG में यह फायदा बड़ा है
data को search के जरिए उपलब्ध कराना बेहतर है, और इससे “विश्वसनीय रूप से intelligent दिखने वाले लेकिन पूरी तरह गलत” जवाब कम होते हैं
embedded data कम हो तो chat assistant के दायरे से बाहर भी इसे ज्यादा general-purpose तरीके से इस्तेमाल किया जा सकता है। अक्सर आप चाहते हैं कि model केवल वही data जाने जो user ने दिया है
उदाहरण के लिए, medieval fantasy game में कोई किरदार अचानक American politics पर बात करने लगे तो यह बहुत अजीब होगा। Phi-2 भी fine-tuning के बिना इसे पूरी तरह हल नहीं करेगा, लेकिन मूल बात यही दिशा है
model से ज्यादा dataset को लेकर उत्सुकता है
यह बेहतरीन बदलाव है, और यह भी दिखाता है कि स्वतंत्र open source projects क्यों महत्वपूर्ण हैं
यह मानना मुश्किल है कि TinyLlama का Apache 2.0 license के तहत release होना इस बदलाव को प्रभावित नहीं कर गया
यह संकेत लगता है कि Phi-3 और अगली पीढ़ी के models Phi-2 को पुराना बना देंगे
यह model काफी समय से top पर था, इसमें ऐसा क्या अच्छा है?
यह ऐसा सबसे अच्छा model है जो phone जैसे छोटे devices पर भी चल सकता है और GPT-3.5 के करीब performance देता है
architecture और training data भी दिलचस्प हैं। यह curated synthetic data इस्तेमाल करने वाला sparse model है, इसलिए random internet text पर train किए गए models की तुलना में कहीं ज्यादा accuracy हासिल करता है