- Huawei पर Qwen और DeepSeek के बड़े AI मॉडलों की नकल करने के बाद उन्हें ‘Pangu’ नाम के अपने उत्पाद के रूप में पेश करने का आंतरिक खुलासा सामने आया
- Pangu टीम के एक आंतरिक कर्मचारी के अनुसार, कुछ वास्तविक मॉडल सीधे विकसित नहीं किए गए थे, बल्कि बाहरी open source मॉडलों पर आधारित थे और केवल उनका नाम बदला गया था
- तकनीकी रूप से यह सामने आया कि 135B V2 और Pro MoE 72B जैसे प्रमुख मॉडल Qwen और DeepSeek की संरचना से काफी हद तक मेल खाते हैं
- अंदरूनी तौर पर, इस तरह की प्रथा ने शोधकर्ताओं के मनोबल में गिरावट और उनके बाहर जाने को बढ़ावा दिया, जबकि प्रशासनिक अक्षमता और अपारदर्शी HR नीतियों ने समस्या को और गंभीर बनाया
- हालांकि वास्तव में स्वदेशी रूप से विकसित मॉडल (जैसे Pangu V3) भी मौजूद हैं, फिर भी नकल की प्रथा और शोध को उचित मान्यता न देने वाली संस्कृति ने पूरे संगठन के भरोसे को गहरी चोट पहुंचाई
- व्हिसलब्लोअर ने अपने वास्तविक नाम के साथ सच सामने लाने का फैसला किया और संगठन से आत्ममंथन व बदलाव की अपील की
Pangu की त्रासदी: Huawei Noah Ark Lab के Pangu बड़े मॉडल के दर्दनाक अंदरूनी हालात
व्हिसलब्लोअर का परिचय और कार्यस्थल का माहौल
- लेखक Huawei Noah Pangu बड़े मॉडल टीम से जुड़ा है, और उसने मुख्य संगठन-प्रोजेक्ट संरचना तथा नेतृत्व संरचना को आंतरिक जानकारी से मिलाकर अपनी पहचान सत्यापित की
- Pangu प्रोजेक्ट वास्तव में शोध संगठन से अधिक डिलीवरी संगठन जैसा था, जहां बार-बार की deadlines, overwork, और लगातार evaluation व reporting के दबाव का सामना करना पड़ता था
- काम का दबाव और नौकरशाही बहुत अधिक थी, परिवार से लंबे समय तक दूर रहकर आवास में रहना पड़ता था, और सप्ताहांत में काम करना भी आम बात थी
- व्यवहार में शोध की स्वायत्तता और रचनात्मकता से अधिक, प्रत्येक product line (Cloud, ICT आदि) की delivery timeline और performance-केंद्रित corporate culture हावी थी
जागी हुई रातें, कुचला गया सृजनबोध
- Qwen मॉडल plagiarism विवाद के बाद, कुछ शोधकर्ताओं ने एक साथ शर्म, गुस्सा और असहायता महसूस की
- स्वयं खुलासा करने वाले व्यक्ति को विशाल कंपनी और उसके आंतरिक नेटवर्क से प्रतिशोध का डर था, लेकिन वह अब और तथ्यों को छिपाने तथा बाहरी दुनिया के सामने झूठा प्रचार बर्दाश्त नहीं कर सका और उसने अंतःकरण के आधार पर सच बोलने का निर्णय लिया
तकनीकी कठिनाइयाँ और नकल की शुरुआत
- शुरुआती Pangu मॉडल ने Huawei Ascend NPU आधारित वातावरण में स्वयं प्रशिक्षण का प्रयास किया, लेकिन tokenizer efficiency और model performance की कमजोरी जैसी गंभीर कठिनाइयों का सामना किया
- यह प्रतिस्पर्धियों (Alibaba, Zhipu) के GPU आधारित मॉडलों से पीछे रह गया, और उसका स्वयं का 230B dense मॉडल प्रशिक्षण विफल रहा
- इसके बाद, small model lab ने इसे “स्व-विकसित” के रूप में पेश किया, लेकिन वास्तव में उसने Qwen-1.5 (110B) मॉडल को क्लोन कर थोड़ा संशोधित किया हुआ 135B V2 बनाकर उपलब्ध कराया, और अंदरूनी स्तर पर भी code व structure की समानता सामने आई
- प्रमुख नेतृत्व और प्रबंधन इस वास्तविकता को जानते हुए भी, बाहरी उपलब्धियों और performance pressure के कारण इसे अनदेखा करते रहे
वास्तविक तकनीकी उपलब्धि: Pangu V3
- लंबे संघर्ष के बाद, टीम ने शुरुआत से पूरी तरह स्व-विकसित Pangu V3 (135B Ultra) मॉडल को Ascend पर स्वतंत्र रूप से train किया
- tokenizer unification, loss curve stabilization जैसी कई तकनीकी चुनौतियों को पार करते हुए, टीम ने प्रतिस्पर्धियों के समान स्तर का performance हासिल किया
- यह उपलब्धि plagiarism नहीं बल्कि स्वतंत्र बड़े मॉडल विकास का प्रमाण थी, और शोधकर्ताओं के गर्व का स्रोत बनी
कार्य-विभाजन के पीछे अनदेखी मेहनत
- small model lab लगातार data, code और outputs लेकर आसानी से मॉडलों को बदलकर/तैनात करता रहा, जबकि उपलब्धियां और rewards मुख्यतः उसी संगठन को मिलते रहे
- इसके कारण समर्पित शोधकर्ताओं ने या तो संगठन छोड़ दिया या इसे अपने तकनीकी करियर पर दाग की तरह देखा
224B MoE/718B क्लोन जैसी दूसरी plagiarism घटनाएँ
- नए 718B MoE मॉडल के विकास के दौरान भी, DeepSeekv3 को लगभग जस का तस क्लोन कर Pangu Pro MoE 72B नाम से जारी किया गया
- अंदरूनी स्तर पर लोग इस प्रथा से परिचित थे, लेकिन अपनी-अपनी जीविका और सच उजागर करने के डर के कारण इस पर चुप्पी साधे रहे
अव्यवस्थित प्रशासनिक प्रबंधन
- वास्तविक शोधकर्ताओं पर कड़े process, model lineage और audit systems लागू किए गए, जिससे विकास की गति धीमी हो गई
- लेकिन क्लोन किए गए मॉडलों के मामले में “ऊपर से हो जाए तो सब पास” वाला दोहरा मापदंड गहराई से मौजूद रहा
खुलासे की वजह और इस्तीफे का फैसला
- HonestAGI घटना के बाद, कंपनी स्तर पर crisis management और आंतरिक concealment की कोशिशें शुरू हुईं
- खुलासा करने वाले ने कहा कि वह अब “fake reports” और आंतरिक मिलीभगत का हिस्सा नहीं बन सकता, और उसने टीम सूची व रिपोर्टों से अपना नाम हटाने तथा स्वेच्छा से इस्तीफा देने की मंशा जताई
अंतिम अपील और साथियों के प्रति लगाव
- उसके सहयोगी पहले ही ByteDance, DeepSeek, Tencent, Kuaishou जैसी अन्य कंपनियों में जा चुके हैं, जो Huawei से प्रतिभा पलायन की गंभीरता को दिखाता है
- उसने जोर देकर कहा कि अगर innovation, उपयुक्त माहौल, और कम राजनीतिक बाधाएँ होतीं, तो विश्व-स्तरीय बड़े मॉडल और chip development भी संभव था
- उसने यह भी व्यक्त किया कि वह इस सामग्री की सत्यता और आगे के खुलासों के कारण अपने तथा अपने परिवार की सुरक्षा को खतरे में डालने की संभावना तक स्वीकार करने को तैयार है
अतिरिक्त परिस्थिति संबंधी विवरण
- 135B V2 क्लोन मामले में, small model lab ने rewards और incentives जैसे लाभ तो ले लिए, जबकि downstream support और maintenance का बोझ मूल विकास टीम (4th brigade) पर डाल दिया गया
- Pangu technical report के author credits में भी, मॉडल विकास में वास्तविक और महत्वपूर्ण योगदान देने वाले लोगों को बाहर रखा गया, जबकि small model lab के गैर-योगदानकर्ताओं को शामिल किया गया, जो अनुचित अकादमिक प्रथाओं के व्यापक होने को दर्शाता है
1 टिप्पणियां
Hacker News राय