रिपोर्ट: DeepSeek ने प्रतिबंधित Nvidia Blackwell चिपों का उपयोग करके AI मॉडल विकसित किए
(finance.yahoo.com)- चीन की AI स्टार्टअप DeepSeek के बारे में यह बताया गया है कि उसने अमेरिका के निर्यात प्रतिबंध के दायरे में आने वाली Nvidia Blackwell chips का उपयोग करके अगली पीढ़ी का AI मॉडल विकसित किया।
- The Information के अनुसार ये chips पहले उन तीसरे देशों के डेटा सेंटरों में लगाए गए जहां बिक्री की अनुमति थी और बाद में इन्हें चीन भेजने के लिए तस्करी तरीके से वापस लाया गया।
- अमेरिका उन्नत सेमीकंडक्टर का चीन को निर्यात प्रतिबंधित करता है, और कुछ डेवलपर इन्हें विदेशी डेटा सेंटरों या बाईपास चैनल से एक्सेस करने की कोशिश कर रहे हैं।
- Nvidia ने इस रिपोर्ट के बारे में कहा कि “इस तरह के किसी ऑपरेशन की पुष्टि नहीं की गई है,” और बताया कि यदि कोई रिपोर्ट मिलेगी तो जाँच की जाएगी।
- यह उदाहरण अमेरिका-चीन तकनीकी प्रतिस्पर्धा में चीन की AI कंपनियों द्वारा उच्च-प्रदर्शन चिप हासिल करने के प्रयासों की वास्तविकता को दिखाता है।
DeepSeek के प्रतिबंधित चिप उपयोग को लेकर संदेह
- DeepSeek ने अमेरिका के निर्यात प्रतिबंधित Nvidia Blackwell chip का उपयोग करके नया AI मॉडल विकसित करने की जानकारी The Information ने दी।
- बताया गया कि ये chips पहले बिक्री की अनुमति वाले देशों के डेटा सेंटरों में इंस्टॉल करने के बाद अलग किए गए और चीन भेजे गए।
- इसे सर्वर हार्डवेयर बनाने वाली कंपनी के निरीक्षण के बाद आयात करने की रिपोर्ट है।
- अमेरिका इस तरह के उन्नत सेमीकंडक्टर के चीन को निर्यात को प्रतिबंधित करता है।
- इसलिए चीन के AI डेवलपरों में विदेशी डेटा सेंटरों या गैर-औपचारिक मार्गों से chip हासिल करने के उदाहरण सामने आ रहे हैं।
अमेरिका की निर्यात नियंत्रण और संबंधित घटनाएँ
- नवंबर में दो चीनी और दो अमेरिकी नागरिकों पर अमेरिकी अभियोजन ने आरोप लगाए।
- इन्हें इस बात का आरोप है कि इन्होंने मलेशिया के रास्ते chip को चीन पहुँचाने के लिए एक रियल एस्टेट कंपनी को नकली रूप से स्थापित किया।
- ये घटनाएँ अमेरिकी सेमीकंडक्टर निर्यात नियंत्रण कड़े होने के बाद उभरे ऐसे बचाव-लेनदेन का हिस्सा मानी गईं।
Nvidia की स्थिति
- Nvidia ने कहा, “हमें ऐसे किसी भी स्मगलिंग ऑपरेशन की पुष्टि या कोई रिपोर्ट नहीं मिली है।”
- कंपनी के प्रवक्ता ने कहा, “यदि ऐसा कोई स्मगलिंग वास्तव में हुआ होता तो संभावना कम लगती है, परंतु यदि कोई रिपोर्ट मिलेगी तो हम जाँच करेंगे।”
DeepSeek का बैकग्राउंड और AI मॉडल विकास
- DeepSeek ने जनवरी 2024 में घोषणा की थी कि उसने सिलिकॉन वैली के शीर्ष स्तर से प्रतिस्पर्धा कर सकने वाला AI मॉडल कम लागत पर बनाया है।
- यह कंपनी चीनी हेज फंड High-Flyer के फंडिंग सपोर्ट से चल रही थी और 2021 में इसके Nvidia GPU 10,000 हासिल करने की खबर है।
- यह अमेरिकी निर्यात प्रतिबंध नीति लागू होने से पहले की बात है।
- सितंबर 2024 में कंपनी ने नया मॉडल लॉन्च किया और कहा कि वह चीन की chip निर्माण कंपनियों के साथ सहयोग कर रही है।
अमेरिका के नए कदम और चीन की प्रतिक्रिया
- राष्ट्रपति डोनाल्ड ट्रम्प ने इस सप्ताह की शुरुआत में Nvidia के पुराने AI accelerator H200 के चीन को निर्यात की अनुमति दी।
- लेकिन अधिक शक्तिशाली Blackwell chip पर निर्यात प्रतिबंध अभी भी कायम है।
- चीन सरकार ने अपने तकनीकी कंपनियों से देशी उपकरण के उपयोग को बढ़ाने की अपील की।
- DeepSeek भी इसी दिशा में चीन के chip निर्माणकर्ताओं के साथ साझेदारी में आगे बढ़ रहा है।
1 टिप्पणियां
Hacker News की राय
यह पहले से ही ज्ञात है कि DeepSeek ने अमेरिका के जन-उपयोग semiconductor export ban से पहले हासिल किए गए Nvidia chips से मॉडल train किए थे
कुछ लोगों का मानना है कि बाद में भी उसने अनौपचारिक रास्तों से chips हासिल किए होंगे
मैंने कहीं और यह भी पढ़ा कि उसने ChatGPT, Claude, Gemini के output data को training data के रूप में इस्तेमाल किया
जब एक-दूसरे से चुराए गए data को फिर से चुराकर इस्तेमाल करने का ढांचा हो, तो थोड़ी-बहुत तस्करी चौंकाने वाली नहीं लगती
खुद अमेरिकी राष्ट्रपति ने भी माना है कि अमेरिका ऐसे sanctions protectionism के लिए करता है
Anthropic ने भी copyright infringement पर 1 billion dollar का settlement दिया था, और आखिरकार सभी models मानवता की intellectual property और personal data की बड़े पैमाने पर चोरी का नतीजा हैं
मैं इस विश्वास का समर्थन करता हूँ कि open models बंद models को हरा देंगे
बस OpenAI की TOS में यह शर्त है कि उन्हें competing model training में इस्तेमाल नहीं किया जा सकता, इसलिए यह विडंबनापूर्ण है
दूसरे models के output को training में इस्तेमाल करने को knowledge distillation कहा जाता है
पहले के Grok models भी कभी-कभी जवाब की शुरुआत “as a model trained by OpenAI…” से करते थे
GamersNexus की documentary NVIDIA AI GPU के black market ढांचे को अच्छी तरह समझाती है
इसमें दिखाया गया है कि DeepSeek जैसी कंपनियाँ अमेरिकी export ban को bypass करके chips कैसे हासिल करती हैं
winning bidder एक Australian account था, लेकिन shipping address अमेरिका के Delaware के एक सामान्य घर का था, और नाम भी अलग था
कहा जाता है कि ऐसे मामलों में आम तौर पर चीनी students या diaspora GPU खरीदकर आगे बेचते हैं
शायद मेरा 4090 भी चीन में VRAM-modified Frankenstein GPU बनकर फिर जन्म लेगा
सीमा पार होते ही GPU पहले ही चीन के अंदर होता है
यह सिर्फ अंदर लाने की प्रक्रिया में ही ‘smuggling’ है, एक बार चीन के अंदर पहुँचने के बाद यह illegal नहीं रहता
DeepSeek का ऐसे GPU इस्तेमाल करना स्वाभाविक है
sanctions सिर्फ लागत थोड़ी बढ़ाते हैं, असंभव नहीं बनाते
electronic parts हों, तेल हो, या ChatGPT access, आखिरकार पैसे हों तो सब संभव है
हाँ, ऐसे sanctioned items को propaganda tool की तरह misuse भी किया जा सकता है
उदाहरण के लिए, कल्पना कीजिए कि Nvidia driver install करते समय ‘Tiananmen incident’ से जुड़ा सवाल हल करना पड़े
GPUs से भरा truck ले जाना drugs से कहीं आसान है
बस public platforms पर यह मना है
इसलिए यह propaganda strategy वास्तव में कितनी प्रभावी होगी, इस पर संदेह है
रूस के oil smuggling fleet को पूरी तरह रोके बिना भी डर का माहौल बनाकर मुनाफा घटाया जा सकता है
Bloomberg ने इसे “चीन के भीतर banned chips” कहा,
लेकिन अमेरिका द्वारा export ban और चीन के भीतर ban अलग बातें हैं
संबंधित लेख (Al Jazeera)
उदाहरण के लिए, torrent site operators या WikiLeaks से जुड़े लोगों को विदेशों से पकड़कर प्रत्यर्पित करने की कई कोशिशें हुई हैं
यहाँ तक कि ‘enemy combatant’ कहकर दूसरे देशों के लोगों का अपहरण और torture तक सही ठहराया गया है
मुझे लगता है कि अगर अमेरिका दूसरे देशों को दबाने की कोशिश न करता तो दुनिया बेहतर होती
सभी महाशक्तियों में अपनी स्थिति बचाए रखने की प्रवृत्ति होती है
अमेरिकी sanctions सिर्फ protectionism नहीं, बल्कि unfair competition के जवाब के रूप में भी देखे जा सकते हैं
यह अजीब है कि इस चर्चा में cloud access का बिल्कुल ज़िक्र नहीं हुआ
अमेरिकी servers से H100 किराए पर लेना बिना किसी खास रोक-टोक के संभव था
सामान्य users के लिए उस स्तर की infrastructure पाना मुश्किल है
शायद reboot की भी ज़रूरत न पड़े
यह न तो चौंकाने वाली बात है, और शायद कुछ होने भी वाला नहीं है
अगर manufacturing source पास के देश में हो, तो chips पाने का रास्ता हमेशा मिल जाता है
जब तक Nvidia की overseas sales पूरी तरह बंद न कर दी जाए, sanctions की प्रभावशीलता कम ही रहेगी
और सरकार द्वारा GPU खरीद को license system से नियंत्रित करना भी अव्यावहारिक है
GamersNexus का “एक आँख बंद, एक आँख खुली” वाला रवैया बिल्कुल सही लगता है
चीन ने Nvidia chips का इस्तेमाल रोकने का निर्देश दिया, लेकिन वास्तव में यह आत्मनिर्भरता की ओर धकेलने वाला संकेत अधिक है
और अमेरिकी sanctions भी drugs पर युद्ध की तरह पहले से विफलता-निश्चित नीति लगते हैं
हालाँकि अगर इसमें दबाव न हो और भागीदारी सचमुच स्वैच्छिक हो, तो और बेहतर होगा
अगर इस बार इस्तेमाल किए गए chips ban से पहले कानूनी रूप से खरीदे गए थे,
तो संभव है कि यह विवाद वास्तव में अर्थहीन हो
यह अफवाह भी थी कि DeepSeek ने sanctions को dodge किया और दूसरे models के parameters को bootstrapping करके लागत घटाई
यह रिपोर्ट उन अफवाहों को समर्थन देती दिखती है
मुझे नहीं लगता कि दोनों देशों के बीच व्यापार रोकना व्यावहारिक रूप से आसान है
GPU कम circulation वाले ऐसे सामान हैं जिन्हें satellite से track नहीं किया जा सकता,
इसलिए वे तेल जैसी उन वस्तुओं से अलग हैं जिनकी infrastructure साफ दिखती है