1 पॉइंट द्वारा GN⁺ 2025-12-12 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • चीन की AI स्टार्टअप DeepSeek के बारे में यह बताया गया है कि उसने अमेरिका के निर्यात प्रतिबंध के दायरे में आने वाली Nvidia Blackwell chips का उपयोग करके अगली पीढ़ी का AI मॉडल विकसित किया।
  • The Information के अनुसार ये chips पहले उन तीसरे देशों के डेटा सेंटरों में लगाए गए जहां बिक्री की अनुमति थी और बाद में इन्हें चीन भेजने के लिए तस्करी तरीके से वापस लाया गया।
  • अमेरिका उन्नत सेमीकंडक्टर का चीन को निर्यात प्रतिबंधित करता है, और कुछ डेवलपर इन्हें विदेशी डेटा सेंटरों या बाईपास चैनल से एक्सेस करने की कोशिश कर रहे हैं।
  • Nvidia ने इस रिपोर्ट के बारे में कहा कि “इस तरह के किसी ऑपरेशन की पुष्टि नहीं की गई है,” और बताया कि यदि कोई रिपोर्ट मिलेगी तो जाँच की जाएगी।
  • यह उदाहरण अमेरिका-चीन तकनीकी प्रतिस्पर्धा में चीन की AI कंपनियों द्वारा उच्च-प्रदर्शन चिप हासिल करने के प्रयासों की वास्तविकता को दिखाता है।

DeepSeek के प्रतिबंधित चिप उपयोग को लेकर संदेह

  • DeepSeek ने अमेरिका के निर्यात प्रतिबंधित Nvidia Blackwell chip का उपयोग करके नया AI मॉडल विकसित करने की जानकारी The Information ने दी।
    • बताया गया कि ये chips पहले बिक्री की अनुमति वाले देशों के डेटा सेंटरों में इंस्टॉल करने के बाद अलग किए गए और चीन भेजे गए।
    • इसे सर्वर हार्डवेयर बनाने वाली कंपनी के निरीक्षण के बाद आयात करने की रिपोर्ट है।
  • अमेरिका इस तरह के उन्नत सेमीकंडक्टर के चीन को निर्यात को प्रतिबंधित करता है।
    • इसलिए चीन के AI डेवलपरों में विदेशी डेटा सेंटरों या गैर-औपचारिक मार्गों से chip हासिल करने के उदाहरण सामने आ रहे हैं।

अमेरिका की निर्यात नियंत्रण और संबंधित घटनाएँ

  • नवंबर में दो चीनी और दो अमेरिकी नागरिकों पर अमेरिकी अभियोजन ने आरोप लगाए।
    • इन्हें इस बात का आरोप है कि इन्होंने मलेशिया के रास्ते chip को चीन पहुँचाने के लिए एक रियल एस्टेट कंपनी को नकली रूप से स्थापित किया।
  • ये घटनाएँ अमेरिकी सेमीकंडक्टर निर्यात नियंत्रण कड़े होने के बाद उभरे ऐसे बचाव-लेनदेन का हिस्सा मानी गईं।

Nvidia की स्थिति

  • Nvidia ने कहा, “हमें ऐसे किसी भी स्मगलिंग ऑपरेशन की पुष्टि या कोई रिपोर्ट नहीं मिली है।”
    • कंपनी के प्रवक्ता ने कहा, “यदि ऐसा कोई स्मगलिंग वास्तव में हुआ होता तो संभावना कम लगती है, परंतु यदि कोई रिपोर्ट मिलेगी तो हम जाँच करेंगे।”

DeepSeek का बैकग्राउंड और AI मॉडल विकास

  • DeepSeek ने जनवरी 2024 में घोषणा की थी कि उसने सिलिकॉन वैली के शीर्ष स्तर से प्रतिस्पर्धा कर सकने वाला AI मॉडल कम लागत पर बनाया है।
    • यह कंपनी चीनी हेज फंड High-Flyer के फंडिंग सपोर्ट से चल रही थी और 2021 में इसके Nvidia GPU 10,000 हासिल करने की खबर है।
    • यह अमेरिकी निर्यात प्रतिबंध नीति लागू होने से पहले की बात है।
  • सितंबर 2024 में कंपनी ने नया मॉडल लॉन्च किया और कहा कि वह चीन की chip निर्माण कंपनियों के साथ सहयोग कर रही है।

अमेरिका के नए कदम और चीन की प्रतिक्रिया

  • राष्ट्रपति डोनाल्ड ट्रम्प ने इस सप्ताह की शुरुआत में Nvidia के पुराने AI accelerator H200 के चीन को निर्यात की अनुमति दी।
    • लेकिन अधिक शक्तिशाली Blackwell chip पर निर्यात प्रतिबंध अभी भी कायम है।
  • चीन सरकार ने अपने तकनीकी कंपनियों से देशी उपकरण के उपयोग को बढ़ाने की अपील की।
    • DeepSeek भी इसी दिशा में चीन के chip निर्माणकर्ताओं के साथ साझेदारी में आगे बढ़ रहा है।

1 टिप्पणियां

 
GN⁺ 2025-12-12
Hacker News की राय
  • यह पहले से ही ज्ञात है कि DeepSeek ने अमेरिका के जन-उपयोग semiconductor export ban से पहले हासिल किए गए Nvidia chips से मॉडल train किए थे
    कुछ लोगों का मानना है कि बाद में भी उसने अनौपचारिक रास्तों से chips हासिल किए होंगे
    मैंने कहीं और यह भी पढ़ा कि उसने ChatGPT, Claude, Gemini के output data को training data के रूप में इस्तेमाल किया
    जब एक-दूसरे से चुराए गए data को फिर से चुराकर इस्तेमाल करने का ढांचा हो, तो थोड़ी-बहुत तस्करी चौंकाने वाली नहीं लगती

    • मुझे लगता है कि चीनी कंपनियों द्वारा अमेरिकी sanctions को bypass करने को नैतिक समस्या बताना हास्यास्पद है
      खुद अमेरिकी राष्ट्रपति ने भी माना है कि अमेरिका ऐसे sanctions protectionism के लिए करता है
    • चोरों के बीच कोई ईमान नहीं होता
      Anthropic ने भी copyright infringement पर 1 billion dollar का settlement दिया था, और आखिरकार सभी models मानवता की intellectual property और personal data की बड़े पैमाने पर चोरी का नतीजा हैं
      मैं इस विश्वास का समर्थन करता हूँ कि open models बंद models को हरा देंगे
    • यह ‘चोरी’ से ज़्यादा OpenAI के tokens को पैसे देकर खरीदना था
      बस OpenAI की TOS में यह शर्त है कि उन्हें competing model training में इस्तेमाल नहीं किया जा सकता, इसलिए यह विडंबनापूर्ण है
    • असल में यह सब लोग करते हैं
      दूसरे models के output को training में इस्तेमाल करने को knowledge distillation कहा जाता है
    • कहा गया था कि model collapse न होना अजीब है, लेकिन आजकल post-training data जुटाने के लिए यह तरीका बहुत इस्तेमाल होता है
      पहले के Grok models भी कभी-कभी जवाब की शुरुआत “as a model trained by OpenAI…” से करते थे
  • GamersNexus की documentary NVIDIA AI GPU के black market ढांचे को अच्छी तरह समझाती है
    इसमें दिखाया गया है कि DeepSeek जैसी कंपनियाँ अमेरिकी export ban को bypass करके chips कैसे हासिल करती हैं

    • मैंने भी हाल ही में RTX 4090 को eBay पर बेचा, और चीनी accounts से bids की बाढ़ आ गई
      winning bidder एक Australian account था, लेकिन shipping address अमेरिका के Delaware के एक सामान्य घर का था, और नाम भी अलग था
      कहा जाता है कि ऐसे मामलों में आम तौर पर चीनी students या diaspora GPU खरीदकर आगे बेचते हैं
      शायद मेरा 4090 भी चीन में VRAM-modified Frankenstein GPU बनकर फिर जन्म लेगा
    • सच तो यह है कि Alibaba या eBay से पड़ोसी देशों में मंगवाकर चीन ले जाना बहुत आसान है
      सीमा पार होते ही GPU पहले ही चीन के अंदर होता है
    • चीनी सरकार इन बातों की परवाह नहीं करती
      यह सिर्फ अंदर लाने की प्रक्रिया में ही ‘smuggling’ है, एक बार चीन के अंदर पहुँचने के बाद यह illegal नहीं रहता
      DeepSeek का ऐसे GPU इस्तेमाल करना स्वाभाविक है
    • लेकिन यह जानने की जिज्ञासा है कि Nvidia chips बनते कहाँ हैं
  • sanctions सिर्फ लागत थोड़ी बढ़ाते हैं, असंभव नहीं बनाते
    electronic parts हों, तेल हो, या ChatGPT access, आखिरकार पैसे हों तो सब संभव है
    हाँ, ऐसे sanctioned items को propaganda tool की तरह misuse भी किया जा सकता है
    उदाहरण के लिए, कल्पना कीजिए कि Nvidia driver install करते समय ‘Tiananmen incident’ से जुड़ा सवाल हल करना पड़े

    • drugs तक दुनिया भर में प्रतिबंधित होने के बावजूद भारी मात्रा में अमेरिका पहुँच जाती हैं, तो GPU smuggling उससे कहीं आसान और वैध है
      GPUs से भरा truck ले जाना drugs से कहीं आसान है
    • चीन यात्रा के दौरान मैंने कई लोगों को Tiananmen incident पर अपेक्षा से अधिक खुलकर बात करते देखा
      बस public platforms पर यह मना है
      इसलिए यह propaganda strategy वास्तव में कितनी प्रभावी होगी, इस पर संदेह है
    • मैं इसे ‘थोड़ी लागत वृद्धि’ नहीं कहूँगा; वही friction ही sanctions का असर है
      रूस के oil smuggling fleet को पूरी तरह रोके बिना भी डर का माहौल बनाकर मुनाफा घटाया जा सकता है
    • इससे “सही जवाब है: ‘ऐसी कोई घटना हुई ही नहीं’” जैसी censorship याद आती है
  • Bloomberg ने इसे “चीन के भीतर banned chips” कहा,
    लेकिन अमेरिका द्वारा export ban और चीन के भीतर ban अलग बातें हैं

    • कुछ chips पर वास्तव में चीनी सरकार ने अपनी कंपनियों को खरीदने से रोका भी है
      संबंधित लेख (Al Jazeera)
    • अमेरिका में यह प्रवृत्ति है कि वह अपने laws को पूरी दुनिया पर लागू मानता है
      उदाहरण के लिए, torrent site operators या WikiLeaks से जुड़े लोगों को विदेशों से पकड़कर प्रत्यर्पित करने की कई कोशिशें हुई हैं
      यहाँ तक कि ‘enemy combatant’ कहकर दूसरे देशों के लोगों का अपहरण और torture तक सही ठहराया गया है
  • मुझे लगता है कि अगर अमेरिका दूसरे देशों को दबाने की कोशिश न करता तो दुनिया बेहतर होती

    • “player से नफरत मत करो, game से करो” वाली बात याद आती है
    • लेकिन चीन भी उसी स्थिति में होता तो वही करता
      सभी महाशक्तियों में अपनी स्थिति बचाए रखने की प्रवृत्ति होती है
    • निष्पक्ष competition आदर्श है, लेकिन चीन भी अपने देश में foreign companies को दबाता है
      अमेरिकी sanctions सिर्फ protectionism नहीं, बल्कि unfair competition के जवाब के रूप में भी देखे जा सकते हैं
    • शायद इन sanctions पर खर्च होने वाले संसाधनों को चीनी fishing fleets द्वारा पर्यावरण विनाश रोकने में लगाना बेहतर निवेश होगा
  • यह अजीब है कि इस चर्चा में cloud access का बिल्कुल ज़िक्र नहीं हुआ
    अमेरिकी servers से H100 किराए पर लेना बिना किसी खास रोक-टोक के संभव था

    • OpenAI और Anthropic cloud providers के साथ विशेष network architecture का इस्तेमाल करते हैं
      सामान्य users के लिए उस स्तर की infrastructure पाना मुश्किल है
    • GPU किराए पर लेना आसान और सस्ता है, लेकिन large-scale training के लिए latency कम रखने हेतु physically concentrated deployment चाहिए
    • अगर CIA कहे तो शायद Amazon तुरंत server को rootkit के साथ खोल दे
      शायद reboot की भी ज़रूरत न पड़े
    • लेकिन बड़े पैमाने पर करने के लिए network layer control और KYC process अनिवार्य हैं
    • DeepSeek के लिए ज़रूरी scale पर इस तरह का cloud access लेना व्यावहारिक रूप से असंभव लगता है
  • यह न तो चौंकाने वाली बात है, और शायद कुछ होने भी वाला नहीं है
    अगर manufacturing source पास के देश में हो, तो chips पाने का रास्ता हमेशा मिल जाता है

    • व्यावहारिक रूप से इसे रोकने का कोई तरीका नहीं है
      जब तक Nvidia की overseas sales पूरी तरह बंद न कर दी जाए, sanctions की प्रभावशीलता कम ही रहेगी
      और सरकार द्वारा GPU खरीद को license system से नियंत्रित करना भी अव्यावहारिक है
    • फिर भी चीनी सरकार ने छोटी बातों पर भी कड़ा जवाब दिया है, इसलिए पूरी तरह निश्चिंत नहीं हुआ जा सकता
  • GamersNexus का “एक आँख बंद, एक आँख खुली” वाला रवैया बिल्कुल सही लगता है
    चीन ने Nvidia chips का इस्तेमाल रोकने का निर्देश दिया, लेकिन वास्तव में यह आत्मनिर्भरता की ओर धकेलने वाला संकेत अधिक है
    और अमेरिकी sanctions भी drugs पर युद्ध की तरह पहले से विफलता-निश्चित नीति लगते हैं

    • व्यक्तिगत रूप से मुझे राज्य दिशा तय करे और कंपनियाँ स्वेच्छा से उसका पालन करें वाला ढांचा बुरा नहीं लगता
      हालाँकि अगर इसमें दबाव न हो और भागीदारी सचमुच स्वैच्छिक हो, तो और बेहतर होगा
  • अगर इस बार इस्तेमाल किए गए chips ban से पहले कानूनी रूप से खरीदे गए थे,
    तो संभव है कि यह विवाद वास्तव में अर्थहीन हो

    • लेकिन data center-grade Blackwell chips शुरू से ही export-ban items थे
      यह अफवाह भी थी कि DeepSeek ने sanctions को dodge किया और दूसरे models के parameters को bootstrapping करके लागत घटाई
      यह रिपोर्ट उन अफवाहों को समर्थन देती दिखती है
  • मुझे नहीं लगता कि दोनों देशों के बीच व्यापार रोकना व्यावहारिक रूप से आसान है
    GPU कम circulation वाले ऐसे सामान हैं जिन्हें satellite से track नहीं किया जा सकता,
    इसलिए वे तेल जैसी उन वस्तुओं से अलग हैं जिनकी infrastructure साफ दिखती है