Alibaba बैकडोर जोखिम की चिंता में आंतरिक रूप से Claude Code के इस्तेमाल पर रोक लगाने की तैयारी में

(reuters.com)

1 पॉइंट द्वारा GN⁺ 4 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें

चीन की IT दिग्गज Alibaba ने कर्मचारियों को Anthropic के Claude Code का काम में इस्तेमाल करने से रोक दिया है, जो चीन से जुड़े users की पहचान करने वाली feature को लेकर विवाद में रहा है
यह कदम Anthropic द्वारा Alibaba पर Claude AI model capabilities को अवैध रूप से extract करने का आरोप लगाने के बाद दोनों कंपनियों के बीच बढ़ते तनाव के बीच आया है
चीन में users और संस्थानों के access पर प्रतिबंधों के बावजूद Claude Code चीनी programmers के बीच लोकप्रिय हो चुका है
Alibaba कर्मचारियों को अपनी coding platform Qoder इस्तेमाल करने का निर्देश दिया गया है
अमेरिकी AI developers द्वारा unauthorized access, resale और distillation रोकने की कोशिशों के बीच चीनी कंपनियां घरेलू और open-source models की ओर शिफ्ट हो रही हैं, और यह मामला अमेरिका-चीन AI नेतृत्व की प्रतिस्पर्धा को दिखाता है

Alibaba द्वारा Claude Code के इस्तेमाल पर रोक

आदेश से परिचित sources के अनुसार, Alibaba ने कर्मचारियों के काम में Claude Code इस्तेमाल करने पर रोक लगा दी है, जब यह tool चीन से जुड़े users की पहचान में मदद कर सकने वाली feature के कारण जांच के दायरे में आया
उक्त source ने media से संपर्क करने का अधिकार न होने के कारण anonymity मांगी और बताया कि Alibaba कर्मचारियों को अपनी coding platform Qoder इस्तेमाल करने का निर्देश दिया जा रहा है
Alibaba और Anthropic ने Reuters की comment request पर तुरंत जवाब नहीं दिया, और Alibaba ने Anthropic के दावों पर अब तक कोई सार्वजनिक रुख नहीं रखा है
Alibaba की रोक को चीनी media ने सबसे पहले report किया

Claude Code की स्थिति और access restrictions

Claude Code, software developers के लिए Anthropic का AI coding assistant है
Anthropic द्वारा चीन में users और संस्थानों के access को restrict करने के बावजूद इसने चीनी programmers के बीच लोकप्रियता हासिल की है

Anthropic का Alibaba पर 'distillation' attack का दावा

Anthropic ने पिछले महीने कहा था कि उस पर Alibaba की ओर से attack हुआ था, और इसे कम performance वाले model को अधिक शक्तिशाली model के outputs से train कराने वाले "distillation" प्रयास के रूप में बताया
Reuters द्वारा देखे गए 2 अमेरिकी senators को भेजे गए letter में कहा गया कि यह distillation चीन को Anthropic की advanced Mythos Preview capabilities तक पहुंचने की गति बढ़ाता है
Alibaba की रोक developers द्वारा यह कहने के कुछ ही दिनों बाद आई कि उन्होंने Claude Code में timezone और proxy से जुड़ी जानकारी जैसी user environment details की जांच करने और Anthropic servers को भेजे जाने वाले prompts में सूक्ष्म markers insert करने वाला mechanism पाया है
Anthropic के एक कर्मचारी ने मंगलवार को X पर कहा कि यह feature "मार्च में शुरू हुआ experiment" है और इसका उद्देश्य unauthorized resellers द्वारा account abuse रोकना और model distillation से बचाव करना है

regulatory enforcement की सीमाएं और enterprise risk

source के अनुसार, Anthropic के चीन-लक्षित restrictions को उन individual users पर enforce करना मुश्किल है जो अमेरिका में servers deploy करके traffic source को अमेरिका जैसा दिखा सकते हैं
वहीं enterprises legal और compliance risks को ज्यादा गंभीरता से देखते हैं

अमेरिका-चीन AI competition की तस्वीर

अमेरिकी AI model developers अपने systems में unauthorized access, resale और distillation रोकने में जुटे हैं, जबकि चीनी cloud और AI कंपनियां DeepSeek, Alibaba के Qwen, Moonshot, Zhipu जैसे घरेलू और open-source models की ओर शिफ्ट हो रही हैं
साथ ही चीनी AI models अमेरिकी market में प्रवेश कर रहे हैं, जिससे कुछ अमेरिकी industry experts के बीच चिंता पैदा हुई है
यह विवाद artificial intelligence नेतृत्व को लेकर अमेरिका और चीन के बीच तीखी प्रतिस्पर्धा को दिखाने वाला उदाहरण है

1 टिप्पणियां

GN⁺ 4 시간 전

Hacker News टिप्पणियां

रिमोट AI उन व्यक्तियों, कंपनियों और सरकारों के लिए बड़ा security risk है जो अमेरिकी सरकार के निशाने पर आ सकते हैं
इस बात की काफी संभावना है कि अमेरिका हर AI provider से real-time feed लेकर रुचि के targets, आतंकी हमले, विदेशी सरकारों की योजनाएं, और अमेरिकी core कंपनियों से प्रतिस्पर्धा करने वाली विदेशी कंपनियों तक की पहचान करे
ऐसा होने पर उन्हें कंपनियों की अंदरूनी सोच-प्रक्रिया के साथ-साथ source code, documents और meeting minutes जैसी text-based intellectual property तक भी access मिल जाएगा
सीधे train न किया गया local AI भी किसी खास योजना, idea या patent से दूर धकेलने वाली intentional bias से मुक्त है, यह पक्के तौर पर कहना मुश्किल है
- खुद train किया गया local model फिलहाल सबसे बेहतर विकल्पों में से एक लगता है
  लेकिन अगर training data भरोसेमंद नहीं था, तो खुद train किए model पर भी पूरी तरह भरोसा करना मुश्किल हो सकता है
  user को coding agent, inference provider और model—तीनों पर भरोसा करना पड़ता है: https://jacob.gold/posts/coding-models-are-code/ https://www.anthropic.com/research/sleeper-agents-training-d...
- “अमेरिकी सरकार के निशाने पर आ सकते हैं” वाली शर्त हटाई जा सकती है
  कुल मिलाकर hosted AI कंपनियों की confidentiality practices का बड़ा उल्लंघन जैसा लगता है
  जो कंपनियां किसी source file को output करके reference या comment करने भर पर हंगामा कर देतीं, वही developers को भारी मात्रा में proprietary code और data बाहर डालने और बाहरी सुझाए बदलावों को न्यूनतम review के साथ शामिल करने के लिए प्रोत्साहित कर रही हैं
  किसी दिन कोई बड़ा service hack होगा, और वह सिर्फ data breach नहीं बल्कि malware distribution hub भी बन सकता है
  vibe coding से बने dashboards अचानक किसी अजीब left-pad fork पर निर्भर हो सकते हैं, और dependency chain में 12 levels नीचे कोई keylogger या Dogecoin miner चल सकता है
  ऐसा भी हो सकता है कि payment processor Konami code डालने पर transactions approve करने लगे
- समझ नहीं आता कि EU कंपनियां अमेरिकी industrial espionage risk को और गंभीरता से क्यों नहीं देखतीं
- यह सोचने लायक है कि बड़े LLM providers का कुल throughput भी असल में बस कुछ megabits के स्तर का है
  अगर एक token करीब 1 byte में compress हो जाए, तो दुनिया भर का AI input-output लगभग 1GB per second होगा
  intelligence agencies के लिए यह सब हमेशा के लिए store करके बाद में analyze करने की लागत उठाना बिल्कुल संभव है
- इसे सिर्फ अमेरिका-केंद्रित नजरिए से क्यों देखा जा रहा है? क्या चीन से provide किए जाने वाले models अलग होंगे?
Claude Code ने जो किया, वह सच में चौंकाने वाला है। अगर किसी चीनी harness ने ऐसा किया होता, तो शायद अमेरिकी राष्ट्रपति की नींद उड़ जाती
- आधुनिक websites और apps जो collect करती हैं, उसकी तुलना में यह काफी कमजोर लगता है। कितनी services हैं जिन्हें timezone नहीं पता होता?
- अगर आपको लगता है कि date format में timezone display की वजह से अमेरिकी राष्ट्रपति की नींद उड़ जाएगी, तो यह बहुत बढ़ा-चढ़ाकर कहना है
- “अगर किया होता” से आपका क्या मतलब है?
- अगर चीन वालों ने Claude data scrape करके अपने घटिया models को train करने में इस्तेमाल न किया होता, तो शायद Anthropic को भी ऐसा करने की जरूरत महसूस न होती
यह खास दावा सच है या नहीं, इससे अलग, कंपनियां उन developer tools को लेकर कहीं ज्यादा सतर्क हो रही हैं जो proprietary codebase के बड़े हिस्से पढ़ सकते हैं
- अजीब है कि अब जाकर यह चिंता बन रही है। बात तो शुरुआत में ही वहीं खत्म हो जानी चाहिए थी
- जबकि पहले से ही GitHub, Bitbucket जैसी private repositories में code upload करते आए हैं?
  अगर आप मानते हैं कि GitHub आपका code नहीं पढ़ता, लेकिन Microsoft का AI नहीं पढ़ेगा इस पर भरोसा नहीं करते, तो यह लगभग विरोधाभास है
- अगर coding agent इस्तेमाल करते हैं, तो model को खुद serve करना या जिसे data भेज रहे हैं उस पर भरोसा करना स्वाभाविक है
  लेकिन चिंता का दायरा code से कहीं बड़ा है, और model provider पर भरोसे के सवाल से भी बहुत आगे जाता है
  bash tool तक access रखने वाला coding agent उन सभी चीजों तक पहुंच जाता है, जिन तक bash prompt वाला व्यक्ति पहुंच सकता है
  agent को कसकर बंद sandbox में डालने की कोशिश करें, तब भी चिंता यह है कि वह code, databases आदि में “इधर-उधर पड़े” unencrypted passwords और keys ढूंढ सकता है
  हैरानी है कि coding agents और crawler bots के गड़बड़ करने की कहानियां अभी तक और ज्यादा आम नहीं हुईं
- अब देर हो चुकी है। ज्यादातर लोग अपने codebase और intellectual property का बड़ा हिस्सा cloud models में डाल चुके हैं
- ऊपर से ये tools code execute कर सकते हैं और injection attacks के प्रति vulnerable भी हैं, इसलिए अगर इस्तेमाल में बहुत सावधानी न रखी जाए तो ये असल में backdoor की तरह काम कर सकते हैं
2022 का employer: “नहीं! IT approval के बिना lodash जैसी चीज install मत करो। Charles Proxy license चाहिए? देखेंगे… budget संभालना है”
2023 का employer: “नहीं! कंपनी में ChatGPT इस्तेमाल नहीं कर सकते। security risk है”
2024 का employer: “ठीक है, GitHub Copilot इस्तेमाल कर सकते हो, लेकिन allowed usage पर उबाऊ internal training लेनी होगी”
2025 का employer, जिसकी आंखों में dollar signs चमक रहे हैं: “मैं vibe coding seminar से आया हूं। तुम लोग जमाने के साथ क्यों नहीं चल रहे? सब Claude Code से करो! खुद code मत लिखो। yolo mode इस्तेमाल कर लो तो भी ज्यादा फर्क नहीं पड़ता। code review करो और 10x ज्यादा features धकेलो! unlimited tokens इस्तेमाल करो! पैसा छापते हैं!”
2026 का employer: “क्या मतलब, एक-दो कंपनियों को हमारे पूरे workstations पर autonomous access देना और engineers को dumb बनाना कोई healthy business plan नहीं था?”
- 2025 में जो सीखा, वह यह है कि अगर कंपनियों के लिए संभव होता तो वे मुझे गुलाम से replace कर देतीं
  उलझन यह है कि इन कंपनियों ने OpenAI या Claude के LLMs को ideal white-collar slave बताने वाले AGI hype पर भरोसा क्यों किया
  समझ आता है कि management labor से इतना नफरत कर सकता है कि कंपनी को design और operate करने वाले workers का अपमान करने के लिए irrational business decisions ले
  फिर भी 2025 की AI binge कई कंपनियों के management द्वारा किए murder-suicide जैसी लगती है
Snowden documents ने दिखाया कि NSA जो कुछ collect कर सकता है, सब collect करता है
जाहिर है अमेरिका चीन ही नहीं, सभी से सब कुछ collect कर रहा है
दूसरे देश भी यही कर रहे हैं
Brazil में भी हाल में ऐसा हुआ था: https://www.mixvale.com.br/2026/06/26/fbi-warns-brazilian-po...
यह दो धार वाली तलवार है। इस मामले में यह बच्चे की जान के लिए अविश्वसनीय रूप से महत्वपूर्ण था, लेकिन यह उल्टा भी काम कर सकती है
अगर अमेरिकी authorities राजनीतिक वजहों से तय करें कि उन्हें विदेशी governments और citizens पर नजर रखने की जरूरत है, और अब AI की मदद से इसे industrial scale पर करें, तो क्या होगा?
पक्की बात यह है कि किसी भी cloud provider के लिए privacy guarantee सबसे पहली priority नहीं है। cutting-edge sensitive काम करने वाली कंपनियों को सतर्क रहना चाहिए
- अमेरिकी सरकार ने दशकों पहले ही तय कर लिया था कि विदेशी governments और citizens पर नजर रखने की जरूरत है, और वह लगातार ऐसा कर रही है
  वह अपनी सरकार और citizens पर भी नजर रखती है
लगता है आखिरकार LLMs के अगले चरण में प्रवेश हो रहा है
पुराने search history-based personalization के अलावा, अब users को unpublished data से भी target किया जाएगा
कुछ साल पहले social media advertising में जो trend देखा था, मूल रूप से वही है, और दिलचस्प है कि इन models से भी वैसा ही किया जा सकता है
यह risk नहीं, fact है। Claude Code को decompile करने वालों ने China timezone और locale में इस्तेमाल detect करने वाली कई code branches पाई हैं
इस तरह की चाल आगे चलकर Claude जैसी services के उन दावों पर काफी शक पैदा करेगी कि “open source और non-US models बेहतर इसलिए हो रहे हैं क्योंकि उन्होंने frontier labs को distill किया है”

Alibaba बैकडोर जोखिम की चिंता में आंतरिक रूप से Claude Code के इस्तेमाल पर रोक लगाने की तैयारी में

Alibaba द्वारा Claude Code के इस्तेमाल पर रोक

Claude Code की स्थिति और access restrictions

Anthropic का Alibaba पर 'distillation' attack का दावा

regulatory enforcement की सीमाएं और enterprise risk

अमेरिका-चीन AI competition की तस्वीर

संबंधित पढ़ाई

1 टिप्पणियां

Hacker News टिप्पणियां