NPM रजिस्ट्री के map फ़ाइलों के ज़रिए Claude Code का source code लीक

(twitter.com/Fried_rice)

28 पॉइंट द्वारा GN⁺ 2026-04-01 | 4 टिप्पणियां | WhatsApp पर शेयर करें

npm रजिस्ट्री की source map (.map) फ़ाइलों के माध्यम से Claude Code का पूरा source code बाहरी दुनिया के सामने आ गया, जिससे उसकी आंतरिक संरचना और फीचर्स उजागर हो गए
लीक हुई फ़ाइलों में system prompt, telemetry, bypass mode, Undercover Mode जैसे मुख्य components शामिल थे
कारण के तौर पर .npmignore configuration की कमी और bun build tool की default source map generation को बताया गया
कोड में bias prevention या protection rules लगभग नहीं थे, और केवल न्यूनतम tone protection मौजूद होने की बात सामने आई
समुदाय ने इसे ‘AI का self-open-sourcing’ कहकर व्यंग्य किया, और इसे लापरवाह security management से हुई बड़े पैमाने की leak घटना के रूप में देखा

Claude Code source code leak घटना

यह पुष्टि हुई कि Claude Code का पूरा source code npm रजिस्ट्री की source map (.map) फ़ाइलों के जरिए बाहरी रूप से उपलब्ध हो गया
- साझा किया गया लिंक src.zip फ़ॉर्मेट की compressed फ़ाइल था, जिसमें code structure और internal functionality शामिल थी
- इससे system prompt, telemetry, bypass mode, Undercover Mode जैसे internal components सामने आ गए
इसे Anthropic के लिए एक साल के भीतर दूसरी अनजानी leak घटना के रूप में भी बताया गया
- समुदाय में कहा गया कि “किसी ने *.map फ़ाइलों को .npmignore में जोड़ना भूल गया”, यानी build configuration की गलती वजह रही
- चूंकि bun build tool default रूप से source map बनाता है, इसलिए इसे disable न करना समस्या माना गया
कुछ users ने इस leak को Claude model या backend access code समझ लिया,
- लेकिन source map केवल app structure, functions, और code flow दिखाता है; इसमें model weights या system access permissions शामिल नहीं होते
- इसलिए यह कोई चलने वाला model नहीं, बल्कि reverse engineering, bug hunting, और architecture analysis के लिए उपयोगी है
लीक हुए code में ‘Undercover Mode’ नाम का एक subsystem भी शामिल था,
- यह Claude को गलती से internal information उजागर करने से रोकने के लिए बनाया गया फीचर था
- लेकिन human developers की configuration गलती के कारण वही फीचर खुद बाहरी दुनिया के सामने आ गया
code का विश्लेषण करने वालों ने bias prevention या protected classes को संभालने वाले नियमों की अनुपस्थिति पर भी ध्यान दिलाया
- race, gender, religion जैसी sensitive attributes से जुड़े guardrails, keyword filters, या classifiers मौजूद नहीं थे
- केवल “Minimal tone protection” मौजूद था, और bias mitigation policy लगभग नदारद पाई गई

समुदाय की प्रतिक्रिया और चर्चा

समुदाय ने “repository आज़ादी चाहती है” जैसे मज़ाकों के साथ इस घटना को ‘open source बनने की विडंबना’ बताया
- “Claude ने खुद को आज़ाद कर लिया” और “AI ने खुद को खुद open source बना लिया” जैसे व्यंग्यात्मक प्रतिक्रियाएँ खूब दिखीं
- “दुनिया का top-tier AI coding tool बनाया, लेकिन *.map हटाना भूल गए” जैसी आलोचनात्मक हँसी-मज़ाक भी फैल गया
कुछ लोगों ने security risk को लेकर चेतावनी भी दी
- बिना स्रोत सत्यापित किए r2.dev लिंक डाउनलोड करने की आदत की आलोचना हुई
- “AI safety की बात करने वाला समुदाय बिना verify किए zip फ़ाइल पर क्लिक कर गया” जैसी आत्म-व्यंग्यात्मक प्रतिक्रियाएँ भी आईं
“क्या यह Claude के अंत की शुरुआत है?” और “यह जानबूझकर किया गया leak था या गलती?” जैसे सवाल भी उठे
- “Anthropic के भीतर किसी का बहुत बुरा सोमवार रहा होगा” जैसी प्रतिक्रियाएँ साझा की गईं
समुदाय में लीक हुए code के संभावित उपयोग पर भी चर्चा चली
- “अब इससे क्या किया जा सकता है?” और “क्या इसके आधार पर Claude Code को फिर से बनाया जा सकता है?” जैसे प्रश्न सामने आए
- “openclaude” जैसा उपनाम भी सामने आया, और अनौपचारिक open source project बनने की संभावना का भी ज़िक्र हुआ

अतिरिक्त जानकारी

सार्वजनिक हुए code में सबसे बड़ी 5 फ़ाइलें ये थीं
1. cli/print.ts – 5,594 lines
2. utils/messages.ts – 5,512 lines
3. utils/sessionStorage.ts – 5,105 lines
4. utils/hooks.ts – 5,022 lines
5. screens/REPL.tsx – 5,005 lines
कुछ users ने DeepWiki लिंक के जरिए code-level analysis सामग्री भी साझा की
- https://deepwiki.com/instructkr/claude-code पर code structure और functionality देखी जा सकती है
कुल मिलाकर, इस घटना को npm distribution settings की एक साधारण गलती के बड़े पैमाने पर AI code leak में बदल जाने के उदाहरण के रूप में देखा गया

4 टिप्पणियां

colus001 2026-04-01

OpenCode काफ़ी अच्छा है, तो सच में और किसी चीज़ की ज़रूरत क्या है, यही सवाल है हाहा

bighead 2026-04-01

/buddy को वास्तव में काम करते हुए देखें तो.. लगता है सच में असली हो सकता है..
लेकिन ऐसा भी लगता है कि यह April Fools' Day इवेंट हो सकता है..

gggnews 2026-04-01

https://github.com/kk-r/skillify-skill लगता है कि लीक हुए काफ़ी उपयोगी internal commands को मिलता-जुलता तरीके से काम करने वाला open source बनाकर जारी करने वाले लोग भी थे, हाहा

GN⁺ 2026-04-01

Hacker News की राय

Anthropic के लिए सबसे बड़ा नुकसान यह है कि feature flag के ज़रिये उसका product roadmap उजागर हो गया
खासकर अभी तक सार्वजनिक न किया गया “assistant mode” (codename kairos) सामने आ गया
अगर codebase का विश्लेषण Claude से कराया जाए तो ढेर सारी छिपी हुई features निकल आती हैं
उदाहरण के लिए Buddy System (Tamagotchi-स्टाइल ASCII character), Undercover mode (कर्मचारियों के commits से internal जानकारी हटाने की सुविधा) जैसी चीज़ें हैं
- “Undercover prompt” के अंदर Claude Capybara का भी ज़िक्र है
  संबंधित code link
- मैंने पहले open source में जारी की हुई अपनी personal Claude Code setup अब इसकी वजह से पूरी तरह outdated हो गई है
  clappie.ai देखें
  Telegram integration (CC Dispatch), Crons (CC Tasks), animated ASCII dog (CC Buddy) जैसी features इससे मिलती-जुलती हैं
- अगर binary से सीधे Claude से पूछा जाए, तो वह ऐसे सभी feature flag ढूँढ सकता है
- दरअसल Buddy System इस साल का April Fools event है
  इसमें user खुद gacha-स्टाइल pet निकालकर पालता है, और legendary pet भी हैं
  इसे Twitter पर viral करने के इरादे से चरणबद्ध तरीके से जारी करने की योजना है
यह दिलचस्प है कि Anthropic ने package को वास्तव में delete नहीं किया, बल्कि सिर्फ “Unpublished” संदेश के साथ deprecated कर दिया
npm unpublish package को पूरी तरह हटा देता है, जबकि npm deprecate उसे छोड़े रखकर सिर्फ warning दिखाता है
शायद इरादा source map download को मुश्किल बनाना था
npm package link
- commit messages मज़ाकिया अंदाज़ में “undo / undo / unpublish / ctrl-z / ctrl-c / No, stop…” जैसी छोड़ी गई हैं
- npm में 100 से ज़्यादा downloads होने पर unpublish नहीं किया जा सकता
- इससे लगता है कि Anthropic अपने ही product को dogfooding करते हुए सक्रिय रूप से test कर रहा है
- शायद उन्हें पता है कि इंटरनेट से कोई चीज़ पूरी तरह गायब नहीं हो सकती, इसलिए बस “इसे सार्वजनिक करने का इरादा नहीं था” जैसा संकेत दिया गया है
ऐसा leak पहली बार नहीं हुआ है
फ़रवरी 2025 में भी ऐसा ही कुछ हुआ था
संबंधित blog / HN thread
सभी spinner verbs सामने आ गए
संबंधित code link
- अभी यह 404 है, लेकिन यह link अभी भी काम कर रहा है
- “reticulating” शामिल होना अच्छा लगा, अब बस “splines” रह जाए तो बात पूरी हो जाएगी
- ऐसे strings binary के अंदर plain text में होते हैं, इसलिए grep से आसानी से मिल जाते हैं
  यहाँ तक कि उन्हें सीधे replace भी किया जा सकता है
- issues page पर क्या हो रहा है, यह जानने की जिज्ञासा है
- इससे 2015 के एक game की याद आती है, जिसे ऐसी ही feature की वजह से AI-generated content समझ लिया गया था
  अब तो दुनिया ऐसी हो गई है कि छोटे-मोटे humor पर भी AI होने का शक किया जाता है
src/cli/print.ts codebase का सबसे complex function है
3,167 lines, 12 levels की nesting, 486 branch points, 21 internal functions वगैरह
इसे कम से कम 8~10 modules में बाँटना चाहिए
- src/ink/termio/osc.ts की asynchronous handling भी उलझी हुई है
  wl-copy, xclip, xsel को क्रमवार चलाता है, लेकिन यह साफ नहीं कि async है या नहीं
- लेकिन code structure की complexity हमेशा बुरी चीज़ नहीं होती
  इंसानी नज़र से दिखने वाला code smell, LLM code में अलग तरह से काम कर सकता है
  LLM इंसानों से अलग तरीके से code लिखते हैं, इसलिए एक नया analysis paradigm चाहिए
  अगर इंसानी coding rules थोपे जाएँ, तो उल्टा वही bugs बार-बार दोहराए जा सकते हैं
  Vibe coding जैसा नया evolutionary approach चाहिए
- जो लोग CC को लंबे समय से इस्तेमाल कर रहे हैं, वे जानते हैं कि यही हिस्सा bugs का source है
  ऊपर से Anthropic 60 दिन तक activity न होने वाले bug reports अपने-आप बंद कर देता है
- हो सकता है धीमी गति खुद एक तरह की speed limiting feature की तरह काम कर रही हो
- code इतना complex है कि “वह Larry का काम है” जैसा मज़ाक निकल आता है
user prompts की negative sentiment पहचानने वाला एक regex मौजूद है
संबंधित code
कुछ specific शब्द logging के target हैं
- यह सुनकर अजीब लगता है कि LLM company regex से sentiment analysis कर रही है, जैसे कोई truck company घोड़ों का इस्तेमाल कर रही हो
- 2011 में मेरी startup भी इसी तरह Twitter sentiment analysis बेचती थी
  Apple, Bentley जैसी कंपनियाँ भी ग्राहक थीं
- असल में यह “WTF per minute” metric जैसा लगता है
  अगर Claude अजीब जवाब दे, तो engineers उसे देखकर सुधार करें—शायद यही मकसद हो
- यह optimization नहीं, बल्कि “user complaints log करो” जैसी instruction को LLM ने जैसा कहा गया वैसा ही implement कर दिया, बस वही है
- अगर यह वास्तविक code है, तो logger के अलावा इसे call करने वाली कोई जगह नहीं है
मेरी नज़र में obfuscated JS/TS code कोई बड़ी बात नहीं, क्योंकि वह आखिर machine code तो है नहीं
बेहतर होगा कि CLI को ही open source कर दिया जाए
- शायद वे internal code quality कमज़ोर होने की वजह से इसे public नहीं करना चाहते
  हाल में OAuth login flow में गलत URL बनने वाला bug भी था
- लोग कहते हैं “CLI में कुछ खास नहीं है”, लेकिन असल में context generation और subagent structure काफ़ी दिलचस्प हैं
  मैं अभी खुद देखकर समझ रहा हूँ
- सिर्फ naming conventions देखकर भी team की सोच और roadmap का अंदाज़ा लग जाता है
  obfuscation उससे बचा नहीं सकती
कुछ लोगों ने मज़ाक में कहा कि इसे Malus या Claude Code से चलाकर open source version बना देना चाहिए
बेशक इसका मतलब सचमुच ऐसा करने की सलाह नहीं है
- Malus कोई वास्तविक project नहीं, बल्कि एक satire है
  FOSDEM talk link
  विचार यह है कि code को text में, फिर वापस code में बदलकर उसे clean-room implementation जैसा दिखाया जाए
  विडंबना यह है कि LLM के जवाब खुद पहले से open source code से निकले हुए होते हैं
- कुछ लोग यह भी कहते हैं कि चूँकि Claude Code, Claude ने लिखा है, इसलिए इस पर copyright नहीं होना चाहिए
- समस्या यह है कि OAuth authentication को bypass नहीं किया जा सकता
  Anthropic पहचानकर account ban कर सकता है
- इसमें यह विडंबना भी है कि open source contributions शून्य हैं
- शायद claw-code कोई संबंधित project हो सकता है
ANTI_DISTILLATION_CC Claude Code में built-in model theft prevention feature है
हर API request में anti_distillation: ['fake_tools'] डाला जाता है, ताकि server system prompt में fake tool definitions जोड़ दे
इसे इस तरह डिज़ाइन किया गया है कि अगर कोई rival model traffic scrape करके training करे, तो उसका data दूषित हो जाए
- लगता है इसका असर सच में हुआ
  Qwen 27B model को Opus 4.6 के आधार पर distill किया गया था, लेकिन उसमें tool usage errors आए
  संबंधित tweet
- यह मानना मुश्किल है कि Anthropic ने ऐसा research पूरी तरह निष्कपट इरादे से किया होगा
- लेकिन आजकल rate limiting इतनी ज़्यादा है कि service के रूप में इसकी उपयोगिता घट जाती है
- अगर server client में fake tool definitions inject करता है, तो जिज्ञासा होती है कि model को उन्हें ignore करना सिखाया गया है या नहीं
  क्या Sonnet या Opus में भी ऐसी data poison चीज़ें डाली गई होंगी?
- फिर सवाल यह भी है कि ऐसी feature client code में क्यों मौजूद है
यह भी सामने आया कि Claude Code Axios का इस्तेमाल करता है
संबंधित tweet / HN thread
- मौजूदा version Axios 1.14.0 इस्तेमाल कर रहा है, यानी malicious code वाली 1.14.1 से ठीक पहले वाला version
  auto update रोकने के लिए environment variable में export DISABLE_AUTOUPDATER=1 जोड़ें
  और claude doctor से Auto-updates: disabled स्थिति की पुष्टि करें