NPM रजिस्ट्री के map फ़ाइलों के ज़रिए Claude Code का source code लीक
(twitter.com/Fried_rice)- npm रजिस्ट्री की source map (.map) फ़ाइलों के माध्यम से Claude Code का पूरा source code बाहरी दुनिया के सामने आ गया, जिससे उसकी आंतरिक संरचना और फीचर्स उजागर हो गए
- लीक हुई फ़ाइलों में system prompt, telemetry, bypass mode, Undercover Mode जैसे मुख्य components शामिल थे
- कारण के तौर पर .npmignore configuration की कमी और bun build tool की default source map generation को बताया गया
- कोड में bias prevention या protection rules लगभग नहीं थे, और केवल न्यूनतम tone protection मौजूद होने की बात सामने आई
- समुदाय ने इसे ‘AI का self-open-sourcing’ कहकर व्यंग्य किया, और इसे लापरवाह security management से हुई बड़े पैमाने की leak घटना के रूप में देखा
Claude Code source code leak घटना
- यह पुष्टि हुई कि Claude Code का पूरा source code npm रजिस्ट्री की source map (.map) फ़ाइलों के जरिए बाहरी रूप से उपलब्ध हो गया
- साझा किया गया लिंक
src.zipफ़ॉर्मेट की compressed फ़ाइल था, जिसमें code structure और internal functionality शामिल थी - इससे system prompt, telemetry, bypass mode, Undercover Mode जैसे internal components सामने आ गए
- साझा किया गया लिंक
- इसे Anthropic के लिए एक साल के भीतर दूसरी अनजानी leak घटना के रूप में भी बताया गया
- समुदाय में कहा गया कि “किसी ने *.map फ़ाइलों को .npmignore में जोड़ना भूल गया”, यानी build configuration की गलती वजह रही
- चूंकि
bunbuild tool default रूप से source map बनाता है, इसलिए इसे disable न करना समस्या माना गया
- कुछ users ने इस leak को Claude model या backend access code समझ लिया,
- लेकिन source map केवल app structure, functions, और code flow दिखाता है; इसमें model weights या system access permissions शामिल नहीं होते
- इसलिए यह कोई चलने वाला model नहीं, बल्कि reverse engineering, bug hunting, और architecture analysis के लिए उपयोगी है
- लीक हुए code में ‘Undercover Mode’ नाम का एक subsystem भी शामिल था,
- यह Claude को गलती से internal information उजागर करने से रोकने के लिए बनाया गया फीचर था
- लेकिन human developers की configuration गलती के कारण वही फीचर खुद बाहरी दुनिया के सामने आ गया
- code का विश्लेषण करने वालों ने bias prevention या protected classes को संभालने वाले नियमों की अनुपस्थिति पर भी ध्यान दिलाया
- race, gender, religion जैसी sensitive attributes से जुड़े guardrails, keyword filters, या classifiers मौजूद नहीं थे
- केवल “Minimal tone protection” मौजूद था, और bias mitigation policy लगभग नदारद पाई गई
समुदाय की प्रतिक्रिया और चर्चा
- समुदाय ने “repository आज़ादी चाहती है” जैसे मज़ाकों के साथ इस घटना को ‘open source बनने की विडंबना’ बताया
- “Claude ने खुद को आज़ाद कर लिया” और “AI ने खुद को खुद open source बना लिया” जैसे व्यंग्यात्मक प्रतिक्रियाएँ खूब दिखीं
- “दुनिया का top-tier AI coding tool बनाया, लेकिन *.map हटाना भूल गए” जैसी आलोचनात्मक हँसी-मज़ाक भी फैल गया
- कुछ लोगों ने security risk को लेकर चेतावनी भी दी
- बिना स्रोत सत्यापित किए
r2.devलिंक डाउनलोड करने की आदत की आलोचना हुई - “AI safety की बात करने वाला समुदाय बिना verify किए zip फ़ाइल पर क्लिक कर गया” जैसी आत्म-व्यंग्यात्मक प्रतिक्रियाएँ भी आईं
- बिना स्रोत सत्यापित किए
- “क्या यह Claude के अंत की शुरुआत है?” और “यह जानबूझकर किया गया leak था या गलती?” जैसे सवाल भी उठे
- “Anthropic के भीतर किसी का बहुत बुरा सोमवार रहा होगा” जैसी प्रतिक्रियाएँ साझा की गईं
- समुदाय में लीक हुए code के संभावित उपयोग पर भी चर्चा चली
- “अब इससे क्या किया जा सकता है?” और “क्या इसके आधार पर Claude Code को फिर से बनाया जा सकता है?” जैसे प्रश्न सामने आए
- “openclaude” जैसा उपनाम भी सामने आया, और अनौपचारिक open source project बनने की संभावना का भी ज़िक्र हुआ
अतिरिक्त जानकारी
- सार्वजनिक हुए code में सबसे बड़ी 5 फ़ाइलें ये थीं
cli/print.ts– 5,594 linesutils/messages.ts– 5,512 linesutils/sessionStorage.ts– 5,105 linesutils/hooks.ts– 5,022 linesscreens/REPL.tsx– 5,005 lines
- कुछ users ने DeepWiki लिंक के जरिए code-level analysis सामग्री भी साझा की
https://deepwiki.com/instructkr/claude-codeपर code structure और functionality देखी जा सकती है
- कुल मिलाकर, इस घटना को npm distribution settings की एक साधारण गलती के बड़े पैमाने पर AI code leak में बदल जाने के उदाहरण के रूप में देखा गया
4 टिप्पणियां
OpenCode काफ़ी अच्छा है, तो सच में और किसी चीज़ की ज़रूरत क्या है, यही सवाल है हाहा
/buddy को वास्तव में काम करते हुए देखें तो.. लगता है सच में असली हो सकता है..
लेकिन ऐसा भी लगता है कि यह April Fools' Day इवेंट हो सकता है..
https://github.com/kk-r/skillify-skill लगता है कि लीक हुए काफ़ी उपयोगी internal commands को मिलता-जुलता तरीके से काम करने वाला open source बनाकर जारी करने वाले लोग भी थे, हाहा
Hacker News की राय
Anthropic के लिए सबसे बड़ा नुकसान यह है कि feature flag के ज़रिये उसका product roadmap उजागर हो गया
खासकर अभी तक सार्वजनिक न किया गया “assistant mode” (codename kairos) सामने आ गया
अगर codebase का विश्लेषण Claude से कराया जाए तो ढेर सारी छिपी हुई features निकल आती हैं
उदाहरण के लिए Buddy System (Tamagotchi-स्टाइल ASCII character), Undercover mode (कर्मचारियों के commits से internal जानकारी हटाने की सुविधा) जैसी चीज़ें हैं
संबंधित code link
clappie.ai देखें
Telegram integration (CC Dispatch), Crons (CC Tasks), animated ASCII dog (CC Buddy) जैसी features इससे मिलती-जुलती हैं
इसमें user खुद gacha-स्टाइल pet निकालकर पालता है, और legendary pet भी हैं
इसे Twitter पर viral करने के इरादे से चरणबद्ध तरीके से जारी करने की योजना है
यह दिलचस्प है कि Anthropic ने package को वास्तव में delete नहीं किया, बल्कि सिर्फ “Unpublished” संदेश के साथ deprecated कर दिया
npm unpublishpackage को पूरी तरह हटा देता है, जबकिnpm deprecateउसे छोड़े रखकर सिर्फ warning दिखाता हैशायद इरादा source map download को मुश्किल बनाना था
npm package link
ऐसा leak पहली बार नहीं हुआ है
फ़रवरी 2025 में भी ऐसा ही कुछ हुआ था
संबंधित blog / HN thread
सभी spinner verbs सामने आ गए
संबंधित code link
यहाँ तक कि उन्हें सीधे replace भी किया जा सकता है
अब तो दुनिया ऐसी हो गई है कि छोटे-मोटे humor पर भी AI होने का शक किया जाता है
src/cli/print.tscodebase का सबसे complex function है3,167 lines, 12 levels की nesting, 486 branch points, 21 internal functions वगैरह
इसे कम से कम 8~10 modules में बाँटना चाहिए
src/ink/termio/osc.tsकी asynchronous handling भी उलझी हुई हैwl-copy,xclip,xselको क्रमवार चलाता है, लेकिन यह साफ नहीं कि async है या नहींइंसानी नज़र से दिखने वाला code smell, LLM code में अलग तरह से काम कर सकता है
LLM इंसानों से अलग तरीके से code लिखते हैं, इसलिए एक नया analysis paradigm चाहिए
अगर इंसानी coding rules थोपे जाएँ, तो उल्टा वही bugs बार-बार दोहराए जा सकते हैं
Vibe coding जैसा नया evolutionary approach चाहिए
ऊपर से Anthropic 60 दिन तक activity न होने वाले bug reports अपने-आप बंद कर देता है
user prompts की negative sentiment पहचानने वाला एक regex मौजूद है
संबंधित code
कुछ specific शब्द logging के target हैं
Apple, Bentley जैसी कंपनियाँ भी ग्राहक थीं
अगर Claude अजीब जवाब दे, तो engineers उसे देखकर सुधार करें—शायद यही मकसद हो
मेरी नज़र में obfuscated JS/TS code कोई बड़ी बात नहीं, क्योंकि वह आखिर machine code तो है नहीं
बेहतर होगा कि CLI को ही open source कर दिया जाए
हाल में OAuth login flow में गलत URL बनने वाला bug भी था
मैं अभी खुद देखकर समझ रहा हूँ
obfuscation उससे बचा नहीं सकती
कुछ लोगों ने मज़ाक में कहा कि इसे Malus या Claude Code से चलाकर open source version बना देना चाहिए
बेशक इसका मतलब सचमुच ऐसा करने की सलाह नहीं है
FOSDEM talk link
विचार यह है कि code को text में, फिर वापस code में बदलकर उसे clean-room implementation जैसा दिखाया जाए
विडंबना यह है कि LLM के जवाब खुद पहले से open source code से निकले हुए होते हैं
Anthropic पहचानकर account ban कर सकता है
ANTI_DISTILLATION_CC Claude Code में built-in model theft prevention feature है
हर API request में
anti_distillation: ['fake_tools']डाला जाता है, ताकि server system prompt में fake tool definitions जोड़ देइसे इस तरह डिज़ाइन किया गया है कि अगर कोई rival model traffic scrape करके training करे, तो उसका data दूषित हो जाए
Qwen 27B model को Opus 4.6 के आधार पर distill किया गया था, लेकिन उसमें tool usage errors आए
संबंधित tweet
क्या Sonnet या Opus में भी ऐसी data poison चीज़ें डाली गई होंगी?
यह भी सामने आया कि Claude Code Axios का इस्तेमाल करता है
संबंधित tweet / HN thread
auto update रोकने के लिए environment variable में
export DISABLE_AUTOUPDATER=1जोड़ेंऔर
claude doctorसेAuto-updates: disabledस्थिति की पुष्टि करें