Universal Claude.md – Claude आउटपुट टोकन में कमी
(github.com/drona23)- Claude मॉडल के अनावश्यक शुरुआती वाक्य, समापन, और दोहराव हटाकर आउटपुट टोकन की बर्बादी कम करने वाली सेटिंग फ़ाइल
- प्रोजेक्ट रूट में
CLAUDE.mdजोड़ने पर कोड बदले बिना तुरंत लागू होता है, और औसतन 63% टोकन कमी का प्रभाव मिलता है - ASCII-only आउटपुट, अनुमान पर रोक, अनुरोध की सीमा के भीतर उत्तर सीमित करना जैसी 12 नियमों के ज़रिए उत्तर को संक्षिप्त बनाया जाता है
- ऑटोमेशन पाइपलाइन, कोड जेनरेशन, एजेंट लूप जैसे बड़े आउटपुट वाले वातावरण में लागत बचत का असर बड़ा है, जबकि एकल क्वेरी में यह अलाभकारी हो सकता है
- MIT लाइसेंस के तहत जारी, इसलिए टीम या कार्य के अनुसार प्रोफ़ाइल-आधारित नियम प्रबंधन और कम्युनिटी योगदान संभव है
समस्या का अवलोकन
- Claude Code में बनने वाला हर शब्द टोकन लागत पैदा करता है, और डिफ़ॉल्ट सेटिंग में उपयोगकर्ता के लिए उत्तर के फ़ॉर्मैट को नियंत्रित करना मुश्किल होता है
- डिफ़ॉल्ट रूप से “Sure!”, “Great question!” जैसे विनम्र शुरुआती वाक्य, “I hope this helps!” जैसे औपचारिक समापन, प्रश्न का दोहराव, और अनावश्यक सुझाव अपने-आप शामिल हो जाते हैं
- साथ ही यह em dash, smart quotes, Unicode characters जैसे ऐसे वर्ण भी इस्तेमाल करता है जो parser को तोड़ सकते हैं, और अत्यधिक code abstraction या गलत सहमति-प्रदर्शन भी शामिल कर देता है
- इसके कारण टोकन की बर्बादी होती है जबकि वास्तविक सूचना-मूल्य लगभग नहीं के बराबर होता है
समाधान
- प्रोजेक्ट रूट में
CLAUDE.mdफ़ाइल जोड़ने पर Claude Code इसे अपने-आप पढ़कर आउटपुट व्यवहार तुरंत बदल देता है - यह बिना कोड बदलाव या अतिरिक्त सेटिंग के काम करता है, और आउटपुट टोकन उपयोग को लगभग 63% तक घटाता है
- संरचना का उदाहरण
your-project/ └── CLAUDE.md
किन मामलों में उपयोगी है और किनमें नहीं
-
उपयोगी मामले
-
ऑटोमेशन पाइपलाइन, एजेंट लूप, कोड जेनरेशन जैसे अधिक आउटपुट वाले कार्य
- जब दोहराए जाने वाले और संरचित कार्यों में Claude के लंबे डिफ़ॉल्ट उत्तर जमा होते जाते हैं
- जब टीम वातावरण में सेशनों के बीच एकसमान आउटपुट फ़ॉर्मैट चाहिए होता है
-
-
कम उपयोगी मामले
- एकल छोटी क्वेरी या वन-ऑफ उपयोग में
CLAUDE.mdहर बार इनपुट टोकन लेता है, इसलिए लागत उल्टा बढ़ सकती है - hallucination सुधार या आर्किटेक्चरल त्रुटि सुधार जैसे गहरे समस्या-समाधान में इसका प्रभाव नहीं है
- हर काम के लिए नया session खोलने वाली पाइपलाइन में persistent session-आधारित बचत का असर खत्म हो जाता है
- बड़े पैमाने पर parser reliability के लिए JSON mode या schema-आधारित tools अधिक उपयुक्त हैं
- exploratory या discussion-केंद्रित कार्यों में यह सीमित करने वाला लग सकता है
- एकल छोटी क्वेरी या वन-ऑफ उपयोग में
-
वास्तविक trade-off
CLAUDE.mdस्वयं इनपुट टोकन खर्च करता है, इसलिए तभी शुद्ध लाभ होता है जब आउटपुट पर्याप्त बड़ा हो- कम उपयोग में बचत से अधिक लागत हो सकती है
बेंचमार्क परिणाम
- समान 5 prompts के साथ परीक्षण
परीक्षण डिफ़ॉल्ट ऑप्टिमाइज़्ड कमी दर async/await विवरण 180 शब्द 65 शब्द 64% कोड रिव्यू 120 शब्द 30 शब्द 75% REST API विवरण 110 शब्द 55 शब्द 50% hallucination सुधार 55 शब्द 20 शब्द 64% कुल 465 शब्द 170 शब्द 63% - लगभग 295 शब्दों की कमी, बिना सूचना-हानि के
- हालांकि यह केवल दिशात्मक संकेतक है; सांख्यिकीय नियंत्रण या repeated experiments नहीं किए गए
- सिर्फ़ अधिक आउटपुट की स्थिति में ही शुद्ध बचत प्रभाव होता है
-
बड़े पैमाने के उपयोग पर बचत का उदाहरण
उपयोग दैनिक बचत टोकन मासिक बचत राशि (Sonnet मानक) 100 बार/दिन लगभग 9,600 लगभग $0.86 1,000 बार/दिन लगभग 96,000 लगभग $8.64 3 प्रोजेक्ट लगभग 288,000 लगभग $25.92
पहले और बाद की तुलना
-
डिफ़ॉल्ट कोड रिव्यू उत्तर (120 शब्द)
- लंबी प्रशंसा, व्याख्या और सुझाव शामिल
-
CLAUDE.mdलागू होने के बाद (30 शब्द)- “Bug: <= causes an off-by-one error…” जैसे रूप में केवल मुख्य बात, 75% टोकन कमी
क्या-क्या बदला जाता है
| क्रमांक | समस्या | बदलाव का तरीका |
|---|---|---|
| 1 | चापलूसी भरी शुरुआत | प्रतिबंधित – पहली पंक्ति से ही उत्तर शुरू |
| 2 | खोखला समापन | प्रतिबंधित – “I hope this helps!” हटाया जाता है |
| 3 | प्रश्न का दोहराव | प्रतिबंधित – तुरंत कार्रवाई |
| 4 | em dash, smart quotes, Unicode | ASCII-only आउटपुट अनिवार्य |
| 5 | “As an AI…” वाक्यांश | प्रतिबंधित |
| 6 | अनावश्यक disclaimer | सिर्फ़ वास्तविक सुरक्षा जोखिम पर अनुमति |
| 7 | अनुरोध से बाहर के सुझाव | प्रतिबंधित – केवल अनुरोधित दायरे में काम |
| 8 | अत्यधिक code abstraction | सिर्फ़ सबसे सरल काम करने वाला कोड अनुमत |
| 9 | अनिश्चित तथ्यों पर hallucination | “मालूम नहीं” स्पष्ट, अनुमान निषिद्ध |
| 10 | उपयोगकर्ता के सुधार की अनदेखी | सुधारित सामग्री session-आधारित तथ्य के रूप में स्थिर |
| 11 | फ़ाइलों को बार-बार पढ़ना | उसी फ़ाइल को दोबारा पढ़ना निषिद्ध |
| 12 | दायरे का विस्तार | अनुरोध से बाहर कोड बदलाव निषिद्ध |
कम्युनिटी टिप्स
- वास्तविक failure patterns के अनुसार नियम लिखना सबसे प्रभावी है
- उदाहरण: जब Claude पाइपलाइन त्रुटि को निगल जाता है → “किसी चरण के fail होते ही तुरंत रोकें और पूरी त्रुटि व traceback रिपोर्ट करें” नियम जोड़ें
-
CLAUDE.mdफ़ाइलों को hierarchical रूप से merge किया जा सकता है- global (
~/.claude/CLAUDE.md): सामान्य नियम (tone, ASCII आदि) - project root: प्रोजेक्ट-विशिष्ट प्रतिबंध (उदाहरण:
/configसंशोधन निषिद्ध) - subdirectories: कार्य-विशिष्ट विस्तृत नियम
- इससे नियमों का वितरित प्रबंधन और फ़ाइल के अनावश्यक बड़े होने से बचाव संभव है
- global (
प्रोफ़ाइल कॉन्फ़िगरेशन
- प्रोजेक्ट प्रकार के अनुसार अलग compression level चुना जा सकता है
प्रोफ़ाइल उपयुक्त उपयोग CLAUDE.mdसामान्य उपयोग profiles/CLAUDE.coding.mdडेवलपमेंट, कोड रिव्यू, डिबगिंग profiles/CLAUDE.agents.mdऑटोमेशन, मल्टी-एजेंट सिस्टम profiles/CLAUDE.analysis.mdडेटा एनालिसिस, रिसर्च, रिपोर्टिंग
उपयोग का तरीका
- विकल्प 1 (सामान्य उपयोग)
curl -o CLAUDE.md https://raw.githubusercontent.com/drona23/claude-token-efficient/… - विकल्प 2 (प्रोफ़ाइल चुनें)
git clone https://github.com/drona23/claude-token-efficient cp claude-token-efficient/profiles/CLAUDE.coding.md your-project/CLAUDE.md -
विकल्प 3 (मैनुअल)
- repository के
CLAUDE.mdकी सामग्री सीधे कॉपी करें
- repository के
ओवरराइड नियम
-
उपयोगकर्ता का कमांड हमेशा प्राथमिक
- यदि उपयोगकर्ता स्पष्ट रूप से “विस्तार से समझाइए” जैसा कहे, तो Claude उसी के अनुसार चलता है
CLAUDE.mdउपयोगकर्ता की मंशा को दबाता नहीं है
योगदान कैसे करें
- यदि कोई संशोधित किया जा सकने वाला व्यवहार मिले तो Issue दर्ज करें
- समस्या पैदा करने वाला डिफ़ॉल्ट व्यवहार
- उसे ट्रिगर करने वाला prompt
- प्रस्तावित सुधार नियम
- कम्युनिटी सुझाव अगले संस्करण में शामिल किए जाते हैं और योगदानकर्ता क्रेडिट दिया जाता है
सत्यापन और संदर्भ
- पूरा बेंचमार्क परिणाम
BENCHMARK.mdमें देखा जा सकता है - प्रोजेक्ट Claude कम्युनिटी की वास्तविक शिकायतों के मामलों के आधार पर बनाया गया है
- कई संबंधित संदर्भ स्रोत शामिल हैं (GitHub issues, The Register, DEV Community, Medium, Anthropic Docs आदि)
लाइसेंस
- MIT लाइसेंस, स्वतंत्र उपयोग, संशोधन और वितरण संभव
अभी कोई टिप्पणी नहीं है.