rtk - LLM टोकन खपत को 60~90% तक कम करने वाला CLI प्रॉक्सी
(github.com/rtk-ai)- AI coding tools द्वारा चलाए गए CLI कमांड के आउटपुट को LLM तक भेजने से पहले फ़िल्टर और कंप्रेस करके टोकन 60~90% तक बचाने वाला single Rust binary (Windows/macOS/Linux)
git,grep,ls,cargo testआदि 100 से अधिक कमांड को सपोर्ट करता है, और कमांड आउटपुट को LLM context में भेजने से पहले smart filtering, grouping, truncation, और deduplication की 4 रणनीतियाँ लागू करता है- Claude Code, Codex, Cursor, Gemini CLI सहित 10 AI coding tools को सपोर्ट करता है, और hook install करने पर bash कमांड को अपने-आप पारदर्शी रूप से rtk के उसी कमांड में rewrite कर देता है
- यह hook केवल Bash tool calls पर लागू होता है; Claude Code के built-in tools जैसे
Read,Grep,Globआदि इस hooking को bypass करते हैं, इसलिए RTK filtering लागू करने के लिए shell commands या explicitrtkcommands का उपयोग करना होगा
- यह hook केवल Bash tool calls पर लागू होता है; Claude Code के built-in tools जैसे
- 30 मिनट के Claude Code session के आधार पर अनुमानित बचत standard ~118,000 टोकन की तुलना में ~23,900 टोकन (लगभग 80% बचत)
cargo test/npm test,pytest,go testजैसे test runners में अधिकतम 90% तक बचत
- शुरू करने का तरीका
# 1. इंस्टॉल करें rtk init -g # Claude Code / Copilot (default) rtk init -g --gemini # Gemini CLI rtk init -g --codex # Codex (OpenAI) rtk init -g --agent cursor # Cursor # 2. इसके बाद AI tool को restart करें git status # अब rtk git status के रूप में काम करेगा - Apache-2.0 लाइसेंस
9 टिप्पणियां
आखिरकार यह गुणवत्ता के साथ एक trade-off ही है, और यह चिंता भी होती है कि कहीं खोई हुई गुणवत्ता को वापस लाने के लिए फिर से ज़्यादा tokens खर्च करने वाली संरचना न बन जाए।
मैंने इसे पहले इस्तेमाल किया था, लेकिन Claude बार-बार rtk से पैदा हुई समस्याओं को हल करने के लिए और ज़्यादा tokens खर्च करने लगा, इसलिए मैंने इसे हटा दिया।
(उदाहरण के लिए,
curlसे JSON request करने पर यह invalid JSON बना देता था, जिससेjqerror दे देता था, फिर Claude उसे debug करते-करते tokens खर्च करता रहता था, और आखिर में rawcurlrequest फिर से लेकरjqसे parse करने की नौबत आ जाती थी.)फिर भी मुझे लगता है कि इसका इरादा अपने आप में एक अच्छा प्रयास है, इसलिए अगर यह stable हो जाए तो इस्तेमाल करने लायक हो सकता है।
सच में इतना कम करता है या नहीं, पता नहीं। agent को बार-बार
rtk ls..कमांड इस्तेमाल करने को कहा, लेकिन वह करता ही नहीं है।मैं खुद भी इसे इस्तेमाल कर रहा हूँ.. लेकिन rtk compression की वजह से कभी-कभी Claude Code कमांड के नतीजों से ज़रूरी context हासिल नहीं कर पाता, इसलिए लगता है कि यह case by case है।
मुझे भी उस हिस्से में अफ़सोस था!
हाल ही में जो अपडेट हुआ है, उसमें full output को एक अलग फ़ाइल में छोड़ दिया जाता है ताकि ज़रूरत होने पर llm उसे पढ़ सके~
ऐसा लगता है कि दूसरे users के use cases में कुछ side effects हैं।
उम्मीद है कि इन्हें जल्द ही पार कर लिया जाएगा और यह अच्छी तरह लागू हो पाएगा।
https://reddit.com/r/ClaudeCode/…
अगर यह सच में इतना अच्छी तरह कम कर दे, तो यह बहुत बढ़िया होगा!
आइडिया अच्छा है
लेकिन क्योंकि training शायद सामान्य CLI output के आधार पर हुई होगी, इसलिए इसे इस तरह condense करने पर क्या output पहले की तरह ठीक से आएगा, इसको लेकर थोड़ी चिंता है
एक बार इस्तेमाल करके देखूंगा
लगता है... contextmode के साथ तुलना करनी पड़ेगी।