rtk - LLM टोकन खपत को 60~90% तक कम करने वाला CLI प्रॉक्सी

xguru · 2026-04-06T10:06:02+09:00

AI coding tools द्वारा चलाए गए CLI कमांड के आउटपुट को LLM तक भेजने से पहले फ़िल्टर और कंप्रेस करके टोकन 60~90% तक बचाने वाला single Rust binary (Windows/macOS/Linux) git, grep, ls, cargo test आदि 100 से अधिक कमांड को सपोर्ट करता है, और कमांड आउटपुट को LLM context में भेजने से पहले smart filtering, grouping, truncation, और deduplication की 4 रणनीतियाँ लागू करता है Claude Code, Codex, Cursor, Gemini CLI सहित 10 AI coding tools को सपोर्ट करता है, और hook install करने पर bash कमांड को अपने-आप पारदर्शी रूप से rtk के उसी कमांड में rewrite कर देता है यह hook केवल Bash tool calls पर लागू होता है; Claude Code के built-in tools जैसे Read, Grep, Glob आदि इस hooking को bypass करते हैं, इसलिए RTK filtering लागू करने के लिए shell commands या explicit rtk commands का उपयोग करना होगा 30 मिनट के Claude Code session के आधार पर अनुमानित बचत standard ~118,000 टोकन की तुलना में ~23,900 टोकन (लगभग 80% बचत) cargo test/npm test, pytest, go test जैसे test runners में अधिकतम 90% तक बचत शुरू करने का तरीका # 1. इंस्टॉल करें rtk init -g # Claude Code / Copilot (default) rtk init -g --gemini # Gemini CLI rtk init -g --codex # Codex (OpenAI) rtk init -g --agent cursor # Cursor # 2. इसके बाद AI tool को restart करें git status # अब rtk git status के रूप में काम करेगा Apache-2.0 लाइसेंस

(github.com/rtk-ai)

38 पॉइंट द्वारा xguru 2026-04-06 | 9 टिप्पणियां | WhatsApp पर शेयर करें

AI coding tools द्वारा चलाए गए CLI कमांड के आउटपुट को LLM तक भेजने से पहले फ़िल्टर और कंप्रेस करके टोकन 60~90% तक बचाने वाला single Rust binary (Windows/macOS/Linux)
git, grep, ls, cargo test आदि 100 से अधिक कमांड को सपोर्ट करता है, और कमांड आउटपुट को LLM context में भेजने से पहले smart filtering, grouping, truncation, और deduplication की 4 रणनीतियाँ लागू करता है
Claude Code, Codex, Cursor, Gemini CLI सहित 10 AI coding tools को सपोर्ट करता है, और hook install करने पर bash कमांड को अपने-आप पारदर्शी रूप से rtk के उसी कमांड में rewrite कर देता है
- यह hook केवल Bash tool calls पर लागू होता है; Claude Code के built-in tools जैसे Read, Grep, Glob आदि इस hooking को bypass करते हैं, इसलिए RTK filtering लागू करने के लिए shell commands या explicit rtk commands का उपयोग करना होगा
30 मिनट के Claude Code session के आधार पर अनुमानित बचत standard ~118,000 टोकन की तुलना में ~23,900 टोकन (लगभग 80% बचत)
- cargo test/npm test, pytest, go test जैसे test runners में अधिकतम 90% तक बचत

शुरू करने का तरीका

# 1. इंस्टॉल करें  
rtk init -g                     # Claude Code / Copilot (default)  
rtk init -g --gemini            # Gemini CLI  
rtk init -g --codex             # Codex (OpenAI)  
rtk init -g --agent cursor      # Cursor  
# 2. इसके बाद AI tool को restart करें  
git status  # अब rtk git status के रूप में काम करेगा

Apache-2.0 लाइसेंस

9 टिप्पणियां

kurthong 2026-04-06

आखिरकार यह गुणवत्ता के साथ एक trade-off ही है, और यह चिंता भी होती है कि कहीं खोई हुई गुणवत्ता को वापस लाने के लिए फिर से ज़्यादा tokens खर्च करने वाली संरचना न बन जाए।

ksundong 2026-04-06

मैंने इसे पहले इस्तेमाल किया था, लेकिन Claude बार-बार rtk से पैदा हुई समस्याओं को हल करने के लिए और ज़्यादा tokens खर्च करने लगा, इसलिए मैंने इसे हटा दिया।
(उदाहरण के लिए, curl से JSON request करने पर यह invalid JSON बना देता था, जिससे jq error दे देता था, फिर Claude उसे debug करते-करते tokens खर्च करता रहता था, और आखिर में raw curl request फिर से लेकर jq से parse करने की नौबत आ जाती थी.)
फिर भी मुझे लगता है कि इसका इरादा अपने आप में एक अच्छा प्रयास है, इसलिए अगर यह stable हो जाए तो इस्तेमाल करने लायक हो सकता है।

moon5g 2026-04-06

सच में इतना कम करता है या नहीं, पता नहीं। agent को बार-बार rtk ls.. कमांड इस्तेमाल करने को कहा, लेकिन वह करता ही नहीं है।

yowuu 2026-04-06

मैं खुद भी इसे इस्तेमाल कर रहा हूँ.. लेकिन rtk compression की वजह से कभी-कभी Claude Code कमांड के नतीजों से ज़रूरी context हासिल नहीं कर पाता, इसलिए लगता है कि यह case by case है।

anyjava 2026-04-06

मुझे भी उस हिस्से में अफ़सोस था!

हाल ही में जो अपडेट हुआ है, उसमें full output को एक अलग फ़ाइल में छोड़ दिया जाता है ताकि ज़रूरत होने पर llm उसे पढ़ सके~

vwjdalsgkv 2026-04-06

ऐसा लगता है कि दूसरे users के use cases में कुछ side effects हैं।
उम्मीद है कि इन्हें जल्द ही पार कर लिया जाएगा और यह अच्छी तरह लागू हो पाएगा।
https://reddit.com/r/ClaudeCode/…

blacksocks 2026-04-06

अगर यह सच में इतना अच्छी तरह कम कर दे, तो यह बहुत बढ़िया होगा!

t7vonn 2026-04-06

आइडिया अच्छा है
लेकिन क्योंकि training शायद सामान्य CLI output के आधार पर हुई होगी, इसलिए इसे इस तरह condense करने पर क्या output पहले की तरह ठीक से आएगा, इसको लेकर थोड़ी चिंता है
एक बार इस्तेमाल करके देखूंगा

cjinzy 2026-04-06

लगता है... contextmode के साथ तुलना करनी पड़ेगी।

rtk - LLM टोकन खपत को 60~90% तक कम करने वाला CLI प्रॉक्सी

संबंधित पढ़ाई

9 टिप्पणियां