cgrep: AI coding agents के लिए local code intent search tool
(github.com/meghendra6)नमस्ते। मैंने cgrep नाम का एक local-first (code-local) code search tool बनाया है.
इसका मुख्य लक्ष्य यह है कि जब AI coding agents codebase को explore करें, तो token की बर्बादी और बार-बार होने वाली search को कम किया जा सके.
cgrep BM25 search (Tantivy) + AST symbol analysis (tree-sitter) को combine करता है, ताकि साधारण string search की तुलना में code intent के अनुसार बेहतर exploration हो सके.
मुख्य फीचर्स:
- code exploration: definition / references / callers / dependents
- context exploration: read / map
- agent 2-stage flow:
agent locate -> agent expand(छोटे payload से candidates ढूंढें और ज़रूरत भर ही expand करें) - MCP support:
cgrep mcp serve+ host install support - agent install support: claude-code, codex, copilot, cursor, opencode
PyTorch आधारित benchmark (implementation tracing scenario 6):
- grep baseline tokens-to-complete: 127,665
- cgrep(agent locate/expand) tokens-to-complete: 6,153
- token में 95.2% कमी (20.75x reduction)
- completion तक औसत search latency: 1321.3ms -> 22.7ms (लगभग 58.2x)
सारी processing local पर चलती है (cloud index dependency नहीं).
फ़ीडबैक का अनुरोध है:
- वास्तविक बड़े codebase में क्या कमियां हैं
- MCP/agent integration में किन सुधारों की ज़रूरत है
- benchmark scenarios को बेहतर बनाने के लिए सुझाव
Repo: https://github.com/meghendra6/cgrep
Docs: https://meghendra6.github.io/cgrep/
Benchmark: https://meghendra6.github.io/cgrep/benchmarks/…
4 टिप्पणियां
यह mgrep या ck टूल जैसे ही उद्देश्य वाला लगता है।
macOS पर v1.4.1 के रिलीज़ बाइनरी को चलाने की कोशिश करने पर चेतावनी आती है और यह चल नहीं रहा।
मुझे लगा कि agent-browser उदाहरण की तरह ऐसे skills या instruction भी हों, जिन्हें agent संदर्भ के तौर पर देख सके, तो अच्छा रहेगा।
बाइनरी सिग्नेचर में समस्या थी, इसलिए उसे ठीक कर दिया है.
कृपया जांच लें, और रिव्यू करने के लिए धन्यवाद!
टोकन की कमी का असर काफ़ी अच्छा है। अगर Readme में coding से जुड़े benchmark नतीजे भी साथ हों, तो benchmark performance लगभग समान बनी रहने पर भी भरोसा और बढ़ेगा।
आपकी प्रतिक्रिया के अनुसार real coding agent परिदृश्य के benchmark परिणाम भी जोड़ दिए हैं.
प्रतिक्रिया के लिए धन्यवाद!