oh-my-agent — प्रैक्टिकल उपयोग के लिए मल्टी AI IDE एजेंट हार्नेस
(github.com/first-fluke)एजेंट से अगर आप कहें, “TODO ऐप बना दो”, तो वह कुछ न कुछ बना देता है। समस्या यह है कि वह अक्सर गलत चीज़ बना देता है, दायरे से बाहर चला जाता है, और वही गलतियाँ बार-बार दोहराता है.
इन समस्याओं को हल करने के लिए शुरुआत में AGENTS.md, और हाल में Skills जैसी structured approaches काफ़ी सामने आई हैं। लेकिन वास्तव में साझा की जाने वाली skills को देखें तो कुछ आम समस्याएँ दिखती हैं।
- सबसे महत्वपूर्ण library version की जानकारी गायब होती है
- भूमिका का विवरण
"You are a Senior engineer"जैसी घोषणा पर ही खत्म हो जाता है - जिन बातों के लिए कुछ keywords काफ़ी हैं, उन्हें बेहद लंबा लिखकर token waste किया जाता है
नतीजतन, ऐसी skills को मॉडल ठीक से follow भी नहीं कर पाता, वे सिर्फ context बर्बाद करती हैं, और लंबे समय में ऐसा dead code बन जाती हैं जिसे कोई खोलकर देखना भी नहीं चाहता।
[दृष्टिकोण]
oh-my-agent के ज़रिए मैं इस समस्या को prompt से नहीं, बल्कि process से हल करना चाहता था। जब एजेंट काम गलत करता है, तो सिर्फ “फिर से करो” कहने के बजाय, यह संरचना रखी गई है कि क्यों गलती हुई, उसे रिकॉर्ड किया जाए और अगली execution में उसे लागू किया जाए।
इसका एक प्रमुख mechanism है Clarification Debt(CD) scoring। अगर एजेंट requirement को गलत समझ ले या scope से बाहर चला जाए, तो score जमा होता है।
- clarify: +10 — साधारण confirmation question
- correct: +25 — intent की गलत समझ के कारण direction correction
- redo: +40 — scope से बाहर जाने पर rollback करके दोबारा शुरू
- Charter verify किए बिना काम शुरू करना: +15
- allowed range के बाहर की files modify करना: +20
- वही error दोहराना: x1.5 multiplier
50 points से ऊपर जाने पर Root Cause Analysis(RCA) लिखना अनिवार्य है, और 80 points से ऊपर जाने पर session रोक दिया जाता है। यहाँ से निकले lessons lessons-learned.md में जमा होते जाते हैं और अगले session से तुरंत लागू हो जाते हैं। Prompt छोटा लिखा जाए तब भी process उसे compensate कर देता है।
इसके अलावा, एजेंट मनमाने ढंग से न चले, इसके लिए कुछ common protocols भी रखे गए हैं।
- Clarification Protocol
requirement ambiguity को LOW / MEDIUM / HIGH में बाँटा जाता है। LOW हो तो आगे बढ़ें, MEDIUM हो तो options दें, HIGH हो तो काम रोककर clarification करें। - Difficulty Guide
task को Simple / Medium / Complex में बाँटा जाता है और उसी हिसाब से protocol की गहराई तय की जाती है। - Context Budget
हर model के लिए token budget सेट किया जाता है ताकि अनावश्यक context waste कम हो।
यह approach OpenAI द्वारा कही गई Harness Engineering की सोच से भी जुड़ती है। एजेंट को अच्छी तरह इस्तेमाल करने की समस्या सिर्फ एक prompt line की नहीं है, बल्कि एजेंट को किस संरचना से नियंत्रित किया जाए, यह असली सवाल है।
[प्रोजेक्ट संरचना]
oh-my-agent इसे project structure के भीतर manage करता है।
.agents/= SSOT
skills, workflows, और settings को.agents/के नीचे इकट्ठा करके single source of truth की तरह इस्तेमाल किया जाता है। यह किसी खास IDE पर निर्भर नहीं है।- role-based agent team
PM, QA, Frontend, Backend, Mobile, Debug जैसी base roles के अलावा इस बार DB Agent और TF Infra Agent जोड़े गए हैं।- DB Agent: SQL / NoSQL / Vector DB modeling, साथ में ISO 27001 security recommendations
- TF Infra Agent: Multi-cloud Terraform, OPA / Sentinel policies, साथ में ISO 42000 series control guide
- workflow-centric orchestration
planning, review, debug, और parallel execution को base flow में रखा गया है। नया जोड़ा गया/brainstormworkflow code लिखे बिना design से exploration शुरू करता है।
codebase analysis → clarification questions → approach suggestion → user approval → design document save करने के क्रम के बाद यह/plan → implementationतक आगे बढ़ता है।
[दो orchestration modes]
/coordinate तेज़ी से चलाने और समस्या आने पर उसे ठीक करने वाला तरीका है। PM task को तोड़ता है, agents को चलाता है, और फिर QA एक बार review करता है। अगर CRITICAL/HIGH issues आते हैं, तो संबंधित काम फिर से चलाया जाता है। कुल मिलाकर यह हल्का और तेज़ 7-step loop है।
वहीं /ultrawork में quality verification बहुत सख़्त है। यह PLAN → IMPL → VERIFY → REFINE → SHIP, इन पाँच चरणों में बँटा है, और हर चरण पर gate है; पास न होने पर अगला चरण नहीं खुलता। 17 में से 11 चरण review हैं, और REFINE चरण में file splitting, duplication removal, side effect analysis, और dead code cleanup तक किया जाता है।
यह थोड़ा ज़्यादा लग सकता है, लेकिन machine language → programming language → natural language की ओर programming का abstraction level जितना बढ़ता है, validation उतनी ही महत्वपूर्ण हो जाती है — इस बात से शायद आप सहमत होंगे।
[प्रोजेक्ट विस्तार की पृष्ठभूमि]
एक महीने पहले इसे oh-my-ag नाम के Antigravity-विशेष orchestrator के रूप में पेश किया गया था। लेकिन इस बीच कई AI IDE ने .agents/skills/ को project skill path के रूप में इस्तेमाल करना शुरू कर दिया, और इसे किसी एक IDE तक सीमित रखने की वजह नहीं रही। इसलिए इसे generic harness के रूप में expand करके oh-my-agent बनाया गया।
[शुरुआत करें]
curl -fsSL https://raw.githubusercontent.com/first-fluke/oh-my-agent/… | bash
यह Antigravity, Claude Code, Codex CLI, Cursor जैसे प्रमुख AI IDE सभी को support करता है।
अगर आप पहले से AI IDE इस्तेमाल कर रहे हैं, तो इसे एक बार आज़मा सकते हैं। आखिरकार developer का लक्ष्य QCD (Quality, Cost, Delivery) को एक साथ हासिल करना होता है। इसी सोच के साथ इसे बनाया गया है कि agent development भी इसका अपवाद नहीं है।
🔗 GitHub: first-fluke/oh-my-agent
4 टिप्पणियां
मैं पहले से इसका उपयोग करने वाला यूज़र हूँ, इसलिए यह खबर सुनकर अच्छा लगा। मैंने
coordinateको काफ़ी संतोषजनक तरीके से इस्तेमाल किया हैवैसे भी मैं सोच रहा था कि अगर इसे और वेरिफ़ाई कर पाना अच्छा होता, और अब जब Ultra Mode और भी ज़्यादा बारीकी से काम करता है, तो मुझे इसे कल ही तुरंत आज़माना चाहिए।
धन्यवाद! अगर यह आपकी बात अच्छी तरह न माने, तो कृपया हमें बताइए।
package.jsonमें script जोड़ते समय इसने सिर्फ workspace folder को छोड़ा और बाकी सारी files delete कर दीं। अभी recovery कर रहा हूँ, लेकिन यह वाकई हैरान करने वाला है।क्या आपने इसे Claude या एजेंट के अंदर चलाया था?
package.jsonया सभी फ़ाइलों को हटाने वाला कोई कोड नहीं है। अगर आप पूरा flow बता दें तो आभारी रहूँगा!/tmp/oh-my-agent-*अस्थायी डायरेक्टरी हटाता हैoma cleanupकमांड पर चलाया जाता है.cursor/skillsके भीतर 1 symlink.cursor/skillssymlink डायरेक्टरी