oh-my-agent — प्रैक्टिकल उपयोग के लिए मल्टी AI IDE एजेंट हार्नेस

(github.com/first-fluke)

32 पॉइंट द्वारा gracefullight 2026-03-16 | 4 टिप्पणियां | WhatsApp पर शेयर करें

एजेंट से अगर आप कहें, “TODO ऐप बना दो”, तो वह कुछ न कुछ बना देता है। समस्या यह है कि वह अक्सर गलत चीज़ बना देता है, दायरे से बाहर चला जाता है, और वही गलतियाँ बार-बार दोहराता है.

इन समस्याओं को हल करने के लिए शुरुआत में AGENTS.md, और हाल में Skills जैसी structured approaches काफ़ी सामने आई हैं। लेकिन वास्तव में साझा की जाने वाली skills को देखें तो कुछ आम समस्याएँ दिखती हैं।

सबसे महत्वपूर्ण library version की जानकारी गायब होती है
भूमिका का विवरण "You are a Senior engineer" जैसी घोषणा पर ही खत्म हो जाता है
जिन बातों के लिए कुछ keywords काफ़ी हैं, उन्हें बेहद लंबा लिखकर token waste किया जाता है

नतीजतन, ऐसी skills को मॉडल ठीक से follow भी नहीं कर पाता, वे सिर्फ context बर्बाद करती हैं, और लंबे समय में ऐसा dead code बन जाती हैं जिसे कोई खोलकर देखना भी नहीं चाहता।

[दृष्टिकोण]

oh-my-agent के ज़रिए मैं इस समस्या को prompt से नहीं, बल्कि process से हल करना चाहता था। जब एजेंट काम गलत करता है, तो सिर्फ “फिर से करो” कहने के बजाय, यह संरचना रखी गई है कि क्यों गलती हुई, उसे रिकॉर्ड किया जाए और अगली execution में उसे लागू किया जाए।

इसका एक प्रमुख mechanism है Clarification Debt(CD) scoring। अगर एजेंट requirement को गलत समझ ले या scope से बाहर चला जाए, तो score जमा होता है।

clarify: +10 — साधारण confirmation question
correct: +25 — intent की गलत समझ के कारण direction correction
redo: +40 — scope से बाहर जाने पर rollback करके दोबारा शुरू
Charter verify किए बिना काम शुरू करना: +15
allowed range के बाहर की files modify करना: +20
वही error दोहराना: x1.5 multiplier

50 points से ऊपर जाने पर Root Cause Analysis(RCA) लिखना अनिवार्य है, और 80 points से ऊपर जाने पर session रोक दिया जाता है। यहाँ से निकले lessons lessons-learned.md में जमा होते जाते हैं और अगले session से तुरंत लागू हो जाते हैं। Prompt छोटा लिखा जाए तब भी process उसे compensate कर देता है।

इसके अलावा, एजेंट मनमाने ढंग से न चले, इसके लिए कुछ common protocols भी रखे गए हैं।

Clarification Protocol
requirement ambiguity को LOW / MEDIUM / HIGH में बाँटा जाता है। LOW हो तो आगे बढ़ें, MEDIUM हो तो options दें, HIGH हो तो काम रोककर clarification करें।
Difficulty Guide
task को Simple / Medium / Complex में बाँटा जाता है और उसी हिसाब से protocol की गहराई तय की जाती है।
Context Budget
हर model के लिए token budget सेट किया जाता है ताकि अनावश्यक context waste कम हो।

यह approach OpenAI द्वारा कही गई Harness Engineering की सोच से भी जुड़ती है। एजेंट को अच्छी तरह इस्तेमाल करने की समस्या सिर्फ एक prompt line की नहीं है, बल्कि एजेंट को किस संरचना से नियंत्रित किया जाए, यह असली सवाल है।

[प्रोजेक्ट संरचना]

oh-my-agent इसे project structure के भीतर manage करता है।

.agents/ = SSOT
skills, workflows, और settings को .agents/ के नीचे इकट्ठा करके single source of truth की तरह इस्तेमाल किया जाता है। यह किसी खास IDE पर निर्भर नहीं है।
role-based agent team
PM, QA, Frontend, Backend, Mobile, Debug जैसी base roles के अलावा इस बार DB Agent और TF Infra Agent जोड़े गए हैं।
- DB Agent: SQL / NoSQL / Vector DB modeling, साथ में ISO 27001 security recommendations
- TF Infra Agent: Multi-cloud Terraform, OPA / Sentinel policies, साथ में ISO 42000 series control guide
workflow-centric orchestration
planning, review, debug, और parallel execution को base flow में रखा गया है। नया जोड़ा गया /brainstorm workflow code लिखे बिना design से exploration शुरू करता है।
codebase analysis → clarification questions → approach suggestion → user approval → design document save करने के क्रम के बाद यह /plan → implementation तक आगे बढ़ता है।

[दो orchestration modes]

/coordinate तेज़ी से चलाने और समस्या आने पर उसे ठीक करने वाला तरीका है। PM task को तोड़ता है, agents को चलाता है, और फिर QA एक बार review करता है। अगर CRITICAL/HIGH issues आते हैं, तो संबंधित काम फिर से चलाया जाता है। कुल मिलाकर यह हल्का और तेज़ 7-step loop है।

वहीं /ultrawork में quality verification बहुत सख़्त है। यह PLAN → IMPL → VERIFY → REFINE → SHIP, इन पाँच चरणों में बँटा है, और हर चरण पर gate है; पास न होने पर अगला चरण नहीं खुलता। 17 में से 11 चरण review हैं, और REFINE चरण में file splitting, duplication removal, side effect analysis, और dead code cleanup तक किया जाता है।

यह थोड़ा ज़्यादा लग सकता है, लेकिन machine language → programming language → natural language की ओर programming का abstraction level जितना बढ़ता है, validation उतनी ही महत्वपूर्ण हो जाती है — इस बात से शायद आप सहमत होंगे।

[प्रोजेक्ट विस्तार की पृष्ठभूमि]

एक महीने पहले इसे oh-my-ag नाम के Antigravity-विशेष orchestrator के रूप में पेश किया गया था। लेकिन इस बीच कई AI IDE ने .agents/skills/ को project skill path के रूप में इस्तेमाल करना शुरू कर दिया, और इसे किसी एक IDE तक सीमित रखने की वजह नहीं रही। इसलिए इसे generic harness के रूप में expand करके oh-my-agent बनाया गया।

[शुरुआत करें]

curl -fsSL https://raw.githubusercontent.com/first-fluke/oh-my-agent/… | bash

यह Antigravity, Claude Code, Codex CLI, Cursor जैसे प्रमुख AI IDE सभी को support करता है।

अगर आप पहले से AI IDE इस्तेमाल कर रहे हैं, तो इसे एक बार आज़मा सकते हैं। आखिरकार developer का लक्ष्य QCD (Quality, Cost, Delivery) को एक साथ हासिल करना होता है। इसी सोच के साथ इसे बनाया गया है कि agent development भी इसका अपवाद नहीं है।

🔗 GitHub: first-fluke/oh-my-agent

4 टिप्पणियां

findme 2026-03-16

मैं पहले से इसका उपयोग करने वाला यूज़र हूँ, इसलिए यह खबर सुनकर अच्छा लगा। मैंने coordinate को काफ़ी संतोषजनक तरीके से इस्तेमाल किया है
वैसे भी मैं सोच रहा था कि अगर इसे और वेरिफ़ाई कर पाना अच्छा होता, और अब जब Ultra Mode और भी ज़्यादा बारीकी से काम करता है, तो मुझे इसे कल ही तुरंत आज़माना चाहिए।

gracefullight 2026-03-16

धन्यवाद! अगर यह आपकी बात अच्छी तरह न माने, तो कृपया हमें बताइए।

moon5g 2026-03-17

package.json में script जोड़ते समय इसने सिर्फ workspace folder को छोड़ा और बाकी सारी files delete कर दीं। अभी recovery कर रहा हूँ, लेकिन यह वाकई हैरान करने वाला है।

gracefullight 2026-03-17

क्या आपने इसे Claude या एजेंट के अंदर चलाया था? package.json या सभी फ़ाइलों को हटाने वाला कोई कोड नहीं है। अगर आप पूरा flow बता दें तो आभारी रहूँगा!

tarball.ts:33,35,43 — केवल /tmp/oh-my-agent-* अस्थायी डायरेक्टरी हटाता है
cleanup.ts:108,231 — केवल PID फ़ाइल, और स्पष्ट oma cleanup कमांड पर चलाया जाता है
agent.ts:665,1027 — PID/लॉग फ़ाइलें (प्रोसेस बंद होने पर)
skills.ts:234 — .cursor/skills के भीतर 1 symlink
migrate.ts:45-80 — legacy .cursor/skills symlink डायरेक्टरी

oh-my-agent — प्रैक्टिकल उपयोग के लिए मल्टी AI IDE एजेंट हार्नेस

संबंधित पढ़ाई

4 टिप्पणियां