Harness — Claude Code एजेंट टीम और Skill Architect प्लगइन
(github.com/revfactory)- "Harness कॉन्फ़िगर कर दो" सिर्फ़ एक लाइन के निर्देश से डोमेन के मुताबिक विशेषज्ञ एजेंट टीम डिज़ाइन करने और एजेंटों द्वारा इस्तेमाल किए जाने वाले skills को भी अपने-आप बनाने वाला meta skill
- 6 तरह के architecture patterns को सपोर्ट करता है, और एजेंटों के बीच orchestration तथा error handling protocol भी शामिल हैं
- Architecture patterns
- Pipeline: क्रमिक निर्भर कार्य
- Fan-out/Fan-in: समानांतर स्वतंत्र कार्य
- Expert Pool: स्थिति के अनुसार चुनकर कॉल करना
- Generate-Verify: निर्माण के बाद गुणवत्ता जाँच
- Supervisor: केंद्रीय एजेंट द्वारा dynamic वितरण
- Hierarchical Delegation: ऊपरी स्तर → निचले स्तर recursive delegation
- 6-स्टेप workflow : डोमेन विश्लेषण → टीम architecture डिज़ाइन (agent team vs sub-agent) → agent definition बनाना → skill बनाना → integration और orchestration → validation और testing
- Execution mode दो हैं:
- Agent Team (default): TeamCreate + SendMessage + TaskCreate तरीका, 2 या अधिक एजेंट और collaboration की ज़रूरत हो तो अनुशंसित
- Sub-agent: Agent टूल को सीधे कॉल करना, one-off कार्यों और जहाँ communication की ज़रूरत न हो वहाँ उपयुक्त
- Harness चलाने पर
.claude/agents/में agent definition files (जैसे: analyst.md, builder.md, qa.md) और.claude/skills/में skill files अपने-आप बन जाते हैं - बनाई जा सकने वाली टीम संरचनाओं के उदाहरण
- Deep Research —
रिसर्च harness कॉन्फ़िगर कर दो। मुझे ऐसी agent team चाहिए जो किसी भी विषय को कई कोणों से जाँच सके — web search, academic materials, community response — cross-verification के बाद एक समेकित रिपोर्ट लिखने वाली टीम। - Website Development —
फुलस्टैक वेबसाइट development harness कॉन्फ़िगर कर दो। ऐसी टीम जो design, frontend (React/Next.js), backend (API), QA testing को wireframe से deployment तक pipeline में coordinate करे। - Webtoon Production —
webtoon episode production harness कॉन्फ़िगर कर do। story writing, character design prompt, panel layout planning, dialogue editing agents चाहिए, और उन्हें style consistency के दृष्टिकोण से एक-दूसरे के काम की review करनी चाहिए। - YouTube Content Planning —
YouTube content production harness कॉन्फ़िगर कर दो। ऐसी टीम जिसे trend research, script writing, title/tag SEO optimization, thumbnail concept planning को supervisor agent coordinate करे। - Code Review —
comprehensive code review harness कॉन्फ़िगर कर दो। ऐसी टीम जिसमें agents architecture, security vulnerabilities, performance bottlenecks, code style का parallel audit करें और नतीजों को एक रिपोर्ट में integrate करें। - Technical Documentation —
इस codebase से API documentation अपने-आप generate करने वाला harness कॉन्फ़िगर कर दो। ऐसी टीम जो endpoint analysis, explanation writing, usage example generation, completeness review को pipeline में संभाले। - Data Pipeline Design —
data pipeline design harness कॉन्फ़िगर कर दो। schema design, ETL logic, data validation rules, monitoring setup को hierarchical delegation के ज़रिए संभालने वाली agent team। - Marketing Campaign —
marketing campaign production harness कॉन्फ़िगर कर दो। ऐसी टीम जो target market research, ad copy writing, visual concept design, A/B test planning को iterative quality review के साथ आगे बढ़ाए।
- Deep Research —
- revfactory/harness-100 — 10 डोमेन, 100 production-ready agent team harnesses (कोरियाई-अंग्रेज़ी 200 पैकेज) सार्वजनिक
- हर harness में 4-5 विशेषज्ञ agents, orchestrator skill, और domain-specific skills शामिल
- content production, software development, data/AI, business strategy, education, legal, healthcare आदि को मिलाकर 1,808 Markdown files से बना
- सब कुछ Harness प्लगइन से बनाया गया
- Claude Code में agent team feature को enable करना ज़रूरी:
CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1
7 टिप्पणियां
असल में इस्तेमाल करके देखा तो नतीजे वाकई शानदार हैं। मिन्हो-जी ने जो Harness की संरचना बनाई है, वह Fan in/out करते हुए Instruction के मुताबिक कई multi-agent को उद्देश्य के अनुसार बनाती है, और इन्हें मैनेज करने वाला orchestrator हर काम के चरण को कई Phase में बाँटकर पूरा करता है.
आउटपुट की गुणवत्ता quasi-expert स्तर की है। वह रिपोर्ट हो सकती है, या फिर application तक—उसके लिए coder, tester, reviewer, analyst जैसे अलग-अलग भूमिकाओं वाले agent भी काफी उच्च स्तर पर काम करते हैं।
आपको लग सकता है कि MCP या दूसरे टूल्स की तरह Harness की वजह से context लगातार बड़ा बना रहता होगा और token जल्दी खर्च होते होंगे, लेकिन context खोलकर देखें तो पता चलता है कि इसका इस्तेमाल अधिकतम दक्षता के साथ हो रहा है। हाँ, अगर हमें अपनी सोच के मुताबिक बेहतर readability या ज्यादा polished परिणाम चाहिए, तो Gemini API आधारित नैनोबनाना image generation Skill बनाकर जोड़नी होगी।
शायद Claude Max 200 में भी 1~2 घंटे में daily limit आ जाएगी, और मैंने Opus इस्तेमाल किया था।
मैंने जापान यात्रा का itinerary बताया और कहा कि एक Japan travel guide की तरह interactive यात्रा itinerary page बना दें—यह उसका परिणाम है। ऐसी चीज़ों में बहुत ज्यादा token नहीं लगते और यह जल्दी बन जाता है।
http://namojo.github.io/tokyo-tour
क्या किसी ने इसे इस्तेमाल किया है? कृपया अपना अनुभव बताएं।
यह Kakao AI Native Strategy Team के लीडर Hwang Min-ho ने बनाया है।
मैंने इनके इसे कुछ बार परिचित कराते हुए पोस्ट देखे थे, इसलिए सोच रहा था कि इसे सार्वजनिक कब करेंगे।
मैं एक बार इसे इस्तेमाल करके देखूंगा!
अगर आप पहले से Claude code agent team का इस्तेमाल कर रहे हैं, तो इसमें बहुत कुछ खास नया नहीं था.
लेकिन agents या skills का उपयोग करके ऐसा इंफ्रास्ट्रक्चर बनाना सुविधाजनक था, जिससे टीम कॉन्फ़िगरेशन जैसी चीज़ें नई sessions में भी जारी रखी जा सकें.
टीम को मैन्युअली कॉन्फ़िगर करने पर टीम के लिए boilerplate जैसी चीज़ें बार-बार दोहरानी पड़ती थीं.
एक समस्या थी: क्योंकि यह environment subagent और agent team दोनों को ध्यान में रखकर बना है, Supervisor pattern में अक्सर ऐसी अजीब स्थिति आ जाती है जहाँ supervisor, टीम पहले से बनी होने के बावजूद, काम subagent को सौंप देता है.
Max 100 है, लेकिन शुरू करते ही token limit पहुँच गई T_T
समय निकालकर, मैंने लागू की गई चीज़ों को संक्षेप में लिखा है। इसे वास्तव में VibeCoding monorepo पर लागू करके देखा।
Mode A(डेवलपमेंट), B(कोड ऑडिट), C(इंटीग्रेशन: A+B) में से, मैंने पहले से चल रहे प्रोजेक्ट पर Mode B के साथ आगे बढ़ाया।
इससे फ्रंट/बैकएंड type mismatch जैसी चीज़ें भी ढूँढी जा सकीं, जिन्हें static analysis से पकड़ना मुश्किल होता है।
मैंने लागू करने की प्रक्रिया को संक्षेप में लिखा है।
https://blog.neocode24.com/blog/claude-code-harness-real-world/
मैं Harness को व्यक्तिगत रूप से बना रहा हूँ, इसलिए यह जानने की जिज्ञासा है कि open source प्रोजेक्ट्स को लागू करने का प्रभाव किस तरह के टेस्ट्स में सामने आता है। क्या इसके लिए कोई quantifiable और औपचारिक benchmark tool मौजूद है? आम तौर पर दूसरे लोग केवल अनुभव के बजाय प्रभावशीलता का सत्यापन कैसे करते हैं, यह भी जानना चाहता हूँ।