130 पॉइंट द्वारा xguru 2026-03-29 | 7 टिप्पणियां | WhatsApp पर शेयर करें
  • "Harness कॉन्फ़िगर कर दो" सिर्फ़ एक लाइन के निर्देश से डोमेन के मुताबिक विशेषज्ञ एजेंट टीम डिज़ाइन करने और एजेंटों द्वारा इस्तेमाल किए जाने वाले skills को भी अपने-आप बनाने वाला meta skill
  • 6 तरह के architecture patterns को सपोर्ट करता है, और एजेंटों के बीच orchestration तथा error handling protocol भी शामिल हैं
  • Architecture patterns
    • Pipeline: क्रमिक निर्भर कार्य
    • Fan-out/Fan-in: समानांतर स्वतंत्र कार्य
    • Expert Pool: स्थिति के अनुसार चुनकर कॉल करना
    • Generate-Verify: निर्माण के बाद गुणवत्ता जाँच
    • Supervisor: केंद्रीय एजेंट द्वारा dynamic वितरण
    • Hierarchical Delegation: ऊपरी स्तर → निचले स्तर recursive delegation
  • 6-स्टेप workflow : डोमेन विश्लेषण → टीम architecture डिज़ाइन (agent team vs sub-agent) → agent definition बनाना → skill बनाना → integration और orchestration → validation और testing
  • Execution mode दो हैं:
    • Agent Team (default): TeamCreate + SendMessage + TaskCreate तरीका, 2 या अधिक एजेंट और collaboration की ज़रूरत हो तो अनुशंसित
    • Sub-agent: Agent टूल को सीधे कॉल करना, one-off कार्यों और जहाँ communication की ज़रूरत न हो वहाँ उपयुक्त
  • Harness चलाने पर .claude/agents/ में agent definition files (जैसे: analyst.md, builder.md, qa.md) और .claude/skills/ में skill files अपने-आप बन जाते हैं
  • बनाई जा सकने वाली टीम संरचनाओं के उदाहरण
    • Deep Researchरिसर्च harness कॉन्फ़िगर कर दो। मुझे ऐसी agent team चाहिए जो किसी भी विषय को कई कोणों से जाँच सके — web search, academic materials, community response — cross-verification के बाद एक समेकित रिपोर्ट लिखने वाली टीम।
    • Website Developmentफुलस्टैक वेबसाइट development harness कॉन्फ़िगर कर दो। ऐसी टीम जो design, frontend (React/Next.js), backend (API), QA testing को wireframe से deployment तक pipeline में coordinate करे।
    • Webtoon Productionwebtoon episode production harness कॉन्फ़िगर कर do। story writing, character design prompt, panel layout planning, dialogue editing agents चाहिए, और उन्हें style consistency के दृष्टिकोण से एक-दूसरे के काम की review करनी चाहिए।
    • YouTube Content PlanningYouTube content production harness कॉन्फ़िगर कर दो। ऐसी टीम जिसे trend research, script writing, title/tag SEO optimization, thumbnail concept planning को supervisor agent coordinate करे।
    • Code Reviewcomprehensive code review harness कॉन्फ़िगर कर दो। ऐसी टीम जिसमें agents architecture, security vulnerabilities, performance bottlenecks, code style का parallel audit करें और नतीजों को एक रिपोर्ट में integrate करें।
    • Technical Documentationइस codebase से API documentation अपने-आप generate करने वाला harness कॉन्फ़िगर कर दो। ऐसी टीम जो endpoint analysis, explanation writing, usage example generation, completeness review को pipeline में संभाले।
    • Data Pipeline Designdata pipeline design harness कॉन्फ़िगर कर दो। schema design, ETL logic, data validation rules, monitoring setup को hierarchical delegation के ज़रिए संभालने वाली agent team।
    • Marketing Campaignmarketing campaign production harness कॉन्फ़िगर कर दो। ऐसी टीम जो target market research, ad copy writing, visual concept design, A/B test planning को iterative quality review के साथ आगे बढ़ाए।
  • revfactory/harness-100 — 10 डोमेन, 100 production-ready agent team harnesses (कोरियाई-अंग्रेज़ी 200 पैकेज) सार्वजनिक
    • हर harness में 4-5 विशेषज्ञ agents, orchestrator skill, और domain-specific skills शामिल
    • content production, software development, data/AI, business strategy, education, legal, healthcare आदि को मिलाकर 1,808 Markdown files से बना
    • सब कुछ Harness प्लगइन से बनाया गया
  • Claude Code में agent team feature को enable करना ज़रूरी: CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1

7 टिप्पणियां

 
namojo 2026-04-01

असल में इस्तेमाल करके देखा तो नतीजे वाकई शानदार हैं। मिन्हो-जी ने जो Harness की संरचना बनाई है, वह Fan in/out करते हुए Instruction के मुताबिक कई multi-agent को उद्देश्य के अनुसार बनाती है, और इन्हें मैनेज करने वाला orchestrator हर काम के चरण को कई Phase में बाँटकर पूरा करता है.

आउटपुट की गुणवत्ता quasi-expert स्तर की है। वह रिपोर्ट हो सकती है, या फिर application तक—उसके लिए coder, tester, reviewer, analyst जैसे अलग-अलग भूमिकाओं वाले agent भी काफी उच्च स्तर पर काम करते हैं।

आपको लग सकता है कि MCP या दूसरे टूल्स की तरह Harness की वजह से context लगातार बड़ा बना रहता होगा और token जल्दी खर्च होते होंगे, लेकिन context खोलकर देखें तो पता चलता है कि इसका इस्तेमाल अधिकतम दक्षता के साथ हो रहा है। हाँ, अगर हमें अपनी सोच के मुताबिक बेहतर readability या ज्यादा polished परिणाम चाहिए, तो Gemini API आधारित नैनोबनाना image generation Skill बनाकर जोड़नी होगी।

शायद Claude Max 200 में भी 1~2 घंटे में daily limit आ जाएगी, और मैंने Opus इस्तेमाल किया था।

मैंने जापान यात्रा का itinerary बताया और कहा कि एक Japan travel guide की तरह interactive यात्रा itinerary page बना दें—यह उसका परिणाम है। ऐसी चीज़ों में बहुत ज्यादा token नहीं लगते और यह जल्दी बन जाता है।

http://namojo.github.io/tokyo-tour

 
tested 2026-03-30

क्या किसी ने इसे इस्तेमाल किया है? कृपया अपना अनुभव बताएं।

 
xguru 2026-03-29

यह Kakao AI Native Strategy Team के लीडर Hwang Min-ho ने बनाया है।
मैंने इनके इसे कुछ बार परिचित कराते हुए पोस्ट देखे थे, इसलिए सोच रहा था कि इसे सार्वजनिक कब करेंगे।
मैं एक बार इसे इस्तेमाल करके देखूंगा!

 
edunga1 2026-04-06

अगर आप पहले से Claude code agent team का इस्तेमाल कर रहे हैं, तो इसमें बहुत कुछ खास नया नहीं था.
लेकिन agents या skills का उपयोग करके ऐसा इंफ्रास्ट्रक्चर बनाना सुविधाजनक था, जिससे टीम कॉन्फ़िगरेशन जैसी चीज़ें नई sessions में भी जारी रखी जा सकें.
टीम को मैन्युअली कॉन्फ़िगर करने पर टीम के लिए boilerplate जैसी चीज़ें बार-बार दोहरानी पड़ती थीं.

एक समस्या थी: क्योंकि यह environment subagent और agent team दोनों को ध्यान में रखकर बना है, Supervisor pattern में अक्सर ऐसी अजीब स्थिति आ जाती है जहाँ supervisor, टीम पहले से बनी होने के बावजूद, काम subagent को सौंप देता है.

 
neocode24 2026-03-31

Max 100 है, लेकिन शुरू करते ही token limit पहुँच गई T_T

 
neocode24 2026-03-31

समय निकालकर, मैंने लागू की गई चीज़ों को संक्षेप में लिखा है। इसे वास्तव में VibeCoding monorepo पर लागू करके देखा।

Mode A(डेवलपमेंट), B(कोड ऑडिट), C(इंटीग्रेशन: A+B) में से, मैंने पहले से चल रहे प्रोजेक्ट पर Mode B के साथ आगे बढ़ाया।
इससे फ्रंट/बैकएंड type mismatch जैसी चीज़ें भी ढूँढी जा सकीं, जिन्हें static analysis से पकड़ना मुश्किल होता है।
मैंने लागू करने की प्रक्रिया को संक्षेप में लिखा है।

https://blog.neocode24.com/blog/claude-code-harness-real-world/

 
wang3281 2026-03-30

मैं Harness को व्यक्तिगत रूप से बना रहा हूँ, इसलिए यह जानने की जिज्ञासा है कि open source प्रोजेक्ट्स को लागू करने का प्रभाव किस तरह के टेस्ट्स में सामने आता है। क्या इसके लिए कोई quantifiable और औपचारिक benchmark tool मौजूद है? आम तौर पर दूसरे लोग केवल अनुभव के बजाय प्रभावशीलता का सत्यापन कैसे करते हैं, यह भी जानना चाहता हूँ।