बिलकुल असली कोरियाई लोगों की तरह रिव्यू करने वाली AI agent टीम बनाना (Harness fork + NVIDIA 10 लाख personas)
(github.com/hongsw)TL;DR
उन harnesses में जहाँ गहराई से review करना ज़रूरी है — code review, document review, UX research, interview simulation — वहाँ 5 reviewers के पास 5 अलग-अलग नज़रिए होना ही असली मूल्य है। सामान्य AI agent teams में 5 लोग लगभग एक जैसे
tone और perspective रखते हैं, इसलिए व्यवहार में 1 ही राय 5 बार दोहराई जाती है।
यह fork NVIDIA Nemotron-Personas-Korea (10 लाख rows, CC BY 4.0) को runtime dynamic search से लाता है, और कोरियाई workplaces के वास्तविक लोगों (job role, generation, region, family situation तक) को agents पर लागू करके सचमुच अलग-अलग perspectives वाले reviews
बनाता है।
review harness में persona की गहराई क्यों ज़रूरी है
एक ही code/document/design को देखकर भी हर व्यक्ति का नज़रिया अलग होता है:
-
45 वर्षीय SI background वाला backend team lead
→ "risk management के हिसाब से चलिए इसे चरणबद्ध deployment में ले चलते हैं। अच्छी तरह verification करके जाना ही अंत में schedule छोटा करता है।" -
24 वर्षीय MZ growth marketer
→ "जब metrics spike हुए तब cause hypothesis जल्दी बनाने का approach अच्छा है, लेकिन significance level थोड़ा कमजोर है। क्या A/B को थोड़ा और चलाएँ?" -
38 वर्षीय working mom PM
→ "निष्कर्ष यही है कि अगर यह इस quarter के भीतर नहीं जा सकता, तो पहले एक बार priorities को adjust कर दीजिए।" -
27 वर्षीय fintech background वाला designer
→ "user interview के qualitative data में 'coupon मिलने का moment थोड़ा फीका लगता है' यह comment बार-बार आया था।"
→ एक ही code को देखकर भी 4 लोग अलग-अलग risk, value, और priority पकड़ते हैं। यही review team का सार है।
क्या जोड़ा गया है (3 नई skills, non-invasive)
मौजूदा revfactory/harness में कोई बदलाव किए बिना, description keyword के आधार पर auto-trigger branching:
korean-persona-search— Parquet predicate pushdown multi-axis filter (job role, region, age, education, generation) + diversity samplingkorean-voice-adapter— formal/informal speech matrix + कोरियाई workplace culture (reporting line, meeting manners, indirect expressions) + 13 industries की vocabulary dictionarykorean-persona-harness— meta orchestrator (5 sub-agents pipeline: scenario analyst → persona curator → speech adapter → agent builder → diversity QA)
Claude Code और Codex CLI दोनों के साथ compatible — SKILL.md format समान, dataset cache shared।
verification — वही LLM, वही task, वही length (102 lines vs 103 lines)
5-सदस्यीय team की weekly standup meeting minutes simulation। domain accuracy बराबर है। फ़र्क perspective diversity में दिखता है।
सामान्य harness परिणाम:
- voice identifiability: कम (5 लोगों का tone लगभग समान)
- कोरियाई workplace manners: बहुत कम
- mutual response, encouragement, gratitude: 0 बार
- request/confirm tone: 5 बार
- personal circumstances disclosure: 0 मामले
korean-persona-harness परिणाम:
- voice identifiability: बहुत अधिक (नाम छिपाकर भी पहचाना जा सकता है)
- कोरियाई workplace manners: समृद्ध (direct assertion से बचाव, mentoring, confirm tone)
- mutual response, encouragement, gratitude: 4 बार
- request/confirm tone: 11 बार
- personal circumstances disclosure: 2 मामले (family schedule, authority appeal)
सिर्फ Run B में दिखे मानवीय details:
backend (दो बच्चों के पिता): "अगले हफ़्ते मेरा बच्चों का schedule थोड़ा रहेगा, तो क्या rotation को एक बार पहले से व्यवस्थित कर लें?"
- कोरियाई workplace manners: बहुत कम
- कोरियाई workplace manners: बहुत कम
- mutual response, encouragement, gratitude: 0 बार
- request/confirm tone: 5 बार
- personal circumstances disclosure: 0 मामले
korean-persona-harness परिणाम:
- voice identifiability: बहुत अधिक (नाम छिपाकर भी पहचाना जा सकता है)
- कोरियाई workplace manners: समृद्ध (direct assertion से बचाव, mentoring, confirm tone)
- mutual response, encouragement, gratitude: 4 बार
- request/confirm tone: 11 बार
- personal circumstances disclosure: 2 मामले (family schedule, authority appeal)
सिर्फ Run B में दिखे मानवीय details:
backend (दो बच्चों के पिता): "अगले हफ़्ते मेरा बच्चों का schedule थोड़ा रहेगा, तो क्या rotation को एक बार पहले से व्यवस्थित कर लें?"
team lead (45) → marketer (24): "जब metrics spike हुए तब cause hypothesis जल्दी बनाने का approach, ऐसे ही जारी रखिए।"
marketer: "आह, धन्यवाद team lead!"
team lead: "लेकिन हमारी तरफ़ retry policy बहुत आक्रामक तरीके से काम कर रही थी, इसलिए outage कुछ हद तक बढ़ा होने के संकेत हैं। अंतिम निष्कर्ष मैं RCA final version में ही दूँगा।"
→ family, generation, और job-role personas स्वाभाविक रूप से utterances में जुड़ते हैं। यह सिर्फ अमूर्त "stability first" नहीं है, बल्कि क्यों यह व्यक्ति यह priority रखता है वह उसके व्यवहार में दिखता है।
value matrix — कहाँ उपयोगी हो सकता है
- code review (5 लोगों के अलग नज़रिए) → बहुत अधिक
- virtual user interview simulation → बहुत अधिक
- कोरियाई users के लिए marketing copy review → बहुत अधिक
- UX research और persona workshop → अधिक
- meeting minutes और collaboration simulation → अधिक
- RFC और technical documents → मध्यम
- infra और architecture design → कम (
harnessbase version अधिक उपयुक्त)
installation (1 line)
Claude Code:
/plugin marketplace add hongsw/harness
/plugin install harness@harness
Codex CLI:
python3 ~/.codex/skills/.system/skill-installer/scripts/install-skill-from-github.py \
--repo hongsw/harness \
--path skills/korean-persona-search \
--path skills/korean-voice-adapter \
--path skills/korean-persona-harness
dataset cache (दोनों runtimes में shared):
pip install huggingface_hub pyarrow
python3 $SKILL_DIR/korean-persona-search/scripts/download.py
⚠️ सावधानी: मौजूदा revfactory/harness installer में marketplace और plugin नाम समान हैं, इसलिए 4-step migration की ज़रूरत है:
/plugin uninstall harness@harness
/plugin marketplace remove harness-marketplace
/plugin marketplace add hongsw/harness
/plugin install harness@harness
links
- fork repo: github.com/hongsw/harness
- upstream PR #9 (merge की प्रतीक्षा में): github.com/revfactory/harness/pull/9
- verification outputs: _workspace/comparison_test
- dataset: huggingface.co/.../Nemotron-Personas-Korea (CC BY 4.0)
- original Harness: github.com/revfactory/harness
1 टिप्पणियां
दिलचस्प है haha हम भी इसी तरह के क्षेत्र में लेकिन एक अलग path पर काम कर रहे हैं — यह ClawSouls (clawsouls.ai) नाम का एक persona storage registry और sharing platform है। एक बार रजिस्टर किया गया persona, OpenClaw, Claude Code, Cursor, Hermes Agent जैसे agent platforms पर
npm clawsoulsपैकेज के जरिए लागू किया जा सकता है। अगर आप इसे एक बार पोस्ट कर दें तो आभारी रहेंगे। इस platform का GeekNews पर पहले भी परिचय कराया जा चुका है। Show GN: ClawSouls – AI एजेंट persona को एक लाइन में बदलने वाली open registry यदि आप collaboration चाहते हैं तो कृपया संपर्क करें^^ ( contact@clawsouls.ai )