इन दिनों AI coding agent टूल्स की बाढ़ आई हुई है, और parallel agent के ज़रिए एक साथ कई फ़ाइलें बदलने का तरीका काफ़ी लोकप्रिय है। लेकिन इसे खुद इस्तेमाल करके एक बात जल्दी समझ में आती है — नतीजा अक्सर बिखरा हुआ होता है.
एजेंट बिना किसी योजना के कोड उगल देता है, modules के बीच consistency टूट जाती है, और वही गलतियाँ हर session में दोहराई जाती हैं। सिर्फ़ "तेज़ी से ज़्यादा generate करना" हमेशा अच्छी बात नहीं होती। generation speed चाहे कितनी भी तेज़ हो, अगर बाद में इंसान को उसे संभालने में ज़्यादा समय लग जाए तो उसका फ़ायदा नहीं है।
इसलिए मैंने approach बदला। अगर agent की speed को जानबूझकर थोड़ा धीमा किया जाए, लेकिन structure को सख्ती से लागू किया जाए, तो क्या final quality बेहतर होगी?
मैंने Pi coding agent (@mariozechner/pi-coding-agent) के लिए एक workflow extension बनाया, और इसका core यह है कि agent पर 6-step development cycle लागू किया जाए:
📝 Plan → 🔍 Verify Plan → 🔨 Implement → ✅ Verify Impl → 🧠 Compound → 🎉 Done

  1. चरण-दर-चरण tools block करना
    Implement चरण के अलावा file editing tools पूरी तरह block रहते हैं। rm, mv, sed -i जैसे bash commands भी read-only चरण में block किए जाते हैं। यानी AI के लिए योजना बनाने से पहले कोड को छूना ही असंभव है।
  2. parallel multi-model adversarial verification
    योजना और implementation के नतीजों को कई LLMs एक साथ verify करते हैं। यह सिर्फ़ साधारण code review नहीं है, बल्कि कोड को तोड़ने वाले ठोस scenarios बनाकर उस पर हमला करने जैसा तरीका है। severity को 🔴 CRITICAL / 🟡 WARNING / 🔵 INFO में classify किया जाता है, और अगर एक भी CRITICAL हो तो वह चरण pass नहीं कर सकता।
  3. Compound learning & project memory
    हर cycle के खत्म होने पर patterns, mistakes (gotchas), और architecture decisions अपने-आप दर्ज हो जाते हैं। यह memory .pi/workflow-memory.json में save होती है, इसलिए session बदलने पर भी बनी रहती है। यानी "कल इस हिस्से में जो गलती हुई थी, उसे आज फिर न दोहराएँ" जैसी चीज़ें संभव हो जाती हैं।
  4. Repo Map (AST + PageRank)
    web-tree-sitter से पूरे project के symbols (functions, classes, interfaces आदि) निकाले जाते हैं, import graph बनाया जाता है, और PageRank के ज़रिए हर file की importance तय की जाती है। token budget (default 2048) के भीतर project structure समझा जा सकता है, इसलिए agent "यह project कैसे बना है" यह समझकर काम करता है। यह 18 languages को support करता है।
    अन्य विशेषताएँ
  • TODO system — बड़े tasks को TODO units में तोड़ना, और हर TODO के लिए Implement → Verify → Compound cycle को स्वतंत्र रूप से चलाना
  • Git automation — हर TODO boundary पर auto commit/push, और अगर tree dirty हो तो पहले cleanup को मजबूर करना
  • custom checks — docs/checks/ में Markdown files रखकर project-specific verification criteria जोड़े जा सकते हैं
  • context management — हमेशा inject होने वाले minimum context और ज़रूरत पड़ने पर खोजे जाने वाले on-demand context को अलग रखकर token waste कम करना
    दर्शन
    मेरा कहना यह नहीं है कि parallel agents बुरे हैं। लेकिन बिना structure के parallel generation, मेरी नज़र में, parallel तरीके से technical debt बनाने जैसा है। यह extension इस विचार से शुरू हुआ कि "AI से काम करवाएँ, लेकिन उसी तरह की discipline लागू करें जैसी इंसान काम करते समय अपनाते हैं।"
    यह 100% TypeScript में लिखा गया है, और npm install + एक symlink से install हो जाता है।
    GitHub: https://github.com/popododo0720/pi-stuff
    फ़ीडबैक का स्वागत है!

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.