मल्टी-एजेंट orchestration आखिर ठीक से काम क्यों नहीं करता?
(shalomeir.substack.com)हाल ही में AI के ज़रिए “zero human company” चलाने में सक्षम बनाने वाला ‘Paperclip’ प्रोजेक्ट चर्चा में रहा। इसमें एजेंटों को कंपनी के संगठन-चार्ट की तरह व्यवस्थित करके CEO, टीम लीड, और कार्यकारी सदस्यों जैसी भूमिकाएँ दी जाती हैं, और कंपनी का मिशन व विस्तृत प्रोजेक्ट्स परिभाषित कर दिए जाएँ तो वे अपने-आप काम शुरू कर देते हैं। इसने सिर्फ एक महीने में GitHub पर 40,000 stars पार कर लिए।
इससे पहले इसी तरह के अप्रोच के साथ एजेंटों को एक "city" के रूपक में रखने वाला Gastown भी था, Anthropic का Claude Code Agent Teams भी, और Cursor के cloud agents भी — यानी पूरे इंडस्ट्री में "कई एजेंटों को किसी संगठन की तरह चलाएँ" वाली दिशा साफ़ दिखाई दे रही है।
मैं भी इस ट्रेंड को लेकर अपनी जिज्ञासा रोक नहीं पाया और Gastown व Paperclip दोनों इस्तेमाल करके देखे। API token cost के हिसाब से देखें तो मैंने लगभग $5,000 खर्च कर दिए। 🫠
सीधे निष्कर्ष पर आऊँ तो, कुछ ऐसे क्षेत्र ज़रूर थे जहाँ इनका असर साफ़ दिखा, लेकिन उनकी सीमाएँ उससे कहीं ज़्यादा स्पष्ट थीं।
Token cost एक single agent की तुलना में 5~10 गुना तक बढ़ जाती है, लेकिन productivity उसी अनुपात में नहीं बढ़ती। एजेंट बार-बार context खो देते थे, handoff बीच में टूट जाता था, या गलत नतीजों को खुद ही "completed" मानकर बंद कर देते थे। इसलिए मैंने अपने अनुभव की समस्याएँ और उनसे मिली insights को इस तरह व्यवस्थित किया है:
→ मल्टी-एजेंट orchestration की 3 संरचनात्मक bottlenecks
→ "city" या "company" वाला रूपक आखिर क्यों ठीक से काम नहीं करता
→ व्यवहारिक इस्तेमाल में कौन-सी संरचना ज़्यादा robust रहती है
→ अपने काम में agent delegation के लिए उपयुक्त क्षेत्रों की पहचान करने के 5 मानदंड और scoring
उम्मीद है कि agent के इस दौर में "क्या सौंपना चाहिए, और क्या नहीं सौंपना चाहिए" इस सवाल पर सोच रहे लोगों के लिए यह उपयोगी होगा।
अभी कोई टिप्पणी नहीं है.