AI एजेंट अपनाने में सबसे बड़ा bottleneck प्रदर्शन नहीं, भरोसा (feat. समय) है.

AI एजेंट वास्तव में कितनी स्वायत्तता से काम कर रहे हैं

Anthropic ने Claude Code के लाखों इंटरैक्शन का विश्लेषण करके यह मापा कि AI एजेंट वास्तव में कितना काम संभाल रहे हैं.
इस शोध का केंद्र मॉडल का प्रदर्शन नहीं, बल्कि मनुष्यों ने कितनी स्वायत्तता सौंपी यह था.
अधिकांश कार्य छोटे होते हैं, लेकिन सबसे लंबे स्वायत्त कार्य समय 3 महीनों में 25 मिनट → 45 मिनट से अधिक तक बढ़ गए.
दिलचस्प बात यह है कि यह बदलाव मॉडल अपग्रेड की बजाय उपयोगकर्ताओं के भरोसे के संचय से आया.
अनुभवी उपयोगकर्ता auto-approval अनुपात बढ़ाते हुए भी ज़रूरत पड़ने पर बीच में हस्तक्षेप करने वाले 'monitoring approach' में अपनी supervision रणनीति बदलते हैं.
साथ ही AI खुद भी अनिश्चित होने पर सवाल पूछने या रुकने जैसे self-control mechanism दिखाता है.
वर्तमान में एजेंट उपयोग का आधा हिस्सा software development क्षेत्र में केंद्रित है.
अंततः AI एजेंट की स्वायत्तता मॉडल प्रदर्शन से अधिक भरोसे, संगठनात्मक संस्कृति और टूल संरचना से तय होती है.

AI एजेंट अपनाने में सबसे बड़ा bottleneck प्रदर्शन नहीं, भरोसा (feat. समय) है.

AI एजेंट वास्तव में कितनी स्वायत्तता से काम कर रहे हैं

संबंधित पढ़ाई

1 टिप्पणियां