AI एजेंट वास्तव में कितनी स्वायत्तता से काम कर रहे हैं
- Anthropic ने Claude Code के लाखों इंटरैक्शन का विश्लेषण करके यह मापा कि AI एजेंट वास्तव में कितना काम संभाल रहे हैं.
- इस शोध का केंद्र मॉडल का प्रदर्शन नहीं, बल्कि मनुष्यों ने कितनी स्वायत्तता सौंपी यह था.
- अधिकांश कार्य छोटे होते हैं, लेकिन सबसे लंबे स्वायत्त कार्य समय 3 महीनों में 25 मिनट → 45 मिनट से अधिक तक बढ़ गए.
- दिलचस्प बात यह है कि यह बदलाव मॉडल अपग्रेड की बजाय उपयोगकर्ताओं के भरोसे के संचय से आया.
- अनुभवी उपयोगकर्ता auto-approval अनुपात बढ़ाते हुए भी ज़रूरत पड़ने पर बीच में हस्तक्षेप करने वाले 'monitoring approach' में अपनी supervision रणनीति बदलते हैं.
- साथ ही AI खुद भी अनिश्चित होने पर सवाल पूछने या रुकने जैसे self-control mechanism दिखाता है.
- वर्तमान में एजेंट उपयोग का आधा हिस्सा software development क्षेत्र में केंद्रित है.
- अंततः AI एजेंट की स्वायत्तता मॉडल प्रदर्शन से अधिक भरोसे, संगठनात्मक संस्कृति और टूल संरचना से तय होती है.
अभी कोई टिप्पणी नहीं है.