AI एजेंट वास्तव में कितनी स्वायत्तता से काम कर रहे हैं

  • Anthropic ने Claude Code के लाखों इंटरैक्शन का विश्लेषण करके यह मापा कि AI एजेंट वास्तव में कितना काम संभाल रहे हैं.
  • इस शोध का केंद्र मॉडल का प्रदर्शन नहीं, बल्कि मनुष्यों ने कितनी स्वायत्तता सौंपी यह था.
  • अधिकांश कार्य छोटे होते हैं, लेकिन सबसे लंबे स्वायत्त कार्य समय 3 महीनों में 25 मिनट → 45 मिनट से अधिक तक बढ़ गए.
  • दिलचस्प बात यह है कि यह बदलाव मॉडल अपग्रेड की बजाय उपयोगकर्ताओं के भरोसे के संचय से आया.
  • अनुभवी उपयोगकर्ता auto-approval अनुपात बढ़ाते हुए भी ज़रूरत पड़ने पर बीच में हस्तक्षेप करने वाले 'monitoring approach' में अपनी supervision रणनीति बदलते हैं.
  • साथ ही AI खुद भी अनिश्चित होने पर सवाल पूछने या रुकने जैसे self-control mechanism दिखाता है.
  • वर्तमान में एजेंट उपयोग का आधा हिस्सा software development क्षेत्र में केंद्रित है.
  • अंततः AI एजेंट की स्वायत्तता मॉडल प्रदर्शन से अधिक भरोसे, संगठनात्मक संस्कृति और टूल संरचना से तय होती है.

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.