- Software engineering पूरे AI एजेंट tool calls का लगभग 50% हिस्सा लेता है, जबकि healthcare, legal, finance जैसे 16 verticals में से हर एक 5% से भी कम पर है
- AI models की वास्तविक क्षमता इंसानों के 5 घंटे वाले काम करने तक पहुँच चुकी है, लेकिन वास्तविक उपयोग में 99.9th percentile sessions केवल लगभग 42 मिनट तक ही रहते हैं, जिससे क्षमता और भरोसे के बीच बड़ा अंतर दिखता है
- जैसे-जैसे user experience बढ़ता है, auto-approval rate 20% से बढ़कर 40%+ हो जाती है, और साथ ही अनुभवी users pre-approval की बजाय active monitoring वाले supervision model पर शिफ्ट होते हैं
- Vertical AI का मूल है proprietary data integration, domain-specific context engineering, customer change management, और यही साधारण wrapper और defensible company के बीच फ़र्क तय करता है
- जैसे SaaS ने पिछले कुछ दशकों में 170+ unicorns दिए, वैसे ही हर SaaS unicorn के सामने एक vertical AI unicorn उभर सकता है, और AI version सिर्फ software नहीं बल्कि operators को भी replace कर सकता है
Software engineering ने AI एजेंट activity का आधा हिस्सा घेरा
- Anthropic की AI एजेंट के वास्तविक उपयोग पर प्रकाशित research के अनुसार, software engineering पूरे agentic tool calls का 49.7% हिस्सा है
- Healthcare केवल 1%, legal 0.9%, education 1.8% पर है, और 16 verticals में कोई भी क्षेत्र 9% से ऊपर नहीं है
- इसका मतलब यह नहीं कि बाज़ार saturated है, बल्कि यह अभी बना ही नहीं है
- Han Wang ने इसे “ज़्यादातर founders द्वारा नज़रअंदाज़ किया गया greenfield opportunity” कहा
- इस लेख के लेखक Garry Tan ने कहा, “अगर मैं अभी startup शुरू करता, तो इस chart के लाल हिस्से पर ध्यान देता”
Deployment overhang
- METR evaluation के अनुसार Claude models इंसानों के 5 घंटे लगने वाले काम कर सकते हैं, लेकिन वास्तविक sessions औसतन केवल 42 मिनट तक रहते हैं
- AI क्या कर सकता है और users उसे क्या करने देते हैं, इस अंतर में एक बहुत बड़ा अवसर छिपा है
- 2025 के अक्टूबर से 2026 के जनवरी के बीच 99.9th percentile turn duration 25 मिनट से कम से बढ़कर 45 मिनट+ तक लगभग दोगुनी हो गई
- यह सिर्फ model performance के बेहतर होने से नहीं, बल्कि users द्वारा हर session के साथ trust build करने का भी परिणाम है
- Internal data में Claude Code की success rate दोगुनी हुई, और प्रति session human interventions 5.4 से घटकर 3.3 रह गए
- Model की क्षमता काफ़ी है, लेकिन deployment पीछे है, और यही एक नया product opportunity है
भरोसा कैसे विकसित होता है
- नए users Claude Code sessions के केवल 20% को auto-approve करते हैं, लेकिन 750 sessions के अनुभव के बाद 40%+ users full auto-approval पर चले जाते हैं
- उल्टा लगने वाली बात यह है कि अनुभवी users कम नहीं बल्कि ज़्यादा intervene करते हैं — नए users का intervention rate 5%, अनुभवी users का 9%
- यह विरोधाभास नहीं बल्कि oversight strategy का बदलाव है: शुरुआती users हर step को पहले approve करते हैं, जबकि अनुभवी users delegate करके समस्या आने पर intervene करते हैं (pre-approval → active monitoring)
- Safety से जुड़ी खोज: complex tasks में Claude Code, इंसानों के intervene करने की तुलना में दो गुना से भी अधिक बार clarification questions पूछता है
- यानी एजेंट बिना सोचे-समझे आगे नहीं बढ़ता, बल्कि अनिश्चित होने पर खुद रुकता है
- Anthropic का मुख्य सबक: एजेंट को वास्तव में मिलने वाली autonomy model, user, और product मिलकर बनाते हैं
Aaron Levie का vertical AI playbook
- Aaron Levie के अनुसार vertical AI बनाने का फ़ॉर्मूला:
- हर industry के unique data, workflows, और regulatory barriers को समझना एक defensible company की कुंजी है
- सिर्फ wrapper नहीं, बल्कि unique data integration, workflow automation, और change management की क्षमता चाहिए
- Proprietary data से जुड़ा agentic software बनाना
- software को इस तरह डिज़ाइन करना कि वह वास्तविक लोगों और समस्याओं के लिए काम करे
- domain-specific context engineering के ज़रिए output intelligence को अधिकतम करना
- वह हिस्सा जिसे ज़्यादातर founders चूक जाते हैं: customers के लिए change management को आगे बढ़ाना
- Vertical AI defensible क्यों है: wrapper कोई भी बना सकता है, लेकिन healthcare billing, legal discovery, construction permits जैसे specific workflows, regulatory constraints, और organizational friction को नेविगेट करने वाले बहुत कम हैं
- SaaS ने दशकों तक हर 10 साल में 10x growth दिखाई, पिछले 20 वर्षों में VC निवेश का 40%+ SaaS में गया, और 170+ SaaS unicorns बने
- मुख्य thesis: हर SaaS unicorn के सामने एक vertical AI unicorn हो सकता है, और AI version सिर्फ software ही नहीं बल्कि operators को भी replace कर सकता है, इसलिए वह 10x बड़ा हो सकता है
Co-construction insight और policy implications
- Anthropic की मुख्य खोज:
- autonomy model की innate property नहीं है, बल्कि model, user, और product मिलकर इसे बनाते हैं
- इसलिए pre-deployment evaluation से इसे पूरी तरह पकड़ना संभव नहीं, real-world measurement ज़रूरी है
- Safety metrics: 73% tool calls में human intervention था, और केवल 0.8% को irreversible actions के रूप में वर्गीकृत किया गया
- सबसे जोखिमभरे deployments (API key leakage, autonomous crypto trading आदि) ज़्यादातर security evaluations थे, वास्तविक production नहीं
- “हर action को approve करो” जैसी policy, safety बढ़ाए बिना सिर्फ productivity घटाती है
इंसान monitor और intervene कर सकें, यह सुनिश्चित करना बेहतर policy goal है
यूनिकॉर्न कहाँ छिपे हैं
- Software engineering क्षेत्र में पहले ही काफ़ी बढ़त बन चुकी है, जबकि healthcare, legal, finance, education, customer service, logistics जैसे
single-digit market share वाले 16 verticals अब भी किसी ऐसे खिलाड़ी का इंतज़ार कर रहे हैं जो domain expertise को agents में embed करे
- पहले 300 SaaS unicorns बने थे, अगला दौर 300 vertical AI unicorns का हो सकता है
- जो founders किसी vertical को चुनेंगे, domain expertise को agents में embed करेंगे, और change management सुलझाएँगे, वही अगले 10 साल के enterprise software पर कब्ज़ा करेंगे
- Models पहले से 5 घंटे तक काम कर सकते हैं, लेकिन users उन्हें केवल 42 मिनट की अनुमति देते हैं
- यह दिखाता है कि हम AI adoption के शुरुआती चरण में हैं
- और यह भी कि अब भी बहुत से ऐसे क्षेत्र हैं जहाँ एक मिनट की intelligence भी लागू नहीं हुई है
अभी कोई टिप्पणी नहीं है.