# AI foundation model Big Tech के नए युद्धक्षेत्र की नींव रख रहे हैं
- हर तकनीकी बदलाव बुनियादी (foundation) लेयर पर नियंत्रण की दौड़ को जन्म देता है। AI युग भी इसका अपवाद नहीं है
- foundation model डाउनस्ट्रीम AI applications और tools को आगे बढ़ाने वाला नया "oil" हैं
- 2023 में foundation model कंपनियों ने AI venture funding का 60% से अधिक हिस्सा लिया
- OpenAI, Anthropic, Mistral, Cohere आदि ने 124 अरब डॉलर के market cap पर 23 अरब डॉलर जुटाए
- खास तौर पर यह पूंजी प्रवाह मुख्यतः corporate VC द्वारा संचालित था; Morgan Stanley के अनुसार, 2023 में private GenAI fundraising का 90% इसी से आया (2022 के 40% से बढ़कर)
- Microsoft, Google, Amazon, NVIDIA, Oracle जैसी Big Tech कंपनियां अब foundation model कंपनियों में महत्वपूर्ण हिस्सेदारी रखती हैं
- इन निवेशों को रणनीतिक रूप से इस तरह समायोजित किया जा रहा है कि इन टेक दिग्गजों की AI क्षमताएं मजबूत हों और core cloud व computing services की खपत बढ़े
- इसके अलावा, कुछ Big Tech कंपनियां Google के Gemini और Meta AI के Llama जैसी अपनी foundation model initiatives भी चला रही हैं
- इस बुनियादी लेयर में भारी पूंजी आने से प्रतिस्पर्धा अभूतपूर्व गति से तेज हुई है, जो ecosystem में बड़े पैमाने पर innovation को आगे बढ़ा रही है
- 2023 में देखे गए प्रमुख ट्रेंड:
- base model तेजी से बेहतर हो रहे हैं:
- general-purpose LLM न सिर्फ accuracy और latency जैसी बुनियादी performance capabilities में, बल्कि multimodal capabilities सहित frontier पर भी लगातार बेहतर हो रहे हैं
- GPT-4o की release ने हम सभी को चौंका दिया, और नई release ने uploaded files से video और audio को देखकर और समझकर, साथ ही short video generate करने की क्षमता दिखाई
- model improvements की चकरा देने वाली रफ्तार इस बात पर सवाल उठाती है कि कुछ महीनों की half-life वाले models में investment strategy कैसी होनी चाहिए
- open source और closed source के बीच लड़ाई तेज हो रही है:
- Llama 3 की हालिया release के साथ, open source leaders closed source models की performance के लगभग बराबर पहुंच गए हैं, इसलिए open source बनाम closed source बहस 2024 में भी गर्म मुद्दा बनी हुई है
- regulatory प्रभावों के कारण नए सवाल उठ रहे हैं कि क्या closed-source players को नई commercialization strategy के हिस्से के रूप में अपने पुराने models खोलने पड़ेंगे, या open source leaders इतिहास में पहली बार इस बाजार के विजेता बन सकते हैं
- छोटे models की लहर बढ़ रही है:
- HuggingFace के CEO और co-founder Clem Delangue ने घोषणा की कि 2024 SLM का साल होगा
- इस साल जारी Mistral 8x22b जैसे उदाहरण दिखाते हैं कि बड़े model performance के मामले में हमेशा बेहतर नहीं होते, और छोटे models cost व latency में महत्वपूर्ण फायदे दे सकते हैं
- नई architectures और special-purpose foundation models का उदय:
- transformer से आगे जाने वाली नई model architectures के उभरने को लेकर उत्साह है
- उदाहरण के लिए state space models और geometric deep learning ऐसे foundation models की frontier को आगे बढ़ा रहे हैं जो कम compute-intensive हों, लंबा context संभाल सकें, या structured reasoning दिखा सकें
- साथ ही code generation, biology, video, image, speech, robotics, music, physics, brain waves आदि के लिए विशेष उद्देश्य वाले models को train करने वाली teams की संख्या भी तेज़ी से बढ़ रही है
- इससे model layer में विविधता का एक और vector जुड़ता है
- base model तेजी से बेहतर हो रहे हैं:
- foundation layer में इतना कुछ हो रहा है कि मानो जमीन खिसक रही हो
- लेकिन यहां लगाए गए भारी धन के बावजूद अभी विजेता स्पष्ट नहीं है
पूर्वानुमान: AI model की लड़ाई निकट भविष्य में भी गर्म बनी रहेगी। क्योंकि यह एक महत्वपूर्ण "land grab" है जो तय करेगी कि आने वाले वर्षों में cloud और computing बाजार में कौन-सी Big Tech कंपनी शीर्ष पर होगी
- इस model layer की लड़ाई में कौन सबसे अधिक value हासिल करेगा, इस पर निकट-भविष्य की संभावित वास्तविकताएं:
- वास्तविकता 1: model layer commodity बन जाएगी
- क्या VC और Big Tech द्वारा AI leader derby को sponsor करने में लगाए गए सैकड़ों मिलियन डॉलर बेकार चले जाएंगे?
- इसका मतलब यह नहीं कि सबसे अधिक पूंजी वाला model ही विजेता होगा
- क्योंकि open source models लगातार प्रमुख बाजार खिलाड़ियों को चुनौती दे रहे हैं
- लेकिन AI models के commodity बन जाने वाले भविष्य का यह मतलब भी नहीं कि models की value घट जाएगी
- commodity के रूप में AI models, computing या oil जैसी commodity के समान होंगे
- एक दिन वे global business operations के लिए अनिवार्य asset बन जाएंगे
- इस वास्तविकता में AI ecosystem की अंतिम value model खुद नहीं, बल्कि computing और cloud service providers, marketplaces और applications द्वारा capture की जाएगी
- हालांकि, AI models के commodity बनने वाली दुनिया में, oil market की तरह, ऐसे एक-दो बेहद मूल्यवान व्यवसाय उभर सकते हैं जो इस "commodity" को बेचें
- वास्तविकता 2: AI model दिग्गज आर्थिक हिस्सेदारी बांट लेंगे
- cloud war की तरह, Big Tech strategic investors या corporate VC के भारी समर्थन वाली कुछ उल्लेखनीय नई model कंपनियां foundation model ecosystem पर कब्जा करेंगी और दिग्गज बनेंगी
- हर विजेता ऐसा अलग wedge खोजेगा जिसे वह distribution, pricing/cost efficiency, regulatory influence आदि के साथ तकनीकी भिन्नता में बदल सके
- फिर भी कई खिलाड़ी मौजूद रह सकते हैं, खासकर open source, लेकिन value शीर्ष कुछ model players के पास जाएगी
- कल के AI दिग्गजों का फैसला सिर्फ बेहतर technology नहीं, बल्कि उनके स्थापित distribution channels भी करेंगे
- वास्तविकता 3: AI models आलू के चिप्स के बाजार जितने विविध और लोकप्रिय हो जाएंगे
- जैसे आलू के चिप्स में अनगिनत flavors होते हैं, वैसे ही AI model economy का भविष्य भी स्थानीय किराना स्टोर के snack corner जैसा दिख सकता है
- कई model कंपनियां फल-फूल सकती हैं, क्योंकि use cases इतने अलग-अलग हैं कि अन्य model कंपनियों के टिके रहने के लिए पर्याप्त differentiation मौजूद है (जैसे form factor, performance, latency, cost, security आदि)
- इसके अलावा, जब geopolitical considerations AI model क्षेत्र में प्रवेश करते हैं, तो geography और regulation भी यहां भूमिका निभा सकते हैं, क्योंकि regulatory और sovereignty से जुड़ी चिंताएं इस layer में विविधता के प्रसार का समर्थन करती हैं
- वास्तविकता 1: model layer commodity बन जाएगी
पूर्वानुमान: अभी सहमति नहीं बनी है, लेकिन हमारी partnership के लगभग आधे लोगों का मानना है कि closed-source models LLM computing cycles के अधिकांश हिस्से को चलाएंगे, और AI model giants अंततः आर्थिक हिस्सेदारी बांट लेंगे (ऊपर की वास्तविकता #2)।
- हमें उम्मीद है कि cloud giants compute, chips और capital तक अपनी पहुंच का इस्तेमाल कर इस लड़ाई को अपने पक्ष में मोड़ेंगे
- और frontrunners पहले ही दौड़ में उतर चुके हैं
- Microsoft/OpenAI, AWS/Anthropic, Google/Gemini, और Meta/Llama, यूरोपीय leader Mistral सहित, Linux के समकक्ष OSS alternatives हैं
# AI हम सभी को 10x developer बना रहा है
- आज का engineer हमेशा builder और student दोनों होता है; उसे अपनी मुख्य नौकरी के साथ-साथ नई languages, frameworks, infrastructure आदि लगातार सीखते रहना पड़ता है
- AI के आगमन के साथ, developers को लगातार बदलते LLM का उपयोग करने के लिए पूरी तरह नया toolchain और best practices सीखनी पड़ रही हैं, जिनमें data management, curation, prompts, pre-training और fine-tuning के लिए नई infrastructure products की पूरी श्रृंखला शामिल है
- AI युग में हर साल 10 साल के बराबर नया developer knowledge तेजी से सीखना पड़ता है
- लेकिन AI इस जटिलता का समाधान भी दे सकता है
- 2023 में code copilots का व्यापक रूप से adoption हुआ,
- और 2024 की शुरुआत में agent tools के शुरुआती versions सामने आए, जो simple coding tasks के end-to-end automation की संभावना दिखाते हैं
पूर्वानुमान: AI की वजह से developer की भूमिका किसी भी अन्य पेशे की तुलना में सबसे तेज़ी से बदलेगी। 10 साल बाद computer रखने वाला हर व्यक्ति पर्याप्त development क्षमता रखेगा, और इसके परिणामस्वरूप software development की रफ्तार नाटकीय रूप से बढ़ेगी और tech startup founders की औसत उम्र काफी कम हो जाएगी।
- AI developer economy के तेज़ी से विकास को आगे बढ़ाने वाले तीन प्रमुख क्षेत्र:
- 1. code copilot उद्योग innovation और competition का केंद्र बन गया है, और 2023 में GenAI technologies और tools में VC funding के 3.9 अरब डॉलर निवेश किए गए।
- Github का मौजूदा Copilot product, OpenAI के GPT-4 और Codex models पर आधारित, 1.4 करोड़ से अधिक बार install किया जा चुका है
- Tabnine, Magic.dev, Augment, Poolside, Cursor AI, OpenDevin, Cognition's Devin, Supermaven जैसे कई अच्छी funding पाने वाले और तेज़ी से बढ़ते startup competitors developers के साथ मिलकर build और iterate कर रहे हैं
- 2. agentic search और generation capabilities को अंतर्निहित करने वाले copilot का "Graduation Motion" आने वाले वर्षों में बहुत बड़ा value create करेगा।
- Devin, SWE-agent, OpenDevin ऐसे end-to-end agent tools की क्षमता दिखाते हैं, जो developer environment (जैसे file editor, bash shell) और internet के साथ interact करके coding tasks पूरे करते हैं
- 3. code-language reasoning, AI activity का केंद्र बना रहेगा और model-layer innovation (जैसे GPT-4, Claude 3 Opus) तथा नए reasoning/agent paradigms (जैसे Cognition's Devin, SWE-agent, OpenDevin) दोनों से लाभान्वित होगा।
- model layer में सुधार code editing और completion की quality बढ़ाएंगे, जिससे अंततः developers और software organizations को value मिलेगी
- latency और context size की सीमाओं को आगे बढ़ाने वाले, और language domains/pre-training sets का विस्तार करने वाले systems भी developers को बहुत बड़ा value देंगे
- 1. code copilot उद्योग innovation और competition का केंद्र बन गया है, और 2023 में GenAI technologies और tools में VC funding के 3.9 अरब डॉलर निवेश किए गए।
- AI innovation और disruption दोनों को आगे बढ़ा रहा है, और developer speed, productivity तथा software organizations की leverage को तेज़ कर रहा है
- भविष्य-दृष्टि रखने वाली software organizations नियमित रूप से उभरते tools और vendors का आकलन कर रही हैं, और high-value developer software को तेज़ी से prioritize और adopt कर रही हैं
- developer budgets एक बार फिर खुल रहे हैं, और ऐसे tools के लिए भुगतान करने की इच्छा बढ़ रही है जो स्पष्ट असर दिखाते हैं
- developer entrepreneurs के लिए यह कुछ नया build करने का बेहद रोमांचक समय है। copilot के अलावा infrastructure, developer tools, QA, IT configuration और provisioning, security operations monitoring, penetration testing आदि में भी बहुत अवसर हैं
- copilot अभी सबसे स्पष्ट अवसर हो सकता है, लेकिन संभवतः यही सबसे अधिक प्रतिस्पर्धी क्षेत्र भी है
- security में SecOps से लेकर SRE, QA और pen testing तक, अधिक विशिष्ट developer domains में tools की तेज़ बढ़ोतरी देखी गई है
- ये tools LLM का उपयोग करके low-level complexity को abstract करते हैं और समय लेने वाले, कठिन engineering tasks को automate करते हैं, जिससे higher-level work के लिए engineering resources मुक्त होते हैं
- DevOps process में AI को integrate करने से CI/CD pipelines, automated testing और deployment strategies बेहतर होती हैं, जिससे software delivery तेज़ और अधिक reliable बनती है
- code refactoring developer workflow और ecosystem में AI के प्रभाव का एक और शानदार उदाहरण है
- कई आधुनिक engineering teams अपने FTE समय का केवल एक हिस्सा ही पूरी तरह नए code लिखने में लगाती हैं
- खासकर बड़े organizations में, SWE समय का बड़ा हिस्सा software engineering role के कम आकर्षक हिस्सों—जैसे code maintenance, security और testing—में जाता है
- code refactoring जैसे कई tasks के लिए stack की गहरी समझ चाहिए होती है और ये अक्सर senior engineers द्वारा डरते-डरते किए जाने वाले जटिल projects होते हैं
- AI में इन चुनौतियों को हल करने की स्पष्ट क्षमता है
- Gitar, Grit, ModelCode जैसे startups code generation models, static analysis और AST parsers का उपयोग करके code structure को समझते हैं और languages, package libraries तथा frameworks के बीच code migrate करते हैं
- इनमें से कुछ प्रयास modern web frameworks पर केंद्रित हैं, जबकि कुछ दूसरे fragile legacy engineering stacks (जैसे COBALT, PEARL आदि) पर काम करते हैं, जहाँ समय के साथ skilled engineers पुराने पड़ते जा रहे हैं
- core software engineering functions से जुड़े कई workflows भी समय लेने वाले, दोहरावदार और automation के लिए उपयुक्त हैं
> पूर्वानुमान: 2030 तक enterprise software developers में से अधिकांश की भूमिका software reviewer जैसी हो जाएगी। development cost घटने और experienced developers की productivity बढ़ने के साथ salaries बढ़ेंगी
- AI हर job market के दायरे और आवश्यक skills को प्रभावित करेगा, लेकिन शायद developers जितना किसी और पर नहीं
- AI improvements न केवल इस profession की productivity को बहुत बढ़ाएंगे, बल्कि developer world की सीमाओं का भी विस्तार करेंगे
- 10 साल बाद, development capability दुनिया की अधिकांश आबादी के लिए सुलभ skill बन जाएगी
# multimodal models और AI agents software के साथ इंसानों के संबंध को बदल देंगे
- multimodal models और AI agents का उभार AI innovation की अगली पीढ़ी को आगे बढ़ा रहा है
- शुरुआती text-based models की तुलना में, यह AI के संभावित उपयोग-क्षेत्र को कहीं अधिक व्यापक use cases तक नाटकीय रूप से बढ़ाता है
- AI entrepreneurs के लिए न सिर्फ agent workflows में, बल्कि voice, image और video जैसी नई modalities में भी innovation के नए अवसर पैदा हो रहे हैं
- ये modalities AI को vision, hearing और language जैसी मानव-समान क्षमताएँ देती हैं, जिससे उन मानवीय कार्यों के बड़े हिस्से को augment करने का अवसर खुलता है जो इन इंद्रियों पर निर्भर हैं
voice
- voice AI companies की पहली लहर मुख्य रूप से Automatic Speech Recognition(ASR) में प्रगति का लाभ उठा रही है
- Abridge डॉक्टर-रोगी बातचीत के notes रिकॉर्ड करता है
- Rillavoice field sales representatives और ग्राहकों के बीच हुई बातचीत को capture करता है ताकि sales training को support किया जा सके
- नई voice AI companies उभर रही हैं जो conversational voice products बना रही हैं, जो उबाऊ और दोहरावदार workflows को संभाल सकती हैं
- इससे sales, hiring, customer success और administrative use cases में इंसान अधिक मूल्यवान काम पर ध्यान दे सकते हैं
- Ada ने हाल की voice innovations का उपयोग करके अपने chat-based customer support product में conversational voice को integrate किया है
- इन प्रगतियों के पीछे नई voice architecture काम कर रही है
- यह speech को text में transcribe किए बिना raw audio data को process और reason कर सकती है
- GPT-4o जैसे नए models में दिखने वाली cascade architecture से voice-native architecture की ओर बदलाव
- यह बदलाव बहुत कम latency वाले conversational voice products को संभव बनाएगा, साथ ही emotion, tone और sentiment जैसी non-text जानकारी की कहीं बेहतर समझ भी देगा
- यह speech को text में transcribe किए बिना raw audio data को process और reason कर सकती है
- AI voice applications automobile dealerships, retail stores, restaurants, home services सहित कई industries में उभर रही हैं
- business hours के बाहर आने वाली inbound sales calls का बड़ा हिस्सा अक्सर छूट जाता है, और ऐसे मामलों में AI उस खाली जगह को भरने के लिए उपयुक्त है
- sales में AI voice applications बहुत उच्च ROI वाला use case हैं, क्योंकि AI मूल रूप से इन businesses के खोए हुए revenue को recover कर रहा है
- voice AI की अग्रिम पंक्ति में निर्माण कर रहे entrepreneurs अब पहले से कहीं अधिक natural, conversational और लगभग human-level performance देने वाले interfaces प्रदान कर सकते हैं
image / video
- computer vision models कई वर्षों से मौजूद हैं, लेकिन नई पीढ़ी के multimodal LLMs की दिलचस्प बात यह है कि वे image और text data (अन्य modalities के साथ) की समझ को जोड़ सकते हैं
- यह संयोजन कई tasks के लिए बेहद उपयोगी है
- enterprise image applications की शुरुआती लहर मुख्य रूप से data extraction use cases पर केंद्रित थी
- Raft जैसी companies shipping documents एकत्र करके, ग्राहकों के ERP में भरने और invoice reconciliation workflows को automate करने के लिए महत्वपूर्ण जानकारी निकालती हैं
- जैसे-जैसे foundation models में सुधार जारी रहेगा, उम्मीद है कि अधिक vertical-specific image और video processing applications सामने आएँगी, जो applications को input देने के लिए लगातार बढ़ती मात्रा में data एकत्र कर सकेंगी
- Flux.ai जैसे examples में engineering और design applications भी हैं, जो diagrams या building designs के renderings तैयार करने के लिए graphic data पर reasoning में मदद करने वाले vision models और image generation models का उपयोग करते हैं
autonomous AI agents
- AI के सबसे दिलचस्प नए विषयों में से एक AI agents का विकास है, जो जटिल बहु-चरणीय कार्यों को पूरी तरह स्वायत्त रूप से संभाल सकते हैं
- अधिकांश AI agents अभी भी जटिल use cases में भरोसेमंद तरीके से काम नहीं करते, लेकिन agent workflows में प्रगति बहुत तेज़ी से हो रही है, और हम इस बात की झलकें देख रहे हैं कि क्या संभव है
- Cognition AI का Devin (AI software engineer) दिखाता है कि AI की planning और reasoning क्षमताएँ लगातार बढ़ने के साथ क्या संभव हो सकता है
- अधिक applications अब बहुत सीमित use cases में AI agents लागू करना शुरू कर रही हैं, जहाँ बहु-चरणीय प्रक्रियाओं में compound errors के प्रभाव को सीमित किया जा सकता है
- कंपनियाँ Leena AI जैसे solutions का उपयोग करके IT, HR और finance से जुड़े कामों को support देने वाले AI agents उपलब्ध करा रही हैं, ताकि ये टीमें झंझटभरे कामों से मुक्त होकर employee experience बेहतर बना सकें
- साथ ही, ऐसे नए models भी उभर रहे हैं जिनमें मज़बूत reasoning capabilities हैं, ताकि agents अधिक जटिल workflows चला सकें
- इससे भी ज़्यादा दिलचस्प बात यह है कि chain-of-thought reasoning, self-reflection, tool use, planning और multi-agent collaboration जैसे विभिन्न तरीकों के ज़रिए agent implementation को बेहतर बनाने पर केंद्रित research सक्रिय रूप से की जा रही है
# Legacy SaaS से आगे निकलने की क्षमता दिखाने वाला Vertical AI
- Vertical SaaS ने खुद को पहले cloud revolution के दौरान industries को बदलने वाले hidden giant के रूप में साबित किया है
- अमेरिका में सूचीबद्ध शीर्ष 20 Vertical SaaS कंपनियों का कुल market cap लगभग $300 billion है, और इनमें से आधे से अधिक ने पिछले 10 वर्षों में IPO किया है
- अब large language models (LLM) के उभार के साथ Vertical SaaS की अगली लहर शुरू हो रही है, क्योंकि हम नई क्षमताओं और legacy Vertical SaaS की सीमाओं के पार जाने वाले industries को target करने वाली नई LLM-आधारित कंपनियों का जन्म देख रहे हैं
- Vertical AI applications उन उच्च-लागत, दोहराए जाने वाले, language-based tasks को target करती हैं, जो कई industries और अर्थव्यवस्था के बड़े हिस्से में फैले हुए हैं
- अमेरिकी श्रम सांख्यिकी ब्यूरो के अनुसार, business और professional services industry अमेरिका के GDP का 13% हिस्सा है
- केवल इस सेक्टर में, जहाँ repetitive language tasks प्रमुख हैं, इसका आकार software industry से लगभग 10 गुना है
- professional services से आगे भी, सभी industries में vertical repetitive language-based tasks का हिस्सा काफ़ी बड़ा है
- हमारा मानना है कि vertical AI इन लागतों के एक महत्वपूर्ण हिस्से पर कब्ज़ा करने के लिए प्रतिस्पर्धा करेगा, और उन क्षेत्रों में गतिविधि भी बढ़ाएगा जहाँ मानव श्रमबल की कमी रही है
- उदाहरण के लिए, EvenUp third-party legal services और in-house paralegal workflows को automate करता है, जिससे उन कार्यक्षेत्रों में नई संभावनाएँ खुलती हैं जहाँ पहले labor cost बहुत अधिक होने या consistency की कमी के कारण काम लागू करना मुश्किल था
पूर्वानुमान: Vertical AI service economy को आगे बढ़ाएगा और नए business models पेश करेगा, और Vertical AI का market cap मौजूदा Vertical SaaS के मुकाबले कम से कम 10 गुना होगा
Copilot, Autopilot और AI-supported services के तीन नए business models
- Vertical AI economy के तीन नए business models हैं Copilot, Autopilot और AI-supported services
- Vertical AI कई अन्य business models के ज़रिए भी उपलब्ध कराया जाएगा, जिससे AI capabilities को industry-specific ज़रूरतों के साथ बेहतर तरीके से align करने की संभावना बढ़ेगी
- Copilot
- LLM का उपयोग करके tasks को automate कर workers की efficiency बढ़ाता है
- Sixfold insurance underwriters को data बेहतर तरीके से analyze करने और risk को समझने में मदद करता है
- Copilot model में AI application उपयोगकर्ता के साथ-साथ बैठकर उसे अधिक सफल बनने में मदद करती है
- Agent
- जहाँ Copilot कर्मचारियों को अपना काम करने में मदद करता है, वहीं Agent workflow को पूरी तरह automate कर उपयोगकर्ता की जगह लेता है
- Agent vertical enterprise के भीतर outbound sales या inbound calls receive करने जैसे किसी specific function पर केंद्रित होता है
- Slang AI restaurants के inbound calls संभालता है और reservation लेना तथा सवालों के जवाब देना जैसे काम करता है
- AI-Enabled(आधारित) services
- वे services जो आमतौर पर accounting, legal services, medical billing आदि में third-party providers को outsource की जाती हैं
- चूँकि ये businesses labor-intensive होते हैं, इसलिए पारंपरिक रूप से इनका margin कम होता है, इन्हें scale करना कठिन होता है, और technology businesses की तुलना में इनमें differentiation कम और valuation भी कम होती है
- software का उपयोग कर tasks को automate करके, ये AI-enabled service कंपनियाँ बाज़ार में कम लागत पर, बेहतर और तेज़ services देने तथा मौजूदा service-oriented businesses का market share हासिल करने का लक्ष्य रखती हैं
- SmarterDx AI का उपयोग करके bills और उनसे जुड़े clinical documents को payers के पास भेजने से पहले healthcare systems और hospitals की ओर से inpatient claims का audit करता है
- पहले यह auditing काम vendors को outsource किया जाता था
Vertical AI business model की ताकत के शुरुआती संकेत
- हम (Bessemer) कई industries में legacy SaaS leaders का समर्थन करने का सौभाग्य रखते हैं, और अब हमारे पास सबसे बड़े Vertical AI portfolios में से एक है
- इसके परिणामस्वरूप, हमारे पास पहले से ही ऐसा meaningful data है जिसका उपयोग Vertical AI कंपनियों और legacy Vertical SaaS comparables की तुलना के लिए किया जा सकता है
- हमारे Vertical AI portfolio पर तीन analyses इस नए application class की ताकत दिखाते हैं
- Vertical AI players उन functions के साथ बाज़ार का नेतृत्व कर रहे हैं जो legacy SaaS से प्रतिस्पर्धा नहीं करते
- इन applications की उपयोगिता आम तौर पर legacy SaaS products को complement करने में है, न कि उन्हें replace/replicate करने में
- ये Vertical AI startups पहले ही पारंपरिक core Vertical SaaS systems के ACV का लगभग 80% हासिल कर चुके हैं
- यह साबित करता है कि Vertical AI, service spending को replace करके, vertical end markets के भीतर पर्याप्त spend पैदा कर सकता है और अंततः ऐसा TAM दे सकता है जो मौजूदा SaaS से कई गुना बड़ा हो
- meaningful scale ($4M ARR से अधिक) वाली Vertical AI कंपनियों की efficiency और growth profile भी उत्साहजनक है
- ये सालाना लगभग 400% की growth दिखा रही हैं, जो अब तक देखी गई सबसे तेज़ growth rates में से है
- ये औसतन लगभग 65% gross margin और लगभग 1.1x BVP efficiency ratio (net new CARR / net burn) के साथ स्वस्थ efficiency भी दिखा रही हैं
- Vertical AI कंपनियों के revenue का वह हिस्सा विश्लेषित करके जो model costs पर खर्च होता है, इस चिंता को कम किया गया है कि ये applications सिर्फ़ thin wrappers हैं
- औसतन, ये कंपनियाँ अभी revenue का केवल लगभग 10% या कुल COGS का लगभग 25% model costs पर खर्च कर रही हैं
- इसलिए, LLM के ऊपर बनाई गई ये vertical applications पहले से ही base model cost के लगभग 6 गुना margin पैदा कर रही हैं
- Vertical AI players उन functions के साथ बाज़ार का नेतृत्व कर रहे हैं जो legacy SaaS से प्रतिस्पर्धा नहीं करते
- कुल मिलाकर, model layer में भारी value creation की उम्मीद है, लेकिन इस data के अनुसार, पिछली infrastructure innovations की तरह, enterprise value का अधिकांश हिस्सा एक बार फिर application layer में capture किया जाएगा
- vertical software के मौजूदा incumbents भी पूरी तरह निष्क्रिय नहीं हैं
- Thomson Reuters ($650 million में CaseText का अधिग्रहण) और DocuSign ($165 million में Lexion का अधिग्रहण) जैसी कंपनियों ने शुरुआती उल्लेखनीय Vertical AI acquisitions किए हैं
- लेकिन हमें अब भी लगता है कि हम Vertical AI marathon की start line के काफ़ी करीब हैं
- आने वाले कुछ वर्षों में नए enduring public Vertical AI companies के उभरने की उम्मीद है
- growth की रफ्तार को देखते हुए, हमें उम्मीद है कि अगले 2–3 वर्षों में कम से कम 5 Vertical AI Centaur (ARR $100 million से अधिक) उभरेंगे
पूर्वानुमान: अगले 3 वर्षों के भीतर पहला Vertical AI IPO होगा
# AI की वजह से consumer cloud का पुनरुत्थान
- यह सबको पता है कि consumer cloud ने पिछले 10 वर्षों में धीमी growth दिखाई है
- consumer cloud को उन कंपनियों के रूप में परिभाषित किया जाता है जो सीधे individual consumers को cloud-based storage, computing और digital applications देती हैं (साथ ही B2B और "prosumer" products भी शामिल हैं)
- 9 साल पहले शुरू हुए Cloud 100 data के analysis से पता चला कि cumulative list में सिर्फ 4% कंपनियों के पास consumer products थे
- 2018 में IPO करने वाली Dropbox के बाद किसी 'pure' consumer cloud कंपनी का exit नहीं हुआ माना जा सकता
- consumer cloud unicorns बड़े तकनीकी बदलावों की लहर से पैदा हुए हैं
- लेकिन 15 साल पहले iPhone के launch और उसके बाद social media platforms के विकास के बाद consumer-facing technology में कोई व्यापक tectonic shift नहीं आया
- हालांकि, 2 साल पहले consumers ने एक बड़ा upheaval देखा
- LLM की तेजी से विकसित होती multimodal capabilities की वजह से अब text, visual और auditory senses को उन तरीकों से बढ़ाना और बेहतर बनाना संभव हो गया है जो पहले संभव नहीं थे, और इससे मौजूदा consumer cloud की सभी categories में disruption की संभावना खुल रही है
- AI की consumer appeal का पैमाना यह है कि ये applications हमारे समय और attention का कितना हिस्सा लेती हैं
- ChatGPT अब Reddit जैसे attention economy leaders से प्रतिस्पर्धा कर रहा है, और Claude व Gemini सहित दूसरे general-purpose AI assistants भी तेजी से traction हासिल कर रहे हैं
- general-purpose assistants के अलावा भी, search के लिए Perplexity, companionship के लिए Character.ai, image creativity के लिए Midjourney, music generation के लिए Suno और Udio, और video generation के लिए Luma, Viggle, Pika जैसे consumer AI startups पहले से अपनी-अपनी categories में innovation को आगे बढ़ाते दिख रहे हैं
- ये कंपनियां dedicated user bases को आकर्षित और बनाए रख रही हैं, और कुछ मामलों में यह दिखा रही हैं कि LLM-based applications में modern incumbents को प्रभावी रूप से replace करने की क्षमता है
- जैसे-जैसे AI तकनीक के साथ interact करने और उसका आनंद लेने के तरीके बदल रहा है, consumer cloud builders और investors के लिए यह सबसे रोमांचक दौरों में से एक है
- अगले 5 वर्षों में कई consumer cloud IPO होने की उम्मीद है
भविष्यवाणी: synthetic media, नए consumer applications और conversational AI agents के चौंकाने वाले उभार के कारण 2030 तक attention economy पर हावी शीर्ष 3 businesses AI-generated content या products पर आधारित होंगे
- specific-function consumer AI applications के long tail में काफ़ी early-stage activity दिखाई दे रही है (जैसे content creation और editing, education)
- अच्छी खबर यह है कि यह शुरुआती संकेत है कि consumers अपनी ज़िंदगी बेहतर बनाने के लिए AI की ओर देख रहे हैं
- बुरी खबर यह है कि wrapper से आगे product depth दिखाने वाले, या strong retention के साथ users के लंबे समय तक प्यार को साबित करने वाले category-specific consumer AI-native apps की संख्या 10 से ज़्यादा नहीं है
- अब भी यह स्पष्ट अवसर मौजूद है कि कई unmet consumer needs को हल करने के लिए sustainable cloud businesses बनाए जाएँ
- consumer needs पर दो मुख्य सवाल:
- मौजूदा स्थिति consumer के लिए कितनी तीव्र पीड़ा या labour-intensive है?
- इसमें कितनी बार-बार दोहराई जाने वाली और अनुमानित language/visual/audio effort की ज़रूरत होती है?
- AI सिर्फ social, entertainment, shopping, travel जैसी हमारी पसंदीदा activities को फिर से नहीं गढ़ेगा, बल्कि लोगों को जुड़ने, खेलने, खरीदने और दुनिया को explore करने के नए तरीके खोजने और कल्पना करने में भी मदद करेगा
# निष्कर्ष - AI cloud: reality vs. hype
- Roy Amara ने कहा था, "हम short term में technology के प्रभाव को overestimate करते हैं और long term में underestimate"
- इसने dot-com, nanotech, cleantech, blockchain जैसी कई पिछली tech waves में VC numbers को सटीक रूप से पकड़ लिया था
- यहां तक कि पुराना, उबाऊ SaaS भी 2021 में जरूरत से ज़्यादा तेज़ी से बढ़ा था
- तो क्या AI cloud को लेकर hype, reality से आगे निकल रही है?
- क्या हम अगले 1~2 वर्षों में यह मानने को मजबूर होंगे कि AI का promise cloud VC पर हावी हो गया था?
- या AI, "Amara's Law" को तोड़ने की धमकी दे रहा है?
- क्या यह पहली tech wave हो सकती है जिसमें reality, पागलपन भरे hype से आगे निकल जाए?
- दुनिया भर के Bessemer investors के survey results एक स्पष्ट जवाब देते हैं
- अब तक hype इसकी कीमत के लायक रही है
- आप जहाँ भी देखें, AI impact के ऐसे सबूत मिल रहे हैं जिनका कोई historical precedent नहीं है
- हमारे portfolio की अधिकांश कंपनियों ने internally AI technology अपना ली है और AI को integrate करने के लिए अपने product roadmaps अपडेट किए हैं
- AI-based portfolio companies meaningful commercial traction दिखा रही हैं, और अब तक हमारे द्वारा देखे गए किसी भी समूह की तुलना में ज़्यादा तेज़ और efficient तरीके से बढ़ रही हैं
- पिछले साल की भविष्यवाणियों को देखें तो, गंभीर optimism और excitement के बावजूद भी हम इस बदलाव की speed और scale का पूरी तरह अनुमान नहीं लगा पाए थे
- खास तौर पर, हमने भविष्यवाणी की थी कि AI-based कंपनियाँ legacy cloud कंपनियों की तुलना में 50% तेज़ी से $1 billion revenue तक पहुँचेंगी
- OpenAI ने इस साल फ़रवरी में $2 billion revenue दर्ज किया, और कुछ महीनों बाद इसके $3.4 billion annualized revenue को पार करने की रिपोर्ट आई
- Anthropic के 2024 के अंत तक $850 million annual revenue तक पहुँचने की उम्मीद है
- दूसरी reports के अनुसार Midjourney $200 million revenue कमा रहा है, और Character.ai को भी इसी पैमाने पर माना जा रहा है
- हमारी अंतिम भविष्यवाणी शायद यह है कि जब हम 2025 State of the Cloud में एक साल पीछे मुड़कर देखेंगे, तब AI को मिल रहा मौजूदा attention ज़रा भी कम नहीं हुआ होगा
अभी कोई टिप्पणी नहीं है.