35 पॉइंट द्वारा xguru 2024-04-08 | 1 टिप्पणियां | WhatsApp पर शेयर करें

एक इमेज में संक्षेपित 2024 MAD(ML, AI, Data) इंडस्ट्री मैप और इस साल की 24 थीम्स का विवरण

[Part I : Landscape]

  • 2012 के पहले वर्ज़न में केवल 139 कंपनियां थीं, लेकिन 2024 के MAD इकोसिस्टम में 2,011 कंपनियां शामिल हैं
  • यह पिछले साल की 1,416 कंपनियों की तुलना में 578 नई कंपनियों का इजाफा है
  • इतनी बड़ी संख्या में कंपनियों के शामिल होने की वजह यह है कि पिछले लगभग 10 वर्षों में डेटा इन्फ्रास्ट्रक्चर टेक्नोलॉजी और ML/AI टेक्नोलॉजी की दो बड़ी तकनीकी लहरें लगातार आईं
    • पहली लहर बिग डेटा से शुरू होकर modern data stack पर खत्म होने वाले लगभग 10 वर्षों के डेटा इन्फ्रास्ट्रक्चर टेक्नोलॉजी विकास की थी
    • दूसरी लहर Generative AI से शुरू हुई ML/AI टेक्नोलॉजी प्रगति की है
  • MAD इकोसिस्टम का फोकस डेटा के पूरे lifecycle को दिखाने पर है, जिसमें data collection से लेकर storage, processing, analysis और applications के माध्यम से value delivery तक सब शामिल है

इन्फ्रास्ट्रक्चर और analytics क्षेत्र में प्रमुख बदलाव

  • डेटा इन्फ्रास्ट्रक्चर क्षेत्र (MAD इकोसिस्टम का बायां हिस्सा) में हाल में कोई बड़ा बदलाव नहीं हुआ
    • Database Abstraction को Multi-Model Databases & Abstractions में बदला गया है, ताकि SurrealDB, EdgeDB जैसे all-in-one multi-model DB के उभरने को दर्शाया जा सके
    • पिछले साल प्रयोग के तौर पर बनाया गया Crypto / Web 3 Analytics सेक्शन हटा दिया गया
    • Query Engine सेक्शन भी हटा दिया गया है (हालांकि संबंधित कंपनियां अभी भी शामिल हैं)

मशीन लर्निंग और आर्टिफिशियल इंटेलिजेंस क्षेत्र में प्रमुख बदलाव

  • 2023 में AI कंपनियों की विस्फोटक बढ़ोतरी के कारण इस क्षेत्र में सबसे अधिक संरचनात्मक बदलाव हुए
  • MLOps के बगल में 3 नई कैटेगरी जोड़ी गईं
    • AI Observability: LLM applications को test, evaluate और monitor करने वाले startup
    • AI Developer Platforms: MLOps के समान, लेकिन LLM training, deployment और inference पर फोकस करने वाले AI application development platforms
    • AI Safety & Security: LLM से जुड़ी विशिष्ट चिंताओं (hallucination, ethics, regulatory compliance आदि) को संभालने वाली कंपनियां
  • Horizontal AI/AGI को अलग करके Commercial AI Research और Nonprofit AI Research दो कैटेगरी में बांटा गया
  • GPU Cloud को GPU Cloud / ML Infra में बदला गया है, ताकि GPU cloud providers की core infrastructure क्षमताओं के जुड़ने को दर्शाया जा सके

एप्लिकेशन क्षेत्र में प्रमुख बदलाव

  • application layer की सभी कंपनियां अब खुद को AI कंपनी कहती हैं
  • Horizontal Applications में Presentation & Design कैटेगरी जोड़ी गई
  • Search को Search / Conversational AI में बदला गया, ताकि Perplexity जैसे LLM-आधारित chatbot interfaces के उभार को दर्शाया जा सके
  • Industry में Gov't & Intelligence को Aerospace, Defense & Gov't में बदला गया

ओपन सोर्स इन्फ्रास्ट्रक्चर क्षेत्र में प्रमुख बदलाव

  • Data Access और Data Ops को समेटने वाली एकल Data Management कैटेगरी बनाई गई
  • Local AI नाम की नई कैटेगरी जोड़ी गई, जो AI और LLM को local development environment में लाने के लिए infrastructure tools प्रदान करती है

[Part II: 2024 की 24 थीम्स]

1. structured data vs unstructured data

  • डेटा में structured data होता है, जिसे rows और columns में फिट किया जा सकता है, और unstructured data होता है, जैसे text/image/audio/video
  • structured data को analysis उद्देश्यों के लिए extract, store और transform किया जाता है, फिर BI tools से visualize किया जाता है या पारंपरिक ML/AI models में उपयोग किया जाता है
  • unstructured data का उपयोग मुख्य रूप से generative AI models (जैसे LLM) को train करने और इस्तेमाल (inference) करने में होता है
  • फिलहाल unstructured data (ML/AI) पर बहुत ध्यान है, लेकिन structured data (जैसे modern data stack) पर नहीं

2. क्या modern data stack खत्म हो चुका है?

  • modern data stack (MDS) structured data pipelines से जुड़ा है, और कुछ समय पहले तक यह software इंडस्ट्री के सबसे चर्चित concepts में से एक था
  • MDS की संरचना cloud data warehouse को केंद्र में रखती थी, जिसके upstream में Fivetran/Airbyte, बीच में DBT, और downstream में Looker/Mode जैसे tools होते थे
  • Snowflake के इतिहास के सबसे बड़े IPO में सफल होने के बाद MDS में रुचि विस्फोटक रूप से बढ़ी, और इससे startup स्थापना तथा VC investment में अत्यधिक गर्मी आई
    • data catalog, data observability, ETL, reverse ETL जैसी कई categories 1~2 साल में ही saturation तक पहुंच गईं
  • MDS वास्तविक समस्याओं का समाधान भी था, लेकिन साथ ही यह data value chain पर मौजूद कई startups के बीच marketing partnerships का रूप भी था
  • लेकिन अब MDS दबाव में है क्योंकि ① कई vendor solutions को जोड़ना पड़ता है, जिससे लागत बढ़ती है, और ② generative AI के आगे यह अब पहले जैसा ध्यान नहीं खींच पा रहा

3. डेटा इन्फ्रास्ट्रक्चर क्षेत्र का consolidation और बड़ी कंपनियों की बढ़त

  • 2024 में data infrastructure और analytics इंडस्ट्री में निम्नलिखित घटनाएं होने की संभावना है:
    • MDS से जुड़ी कई startups खुद को AI infrastructure startup के रूप में reposition करने की कोशिश करेंगी
      • कुछ सफल हो सकती हैं, लेकिन अधिकांश के लिए structured data से unstructured data की ओर बढ़ने हेतु product में बुनियादी बदलाव जरूरी होगा
    • data infrastructure इंडस्ट्री आखिरकार एक निश्चित स्तर का consolidation देखेगी
      • अब तक M&A सीमित रहा था, लेकिन 2023 में Stemma (Teradata द्वारा अधिग्रहण), Manta (IBM द्वारा अधिग्रहण), Mode (Thoughtspot द्वारा अधिग्रहण) जैसे छोटे-मझोले deals हुए
    • startup failures के मामले काफी बढ़ेंगे
      • VC funding सूखने से स्थिति लगातार खराब हो रही है। कई startups ने लागत काफी कम की है, लेकिन अंततः cash exhaustion का सामना करना पड़ेगा। बड़े चमकदार headlines की उम्मीद करना कठिन लगता है
    • scale वाली कंपनियां platformization पर और अधिक जोर देंगी
      • यह M&A के माध्यम से भी होगा, लेकिन वे in-house development के जरिए भी अधिक features को समेटने की कोशिश करेंगी

4. Databricks vs Snowflake की मौजूदा स्थिति

  • structured data इंडस्ट्री की Snowflake अब भी एक बेहतरीन कंपनी है और tech stocks में सबसे ऊंचे valuation में से एक पर ट्रेड हो रही है (PER 14.8x)
    • लेकिन कई software कंपनियों की तरह इसकी growth काफी धीमी हो गई है
      • FY2024 revenue साल-दर-साल 38% बढ़कर $2.67B रहा, और अगले 12 महीनों की अनुमानित growth rate 22% है
    • सबसे बढ़कर, यह product innovation में संघर्ष करती हुई दिखती है
      • AI के प्रति इसकी प्रतिक्रिया धीमी रही है और M&A में भी यह कम सक्रिय है
      • हाल की कुछ हद तक अचानक CEO बदलाव भी एक दिलचस्प संकेत है
  • unstructured data इंडस्ट्री की Databricks समग्र रूप से मजबूत momentum दिखा रही है
    • बताया जाता है कि FY2024 revenue $1.6B रहा और 50% से अधिक बढ़ा (कंपनी unlisted है)
    • Databricks generative AI की एक प्रमुख कंपनी के रूप में उभर रही है
      • MosaicML को $1.3B में acquire करने सहित, यह M&A और in-house product development दोनों में सक्रिय है
      • यह न केवल LLM को feed किए जाने वाले unstructured data का core repository है, बल्कि Dolly से लेकर हाल ही में घोषित DBRX तक कई models भी खुद विकसित कर रही है
  • दोनों कंपनियों की प्रतिस्पर्धा में नया variable है MS का Fabric लॉन्च
    • मई 2023 में घोषित Fabric एक end-to-end cloud-based data analytics SaaS platform है
    • यह MS के data lake OneLake, BI tool PowerBI, Synapse आदि को एकीकृत कर data integration से लेकर engineering और data science तक पूरे दायरे को कवर करता है
    • घोषणा और वास्तविक product के बीच अंतर जरूर हो सकता है, लेकिन MS के generative AI निवेश के साथ मिलकर यह एक मजबूत खतरा बन सकता है
    • यह भी दिलचस्प है कि Databricks मुख्य रूप से MS के cloud Azure पर चलती है

5. 2024 में BI की स्थिति और क्या generative AI analytics को बदल रही है?

  • MDS और structured data pipeline क्षेत्र में सबसे अधिक पुनर्निर्माण की ज़रूरत जिस क्षेत्र में थी, वह BI था
    • 2019 के MAD में यह इंगित किया गया था कि BI इंडस्ट्री का consolidation लगभग पूरा हो चुका है, और 2021 में metric store के उभरने पर चर्चा की गई थी
  • लेकिन BI/analytics का रूपांतरण अपेक्षा से धीमी गति से आगे बढ़ रहा है
    • अब भी PowerBI, Tableau, Looker जैसे पुराने product suites बाज़ार पर हावी हैं, और ये अक्सर बड़े sales contracts से बंधे होने के कारण मुफ़्त में भी दिए जाते हैं
    • कुछ अतिरिक्त consolidation हुआ है (Thoughtspot द्वारा Mode का अधिग्रहण, Snowflake द्वारा Sisu का अधिग्रहण), और dbt (semantic layer/MetricFlow), Trace (metric tree) जैसी innovative approaches आज़माने वाली युवा कंपनियाँ भी हैं, लेकिन अभी यह शुरुआती चरण में है
  • दूसरी ओर generative AI केवल data extraction/transformation ही नहीं, बल्कि analysis itself पर भी बड़ा प्रभाव डाल सकता है
    • OpenAI का Code Interpreter (अब Advanced Data Analysis), MS का Excel के लिए finance chatbot आदि जैसे सक्रिय प्रयास हुए हैं
    • cloud vendors, Databricks, Snowflake, open source समुदाय, और अनेक startups प्राकृतिक भाषा में DB query चलाने वाले text to SQL products विकसित कर रहे हैं या लॉन्च कर चुके हैं
  • यह दिलचस्प और संभावित रूप से disruptive बदलाव का संकेत देता है
    • analytics का democratization लंबे समय से एक आकांक्षा रहा है, और अगर प्राकृतिक भाषा notebook/DB/BI tools का interface बन जाती है, तो कहीं अधिक लोग analysis कर सकेंगे
  • लेकिन BI इंडस्ट्री के भीतर skeptical नज़रिया भी मौजूद है
    • यह तर्क दिया जाता है कि SQL की precision और query के पीछे के business context को समझना automation में बाधा बनेगा

6. Modern AI stack का उदय

  • अब तक की चर्चा का बड़ा हिस्सा structured data pipelines के बारे में था
  • unstructured data infrastructure, structured data infrastructure की तुलना में एक बिल्कुल अलग चरण में है। LLM को उपलब्ध कराए जाने वाले data की मांग बहुत अधिक है
    • generative AI का प्रयोग या deployment करने वाली हर कंपनी फिर से उस cliché को खोज रही है कि data is the new oil
    • सभी लोग LLM की शक्ति चाहते हैं, लेकिन ऐसा model चाहते हैं जो उनके अपने enterprise data पर trained हो
  • बड़ी कंपनियाँ और startups दोनों generative AI के लिए infrastructure उपलब्ध कराने की दौड़ में उतर चुके हैं
  • कई AI scale-up कंपनियाँ momentum पकड़ने के लिए तेज़ी से अपने products को विकसित कर रही हैं
    • Databricks, Scale AI (autonomous vehicles के लिए labeling infrastructure से OpenAI आदि के साथ साझेदारी करते हुए enterprise data pipeline तक विस्तार), Dataiku (multi-vendor/multi-model के लिए LLM Mesh लॉन्च) आदि
  • इसी बीच कई क्षेत्रों में AI infrastructure startups की नई पीढ़ी उभर रही है
    • vector DB: data को ऐसे format (vector embeddings) में स्टोर करना जिसे generative AI models consume कर सकें। Pinecone, Weaviate, Chroma, Qudrant जैसे specialist vendors तेज़ी से बढ़ रहे हैं, और MongoDB जैसी existing DB कंपनियाँ भी vector search features जोड़ने में सक्रिय हैं। दूसरी ओर यह बहस भी है कि context window के विस्तार से vector DB की ज़रूरत ही खत्म हो सकती है
    • framework: LlamaIndex, Langchain आदि, जो कई elements को जोड़ने और orchestrate करने का काम करते हैं
    • guardrails: LLM और user के बीच रहकर यह सुनिश्चित करना कि output संगठन के नियमों के अनुरूप हो
    • evaluators: generative AI model के performance को test/analyze/monitor करना। public benchmarks पर अविश्वास के कारण इसे कठिन समस्या माना जाता है
    • routers: user queries को real time में कई models में वितरित करके performance/cost/experience को optimize करना
    • cost management: LLM उपयोग लागत की monitoring
    • endpoints: APIs जो models जैसी base infrastructure की complexity को abstract करती हैं
  • MDS के उदाहरण को देखते हुए Modern AI stack शब्द का उपयोग करने में संकोच है
    • लेकिन समानताएँ बहुत हैं: ये startups भी पुराने MDS उद्यमों की तरह "hot" हैं, समूहों में चलते हैं, और marketing/product partnerships करते हैं
  • AI infrastructure startups की इस नई पीढ़ी को MDS कंपनियों जैसी चुनौतियों का सामना करना पड़ेगा
    • क्या हर category इतनी बड़ी है कि उससे multi-billion-dollar कंपनी बन सके?
    • किन हिस्सों को Big Tech (cloud कंपनियाँ, Databricks, Snowflake आदि) सीधे खुद बना देगी?

7. AI hype cycle, हम अभी कहाँ हैं?

  • AI कई दशकों से AI summer और winter के चक्र दोहराता रहा है। केवल पिछले 10-12 वर्षों में भी तीन hype cycles रहे हैं
    • पहला: 2013-2015, ImageNet 2012 के बाद deep learning पर ध्यान बढ़ने से शुरुआत
    • दूसरा: लगभग 2017-2018, chatbot boom और TensorFlow के उभार के साथ
    • तीसरा: नवंबर 2022 से अब तक, generative AI
  • इस बार का hype cycle इतना तीव्र है कि यह AI bubble जैसा महसूस होता है। इसके कई कारण हैं
    • तकनीक स्वयं बेहद प्रभावशाली है, और tech क्षेत्र से बाहर आम लोगों के लिए भी आसानी से समझ आने योग्य है
    • बहुत अधिक dry powder (अप्रयुक्त पूंजी) रखने वाले VCs के लिए, जब अन्य सभी tech sectors सुस्त थे, यह लगभग एकमात्र investment destination था
  • hype हमेशा की तरह कई फ़ायदे ("उन्मादी जुनून के बिना महान उपलब्धियाँ नहीं होतीं", "सौ फूल खिलने दो" शैली की ambitious projects को funding मिलना) और नुकसान (रातोंरात हर कोई AI expert बन जाना, हर startup का AI कंपनी बन जाना, AI conferences/podcasts/newsletters की बाढ़, AI market maps की भरमार) साथ लाता है
  • लेकिन hype cycle की मुख्य समस्या उसका अनिवार्य backlash है
  • मौजूदा चरण में कई तरह की "quirkiness" और risks निहित हैं
    • leading company (OpenAI) की असामान्य legal/governance structure
    • "computing power support के बदले equity लेना" जैसे सौदों का व्यापक प्रचलन, जिन्हें पर्याप्त रूप से समझा या सार्वजनिक नहीं किया गया है (round-tripping की संभावना सहित)
    • कई promising startups का AI researchers द्वारा संचालित होना
    • VCs का ऐसा deal behavior जो zero-interest-rate era की याद दिलाता है ("land grab", विशाल rounds, और बहुत नई कंपनियों को चौंका देने वाली valuations)
  • AI hype में दरार के संकेत भी हैं (नीचे देखें), लेकिन अभी भी हर हफ्ते कुछ नया सबको चौंका रहा है। Saudi के $40B AI fund जैसी खबरें देखें तो निकट भविष्य में capital inflow रुकना मुश्किल लगता है

8. experiment या reality? क्या 2023 नकली था?

  • hype को देखते हुए यह फिर से देखना ज़रूरी है कि अब तक कितना वास्तविक काम हुआ है, और कितना केवल experimentation तक सीमित रहा
  • 2023 बहुत ही व्यस्त वर्ष था
    • हर tech कंपनी अपने products में generative AI जोड़ने की जल्दबाज़ी में थी
    • Global 2000 कंपनियों के सभी boards ने AI adoption का निर्देश दिया, और Morgan Stanley/Citibank जैसे regulated industries के उद्यमों ने भी रिकॉर्ड गति से adoption आगे बढ़ाया
    • consumers ने generative AI apps के प्रति जबरदस्त रुचि दिखाई
  • इसके परिणामस्वरूप OpenAI ($2B ARR), Anthropic (2024 expected revenue $850M), Midjourney (बिना investment, 40 लोगों की टीम के साथ $200M revenue), Perplexity (MAU 0→10 million) आदि ने बड़ी सफलता हासिल की
  • लेकिन क्या इसे cynically देखना चाहिए? कुछ चिंताएँ हैं
    • enterprise spending कई बार PoC या दिखावटी उपलब्धियों तक सीमित रही, और अक्सर innovation budgets से आई
      • क्या यह वास्तविक business problems सुलझाने से अधिक इस डर से प्रेरित था कि executives पीछे छूटे हुए न दिखें?
    • consumer apps में churn rate ऊँचा है। क्या यह केवल क्षणिक जिज्ञासा थी?
    • बहुत से लोग अब भी नहीं जानते कि generative AI का व्यक्तिगत या कामकाजी उपयोग कैसे किया जाए
    • शीर्ष AI experts द्वारा बनाए गए products भी हमेशा जादू जैसे नहीं लगेंगे
      • $1.3B जुटाने के बाद भी अचानक बंद हो गई Inflection AI की घटना को कैसे देखा जाए? क्या यह इस बात का संकेत है कि दुनिया को एक और AI chatbot या LLM की ज़रूरत नहीं है?

9. LLM कंपनियाँ, क्या वे उतनी commoditized नहीं हुईं?

  • LLM कंपनियों में बहुत बड़े पैमाने पर venture capital और corporate funding निवेश की जा रही है
  • पिछले 18 महीनों में सबसे आम सवाल यह रहा है: क्या हम ऐसे products पर भारी पूंजी जलते हुए देख रहे हैं जो आखिरकार commoditized हो जाएंगे? या ये LLM कंपनियां नई AWS, Azure, GCP बनेंगी?
  • LLM कंपनियों के नजरिए से परेशान करने वाली बात यह है कि ऐसा लगता है कि कोई भी LLM लगातार performance advantage बना नहीं पा रहा है
    • फिलहाल Claude 3 Sonnet और Gemini Pro 1.5, GPT-4 से बेहतर हैं, और GPT-4, Gemini 1.0 Ultra से बेहतर है, लेकिन यह बढ़त हर कुछ हफ्तों में बदलती दिखती है
    • performance volatility भी है - ChatGPT एक समय "अपना संतुलन खो बैठा" और "सुस्त" हो गया था, फिर अस्थायी रूप से संभला
  • इसके अलावा open source models (Llama 3, Mistral, DBRX आदि) का performance भी तेजी से बराबरी पर पहुंच रहा है
  • वहीं, शुरुआती अनुमान से कहीं ज्यादा LLM कंपनियां बाजार में आ चुकी हैं
  • कुछ साल पहले तक आम धारणा यह थी कि transformer scaling के लिए जरूरी expertise दुनिया में बहुत कम लोगों के पास है, इसलिए LLM कंपनियां सिर्फ एक-दो होंगी और winner-takes-all स्थिति बनेगी
  • लेकिन लगता है कि सक्षम टीमों की संख्या उम्मीद से ज्यादा है
    • OpenAI, Anthropic के अलावा भी Mistral, Cohere, Adept, AI21, Imbue, 01.AI जैसी foundational AI research करने वाली startups हैं, और Google, Meta जैसी कंपनियों की टीमें भी हैं
  • इसके बावजूद अब तक LLM कंपनियां खराब प्रदर्शन नहीं कर रही हैं। OpenAI और Anthropic की revenue बहुत तेज गति से बढ़ रही है
  • LLM "models" भले commoditized हो जाएं, लेकिन LLM "companies" के सामने अब भी बहुत बड़ा business opportunity है
    • ये पहले ही base models के ऊपर consumer/enterprise/developer applications और tools देने वाली "full-stack" कंपनियां बन चुकी हैं
  • cloud कंपनियों से की गई तुलना काफी हद तक सही लगती है
    • AWS, Azure, GCP application/tool layer के जरिए customers को जोड़ते और बनाए रखते हैं, और अपेक्षाकृत कम differentiated compute/storage layer के जरिए revenue कमाते हैं

10. hybrid भविष्य: LLM, SLM

  • बड़े LLMs (GPT-3, GPT-4, GPT-5 आदि) पर ज्यादा ध्यान है, लेकिन SLM (small language model) भी तेजी से आगे बढ़ रहे हैं
    • Meta का Llama-2-13b, Mistral का Mistral-7b/Mixtral 8x7b, MS का Phi-2/Orca-2 आदि
    • SLM का operating cost कम है, fine-tuning आसान है, और performance भी अच्छा है
  • खास tasks (coding, finance आदि) के लिए specialized models भी सामने आ रहे हैं
    • Code-Llama, Poolside AI जैसे coding-focused models
    • Bloomberg का finance model, Orbital Materials का materials science model जैसे industry-specific models
  • कंपनियां तेजी से ऐसे hybrid architecture की ओर बढ़ रही हैं जिनमें अलग-अलग models को मिलाकर इस्तेमाल किया जाता है
  • कीमतें कम हो रही हैं, लेकिन बड़े proprietary LLM अब भी महंगे हैं और latency की समस्या भी है, इसलिए users/customers धीरे-धीरे कई तरह के models को मिलाकर deploy करेंगे
    • जरूरत और budget के हिसाब से बड़े/छोटे, commercial/open source, general-purpose/specialized models को मिलाकर इस्तेमाल करने का रुझान बढ़ रहा है

11. क्या traditional AI खत्म हो चुका है?

  • ChatGPT के आने के बाद, उससे पहले तक cutting-edge मानी जाने वाली AI technologies को रातोंरात "traditional AI" कहा जाने लगा
  • लेकिन traditional AI (या predictive AI) structured data को संभालता है और generative AI का पूरक है
  • traditional AI पहले से ही बहुत-सी कंपनियों में बड़े पैमाने पर इस्तेमाल हो रहा है
  • आगे कंपनियां यह तय करेंगी कि किन कामों में LLM का इस्तेमाल करना है, किन कामों में traditional AI models का, और दोनों को कैसे जोड़ना है

12. thin wrapper, thick wrapper, और full-stack बनने की दौड़

  • thin wrapper: 2023 में प्रचलित एक शब्द, जिसका नकारात्मक अर्थ था ऐसा product जो OpenAI जैसी third-party technology पर निर्भर हो
    • Jasper जैसी startups की मुश्किलें इस बात को समर्थन देती हैं
  • लेकिन समय के साथ differentiation के तरीके भी सामने आए हैं
    • किसी खास (vertical) समस्या पर फोकस
    • workflow, collaboration, और deep integration जैसी क्षमताएं बनाना
    • model fine-tuning, hybrid systems बनाना जैसे AI model स्तर के काम करना
  • यानी full-stack (application + infrastructure) भी बनना है और साथ ही specialized भी रहना है

13. ध्यान देने लायक क्षेत्र: AI agents, Edge AI

  • AI agents automation के अंतिम चरण के रूप में बड़ी दिलचस्पी का विषय हैं
    • लेकिन अभी generative AI कई मामलों में कमजोर दिख रहा है, इसलिए नतीजे उम्मीद से कम हैं
    • AI systems में memory जैसी क्षमताएं जोड़ने की जरूरत है
    • फिर भी आने वाले 1-2 वर्षों में यह सबसे रोमांचक क्षेत्रों में से एक हो सकता है
  • Edge AI भी रुचि का विषय है
    • GPU के बिना device पर चलने वाले models लंबे समय से एक लक्ष्य रहे हैं
    • smartphone या IoT devices में लागू होने पर बड़ी संभावना है
    • Mixtral, Ollama, Llama.cpp जैसे सक्रिय open source projects इस दिशा में चल रहे हैं

14. क्या generative AI, AGI की ओर बढ़ रही है या ठहर रही है?

  • तकनीक की तेज प्रगति के बावजूद यह चिंता है कि generative AI या तो ① resources (compute, data) की सीमा से टकरा सकती है, या ② reasoning क्षमता की कमी के कारण अपनी सीमा पर पहुंच सकती है
  • 2018 में भी इसी तरह की चर्चा हुई थी, और उसके बाद resources के निवेश में काफी बढ़ोतरी हुई
  • reasoning के क्षेत्र में DeepMind के AlphaGeometry जैसे अर्थपूर्ण advances हुए हैं
  • resources की सीमा का आकलन करना कठिन है। compute लगातार बढ़ रहा है (NVIDIA Blackwell), और data की कमी को synthetic data generation जैसी तकनीकों से कुछ हद तक दूर किया जा सकता है
  • startup ecosystem के प्रतिभागियों के लिए GPT-5 का performance, GPT-4 की तुलना में कितना बेहतर होता है, यही तकनीकी प्रगति की रफ्तार का barometer होगा
    • भले ही generative AI की प्रगति अभी रुक जाए, कुछ समय तक business opportunity पर्याप्त रहने की संभावना है

15. GPU युद्ध (क्या NVIDIA का मूल्यांकन बढ़ा-चढ़ाकर किया गया है?)

  • क्या हम ऐसे नए दौर में हैं जहां compute दुनिया का सबसे कीमती resource बन जाएगा, या यह GPU overproduction से पैदा हुआ bubble है?
  • NVIDIA ने AI-सक्षम GPU बाजार पर लगभग monopoly बना ली है और उसके stock में 5 गुना उछाल जैसी तेजी आई है
    • इसकी एक वजह यह भी हो सकती है कि VCs द्वारा AI में लगाया गया पैसा NVIDIA की ओर बहा है
  • लेकिन hardware manufacturing (TSMC fabs) आसान काम नहीं है, इसलिए NVIDIA का भविष्य मौजूदा boom की sustainability पर निर्भर करता है
  • AMD, Intel जैसे competitors की चुनौती भी है, लेकिन लंबी अवधि में AI chip manufacturers की संभावनाएं अच्छी दिखती हैं

16. open source AI, क्या जरूरत से ज्यादा हो गया है?

  • पिछले एक साल में open source AI को बहुत ज्यादा ध्यान मिला है
    • Meta का Llama, Mistral, Google का Gemma चर्चा में रहे, और HuggingFace भी अनगिनत models host करते हुए लगातार बढ़ रहा है
    • generative AI क्षेत्र के सबसे innovative कामों का बड़ा हिस्सा open source community में हो रहा है
  • लेकिन open source community में over-saturation के संकेत भी दिख रहे हैं
    • लाखों नहीं तो सैकड़ों हजार open source AI models जारी किए गए हैं, लेकिन उनमें से ज्यादातर toy-level हैं या weekend projects भर हैं
    • rankings बार-बार बदलती रहती हैं, और कई models कुछ दिनों में मशहूर होकर गायब भी हो जाते हैं
  • market की self-correction के बाद शायद कुछ ही सफल open source projects को cloud कंपनियों जैसी बड़ी संस्थाओं का समर्थन मिलेगा। लेकिन तब तक अव्यवस्था बनी रहने की संभावना है

17. AI की असली लागत आखिर कितनी है?

  • generative AI की economics तेजी से बदलने वाला विषय है
    • search market में Google को चुनौती देनी है तो 10 links दिखाने की लागत से कम में AI-based answers देने होंगे
    • AI-based software कंपनियों को यह सुनिश्चित करना होगा कि inference cost उनकी gross margin को खत्म न कर दे
  • AI model के customers/users के नजरिए से अच्छी खबर यह है: price-cut competition उम्मीद से जल्दी शुरू हो गया है
    • open source AI और commercial inference vendors के आने से customers के लिए switching cost बहुत कम हो गई है, और यह OpenAI व Anthropic पर दबाव डाल रही है
    • embedding model की कीमतों में एक साथ की गई कटौती इसका उदाहरण है
  • providers के नजरिए से AI बनाना और service देना अब भी महंगा है
    • कहा गया है कि Anthropic अपनी revenue का आधे से ज्यादा हिस्सा cloud cost पर खर्च कर रही थी
    • data licensing cost भी कम नहीं है
  • users के लिए एक तरीका यह भी है कि VC-funded free services का फायदा उठाया जाए

18. बड़ी कंपनियां और AI की राजनीतिक-अर्थव्यवस्था में बदलाव: क्या Microsoft जीत चुका है?

  • 2022 के अंत से उठता रहा सवाल: क्या Big Tech generative AI की ज्यादातर वैल्यू अपने कब्जे में कर लेगी?
  • AI में डेटा, compute और researchers जितने ज्यादा हों, उतना फायदा होता है। Big Tech यह अच्छी तरह जानती है और सक्रिय रूप से प्रतिक्रिया दे रही है
  • लगता है MS सबसे प्रभावी ढंग से प्रतिक्रिया दे रहा है (मानो 4-D chess खेल रहा हो)
    • OpenAI में 13 अरब डॉलर का निवेश
    • open source प्रतिद्वंद्वी Mistral के साथ साझेदारी
    • ChatGPT प्रतिद्वंद्वी Inflection AI का अधिग्रहण
    • Azure की revenue भी तेज़ी से बढ़ रही है
  • Google/Amazon ने Anthropic के साथ साझेदारी और निवेश किया है, Amazon ने Hugging Face के साथ भी साझेदारी की है
  • Meta open source AI पर पूरी ताकत लगाता दिख रहा है
  • चीन से आ रहे बदलाव भी ध्यान देने योग्य हैं
  • असली सवाल यह है कि startups के बढ़ने की कितनी गुंजाइश बचेगी
    • OpenAI, Anthropic जैसी कुछ कंपनियों ने अच्छी partnerships के ज़रिए तेजी से आगे निकलने की रफ्तार पाई
    • लेकिन कई startups का भविष्य अब भी धुंधला है
    • Inflection AI का अधिग्रहण, Stability AI के CEO से जुड़ा घटनाक्रम आदि संकेत देते हैं कि "second-tier" startups संघर्ष कर रहे हैं

19. OpenAI को लेकर दीवानगी बनाम संशय

  • OpenAI अब भी बेहद आकर्षक है
    • 86 अरब डॉलर valuation, revenue में तेज़ बढ़ोतरी, संस्थापकों के बीच टकराव(?), Sam Altman इस पीढ़ी के Steve Jobs
  • दिलचस्प सवाल:
    • क्या OpenAI बहुत ज्यादा चीज़ें करने की कोशिश कर रही है? ऐसा लगता है जैसे वह vertical और horizontal दोनों दिशा में AI का सब कुछ करना चाहती है — क्या यह हद से ज्यादा महत्वाकांक्षी नहीं है?
      • मिलता-जुलता हाल Coinbase के साथ पहले भी देखा गया है
      • प्रतिस्पर्धा तेज़ होने की स्थिति में यह बहुत कठिन चुनौती होगी
      • ChatGPT से जुड़े मुद्दे, marketplace की धीमी प्रगति आदि संकेत देते हैं कि OpenAI भी मुश्किलों का सामना कर सकती है
    • क्या OpenAI और MS अलग हो जाएंगे?
      • MS का समर्थन OpenAI के लिए बहुत मददगार है (resources, enterprise customers आदि)
      • लेकिन MS साफ कर रहा है कि वह OpenAI पर निर्भर नहीं है (Mistral साझेदारी, Inflection AI अधिग्रहण आदि), और उसकी अपनी AI क्षमता भी पर्याप्त है
      • दूसरी ओर, OpenAI भी शायद सिर्फ MS पर निर्भर नहीं रहना चाहे। वह दूसरे cloud पर deploy होना चाह सकती है
      • OpenAI की विशाल महत्वाकांक्षा और MS की domination की चाह को देखते हुए, यह भी संभव लगता है कि दोनों कंपनियां प्रतिस्पर्धी बन जाएं

20. क्या 2024 enterprise AI का साल बनेगा?

  • 2023 में enterprises द्वारा AI अपनाना proof-of-concept स्तर तक ही सीमित रहा
  • 2023 में generative AI का सबसे बड़ा लाभ उन कंपनियों को मिला जो AI consulting से कमाई कर रही थीं, जैसे Accenture जिसने 2 अरब डॉलर की revenue हासिल की
  • उम्मीद की जा रही है कि 2024 enterprise generative AI का शुरुआती साल बने (traditional AI तो पहले से काफी अपनाया जा चुका है)
  • लेकिन अभी भी कई चुनौतियां बाकी हैं:
    • use cases अभी developer copilots, enterprise knowledge management, customer service chatbots जैसे कुछ क्षेत्रों तक सीमित हैं
    • कौन से tools चुने जाएं, यह स्पष्ट नहीं है (commercial/open source, बड़े/छोटे models, horizontal/vertical specialization आदि का सही मेल चाहिए)
    • talent की भारी कमी है (जब developers ही मुश्किल से मिल रहे हैं, तो ML engineers का हाल समझा जा सकता है)
    • hallucination, black-box problem जैसी चीज़ें enterprise के लिए गंभीर risk हैं
    • ROI साबित करना ज़रूरी है (जैसे Palo Alto Networks का कहना है कि उसने business travel management cost आधी कर दी — ऐसे कुछ उदाहरण मौजूद हैं)
  • सकारात्मक बात यह है कि कंपनियां innovation budget नहीं बल्कि OpEx budget लगाने को तैयार दिख रही हैं
  • लेकिन बड़े पैमाने पर adoption में अभी भी 3–5 साल लग सकते हैं

21. क्या AI SaaS को खत्म कर देगा?

  • पिछले एक साल में यह काफी लोकप्रिय विचार रहा
  • दलील यह है कि AI की वजह से coding productivity 10 गुना बढ़ जाएगी और कुछ ही developers के साथ customized SaaS बनाना संभव हो जाएगा, जिससे मौजूदा SaaS की ज़रूरत खत्म हो जाएगी
  • या फिर यह कि अगर AI HR/finance/sales सब कुछ संभाल ले, तो अलग software की ज़रूरत ही नहीं बचेगी
  • लेकिन दोनों scenarios का पूरी तरह साकार होना मुश्किल लगता है
  • इससे ज्यादा संभव यह लगता है कि AI मौजूदा SaaS में ही embed होकर उसे और शक्तिशाली बना दे

22. क्या AI venture capital को खत्म कर देगा?

  • इस सवाल से अलग कि क्या AI VC के startup चयन और निवेश के बाद value creation को automate कर सकता है, AI युग में VC asset class का आकार उचित है या नहीं, इस पर चर्चा ज़रूरी है
  • क्या VC बहुत छोटा है?
    • OpenAI जैसी कंपनियों को अरबों डॉलर और उससे भी ज्यादा पूंजी चाहिए
    • MS जैसी बड़ी कंपनियां इस पूंजी का बड़ा हिस्सा दे रही हैं (संभव है कि यह compute उपलब्ध कराने के रूप में हो)
    • कुछ VCs बड़े foundation model startups में निवेश कर रहे हैं, लेकिन यह पारंपरिक VC software investment model से काफी अलग है
    • AI निवेश के लिए mega-scale funds की ज़रूरत पड़ सकती है (खबर है कि Saudi, अमेरिकी VCs के साथ मिलकर 40 अरब डॉलर का AI fund बना रहा है)
  • या क्या VC बहुत बड़ा है?
    • अगर AI से developer productivity 10 गुना बढ़ जाती है और sales/marketing automate हो जाते हैं
    • तो शायद ऐसा दौर आए जब छोटी teams या यहां तक कि एक व्यक्ति की कंपनी भी सैकड़ों मिलियन डॉलर revenue कमाकर listed हो सके
    • अगर कोई one-person company 100 million dollar revenue तक पहुंच जाए, तो क्या उसे founding से EXIT तक VC funding की सच में ज़रूरत होगी?

23. क्या AI consumer market को फिर से जगा देगा?

  • social media/mobile युग के बाद सुस्ती में फंसे consumer market को क्या generative AI फिर से उछाल दे सकता है?
  • दिलचस्प क्षेत्र:
    • search: Perplexity AI, You.com जैसे startups, जिन्होंने दशकों बाद Google को चुनौती दी है और search engine से answer engine की ओर बदलाव को आगे बढ़ा रहे हैं
    • AI companion: dystopian चिंताओं को एक तरफ रखें, तो क्या हर इंसान के पास अपना एक अनंत धैर्यवान और मददगार साथी हो सकता है?
    • AI hardware: Humane, Rabbit, VisionPro जैसे consumer AI hardware के दिलचस्प प्रयोग
    • hyper-personalized entertainment: जैसे-जैसे generative AI tools बेहतर और सस्ते होते जाएंगे, मनोरंजन और कला के कौन से नए रूप सामने आएंगे?

24. AI और blockchain: बेतुका या दिलचस्प?

  • AI और crypto का मेल Twitter memes के लिए एकदम परफेक्ट विषय है
  • लेकिन compute, data, talent जैसे AI resources का कुछ कंपनियों में सिमट जाना चिंता की बात है
  • blockchain का मूल विचार यह है कि distributed network के माध्यम से participants resources और assets साझा कर सकें
  • इन दोनों के बीच खोजे जाने लायक क्षेत्र मौजूद हैं (यह कई सालों से सोचने का विषय रहा है)
  • Bittensor (distributed AI platform), Render (distributed GPU rendering platform), Arweave (distributed data platform) जैसे संबंधित projects की रफ्तार तेज़ होती दिख रही है
  • असली सवाल यह है कि crypto industry खुद को सच में उपयोगी बना पाएगी या AI-संबंधित meme coins और fraud में गिर जाएगी

BONUS: वे विषय जो शामिल नहीं किए गए

  • क्या AI हम सबको मार डालेगी? AI doomsday बनाम AI accelerationists
  • regulation, privacy, ethics, deepfakes
  • क्या AI सिर्फ Silicon Valley में ही बनाई जा सकती है?

[Part III: Financing, M&A & IPO]

Financing

  • AI निवेश और बाकी क्षेत्रों में निवेश के बीच स्पष्ट रूप से बंटी हुई "दो बाज़ारों की कहानी" जैसी स्थिति दिख रही थी
  • कुल निवेश लगातार घटता रहा और 2023 में 42% गिरकर $248.4B पर पहुंच गया। 2024 के शुरुआती कुछ महीनों में हल्की रिकवरी दिखी है, लेकिन रुझान अभी भी broadly वैसा ही है
  • ऊपर बताए गए कई कारणों से data infrastructure में फंडिंग बहुत कमजोर रही, और Sigma Computing तथा Databricks इसके अपवाद रहे
  • इसके विपरीत, AI की कहानी पूरी तरह अलग थी
  • AI निवेश बाज़ार की खास बातें इस प्रकार थीं:
    • कुछ चुनिंदा startups, खासकर OpenAI, Anthropic, Inflection AI, Mistral आदि में पूंजी का संकेंद्रण
    • MS, Google, NVIDIA जैसे corporate investors (CVC) की असामान्य रूप से ऊंची हिस्सेदारी
    • CVC deals के विवरण में वास्तविक नकद निवेश और "computing power support के बदले मिली equity" के बीच अस्पष्टता
  • 2023 MAD के बाद उल्लेखनीय deals इस प्रकार रहीं (कालक्रमानुसार, पूरी सूची नहीं):
    • OpenAI (प्रमुख foundation model डेवलपर): दो राउंड में $10.3B जुटाए, valuation $86B
    • Adept (foundation model डेवलपर): $350M फंडिंग, valuation $1B
    • AlphaSense (financial research platform): दो राउंड में $475M जुटाए, valuation $2.5B
    • Anthropic (foundation model डेवलपर): तीन राउंड में $6.45B जुटाए, valuation $18.4B
    • Pinecone (vector DB platform): $100M फंडिंग, valuation $750M
    • Celestial AI (optical interconnect platform): दो राउंड में $275M जुटाए
    • CoreWeave (GPU cloud): $421M फंडिंग, valuation $2.5B
    • Lightmatter (optical chip डेवलपर): दो राउंड में $308M जुटाए, valuation $1.2B
    • Sigma Computing (cloud analytics platform): $340M फंडिंग, valuation $1.1B
    • Inflection (foundation model डेवलपर): $1.3B फंडिंग, valuation $4B
    • Mistral (foundation model डेवलपर): दो राउंड में $528M जुटाए, valuation $2B
    • Cohere (foundation model डेवलपर): $270M फंडिंग, valuation $2B
    • Runway (generative video model डेवलपर): $191M फंडिंग, valuation $1.5B
    • Synthesia (enterprise video generation platform): $90M फंडिंग, valuation $1B
    • Hugging Face (open source ML platform): $235M फंडिंग, valuation $4.5B
    • Poolside (coding के लिए foundation model डेवलपर): $126M फंडिंग
    • Modular (AI development platform): $100M फंडिंग, valuation $600M
    • Imbue (AI agent डेवलपर): $212M फंडिंग
    • Databricks (data/analytics/AI solution): $684M फंडिंग, valuation $43.2B
    • Aleph Alpha (foundation model डेवलपर): $486M फंडिंग
    • AI21 Labs (foundation model डेवलपर): $208M फंडिंग, valuation $1.4B
    • Together (generative AI cloud): दो राउंड में $208.5M जुटाए, valuation $1.25B
    • VAST Data (deep learning data platform): $118M फंडिंग, valuation $9.1B
    • Shield AI (aerospace/defense AI pilot): $500M फंडिंग, valuation $2.8B
    • 01.ai (foundation model डेवलपर): $200M फंडिंग, valuation $1B
    • Hadrian (aerospace/defense parts manufacturing): $117M फंडिंग
    • Sierra AI (customer service AI chatbot): दो राउंड में $110M जुटाए
    • Glean (enterprise AI search): $200M फंडिंग, valuation $2.2B
    • Lambda Labs (GPU cloud): $320M फंडिंग, valuation $1.5B
    • Magic (coding के लिए foundation model डेवलपर): $117M फंडिंग, valuation $500M

M&A, प्राइवेट लेनदेन

  • 2023 MAD के बाद M&A बाज़ार काफी शांत रहा
  • कई पारंपरिक software कंपनियां M&A की बजाय अपने stock price और overall business पर ध्यान देती दिखीं
  • खासकर, सख्त हुए antitrust माहौल ने भी संभावित खरीदारों पर दबाव डाला
  • private equity (PE) ने कमजोर पड़े बाज़ार में सस्ते अवसर तलाशते हुए अपेक्षाकृत सक्रिय रुख दिखाया
  • MAD में दिखे उल्लेखनीय deals इस प्रकार थे (आकार के क्रम में):
    • Broadcom (semiconductor निर्माता) द्वारा VMWare (cloud कंपनी) का अधिग्रहण, $69B
    • Cisco (network/security infrastructure) द्वारा Splunk (monitoring/observability) का अधिग्रहण, $28B
    • Qualtrics (CX management), Silver Lake/CPP द्वारा private किया गया, $12.5B
    • Coupa (spend management platform), Thoma Bravo द्वारा private किया गया, $8B
    • New Relic (monitoring/observability), Francisco Partners/TPG द्वारा अधिग्रहण, $6.5B
    • Alteryx (analytics platform), Clearlake/Insight द्वारा private किया गया, $4.4B
    • Salesloft (revenue orchestration), Vista Equity द्वारा अधिग्रहण $2.3B
      • Vista ने customer experience AI chatbot कंपनी Drift का भी अधिग्रहण किया
    • Databricks (data lakehouse), MosaicML (AI development platform) का अधिग्रहण, $1.3B
      • Arcion, Okera आदि के भी छोटे अधिग्रहण
    • Thoughtspot (analytics platform), Mode Analytics (BI) का अधिग्रहण, $200M
    • Snowflake (data warehouse), Neeva (AI search engine) का अधिग्रहण, $150M
    • DigitalOcean (cloud), Paperspace (AI development) का अधिग्रहण, $111M
    • NVIDIA (AI chip) द्वारा OmniML (edge AI optimization) का अधिग्रहण
  • MS द्वारा Inflection AI का अधिग्रहण भी एक अनोखा मामला था
  • 2024 AI M&A का साल बनेगा या नहीं, यह बाज़ार की momentum पर निर्भर करेगा
  • निचले बाज़ार खंड में, पिछले 1-2 वर्षों में कई promising AI startups ने फंडिंग जुटाई है। पिछली AI boom के दौरान शुरुआती निवेश के बाद प्रदर्शन की तुलना में बड़े दाम पर talent acquisitions (acquihire) काफी हुए थे। AI talent अब भी दुर्लभ है
  • ऊपरी बाज़ार खंड में, leading data platforms और AI platforms के बीच convergence को गति मिल रही है, लेकिन कीमतें आसान नहीं होंगी

IPO

  • शेयर बाज़ार में भी AI सबसे गर्म विषयों में था। "Magnificent 7" (NVIDIA, Meta, Amazon, MS, Alphabet, Apple, Tesla) के शेयर 2023 में 49% से अधिक चढ़े और उन्होंने व्यापक बाज़ार की बढ़त को lead किया
  • लेकिन pure AI stocks अब भी बहुत कम हैं। जो कुछ AI stocks मौजूद हैं, वे premium पर ट्रेड हो रहे हैं (Palantir का शेयर 2023 में 167% चढ़ा)
  • यह कई AI-संबंधित IPO उम्मीदवार startups के लिए सकारात्मक संकेत हो सकता है। Databricks के नेतृत्व में Celonis, Scale AI, Dataiku, Fivetran जैसी बड़ी कंपनियां IPO की तैयारी कर रही हैं
  • OpenAI और Anthropic listing को लेकर क्या रुख अपनाते हैं, यह भी दिलचस्प विषय होगा
  • दूसरी ओर, 2023 का IPO बाज़ार बहुत कमजोर रहा। MAD-संबंधित कंपनियों में से केवल कुछ ही listing कर पाईं:
    • Klaviyo (marketing automation): 2023.9 में listed, valuation $9.2B
    • Reddit (AI कंपनियों को content licensing प्रदान करता है): 2024.3 में listed, valuation $6.4B
    • Astera Labs (AI/cloud के लिए semiconductor): 2024.3 में listed, valuation $5.5B

निष्कर्ष

  • हम एक बेहद असाधारण समय में जी रहे हैं। हम paradigm shift की शुरुआती अवस्था में हैं
  • यह प्रयोग करने और नई चीज़ें आज़माने का समय है। हमने अभी बस शुरुआत ही की है