- रोबोटिक्स उद्योग इस समय GPT-2.5 स्तर के चरण में है, जहां foundation models वास्तविक क्षमताएं दिखा रहे हैं, लेकिन लैब प्रदर्शन और फील्ड डिप्लॉयमेंट के बीच का अंतर अभी भी बड़ा है
- Goldman Sachs ने 1 साल में 6 गुना बढ़ाकर 2035 तक 38 अरब डॉलर के बाज़ार का अनुमान दिया, फिर भी Bessemer इसे सतर्क मानता है, और उसका अनुमान है कि केवल रोबोटिक्स डेटा लागत पर ही अगले 2 वर्षों में पूरे उद्योग में 3 अरब डॉलर से अधिक खर्च होगा
- अमेरिकी रोबोटिक्स कंपनियों के 48% संस्थापक Stanford, MIT, Berkeley, CMU इन 4 संस्थानों से हैं, जिससे टैलेंट का केंद्रीकरण winner-takes-all संरचना को और तेज़ करेगा
- रक्षा रोबोटिक्स कंपनियों का Series A median गैर-रक्षा कंपनियों की तुलना में दोगुना होकर 10.5 करोड़ डॉलर तक पहुंच गया है, और Anduril की 60 अरब डॉलर valuation जैसे संकेतों के आधार पर अनुमान है कि पहला 50 अरब डॉलर से बड़ा IPO इसी क्षेत्र से आएगा
- पिछले 5 वर्षों में 3 करोड़ डॉलर से अधिक निवेश पाने वाली रोबोटिक्स कंपनियां केवल 42 रहीं, जो software की तुलना में 18वें हिस्से के बराबर है, इसलिए यह रोबोटिक्स bubble नहीं बल्कि संरचनात्मक अल्प-निवेश की स्थिति है
रोबोटिक्स की संरचनात्मक मांग और बाज़ार दृष्टिकोण
- दोहराए जाने वाले शारीरिक श्रम या जोखिम भरे कार्य-पर्यावरण में मानव श्रम के विकल्प की मांग, अमेरिका, यूरोप, जापान और चीन में जनसांख्यिकीय बदलावों के कारण लगातार बढ़ रही है
- कुछ analysts ने अनुमान लगाया है कि रोबोटिक्स बाज़ार 2035 तक 38 अरब डॉलर तक पहुंच सकता है, और Goldman Sachs ने केवल 1 साल में इस अनुमान को 6 गुना बढ़ाया
- Bessemer का मानना है कि यह अनुमान भी गति और पैमाने दोनों के लिहाज़ से सतर्क है
- Bessemer पार्टनर Jeremy Levine ने कहा, "अगले 10~20 वर्षों में पृथ्वी पर आज की तुलना में 1 लाख गुना अधिक रोबोट होंगे"
- Bessemer ऐसे समय निवेश अवसर देख रहा है जब टैलेंट मूवमेंट, तकनीकी breakthroughs और संरचनात्मक tailwinds एक साथ तेज़ हो रहे हैं, और उसके portfolio में Waymo, Mind Robotics, Foxglove, Breaker, Noda, Voxel51, DroneDeploy, Auterion, Perceptron, ANYbotics आदि शामिल हैं
पूर्वानुमान 1: रोबोटिक्स का ChatGPT मोमेंट करीब है, लेकिन अभी नहीं आया
- रोबोटिक्स उद्योग GPT-2.5 मोमेंट वाले चरण में है, जहां foundation models ने ठोस क्षमताएं दिखानी शुरू कर दी हैं और scaling laws भी उभरने लगे हैं, लेकिन रिसर्च लैब डेमो और production deployment के बीच का अंतर अभी भी बड़ा है
- Physical Intelligence के π0 model ने मानव-स्तर की फुर्ती के साथ कपड़े मोड़ने में सफलता पाई
- फरवरी 2026 में प्रकाशित EgoScale पेपर ने साबित किया कि pretraining data के पैमाने के अनुसार policy performance अनुमानित रूप से बेहतर होती है, और इसने रोबोटिक्स foundation models के LLM जैसी data-driven improvement curve का पहला मज़बूत प्रमाण दिया
- दो मुख्य अनसुलझे सवाल मौजूद हैं
- लैब performance और production के लिए आवश्यक 99.9% reliability के बीच का अंतर घटाने के लिए कितना डेटा चाहिए
- जब रोबोटिक्स का ChatGPT मोमेंट आएगा, तो वह कैसा दिखेगा
- chatbots के विपरीत, केवल text box से क्षमता साबित नहीं की जा सकती; इसका प्रमाण होगा ऐसा रोबोट जो बिना मानव हस्तक्षेप के अनजान वातावरण में जटिल कार्य कर सके
- जिन क्षेत्रों में पहले से commercialization हो चुका है: warehouse automation, surgical assistance, last-mile delivery, industrial inspection जैसे सीमित वातावरण वाले purpose-built systems पहले से revenue ला रहे हैं
- Perceptron के CEO Armen Aghajanyan: "वास्तविक दुनिया की रोबोटिक्स में मुख्य चीज़ बेहतर control algorithm नहीं, बल्कि भौतिक दुनिया को समझने वाला foundation model है; robot control तो उसके ऊपर की केवल एक पतली layer है"
पूर्वानुमान 2: scaling laws का आगमन — डेटा महंगा है, पूंजी moat है, और world models shortcut बन सकते हैं
- LLM इंटरनेट से सैकड़ों खरब tokens के text का उपयोग कर सके, लेकिन रोबोटिक्स में उसके बराबर का corpus मौजूद नहीं है
- दुनिया भर का robot manipulation data लगभग 3 लाख घंटे माना जाता है; इसकी तुलना में इंटरनेट video लगभग 100 करोड़ घंटे और text 300 खरब tokens है, इसलिए यहां संरचनात्मक अंतर है
- Bessemer का अनुमान है कि अगले 2 वर्षों में पूरे उद्योग की रोबोटिक्स डेटा लागत 3 अरब डॉलर से अधिक होगी
- इसमें teleoperation, egocentric video, simulation और physical demonstration collection आदि शामिल हैं
- robot data को scrape या खरीद नहीं सकते; इसे हर task और हर environment के लिए सीधे बनाना पड़ता है
- Zeromatter के CEO Ian Glow: "केवल teleop से सफल data strategy नहीं बन सकती; ज़रूरी scale और diversity पाने के लिए इंटरनेट या simulator से reinforcement learning के जरिए data लाना होगा"
- World model: ऐसा neural network जो इंटरनेट-स्तर के video से भौतिक नियम सीखता है
- Meta का V-JEPA 2 10 लाख घंटे से अधिक video पर training के बाद, केवल 62 घंटे अतिरिक्त robot data से वास्तविक robot arm पर 80% zero-shot pick-and-place success rate तक पहुंचा
- लेकिन NVIDIA के Cosmos को training के लिए 10,000 H100 GPU तीन महीने तक चाहिए थे, इसलिए world model भी capital-intensive approach है
- Simulation और reinforcement learning: locomotion में sim-to-real ट्रांज़िशन अच्छा काम करता है, लेकिन manipulation में soft objects, fabric और liquids जैसी fidelity समस्याओं के कारण यह अभी भी अनसुलझा research challenge है
- Voxel51 के CEO Brian Moore: "physical AI में लीडर और दिखावेबाज़ी के बीच फर्क data quality के प्रति जुनून से तय होता है; खराब डेटा सिर्फ inefficiency नहीं, बल्कि risk है"
पूर्वानुमान 3: टैलेंट का केंद्रीकरण तेज़ी से विजेताओं को तय करेगा — यह 50 कंपनियों की सफलता वाला बाज़ार नहीं है
- पिछले 5 वर्षों में स्थापित और 3 करोड़ डॉलर से अधिक निवेश पाने वाली अमेरिकी रोबोटिक्स कंपनियों में 43% संस्थापकों के पास PhD है
- उनमें से 48% Stanford, MIT, Berkeley, CMU इन 4 संस्थानों से हैं
- 56% के पास कम-से-कम 1 PhD सह-संस्थापक है, और 43% के संस्थापक सीधे अकादमिक दुनिया से आए हैं
- talent moat में टैलेंट → पूंजी → data partnerships → customer relationships → proprietary datasets के क्रम में compounding effect बनता है, इसलिए winner-takes-all संरचना अधिकांश अनुमान से भी तेज़ी से बनेगी
- LLM क्षेत्र में open source (Llama, Mistral) ने capability access को लोकतांत्रिक बनाया, लेकिन रोबोटिक्स में LeRobot, Genesis, Isaac Lab जैसे open source बढ़ रहे हैं, फिर भी यहां यह भौतिक बाधा बनी हुई है कि "आख़िरकार robot तो चाहिए ही"
- sim-to-real transition, manipulation, locomotion, sensor fusion जैसे क्षेत्रों में सबसे गहरी विशेषज्ञता रखने वाली टीमें open source releases से आसानी से कॉपी न की जा सकने वाली बढ़त बना रही हैं
पूर्वानुमान 4: full-stack कंपनियां निकट अवधि का मूल्य हासिल करेंगी — pure foundation model कंपनियों को इंतज़ार करना होगा
- LLM में GPT-4 जैसा single API endpoint होने से 2 लोगों की टीम भी frontier AI products बना सकती थी, लेकिन रोबोटिक्स में domain-specific data collection, environment-tailored fine-tuning, hardware integration और operational infrastructure की ज़रूरत होती है
- आज बन रहा moat model architecture से ज़्यादा proprietary data pipeline, domain expertise, deployment infrastructure और feedback loop बनाने वाले customer relationships में है
- hardware cost में गिरावट इस dynamics को तेज़ कर रही है
- DroneDeploy के CEO Mike Winn: "construction क्षेत्र में ground robots की कीमत 1 लाख डॉलर से घटकर 15,000 डॉलर से कम हो गई है, और docking drones 2 लाख डॉलर से घटकर 20,000 डॉलर से कम हो गए हैं, जिससे deployment scale-up का tipping point पार हो रहा है"
- stack तीन layers में बंट रहा है
- infrastructure layer: foundation models, world models
- application layer: custom hardware वाली full-stack कंपनियां (humanoids, industrial systems) + commercial off-the-shelf platforms पर AI लागू करने वाली full-stack कंपनियां
- value application layer में इसलिए केंद्रित हो रहा है क्योंकि infrastructure layer अभी इतनी general-purpose नहीं है कि वह स्वतंत्र रूप से end-to-end deployment को support कर सके
- जैसे-जैसे foundation models बेहतर होंगे और sim-to-real transition परिपक्व होगा, रोबोटिक्स का API मोमेंट आएगा, लेकिन यह 2028 के बाद की बात है; मौजूदा दौर में vertical integration ही टिकाऊ मूल्य बना रहा है
- Foxglove के CEO Adrian Macneil: "physical AI में निर्णायक बढ़त model novelty से नहीं, बल्कि data infrastructure की quality से आती है; जैसे-जैसे models converge करेंगे, सबसे मज़बूत data flywheel वाली कंपनियां जीतेंगी"
पूर्वानुमान 5: रक्षा रोबोटिक्स इस category का पहला 50 अरब डॉलर से बड़ा IPO लाएगा
- रक्षा रोबोटिक्स कंपनियों का Series A median 2025 में 10.5 करोड़ डॉलर था, जो गैर-रक्षा कंपनियों के 5 करोड़ डॉलर से दोगुना से भी अधिक है, और यह अंतर 2021 के बाद हर साल बढ़ा है
- Anduril ने मार्च 2026 में 60 अरब डॉलर valuation पर round बंद किया, और Saronic ने उसी महीने autonomous shipbuilding के लिए 1.75 अरब डॉलर Series D जुटाया
- रक्षा procurement cycle लंबी होती है, लेकिन अनुमानित होती है; contract size बड़ा होता है, renewal rate ऊंचा होता है, और switching cost काफी अधिक होती है
- commercial robotics के विपरीत, रक्षा खरीददार ROI नहीं बल्कि राष्ट्रीय सुरक्षा जोखिम के आधार पर फैसले लेते हैं
- geopolitics इसे और बढ़ाता है: 2025 में दुनिया भर में बिके humanoid robots का लगभग 90% चीन में बना था
- चीनी AI models अमेरिका से औसतन लगभग 7 महीने पीछे हैं, लेकिन यह अंतर लगातार घट रहा है, और अमेरिकी सरकार रोबोटिक्स को राष्ट्रीय सुरक्षा की अनिवार्यता की तरह देखना शुरू कर चुकी है
- dual-use के लिहाज़ से, सबसे मज़बूत कंपनियां single-purpose weapon systems नहीं, बल्कि व्यावसायिक उपयोग वाले autonomous platforms, perception systems और decision infrastructure बना रही हैं
- Breaker के सह-संस्थापक Matthew Buffa: "सबसे दिलचस्प कंपनियां रक्षा और commercial में से एक चुनने वाली नहीं, बल्कि ऐसे systems बनाने वाली हैं जो रक्षा आवश्यकताओं को पूरा करने लायक सक्षम हों और commercial रूप से भी innovative हों"
पूर्वानुमान 6: रोबोटिक्स bubble नहीं है — बल्कि इस क्षेत्र में अभी पर्याप्त पैसा नहीं आ रहा
- पिछले 5 वर्षों में 3 करोड़ डॉलर से अधिक निवेश पाने वाली software कंपनियां 745 थीं, जबकि रोबोटिक्स में यह संख्या केवल 42 थी, यानी 18 गुना कम
- जबकि रोबोटिक्स का underlying market वैश्विक software spending से 30 गुना बड़ा है
- hardware business के capital-intensive स्वभाव को देखते हुए भी, यह अवसर की तुलना में संरचनात्मक अल्प-निवेश की स्थिति है
- ज़्यादातर analysts अगले 10 वर्षों में 50 गुना industry growth का अनुमान लगाते हैं, लेकिन Bessemer के अनुसार यह भी मौजूदा workflow automation तक सीमित अनुमान है और इसमें general-purpose robots से बनने वाली नई economic activity categories शामिल नहीं हैं
- निवेश पाने वाली हर कंपनी सफल नहीं होगी; कुछ valuations बढ़ा-चढ़ाकर आंकी गई हैं, और पूंजी कुछ चुनिंदा leaders में सिमटेगी
- लेकिन selectivity और scarcity अलग बातें हैं; कुल रोबोटिक्स निवेश स्तर अभी भी अवसर के आकार और capability development की गति की तुलना में बहुत कम है
- ChatGPT मोमेंट आने से पहले, और टैलेंट consolidation पूरा होने से पहले, अभी प्रमुख कंपनियों में निवेश करने की खिड़की खुली है; अगर inflection point का सबूत आने का इंतज़ार करेंगे, तो अवसर निकल जाएगा
- Flexion के CEO Nikita Rudin: "5 साल बाद दुनिया में तैनात अधिकांश robots वे startup नहीं बनाएंगे जिन्हें आज जाना जाता है, बल्कि ऐसी कंपनियां बनाएंगी जिन्होंने अभी रोबोट बनाना शुरू भी नहीं किया है, लेकिन बड़े पैमाने पर निर्माण करना जानती हैं"
अनसुलझी चुनौतियां और खुली बहसें
- reliability gap: task success rate को 80% से 99.9% तक ले जाना linear समस्या नहीं है
- इसके लिए tactile sensing, force feedback, manipulation के लिए sim-to-real transition जैसी मूलतः अलग approaches चाहिए
- Argus Systems की CEO Lisa Yan: "Waymo के अनुभव से देखें तो वास्तविक deployment समय के साथ और कठिन होता जाता है और specialized data curation समस्याएं सामने लाता है; 99% से 99.9% तक का अंतर घटाने में ज़्यादातर लोगों की अपेक्षा से अधिक समय लगेगा"
- inference cost समस्या: world models और बड़े vision-language-action models को real-time में चलाने की लागत अधिक है
- text models में हजारों concurrent users को shared infrastructure पर batch किया जा सकता है, लेकिन रोबोटिक्स models को हर robot के लिए कुछ milliseconds पर environment state generate करनी पड़ती है, इसलिए लगभग dedicated GPU pipeline चाहिए
- LLM inference cost 3 वर्षों में लगभग 1,000 गुना घटी है; रोबोटिक्स भी क्या वैसी ही curve का पालन करेगा, यही foundation model approach की commercial viability तय करेगा
- interpretability अगली infrastructure layer के रूप में उभर रही है
- केवल 2026 की पहली तिमाही में ही 6~7 world model कंपनियों में लगभग 6 अरब डॉलर डाले गए
- Vayu Robotics के सह-संस्थापक Mahesh Krishnamurthi: "जैसे-जैसे उद्योग mature होगा, interpretability समझौता न किए जा सकने वाला तत्व बन जाएगी; अभी ये models black box हैं, और इन्हें खोलने के tools बनाने वाले startups की लहर आएगी"
- open source बनाम closed: LLM में open source ने ecosystem development को बहुत तेज़ किया, लेकिन रोबोटिक्स में जहां physical data और deployment infrastructure model architecture जितने ही महत्वपूर्ण हैं, वही dynamics लागू होगा या नहीं, यह अभी स्पष्ट नहीं है
- open source model architectures को उम्मीद से तेज़ commodity बना सकता है, लेकिन data और deployment layers लंबे समय तक proprietary रह सकते हैं
- जो कंपनियां समझेंगी कि stack के कौन से हिस्से को खोलना है और कौन से हिस्से को बचाकर रखना है, वे रणनीतिक बढ़त हासिल करेंगी
दो सच्चाइयों का सह-अस्तित्व
- Cobot के CEO Brad Porter: "रोबोटिक्स का ChatGPT मोमेंट ज़्यादातर लोगों की सोच से जल्दी आ रहा है, और जब यह आएगा तो production time (वास्तविक robot, वास्तविक task, वास्तविक environment) bottleneck होगा; डेमो नहीं बल्कि deployment के लिए optimize करने वाली कंपनियां निर्णायक रूप से अलग दिखेंगी"
- stealth रोबोटिक्स कंपनी के सह-संस्थापक Philipp Wu: "timeline ज़्यादातर अनुमानों से कहीं लंबी है, और general-purpose robotics में अभी 5 साल से अधिक लगेंगे"
- ये दोनों दृष्टिकोण परस्पर विरोधी नहीं, बल्कि अलग-अलग dimensions का वर्णन करते हैं: Porter inflection point तक पहुंचने के रास्ते की बात करते हैं, जबकि Wu बताते हैं कि वह inflection point वास्तव में कितना दूर है
- संस्थापकों के लिए निहितार्थ: अभी निर्णायक रूप से deploy करें, लेकिन general-purpose मोमेंट को क्षितिज मानकर निर्माण करें
- inflection point करीब आ रहा है; टैलेंट शिफ्ट हो रहा है, hardware commodity बन रहा है, data infrastructure तैयार हो रहा है, और अगले 10 वर्षों के physical AI को परिभाषित करने वाली कंपनियां अभी इसी समय स्थापित और funded हो रही हैं
1 टिप्पणियां
जानना दिलचस्प होगा कि कौन-कौन सी कंपनियां सामने आती हैं।