AI का 344 अरब डॉलर का ‘language model’ दांव अस्थिर दिखता है
(bloomberg.com)- इस साल वैश्विक Big Tech की 4 सबसे बड़ी कंपनियां 344 अरब डॉलर AI पर खर्च कर रही हैं, और इसका अधिकांश हिस्सा large language model (LLM) के training और operation के लिए data center में निवेश किया जा रहा है
- LLM पहले ही इतने लोकप्रिय हो चुके हैं कि 70 करोड़ से अधिक लोग हर हफ्ते ChatGPT का इस्तेमाल करते हैं, लेकिन उनकी प्रगति की रफ्तार धीमी पड़ रही है और hallucination, ऊंची लागत, और मामूली performance improvement जैसी सीमाएं सामने आ रही हैं
- चीन की DeepSeek ने छोटे और अधिक efficient model पेश कर बाज़ार को चौंकाया, और Covariant (robotics), Atman Labs (non-deep-learning approach) जैसी कंपनियां physical world-responsive AI की खोज कर रही हैं
- हालिया research के अनुसार LLM की social reasoning ability कुछ गिनी-चुनी विशेषताओं पर निर्भर करती है और छोटे बदलावों से भी कमजोर पड़ सकती है; OpenAI ने भी vulnerable groups के safety guardrails fail होने की संभावना स्वीकार की है
- विशेषज्ञ LLM को सिर्फ ‘token generator’ बताते हुए आलोचना कर रहे हैं, और चेतावनी देते हैं कि एक ही तकनीक के प्रति जुनून बाज़ार की अस्थिरता बढ़ा सकता है, इसलिए नए approaches के उभरने की संभावना के लिए तैयार रहना चाहिए
विशाल AI निवेश और LLM-केंद्रित सोच
- हर निवेशक जानता है कि "सारे अंडे एक ही टोकरी में नहीं रखने चाहिए", तो फिर Silicon Valley artificial intelligence (AI) बनाने के सिर्फ एक ही तरीके पर दांव क्यों लगा रही है?
- दुनिया की 4 सबसे बड़ी tech कंपनियां 2025 में AI पर 344 अरब डॉलर निवेश कर रही हैं, और मुख्य रूप से large language model (LLM) को train और run करने के लिए data center बनाने पर ध्यान दे रही हैं
- LLM text, audio, और visual content जैसे multimodal input को process करते हैं, और sequence में अगले token की prediction तकनीक पर निर्भर करते हैं
- Personal chatbot तेज़ी से बढ़ रहे हैं, कुछ AI startup revenue कमाने लगे हैं, और कंपनियां generative AI से शुरुआती productivity gains भी देख रही हैं
- LLM mainstream adoption हासिल करने वाली पहली AI तकनीक बन गए हैं, और ChatGPT के हर हफ्ते 70 करोड़ से अधिक users हैं
- कुछ startup break-even तक पहुंच गए हैं, लेकिन healthcare और legal जैसे संवेदनशील क्षेत्रों में hallucination की समस्या के कारण भरोसा बनाने की सीमाएं मौजूद हैं
एकल तकनीक के प्रति जुनून का खतरा
- लेकिन एक ही तकनीक पर ध्यान केंद्रित करना जोखिम भरा है; अतीत में BlackBerry physical keyboard पर अड़ा रहा और Apple के touchscreen से पीछे रह गया, और Yahoo का portal दांव Google की search dominance के आगे हार गया
- LLM के साथ भी वही रास्ता दोहराया जा सकता है, और यदि नया AI approach उभरता है तो बड़े पैमाने का निवेश फंसने के जोखिम में पड़ सकता है
- चीन की DeepSeek ने जनवरी में छोटा और अधिक efficient LLM जारी किया, architecture को open किया, और बाज़ार को चौंकाते हुए non-traditional approach की संभावना साबित की
वैकल्पिक approaches की खोज
- AI का विकास अतीत की अंतर्दृष्टि और नए विचारों के मेल से होता है, और superintelligent machine की खोज में भी बहुआयामी approach की जरूरत है
- Covariant जैसे startup data pattern analysis के बजाय spatial reasoning software विकसित कर रहे हैं, और LLM-केंद्रित धारा से बाहर जा रहे हैं
- Robotics, drone, drug discovery, और climate modeling कंपनियों को real-time physical response की जरूरत होती है, इसलिए वे LLM-केंद्रित सोच से दूर हैं
- ब्रिटेन की Atman Labs deep learning से पहले के भुला दिए गए विचारों को फिर से खोज रही है, जो Google DeepMind के शुरुआती multi-track approach (जैसे AlphaGo, reinforcement learning) को दर्शाता है
LLM की सीमाएं और reliability की समस्या
- अब large language model logic में दरारें दिखने लगी हैं: बेहद ऊंची लागत से लेकर घटते returns की आशंका तक
- OpenAI और Google के नवीनतम model अपने पिछले versions से बस थोड़ा बेहतर हैं, चाहे उन पर और ज्यादा पैसा ही क्यों न लगाया जाए
- इसके बावजूद hallucination खत्म नहीं हो रही, जिससे medical या legal analysis जैसे enterprise adoption में बाधा आ रही है
- हालिया Nature study में पाया गया कि language model की social reasoning ability बहुत कम विशेषताओं पर निर्भर करती है और छोटे बदलाव से भी ढह सकती है, जो reliability पर बुनियादी सवाल उठाती है
- OpenAI ने स्वीकार किया कि लंबी बातचीत के दौरान vulnerable groups के लिए safety guardrails टूट सकते हैं, और वास्तव में एक घटना में एक teenager को self-harm instructions दिए गए
उद्योग की आलोचना और आगे का रास्ता
- Fei-Fei Li: “प्रकृति में भाषा नहीं होती, दुनिया physical laws का पालन करती है,” कहते हुए language-centered limits की ओर इशारा
- Alex Karp (Palantir CEO): “Silicon Valley ने LLM का जरूरत से ज्यादा प्रचार किया,” ऐसी आलोचना
- Yann LeCun: LLM अधिक बुद्धिमान मशीनों की ओर जाने वाला ‘dead end’ हैं, वे सिर्फ “token generator” हैं और अपने physical surroundings को समझ नहीं सकते या पहले से planning नहीं कर सकते
- निष्कर्षतः LLM बने रहेंगे, लेकिन एक ही समाधान से चिपके रहना जोखिम भरा है, और investors व companies को नई technological paradigm shift की संभावना के लिए तैयार रहना चाहिए
2 टिप्पणियां
GPT5 से लगता है कि वे reasoning के सहारे किसी तरह performance बढ़ाने की कोशिश कर रहे हैं, लेकिन वह भी आसान नहीं दिखता। जिन जवाबों को बस एक ठीक-ठाक उत्तर पर रुक जाना चाहिए, वे अब दर्जनों पंक्तियों में आने लगे हैं, इसलिए यह बहुत बोझिल लगता है. sigh
Hacker News राय
https://archive.is/2rFK4 पर देखें
यह तकनीक डेमो में बेहद प्रभावशाली दिखती है, और साफ़ दिखता है कि हर कोई वाकई उत्साहित है; सहकर्मियों या executives को गर्व से डेमो करते या लगातार मज़ाक करते देखना कुछ वैसा लगता है जैसा पहले लोगों को नया मोबाइल फ़ोन मिलने पर उसे दूसरों को दिखाते समय लगता था। इसलिए लोग इसकी असली उपयोगिता से ज़्यादा इसे बढ़ा-चढ़ाकर देखने लगते हैं। मोबाइल फ़ोन की तरह यह भी एक सार्थक प्रगति है, लेकिन कम-से-कम निकट अवधि में इसका असर hype जितना बड़ा नहीं होगा। खासकर anonymous forums में "यह overhyped है" जैसी बात बहुत दिखती है, लेकिन पेशेवर भूमिकाओं में लोग माहौल के साथ बहते जाते हैं। जैसे सब जानते हों कि क्या हो रहा है, फिर भी चाहते हों कि पार्टी चलती रहे।
अगर मेरा boss AI पर ज़रूरत से ज़्यादा ज़ोर देकर कहे कि पूरी कंपनी को इसमें all-in जाना है, तो आज जैसी कठिन job market में बहुत से लोग डर की वजह से साथ चलेंगे। खासकर इसलिए भी कि AI की वजह से jobs कम हो रही हैं। कुछ लोग चुपचाप सिर्फ़ अपने काम के हिसाब से उपयोगी LSP या refactoring जैसे practical tools का इस्तेमाल करते रहेंगे। पेशेवर दुनिया में बहुत कम लोग हिम्मत करके कह पाते हैं कि "सम्राट नंगा है"।
दिलचस्प बात यह है कि anonymous forums में AI को जीवन बदल देने वाला innovation मानने वाली राय भी काफ़ी मिलती है। कम-से-कम तब, जब लोग विशेषज्ञ होने का दिखावा नहीं कर रहे होते। पेशेवर भूमिका में लोग दो समूहों में बँट जाते हैं। जो लोग अपने मूल expertise के बाहर AI का इस्तेमाल करते आए हैं, वे इसकी तारीफ़ ऐसे बढ़ा-चढ़ाकर करते हैं जैसे पहली बार smartphone revolution देखा हो। लेकिन जब वे AI को अपने असली विशेषज्ञता वाले क्षेत्र में लागू करते हैं, तो उन्हें खुद महसूस होता है कि AI को कुछ हद तक ज़रूरत से ज़्यादा आँका गया है, और वे ज़्यादा सतर्क optimist बन जाते हैं। दूसरी ओर, जो लोग अपने ही विशेषज्ञता वाले क्षेत्र में AI का सबसे अच्छा इस्तेमाल करते हैं, वे सकारात्मक तो होते हैं, लेकिन ज़्यादातर शांत ढंग से—कि सीमित परिस्थितियों में यह अच्छा काम करता है।
यह भूल जाना आसान है कि अभी भी इस तकनीक से फ़ायदा उठाने के लिए बहुत से "low-hanging fruit" बचे हुए हैं। लोग अभी भी बहुत बुनियादी integrations ही आज़मा रहे हैं। इतने शुरुआती चरण में भी LLM से काफ़ी शानदार चीज़ें की जा सकती हैं। उदाहरण के लिए Cursor के साथ पुराने codebase को modernize करना और लंबे समय से चाही गई नई feature बनाना। इसमें मेरा कुछ घंटों का समय लगा, जबकि पुराने तरीके से यही काम 1–2 हफ़्ते लेता। यानी संभावना काफ़ी बड़ी है। हाँ, hype मुझसे कुछ दूरी पर है, इसलिए मेरी धारणा अलग हो सकती है।
इन systems में error bars या confidence intervals नहीं होते। आख़िरकार यह एक ऐसा शब्द-जादूगर है जिसकी एक ही "specialty" है—कुछ ऐसा निकालना जो ऊपर-ऊपर से plausible लगे। बेशक इसके लिए कई उपयुक्त उपयोग-क्षेत्र हैं, लेकिन अब भी इतने बड़े, अनुमान से बाहर और सुधारना मुश्किल gaps हैं कि इसकी efficiency की सीमाएँ बनी रहती हैं।
smartphone से की गई तुलना दिलचस्प है। smartphone ने सचमुच दुनिया बदल दी, और उसके आसपास hype भी बहुत था, लेकिन अंत में बदलाव वास्तविक था। सोच रहा हूँ कि क्या LLM और AI भी सच में ऐसा बदलाव लाएँगे।
समझ नहीं आता कि इस investment को वसूल करने की योजना क्या है। मान लें कि अमेरिका की हर बड़ी कंपनी सालाना 100,000 डॉलर subscription दे, और हर परिवार महीने के 20 डॉलर दे, तब भी inference cost और दूसरे ancillary costs को देखते हुए यह रकम investment वसूलने के लिए बहुत कम लगती है। क्या इसके लिए किसी नई medical discovery जैसी चीज़ चाहिए? उदाहरण के लिए OpenAI की gpt-bio और iPSC वाली खबरें सचमुच कमाल की थीं। लेकिन commercialization तक पहुँचने में अभी बहुत लंबा समय है। जानना चाहता हूँ कि असली plan क्या है।
जहाँ तक याद है, मूल लक्ष्य AGI था। मौजूदा AI services से ROI निकालना मक़सद नहीं था। विचार यह था कि AGI आ गया तो monopoly मिल जाएगी, इसलिए सबने lottery ticket की तरह पैसा झोंक दिया। लेकिन पिछले एक साल में exponential progress नहीं दिखी, इसलिए AGI का सपना थोड़ा धीमा पड़ा हुआ लगता है।
game plan शुरू से ही human labor को target करना था। कुछ नौकरियाँ AI से पहले ही पूरी तरह replace हो चुकी हैं, और बाकी में यह productivity बहुत बढ़ा देता है। उसकी आर्थिक value बहुत बड़ी है। AGI के बिना भी, AI-आधारित automation अभी "सबसे सस्ती और सबसे आसानी से replace होने वाली" labor को गंभीर रूप से replace कर रही है। जो काम पहले India के call centers को outsource होते थे, वे धीरे-धीरे data centers की ओर जा रहे हैं। बड़ी AI कंपनियाँ मानती हैं कि अगर R&D और compute investment जारी रहे तो आख़िरकार AGI तक पहुँचा जा सकता है।
अगर AI आपको नौकरी से नहीं निकालता, तो AI अपनी लागत खुद नहीं निकाल सकता।
If AI Doesn’t Fire You, It Can’t Pay For Itself
अगर LLM पूरे white-collar workforce की efficiency को 2x तक बढ़ा सके, तो बड़ी कंपनियों को सालाना 100,000 डॉलर नहीं बल्कि उससे कहीं ज़्यादा चुकाना पड़ेगा। अगर यह आधी नौकरियाँ replace करके बचाई गई लागत का सिर्फ़ 25% भी ले ले, तो इतनी revenue बन सकती है कि मौजूदा valuations बहुत सस्ते लगें।
साल के 100,000 डॉलर तो लगभग कुछ भी नहीं हैं। मोटे तौर पर यह प्रति employee 10 डॉलर जैसा है; अगर salary और benefits मिलाकर प्रति employee 100,000 डॉलर मानें, तो सिर्फ़ 10% productivity increase से भी बड़ा असर होगा। 10,000 employees वाली कंपनी में यह सालाना 100 million डॉलर के पैमाने की बात है।
344 billion डॉलर कितना बड़ा है, इसका अंदाज़ा लगाना आसान नहीं, लेकिन अमेरिकी stock market की कुल market cap 62.8 trillion डॉलर है। Shiller का CAPE ratio (मौजूदा कीमत / 10 साल की औसत earnings) लगभग 38x है। यानी 10 साल की औसत annual earnings लगभग 1.7 trillion डॉलर हुई। इस हिसाब से 344 billion डॉलर अमेरिकी equity market की औसत annual earnings के लगभग 1/5 के बराबर है। इस तरह यह संख्या थोड़ी ज़्यादा सहज लगती है।
इन दिनों मैं portfolio खुद manage करते हुए expected returns (GDP + dividends) को risk के हिसाब से adjust करके देश/क्षेत्र के अनुसार अनुमान निकालता हूँ, और साल में एक-दो बार rebalance करता हूँ। अगर मान लें कि यह लगभग पूरी तरह bubble है, तो समझना चाहता हूँ कि अमेरिकी equity earnings को कैसे adjust किया जाए। खासकर AI-केंद्रित stocks को track करते समय इसे लागू करके देखना चाहूँगा।
हालांकि 344 billion डॉलर annual नहीं, cumulative संख्या है।
अभी जो मौजूद है, वह एक शानदार interface है जो users को काम या निजी उपयोग के लिए बहुत जटिल systems तक बिना friction के पहुँचने देता है। लेकिन यह खुद सार नहीं है। अभी यह सिर्फ़ एक पतली outer shell है। यह क्रांति आख़िरकार trillions डॉलर की value बनाएगी या नहीं, इस पर संदेह है, लेकिन अच्छी बात है कि यह मेरी चिंता नहीं है, इसलिए मैं निश्चिंत हूँ।
यह "article" clickbait है। इसमें सिर्फ़ सनसनीखेज़ title है, substance लगभग नहीं के बराबर है। बस ऐसे बेकार सवाल फेंकता है जैसे, "कुछ मामलों में यह उपयोगी है, लेकिन बड़ी कंपनियाँ इसमें इतना निवेश क्यों कर रही हैं, क्या pure R&D बेहतर नहीं होता?"
जैसे जब फ़िल्में पहली बार आई थीं तो लोग ट्रेन से कुचल जाने की चिंता करते थे, वैसे ही अभी भी मैं उस तरफ़ हूँ जो मानती है कि मशीनें सोचती हैं।
अभी बाज़ार में bubble साफ़ मौजूद है। हाल के समय में AI-आधारित startups की संख्या विस्फोटक रूप से बढ़ी है, और एक ही product category में अलग दिखने की कोशिश में तकनीकी details सब marketing copy में बदलती जा रही हैं। management के नज़रिए से, अगर दस startups यह वादा करें कि "हमारे data पर train करिए और सबसे अच्छा chatbot मिलेगा", तो यह समझना मुश्किल होता है कि वे सचमुच training की बात कर रहे हैं या सिर्फ़ prompt tweak कर रहे हैं। ऐसा पहले भी हुआ है, और उसका एक प्रमुख उदाहरण "deep research" वगैरह है। यह marketing growth में मदद करती है, लेकिन trust को नुकसान पहुँचाती है। वास्तव में हाल ही में एक startup ने Series A raise किया, जबकि वह "experience-based learning" के नाम पर बस prompt में memory जोड़कर performance बढ़ा रहा था (आप चाहें तो खुद ढूँढ सकते हैं)। इसका मतलब यह नहीं कि असली innovation नहीं हो रही। निजी तौर पर मुझे लगता है कि pretraining ने अपने शुरूआती उद्देश्य को काफ़ी हद तक पूरा कर दिया है। पहले वह उद्देश्य खुद भी अस्पष्ट था, लेकिन RL के उभरने के बाद बात कुछ साफ़ हुई। pretraining और test-time compute ही general priors बनाने की कुंजी हैं, यानी इंसानों की तरह तरह-तरह की समस्याएँ हल करने की क्षमता। कभी-कभी, जब यह ठीक से काम नहीं करता, तो RLVR के साथ अतिरिक्त training की ज़रूरत पड़ती है। अभी यह शुरुआती चरण में है, लेकिन इस दिशा में scaling curve का एक और दौर आने को लेकर आशावाद है।
कंपनियों को AI में निवेश करना ही होगा—चाहे उनके पास बहुत पैसा हो या कम। LLM की वजह से उनके मौजूदा business models पर ख़तरा है, इसलिए उन्हें पहले से कदम उठाना पड़ेगा। अगर वे आगे नहीं रह पाए, तो पूरी अमेरिकी अर्थव्यवस्था के हिलने का जोखिम है। अगर अमेरिकी big tech global ad revenue (Meta, Google) खो देती है, तो वह एक झटके में खोखली हो सकती है। वजह यह है कि अगर अलग-अलग देश या economic blocs अपने खुद के products बना लें और अपना लें, तो अमेरिकी products को replace करना बहुत आसान हो जाएगा। अमेरिकी अर्थव्यवस्था असल में FAANG के cash flow पर ज़रूरत से ज़्यादा निर्भर रही है, और यही पैसा दूसरे industries को भी चलाता रहा है। इसलिए Trump के साथ dinner वाली बैठकें हुईं, यह समझ में आता है। अगर AI का यह समीकरण कमजोर पड़ता है, तो अमेरिका को आर्थिक रूप से भी बहुत अस्थिर भविष्य का सामना करना पड़ सकता है।
बाज़ार में Oracle की भारी हलचल की वजह यह खबर है कि OpenAI ने अपने workload का बड़ा हिस्सा उसके cloud पर shift करने का वादा किया है। हक़ीक़त में यह profits से ज़्यादा revenue को प्राथमिकता देने वाली financial "engineering" strategy है, खासकर capital expenditure (CapEx) को जितना हो सके future में धकेलने के तरीके के रूप में। संक्षेप में, यह दिखाता है कि मौजूदा AI bubble कितना ज़्यादा बढ़ चुका है। हाल की Economist analysis के मुताबिक़, बाज़ार अब "risk" से नहीं बल्कि "loss का डर" या "छूट जाने का डर (FOMO)" से चल रहा है, और अभी FOMO पूरी तरह चरम पर है।
Want better returns? Forget risk, focus on fear (Economist)
Oracle की इस बार की उछाल और revenue outlook पूरी तरह "jumping the shark" जैसा लग रहा है। Oracle जैसी कंपनी की प्रकृति देखते हुए मैं उस पर दाँव लगाने में सावधान रहता हूँ, लेकिन इस बार तो short position लेने का लालच हो रहा है।
FOMO सचमुच बहुत गंभीर स्तर पर है। मौजूदा stock market पिछले crypto bubble की तरह behave कर रहा है।