AI की रफ़्तार धीमी पड़ रही है
(wheresyoured.at)- जनरेटिव AI इन्फ्रास्ट्रक्चर को डेटा सेंटर निवेश और compute commitments को सही ठहराने के लिए 2030 तक हर साल AI compute revenue में 2 ट्रिलियन डॉलर से अधिक पैदा करने होंगे
- योजनाबद्ध 190GW डेटा सेंटर, प्रति GW 80–100 बिलियन डॉलर लागत मानने पर, 9.5–15 ट्रिलियन डॉलर के पैमाने पर हैं, और इन्हें वास्तविकता बनाने के लिए हर साल 500 बिलियन–1 ट्रिलियन डॉलर के डेटा सेंटर ऋण जारी करने की ज़रूरत होगी
- OpenAI के 2030 के अंत तक कम-से-कम 852 बिलियन डॉलर खर्च कर देने का अनुमान है, और Anthropic को अपने compute commitments वहन करने के लिए 2029 में सालाना 174 बिलियन डॉलर राजस्व लक्ष्य हासिल करना होगा
- token-based billing पर जाने के बाद कंपनियाँ AI खर्च की visibility और ROI मापने में कठिनाई झेल रही हैं, और Uber, T-Mobile, Brex ने प्रति कर्मचारी token खर्च की सीमा तय की है
- अभी AI startup revenue का 89% OpenAI और Anthropic में केंद्रित है, इसलिए बन रही compute क्षमता को सही ठहराने के लिए कम-से-कम 250 बिलियन डॉलर अतिरिक्त सालाना AI compute demand की ज़रूरत है
AI के पास धीमा पड़ने की गुंजाइश नहीं है — 2030 के अंत तक 3 ट्रिलियन डॉलर से अधिक revenue चाहिए
- Sightline Climate डेटा को ज्यों का त्यों लागू करें तो योजनाबद्ध डेटा सेंटर क्षमता 190GW है, और Jensen Huang के प्रति GW 80–100 बिलियन डॉलर वाले बयान को मानें तो लागत 9.5–15 ट्रिलियन डॉलर निकलती है
- Bloomberg का 3 ट्रिलियन डॉलर डेटा सेंटर buildout वाला वर्णन ऊपर की गणना से मेल नहीं खाता, और ज़रूरी पूंजी कहीं-न-कहीं से जुटानी ही होगी
- Financial Times की रिपोर्ट के मुताबिक बैंक डेटा सेंटर ऋण का बोझ नहीं उठा पाएँगे; अभी सालाना लगभग 250 बिलियन डॉलर के issuance को वास्तविक buildout के लिए 500 बिलियन–1 ट्रिलियन डॉलर सालाना तक बढ़ना होगा
- NVIDIA 2027 के अंत तक 1 ट्रिलियन डॉलर revenue की उम्मीद कर रही है, और क्योंकि revenue का 54% तीन ग्राहकों से आता है, आगे का revenue कुछ गिने-चुने ग्राहकों और counterparties की debt-raising क्षमता पर निर्भर है
- Google की 85 बिलियन डॉलर equity sale और Meta की कई-बिलियन डॉलर equity sale योजना इस बात से जुड़ी है कि hyperscalers के लिए debt financing कठिन होती जा रही है
OpenAI और Anthropic के compute commitments
- Anthropic के compute और chip commitments Google, Amazon, Microsoft के बीच 330 बिलियन डॉलर, CoreWeave के साथ 30 बिलियन डॉलर, और SpaceX के साथ 15 बिलियन डॉलर तक पहुँच चुके हैं
- इन compute costs को वहन करने के लिए Anthropic को 2029 में 174 बिलियन डॉलर सालाना revenue लक्ष्य हासिल करना होगा
- Anthropic ने फरवरी, अप्रैल और मई राउंड में 95 बिलियन डॉलर जुटाए, लेकिन यह पूंजी और cash flow मिलकर भी लागत नहीं उठा पाएँगे; अगले साल कम-से-कम 200 बिलियन डॉलर अतिरिक्त जुटाने होंगे
- OpenAI के 2030 के अंत तक कम-से-कम 852 बिलियन डॉलर खर्च कर देने का अनुमान है, और उसने Microsoft, Amazon, CoreWeave, Cerebras, Oracle के साथ 770 बिलियन डॉलर से अधिक के compute commitments किए हैं
- मार्च में OpenAI द्वारा जुटाए गए 122 बिलियन डॉलर लागत पूरी करने के लिए पर्याप्त नहीं हैं, और साल के अंत तक कम-से-कम 250 बिलियन डॉलर अतिरिक्त पूंजी चाहिए
डेटा सेंटर revenue की गणना और Oracle का जोखिम
- जनरेटिव AI और AI compute को 2030 तक हर साल 2 ट्रिलियन डॉलर से अधिक revenue पैदा करना होगा; नहीं तो डेटा सेंटर capex और Anthropic व OpenAI के commitment payments टिक नहीं पाएँगे
- 190GW डेटा सेंटर पर PUE 1.35 लागू करने से core IT load लगभग 140GW बनता है, और प्रति MW 12.5 मिलियन डॉलर billing के हिसाब से सालाना 1.75 ट्रिलियन डॉलर revenue चाहिए
- योजनाबद्ध क्षमता का आधा ही बने, तब भी डेटा सेंटर को funding shortfall से बचाने के लिए सालाना 875 बिलियन डॉलर revenue चाहिए
- OpenAI और Anthropic क्रमशः 2029 में 184 बिलियन डॉलर और 174 बिलियन डॉलर revenue का अनुमान लगाते हैं, यानी कुल सिर्फ 358 बिलियन डॉलर
- अगर OpenAI Oracle compute का खर्च नहीं उठा पाता या उठाना नहीं चाहता, तो Oracle की नकदी खत्म हो सकती है; Oracle OpenAI के लिए 7.1GW डेटा सेंटर पर 340–700 बिलियन डॉलर खर्च कर रहा है
मौजूदा AI spending पर्याप्त नहीं है
- Salesforce की 2026 में Anthropic पर 300 मिलियन डॉलर खर्च करने की योजना ज़रूरी पैमाने से बहुत दूर है
- दुनिया की सभी AI कंपनियों की मौजूदा कुल compute demand 100 बिलियन डॉलर तक नहीं पहुँचती, जबकि 2030 तक इसका 10 गुना चाहिए
- The Information की रिपोर्ट के अनुसार AI startup revenue में OpenAI और Anthropic की concentration {p:89} की तरह 89% तक पहुँच गई है
- Microsoft का 37 बिलियन डॉलर AI annualized run rate मुख्यतः OpenAI compute से बना है, और Microsoft AI CEO Mustafa Suleyman का कहना है कि Anthropic के मॉडल बहुत महँगे हैं और Microsoft इसका उपयोग शून्य तक लाना चाहता है
- भले ही Anthropic और OpenAI सालाना 500 बिलियन डॉलर compute पर खर्च करें, फिर भी डेटा सेंटर buildout को सही ठहराने के लिए 250 बिलियन डॉलर से अधिक अतिरिक्त compute revenue की ज़रूरत होगी
token billing और ROI की अनिश्चितता
- किसी खास AI task की लागत और return on investment को मापना संभव नहीं है, फिर भी कंपनियाँ output measurement के बिना AI adoption बढ़ाती रही हैं
- Anthropic और OpenAI ने 2026 की पहली तिमाही में ग्राहकों को token-based billing पर शिफ्ट किया, और 2–3 महीनों के भीतर AI cost और ROI uncertainty प्रमुख business media का बार-बार उठने वाला विषय बन गया
- Wall Street Journal द्वारा उद्धृत KPMG सर्वे में AI cost visibility की तरह बंटी थी: 26% समग्र, 50% आंशिक, 22% नहीं या केवल bill आने के बाद पता चलने वाली
- एक कंपनी ने खर्च नियंत्रण न रखने के कारण एक ही महीने में Anthropic मॉडल्स पर 500 मिलियन डॉलर खर्च कर दिए, और Uber ने सिर्फ एक तिमाही में अपना सालाना token budget खत्म कर दिया
- Uber ने प्रति user 1,500 डॉलर प्रति माह, T-Mobile ने अस्थायी रूप से प्रति user 2,000 डॉलर प्रति माह, और Brex ने engineers के लिए 500 डॉलर प्रति सप्ताह तथा non-engineers के लिए 5 डॉलर प्रति सप्ताह AI spending सीमा तय की
coding agents, loops और output की समस्या
- Claude Code के प्रमुख Boris Cherny और OpenAI-स्वामित्व वाले OpenClaw के evangelist Peter Steinberger उपयोगकर्ताओं से agents के लिए loops design करने को कहते हैं
- loop ऐसा तरीका है जिसमें LLM बिना उपयोगकर्ता के अतिरिक्त prompt डाले, इच्छित अवधि तक काम करता रहता है
- subsidized subscription में model errors की लागत 20 डॉलर, 100 डॉलर, 200 डॉलर प्रति माह के पीछे छिप जाती है, लेकिन जब असली लागत उपयोगकर्ता देता है तो failure की कीमत साफ दिखाई देती है
- यह उन अध्ययनों से जुड़ता है जो दिखाते हैं कि LLM जितना अधिक reasoning करता है, hallucinations उतनी बढ़ती हैं; agent तरीका LLM को खुद योजना बनाने देता है
- Notion ने Anthropic service disruption के बाद कई घंटों तक Anthropic access block कर दिया, और AI coding tools द्वारा बनाए गए कई apps बेकार और असुरक्षित slopware भर रह जाते हैं
विशाल धातु-मकड़ी का रूपक
- विशाल धातु-मकड़ी 1 मिलियन डॉलर की मशीन है, और हर बार इस्तेमाल पर 40,000 डॉलर का ईंधन जलाती है, लेकिन वह चीज़ें उठा सकती है या रात का खाना बना सकती है
- वही मशीन फ्रिज से Diet Coke सही-सही निकाल भी सकती है और फ्रिज में छेद भी कर सकती है, और उपयोगकर्ता को नतीजे की परवाह किए बिना 40,000 डॉलर चुकाने पड़ते हैं
- subsidy की वजह से आम उपयोगकर्ता कभी-कभी इस तबाही का अनुभव करते हैं, लेकिन enterprise असली लागत उठाता है और निर्माता training व maintenance पर हर साल अरबों डॉलर गँवाता है
- नई features उन कामों की सूची बढ़ाती हैं जिन्हें करने का दावा किया जाता है, लेकिन हर feature जोड़ने में सैकड़ों मिलियन डॉलर लगते हैं और कई बार यह भी साफ नहीं होता कि वास्तव में कुछ नया सीखा गया है या नहीं
- एक अध्ययन यह दिखाता है कि एक निश्चित लंबाई वाले task को 50% तक पूरा करने की क्षमता बढ़ी है, फिर भी इस रूपक की मकड़ी कब गलती करेगी यह पता नहीं, और वह ऐसे काम भी करती है जो उपयोगकर्ता ने नहीं माँगे
AI circular economy और वास्तविक product demand
- जनरेटिव AI में service delivery cost ऊँची है, प्रमुख AI labs के पास profitability तक जाने का स्पष्ट रास्ता नहीं है, और LLM-आधारित कामों की लागत व ROI भी मापी नहीं जा रही
- AI projects operating costs को 10% से 100% तक बढ़ा सकते हैं, और इस वादे के उलट कि AI service operators तथा customers दोनों के लिए लागत घटेगी, खर्च लगातार बढ़ा है
- ऊँची लागत एक ऐसे ढाँचे को बनाए रखती है जिसमें AI labs पैसा hyperscaler compute partners को भेजती हैं, और वही पैसा फिर labs तथा NVIDIA GPU demand में वापस घूमता है
- अगर OpenAI या Anthropic profitability या sustainability का पीछा करें, तो AI compute demand घटेगी, और Azure, Google Cloud, Amazon Web Services, CoreWeave, Oracle Cloud Infrastructure तथा NVIDIA GPU demand भी घटेगी
- मौजूदा commitments और projections के अनुरूप जाने के लिए पूरे AI stack को 10 गुना बढ़ना होगा, साथ ही 250 बिलियन डॉलर अतिरिक्त सालाना AI compute demand और OpenAI/Anthropic के पैमाने की कम-से-कम दो और कंपनियाँ चाहिए
2 टिप्पणियां
API कभी भी token-based pricing से अलग नहीं रहा है...
Hacker News की राय
आज Apple ने अपना बदला हुआ AI फीचर सेट पेश किया, और अगर कई रिपोर्टों पर भरोसा करें तो Apple इसे चलाने के लिए Google को सालाना सिर्फ $1 billion के आसपास ही दे रहा है
यह लगभग सिर्फ intellectual property को license करने जैसा है, और लगता है Google को अपने मॉडल चलाने और distill करने का अधिकार इतनी रकम पर देने में आपत्ति नहीं है
भले ही consumer revenue पूरी तस्वीर का सिर्फ एक हिस्सा हो, फिर भी समझ नहीं आता कि Mac या iPhone उपयोगकर्ताओं को Apple के नए AI से संतुष्ट न होने पर ChatGPT के लिए अलग से पैसे देने की ज़रूरत क्यों पड़ेगी
Google भी फोन में ऐसे ही tools डालेगा और search में AI features देता ही रहेगा, इसलिए Apple की technology मौजूद होने के बाद consumer AI की कीमत Anthropic या OpenAI के लिए सालाना $1 billion से कहीं ज़्यादा है—इसका सबूत कहाँ है, समझ नहीं आता
अगर OpenAI Samsung phones में आने का deal कर ले और मान भी लें कि Samsung, Apple से 10 गुना ज़्यादा बेताब है, तब भी बात सालाना करीब $10 billion की होगी; और अगर OpenAI का 2026 consumer revenue projection $14–15 billion है, तो उसे हासिल कर लेने पर भी iPhone users के लिए उपयोगी built-in features आने के बाद उसे बनाए रखना मुश्किल लगता है
Ed Zitron शोर मचाने वाले ब्रिटिश उकसावेबाज़ के ज़्यादा करीब है, लेकिन कुल मिलाकर वह शायद सही बात कह रहा है
Windows में Copilot button तक आ गया, फिर भी लोग GPT इस्तेमाल करते हैं; Microsoft Edge, Windows पर सबसे लोकप्रिय browser नहीं है; और Instagram Threads भी TikTok को कोई बड़ा झटका नहीं दे पाया—मामला वही है
सवाल उल्टी दिशा में पूछा जा रहा है। लोग वही इस्तेमाल करते हैं जो उन्हें पसंद आता है, और उसे ही इस्तेमाल करते रहने की उनकी बहुत मजबूत प्रवृत्ति होती है
बहुत बड़ी moat होना ज़रूरी नहीं; असली समस्या तब होती है जब users लगातार product से असंतुष्ट रहें या लोगों को कोई बहुत बेहतर competitor दिख रहा हो
अगर Apple का feature set सिर्फ GPT इस्तेमाल करने की तुलना में कोई ठोस फायदा नहीं देता, तो किसी चमत्कार की उम्मीद करना मुश्किल है
बचा हुआ सवाल यह है कि क्या मैं search की वजह से Kagi इस्तेमाल करता रहूँगा, या नई Siri मुझे कुल मिलाकर जहाँ ज़रूरत होगी वहाँ तक पहुँचा देगी। मुझे शायद इस पर ज़्यादा ध्यान देना चाहिए कि मैं वास्तव में search results कितनी बार देखता हूँ और कितनी बार सिर्फ AI summaries पढ़ता हूँ
Apple की घोषणा में कुछ चीज़ें मैंने नहीं देखीं। उदाहरण के लिए basic coding के लिए उसने Xcode के LLM, Shortcuts app, और Safari Extensions का ज़िक्र किया, लेकिन मैंने अभी-अभी Kagi से ऐसा webpage बनवाया जो Kagi से मिले data को दिखाता है, और Gemini भी यह कर सका
Siri भी यह कर पाएगी या नहीं, यह अभी देखना बाकी है, और experience भी मायने रखता है। ChatGPT code लिखने की प्रक्रिया को live editor वाले coding interface में कहीं बेहतर संभालता है, जबकि Kagi कुछ साल पुराने ChatGPT जैसा लगता है—पूरा code block उगल देता है और हर edit पर नया code dump दे देता है
Xcode तक जाना overkill हो सकता है और Siri कम पड़ सकती है, इसलिए prosumer AI use के उस gap के बचे रहने की गुंजाइश है जिसे Apple भर न पाए
Anthropic शायद consumer AI पर बहुत ज़्यादा ध्यान नहीं देता, और consumer segment सबसे कम profitable customers हो सकता है
Apple ज़्यादा इस दिशा में दिखता है कि वह आम consumers की AI usage बढ़ाएगा, और यह Instagram द्वारा Stories जोड़ने जैसा लगता है। उसने Snapchat की growth रोकी थी, लेकिन यह मान लेना कि वह OpenAI के users भी बड़ी संख्या में खींच लेगा, थोड़ा जल्दबाज़ी होगा
अगर आप अभी ChatGPT के लिए पैसे दे रहे हैं, तो संभव है कि आप उसे hobby coding, projects, और image generation के लिए इस्तेमाल कर रहे हों; और जो ज़्यादा पैसे दे रहे हैं, वे लगभग निश्चित रूप से personal programming projects के लिए इसका उपयोग कर रहे होंगे
$100+ monthly subscribers इस वजह से नहीं छोड़ेंगे, और $20 per month वाले users भी बड़ी संख्या में छिटक जाएँगे—यह मानना बहुत मुश्किल है
दुनिया के ज़्यादातर users कमज़ोर CPU और कम RAM वाले सस्ते phones इस्तेमाल करते हैं, इसलिए वे locally कोई ढंग का model चला नहीं सकते
Google-Apple deal में Google उस $1 billion में cloud compute access भी बेच रहा है या सिर्फ weights और intellectual property साझा कर रहा है, यह साफ नहीं है
Apple ने भी usage limits और ज़्यादा usage के लिए subscription upgrade की बात की है, इसलिए अब उसके और AI labs के बीच सीधी competition की एक front बन गई है। Default होने के बावजूद Safari और Chrome जैसे सफल competitors मौजूद हैं, इसलिए यह competition भी संभव है
Google अपने नकदी-संपन्न मुख्य competitor को foundation model training arms race में उतरने की आर्थिक प्रेरणा से वंचित करने के लिए, models को उनकी असली value से कम पर देने को भी तैयार हो सकता है
जो users summaries और style edits से आगे की गंभीर capabilities चाहते हैं, वे चाहे कभी-कभार ही इस्तेमाल करें, फिर भी बेहतर quality वाले model की किसी ठीक-ठाक subscription या ad-supported plan में value पा सकते हैं
Apple भी यह दे सकता है, लेकिन जब लोग features की तुलना शुरू करेंगे, तो कई लोगों के लिए Gemini, Claude, और ChatGPT ज़्यादा उपयुक्त लग सकते हैं
और यह भी वास्तविक जोखिम है कि Apple इस बार भी ज़रूरत से ज़्यादा वादे करे और असली shipped model की quality कम निकले, जिससे users और ज़्यादा subscription services की तरफ धकेले जाएँ
इसमें personal life, interests, plans, business, और family information तक शामिल है, इसलिए किसी दूसरे AI app पर जाना मतलब फिर से शुरुआत करना होगा, जो काफ़ी तकलीफ़देह है
बेकार भड़काने वालों को पहचानने वाली निशानियों में से एक यह है कि वे “लोग इसे समझ क्यों नहीं पा रहे?” जैसी उत्तेजित टोन में बोलते हैं, लेकिन असली तर्क जुड़ता नहीं है
अगर Zitron का दावा उतना ठोस है जितना वह कहता है, तो पढ़ने वाले को उसे समझ पाना चाहिए और यह भी दिखना चाहिए कि वह ठोस है
AI demand statistics से शुरू करके, फिर AI कंपनियों की profitability के लिए जरूरी revenue जैसे अगले चरण की गणना तक सावधानी से बढ़ा जाए, तो बात follow की जा सकती है, लेकिन वह बीच में jump करता है, लंबी छलांग लगाता है, फिर वापस लौट आता है
अगर स्थिति सच में इतनी साफ़ है कि “लोग इसे देख क्यों नहीं पा रहे” वाले स्तर की है, तो उसका explanation भी साफ़ होना चाहिए, लेकिन ऐसा नहीं है। साफ़ न होने की वजह यह है कि स्थिति खुद इतनी साफ़ नहीं है
उसका message, मोटे तौर पर, यह है कि tech industry नैतिक रूप से गहराई तक सड़ चुकी है। इसे बिना उत्तेजित हुए कहना मुश्किल है, लेकिन यह बिना आधार की अतिशयोक्ति नहीं, बल्कि “Meta लोगों के साथ भयानक काम करने वाली कंपनी है, इसके भारी सबूतों के बावजूद लोग अब भी उसमें निवेश क्यों कर रहे हैं और वहाँ काम क्यों कर रहे हैं” जैसी अविश्वास-भरी भावना के क़रीब पढ़ा जाता है
फिर भी, मैंने उसकी बात यह समझी कि AI कंपनियों ने X मात्रा की compute खरीदने का वादा किया है, उस demand को पूरा करने के लिए data centers बनाए जा रहे हैं, और data centers को Y जितनी रकम मिलनी चाहिए, लेकिन AI कंपनियों के पास Y चुकाने लायक पर्याप्त revenue नहीं है
मुझे व्यक्तिगत रूप से यह चौंकाने वाला नहीं लगता। AI के जो वास्तविक उपयोग मैंने देखे हैं, वे code generation या automated sales और scam calls जैसी चीज़ें हैं, और यह अभी चल रही विशाल रकम को संभालने लायक बड़ा market नहीं लगता
मैं जानना चाहूँगा कि Ed इतना ज़्यादा कहाँ ग़लत जा रहा है। मुझे तो AI पूरे क्षेत्र में एक बड़ा correction आता हुआ दिख रहा है
ऐसी जानकारी वह नहीं लगती जिसे हर नियमित blog post में बार-बार दोहराकर शामिल करने की उम्मीद की जाए
बात थोड़ी व्यंग्यात्मक लग सकती है, लेकिन अगर आपने सच में क्लिक किया था, तो जवाब जानने की मेरी जिज्ञासा ईमानदार है
यह आधुनिक exposé journalism की poor नकल जैसी लगती है, चतुर दिखने की कोशिश करती है, लेकिन उसमें substance कम है
यह बात पहले भी बहुत कही जा चुकी है, लेकिन Ed Zitron भरोसा करने में मुश्किल व्यक्ति है
मेरी नज़र में वह बहुत साफ़ और मामूली बातों पर भी कई बार पक्षपाती और ग़लत रहा है, इसलिए numbers और trends वाली जटिल analysis को ज्यों का त्यों स्वीकार करना मुश्किल है
उदाहरण के लिए, कुछ महीने पहले agents और agentic coding की बात करने वालों का मज़ाक उड़ाने वाला उसका tweet याद है। वह कुछ इस तरह था, “Agents? कौन से agents? क्या इन्हें पता भी है कि ये क्या कह रहे हैं?” और replies में सैकड़ों लोगों ने लिखा था कि वे वास्तव में agents इस्तेमाल कर रहे हैं
उसके पास एक audience है और engagement goal है, और उसका उद्देश्य जानकारी देना नहीं, बल्कि clicks पाना है
दिशा सही हो सकती है। उदाहरण के लिए, यह बात सही हो सकती है कि खर्च के हिसाब से जरूरी revenue बेहूदा रूप से ऊँचा दिखता है, लेकिन ऐसा लगता है कि वह reality से पूरी तरह मेल न खाने वाले worst-case scenario बनाने के लिए numbers को मिलाकर इस्तेमाल करता है
इसके साथ AI से थोड़ी भी जुड़ी किसी चीज़ के प्रति खुलेपन का लगभग अभाव जोड़ दें, तो उसे गंभीरता से लेना कठिन हो जाता है
publications को विनाशकारी और उदास लंबी-चौड़ी दलीलें पसंद आती हैं, इसलिए लगता है कि उसने hysterical anti-AI लेखों से अपना करियर बनाया है। इसका मतलब यह नहीं कि वह सही है
लेख का सबसे प्रभावशाली हिस्सा यह है कि केवल numbers देखकर भी ज़रूरी investment scale शुद्ध dollar terms में अस्थिर लगता है
लेखक से सहमत न होते हुए भी उसकी reasoning देखी जा सकती है। OpenAI, SpaceX, और Anthropic को इस साल IPO करना होगा अगर वे cash खत्म होने से बचना चाहते हैं, और अब पर्याप्त private capital नहीं बचा है। IPO ही आख़िरी funding round है
AI बहुत उपयोगी और परिवर्तनकारी हो सकता है, और कंपनियाँ तेज़ी से बढ़ भी सकती हैं, लेकिन उस growth को सहारा देने के लिए पैसा शायद न हो
दिवालिया हुई AI कंपनी ने Oracle contract रद्द किया — इस हिस्से ने मुझे Oracle को Nortel जैसे उदाहरण की तरह महसूस कराया। अगर ग्राहक आधार का बड़ा हिस्सा अचानक हट जाए, तो उसे सैकड़ों अरब डॉलर के write-downs करने पड़ सकते हैं
मैं AI के शासकों को लेकर गहराई से संशय में हूँ, लेकिन लगातार यह दावा करना कि वहाँ कुछ भी नहीं है, ईमानदार नहीं है
अब Zitron इस हद तक पहुँच गया है कि मानो ढहने की भीख माँग रहा हो
उसने macro analysis के ज़रिए बड़े financial risk की ओर सही इशारा किया है, लेकिन लगातार निराशावाद के कारण वह उस ज़मीनी उपयोगिता को पूरी तरह चूक रहा है जिसे HN के बहुत से लोग हर दिन भारी productivity gains के रूप में महसूस करते हैं
अभी मैं यह मानना चाहता हूँ कि व्यक्तिगत क्षमता के इस विस्तार और किसी बड़ी खोज के बीच कोई मध्य क्षेत्र मौजूद है
तो फिर वह productivity आखिर जा कहाँ रही है, value कहाँ है, बड़े पैमाने की unemployment statistics कहाँ हैं, या करोड़ों कमाने वाले लाखों नए startups कहाँ हैं, समझ नहीं आता
अति-उत्तेजित hype cycle में संतुलित आलोचना ज़रूरी है, इसलिए विरोधी आवाज़ अपने-आप में मूल्यवान है, लेकिन उसके तर्क, भले ही उनकी premises मान ली जाएँ, ठोस नहीं हैं
उसके मोटे हिसाब में मेरी सबसे बड़ी शिकायत यह है कि वह inference gross margin को कुछ ऐसा नया मानकर देखता है जिसकी तुलना सामान्य SaaS margins से नहीं की जा सकती
आंशिक रूप से यह सही है। model training, उससे जुड़ा infrastructure build-out, और competitive बने रहने के लिए आसपास के खर्चों का लगातार R&D merry-go-round विश्लेषण को थोड़ा बदलता है
लेकिन यह कहना कि संरचनात्मक रूप से यह सामान्य SaaS margins से अलग है, कुछ ज़्यादा ही है। business model Dropbox जैसा नहीं है, लेकिन शुरुआती AWS, CDN, और telecom providers जैसा काफ़ी है
telecom वह क्षेत्र है जिसमें मैंने अपने करियर का आधे से ज़्यादा समय engineer और founder के रूप में बिताया है, इसलिए कह सकता हूँ कि utilization, overselling, peak capacity planning, segmentation, और capex recovery पर निर्भर बेहद capital-intensive infrastructure businesses भी लाभदायक हो सकते हैं
लागत घटाने के लिए स्पष्ट task segmentation उभरने के साथ उसका हिसाब और संदिग्ध लगता है। अग्रणी organizations समझ रही हैं कि हर काम के लिए सबसे अच्छा और सबसे महँगा model ज़रूरी नहीं है
आसान कामों को सस्ते models की ओर route किया जा सकता है, caching इस्तेमाल की जा सकती है, non-urgent काम batch में चलाए जा सकते हैं, और frontier models को सिर्फ़ उन्हीं कुछ कामों के लिए छोड़ा जा सकता है जिन्हें सच में frontier intelligence चाहिए। यह सीधे उस दावे से टकराता है कि providers को मौजूदा demand, utilization, और price curve बनाए रखने के लिए हमेशा frontier intelligence का पीछा करना ही होगा
productivity में बढ़ोतरी महसूस हो सकती है, फिर भी वास्तविक value पैदा न हो — और मुझे लगता है कि सबसे मज़बूत data यही दिखाता है
https://unessays.substack.com/p/talk-is-cheap
क्या कोई बड़े पैमाने की peer-reviewed study या meta-study है जो इस दावे की पुष्टि करती हो?
यह तथ्य कि उसने अपनी analysis की साफ़ दिखाई देने वाली विफलताओं पर कभी पीछे मुड़कर नहीं देखा, उसकी intellectual honesty के बारे में बहुत कुछ कह देता है
financial risk पर उसकी कुछ बातें सच हो सकती हैं, लेकिन अगर वह upside की संभावना तक स्वीकार नहीं कर सकता, तो वह risk का सही आकलन भी नहीं कर सकता
इसलिए उसे गंभीरता से लेना मुश्किल है
इस thread में बहुत से dismissive comments हैं, लेकिन पोस्ट की वास्तविक बात को संबोधित करने वाले कम हैं
असली सवाल यह है कि क्या “AI can’t afford to slow down — it needs over $3 trillion in revenue by the end of 2030 to sustain its existence” सच है
अगर 2024 में total wages $11.7 trillion थीं [0], और उसी साल nonfarm employment 158,000 था [1], तो AI को break-even तक पहुँचने के लिए कम-से-कम हर 20 में से 1 नौकरी को लेना या बनाना होगा — और यह मेरे मोटे हिसाब से एक order of magnitude ज़्यादा है
[0] https://fred.stlouisfed.org/series/BA06RC1A027NBEA
[1] https://fred.stlouisfed.org/series/PAYEMS
2008 और 2020~2023 में अर्थव्यवस्था में बेहिसाब पैसा डाला गया, और अमीर लोग हास्यास्पद रूप से और अमीर हो गए। वह संपत्ति अब 2020s के version वाले railroad/fiber में फँसी हुई है, और हम असल में वैश्विक अर्थव्यवस्था से खरबों डॉलर मिटाकर reset करने की कोशिश कर रहे हैं
reset की ज़रूरत तो है
इस लेख को पढ़ने में 20 मिनट लगाने से पहले यह जान लेना चाहिए कि यह लेखक 2 साल से ज़्यादा समय से AI के fail होने, पैसे की बर्बादी होने, बुरा होने, और कभी काम न करने जैसी लोकप्रिय लेकिन लगातार ग़लत साबित होने वाली राय लिखता आया है
उदाहरण के लिए मार्च 2024 का यह लेख: https://www.wheresyoured.at/peakai/
दो साल तक वह साफ़ तौर पर पागल जैसा लगा और stock market की बड़ी rally चूक गया, लेकिन आख़िरकार वही सही निकला। हाँ, बाद में tech stocks धीरे-धीरे संभल गए थे
ऐसी चीज़ों की timing का अनुमान लगाना बदनाम रूप से मुश्किल है, और सिर्फ़ इसलिए कि किसी ने 2 साल पहले timing ग़लत पकड़ी, इसका मतलब यह नहीं कि correction नहीं होगा
Ed एक thermometer की तरह थोड़ा दिलचस्प है, लेकिन वह जो लिखता है उसे गंभीरता से लेना मेरे लिए मुश्किल है
Tim Lee ने भी इशारा किया था कि जब Ed ने अपने कुछ analysis details पोस्ट किए, तो उनमें काफ़ी अजीब बातें थीं: https://x.com/binarybits/status/2034377838883700953
newsletter subscribe popup आते ही मैं तुरंत tab बंद कर देता हूँ
Ed एक दिलचस्प शख्स है
AI इंडस्ट्री पर उसका वित्तीय विश्लेषण तार्किक रूप से सही लगता है, लेकिन मेरे पास इतना ज्ञान नहीं है कि कह सकूँ कि वह वास्तव में सही है या नहीं
लेकिन वह AI को लेकर समग्र रूप से इतना नाराज़ है कि लगता है वह उन स्पष्ट क्षेत्रों को चूक रहा है जहाँ LLM वास्तव में state of the art को बदल रहे हैं
जैसा कि Simon Willison ने हाल ही में बताया, coding LLM के मुख्य use case में से एक दिखता है, और अगर वही एकमात्र असली use case भी हो, तब भी वह बेहद उपयोगी है
उपयोगिता और profitability अलग बातें हैं, और मुझे लगता है Ed ने उस हिस्से में एक महत्वपूर्ण बात पकड़ी है। जब तक inference बहुत सस्ता नहीं हो जाता, ये कंपनियाँ मुनाफ़ा नहीं कमा सकतीं, और कुछ बहुत बड़े players API token की कीमत चुका देंगे, लेकिन ज़्यादातर नहीं चुकाएँगे
अगर AI कंपनियों को टिके रहने के लिए अरबों डॉलर के revenue की ज़रूरत है, तो उस revenue का 0.5%, 5%, या 50% state of the art बदलने से आता है या नहीं, यह 100% अप्रासंगिक है
महत्वपूर्ण बात transformation नहीं है, बल्कि यह है कि इन कंपनियों के पास बिल चुकाने लायक आमदनी नहीं होगी, और अगर वे नहीं चुका पाएँगी तो बहुत-सी दूसरी कंपनियाँ भी नहीं चुका पाएँगी
इसलिए transformation हो या न हो, यह अब भी गिरने का इंतज़ार करता हुआ एक card house है। इसे बदलने के लिए और ज़्यादा “transformation” नहीं, बल्कि ऐसे feature bundle चाहिए जो मौजूदा user base को कई गुना बढ़ा सकें या दाम कई गुना बढ़ा सकें
कुछ मायनों में यह काफ़ी ताज़गीभरा है। बहुत से लोग AI के इस-उस पहलू की आलोचना करते हैं, लेकिन अंत में “फिर भी सच कहूँ तो मुझे AI बहुत पसंद है और मैं इसे हर दिन इस्तेमाल करता हूँ” जैसा disclaimer जोड़ देते हैं
शायद वह इस स्थिति से बचना चाहता है जिसमें practical builders comments में उमड़ पड़ते हैं और शांति से nuance पहुँचाते हैं—या आजकल की भाषा में कहें तो कंधे पर chip रखे गुस्सैल keyboard warriors टूट पड़ते हैं—और ऐसी both-sides-ism को छानकर पढ़ना थकाऊ है
Zitron पर ऐसी आलोचना करना मुश्किल है। वह जो भी कहे, उसे इस बात का डर नहीं दिखता कि वह किसी एक पक्ष का समर्थन करता हुआ लगेगा
ये तीनों पूरी तरह अलग रुख हैं। कोई AI को बहुत उपयोगी मानते हुए भी उसे इसलिए नापसंद कर सकता है कि वह उसके सामाजिक दर्जे को कम कर सकता है, और कोई तकनीक को पसंद करते हुए भी Sam Altman को बेईमान मान सकता है
लेकिन बहुत से anti-AI टिप्पणीकार अजीब तरह से यह महसूस करते हैं कि उन्हें ये तीनों दावे एक साथ रखने चाहिए
इससे भी मज़ेदार बात यह है कि अगर यह सचमुच बेकार है, तो फिर इसकी परवाह करने की ज़रूरत ही नहीं है। बाज़ार अंततः इसकी बेकारियत समझ लेगा और सब कुछ सामान्य हो जाएगा, और जो लोग इसे पसंद नहीं करते वे पैसा खो देंगे
बेशक, मुझे नहीं लगता कि वे सचमुच मानते हैं कि यह बेकार है। मुझे ज़्यादा लगता है कि वे इस बात को लेकर चिंतित हैं कि इसका उनकी प्रतिष्ठा पर क्या असर पड़ेगा, और वे बेसब्री से चाहते हैं कि एक दिन सब “जाग जाएँ” और यह मान लें कि LLM सिर्फ़ उपयोगिता-रहित stochastic parrots हैं। लेकिन लोग इन्हें हर दिन इस्तेमाल कर रहे हैं और real time में इन्हें बेहतर होते देख रहे हैं
उसका तर्क यह है कि इन कंपनियों को मुनाफ़ा कमाने के लिए 2022 से पहले जैसी कोई मिसाल न रखने वाली बहुत बड़ी चीज़ों के होने की ज़रूरत है। कुल मिलाकर मैं सहमत हूँ, लेकिन मेरा मानना है कि ऐसी चीज़ें कई सालों से पहले ही हो रही हैं, इसलिए आगे भी होंगी
inference महँगा है, इस पर यक़ीन करने की कोई ठोस वजह नहीं है, माहौल के अलावा। data और intuition के हिसाब से margin ऊँचे हैं
इस तरह की सोच मेरे इस विश्वास को मज़बूत करती है कि लोग ठीक से जाने बिना “AI लाभदायक नहीं है और बहुत महँगा है” जैसी बातों को एक तरह के catharsis की तरह इस्तेमाल कर रहे हैं, ताकि वे विशाल प्रगति पर प्रतिक्रिया दे सकें
Zitron ऐसा कारोबारी है जो सफल predictions नहीं, बल्कि content production करता है
उसके जैसे लोग कितनी भी बार कहें कि अंत आ गया है, फ़र्क नहीं पड़ता; उन्हें सिर्फ़ एक बार सही होना है
लेकिन फिलहाल economics के मामले में वह निश्चित रूप से कुछ हद तक सही है। अभी तक इस विशाल निवेश की भरपाई का कोई तरीका नहीं दिखता
मेरी नज़र में AI दुनिया को बुनियादी तौर पर बदल देगा
यह बदतर हो सकता है, बेहतर हो सकता है, या दोनों का मिश्रण हो सकता है, लेकिन इस बात पर मुझे खुद कोई शक नहीं है
LLM जैसी छलांग शुरू हुए अभी सिर्फ 5~6 साल हुए हैं। तुलना के लिए, रेडियो तरंगों की खोज 1886 में हुई थी, Marconi ने 1895 में उनका इस्तेमाल संचार के लिए किया था, और टेलीफोन व रेडियो कई दशकों तक साथ-साथ रहे, लेकिन मोबाइल फोन और wireless तकनीक का असली विस्तार 1995 के आसपास हुआ
इसमें इतना समय इसलिए नहीं लगा कि रेडियो भौतिकी को परिपक्व होने में समय चाहिए था, बल्कि इसलिए कि उससे मुनाफा कमाने के लिए ज़रूरी बाकी सारी चीज़ों को समय चाहिए था
मेरे लिए LLM, AI से ज़्यादा एक building block के करीब है। यह रेडियो तरंगों या transistor के बराबर हो सकता है
हम पहले से देख रहे हैं कि LLM को जोड़कर agent बनाना संभव है। अभी कीमत coding और agents, दोनों के लिए एक सख्त सीमित करने वाला कारक है
अगर आपको सिर्फ Claude Code या Codex चाहिए तो बात किसी तरह चल जाती है, लेकिन LLM के बहुत-से combinations ऐसे हैं जिन पर ज़्यादातर लोग प्रयोग करने की हिम्मत ही नहीं कर सकते। उदाहरण के लिए, गेम में NPC संवाद और world mechanics को LLM से चलाना अभी लागत की वजह से व्यावहारिक नहीं है
अगर inference hardware की कीमत नीचे आती है और inference algorithms लगातार बेहतर होते रहते हैं, तो मुझे यक़ीन है कि हम ऐसी चीज़ें देखेंगे जिनकी आज कल्पना करना मुश्किल है, और उसी वजह से मुझे डर भी लगता है
लागत समस्या नहीं है। संदर्भ के हिसाब से सुसंगत responses और scenarios की संख्या सीमित होती है, इसलिए गेम के भीतर real time में LLM से टेक्स्ट generate कराने की ज़रूरत नहीं होती
इसकी जगह LLM से संवाद संदेशों, टुकड़ों, संकेतों जैसे “atoms” का एक विशाल corpus बनाया जा सकता है, और फिर player input के अनुसार उन्हें deterministically जोड़ा जा सकता है। implementation से पहले pre-review और तरह-तरह की testing भी संभव है
गेम में इंटरैक्ट करने वाले player के लिए ऐसा सिस्टम, डिज़ाइन की गई interaction की सीमा के भीतर, generated text से कार्यात्मक रूप से अलग पहचानना मुश्किल होगा
इसके फायदे भी बड़े हैं। अगर player भूमिका तोड़कर जानबूझकर कुरेदे तो जोड़ के निशान दिख सकते हैं, लेकिन LLM की तरह इसका दुरुपयोग नहीं किया जा सकता
किसी चीज़ के बेहतर भी, बदतर भी, या दोनों भी बना सकने पर शक जताना — क्या ही तीखी अंतर्दृष्टि है
“हम अभी बहुत शुरुआती दौर में हैं” वाली बात भी अजीब है। कई Super Bowl विज्ञापन पहले ही हो चुके हैं, tech news पर लगभग कब्ज़ा कर चुकी कंपनियाँ अपने CEO की बेतुकी बातों को पत्रकारों से ज्यों का त्यों दोहरवा रही हैं, और जब वे कहती हैं कि उनकी valuation 1 trillion dollar से ऊपर है, तो जिन लोगों के पास उनके finances को चुनौती देने का अधिकार होना चाहिए, वे भी बस सहमत होते दिखते हैं
सैकड़ों एकड़ के data centers बनाए गए हैं, ऐसे data center contracts भी किए गए हैं जो शायद कभी पूरे न हों, और हर महीने अरबों डॉलर माँगे जा रहे हैं
यह silicon को निगल रहा है, और लोग अपनी आँखों से hardware की कीमतों को दोगुना, तिगुना या उससे भी ज़्यादा होते देख रहे हैं
नौकरियों में कर्मचारियों पर AI इस्तेमाल करने का दबाव डाला गया, फिर subsidy खत्म हुई और असली लागत सामने आई तो उत्साह ठंडा पड़ गया और पीछे हटना पड़ा
फिर भी कहा जा रहा है कि इसे और समय, और ध्यान, और और लोगों की ज़रूरत है। रेडियो के इतिहास में ऐसा कब हुआ था, मुझे नहीं पता
simulation उबाऊ है
Ed के “AI धीमा हो रहा है” कहने का आधार कंपनियों की spending caps हैं, खासकर Uber में प्रति engineer प्रति tool प्रति माह $1,500 की सीमा
मैं उसी सबूत की बिल्कुल उलटी व्याख्या करता हूँ। एक साल पहले तक यह कल्पना ही बेतुकी लगती कि कोई कंपनी AI tools पर प्रति कर्मचारी हर महीने $1,500 खर्च करेगी, और सवाल उठता कि आखिर AI से ऐसा क्या कराया जा रहा है कि इतना खर्च हो
लेकिन coding agents और धीरे-धीरे अधिक general-purpose होते agents के आने के बाद, कर्मचारियों की मांग इतनी बढ़ गई है कि कंपनियों को limits लगानी पड़ रही हैं
इन AI कंपनियों का कुल संभावित बाज़ार प्रति knowledge worker प्रति माह $1,500 तक उछल गया है, तो यह कैसे धीमा पड़ना हुआ, मैं समझ नहीं पाता
लेकिन investment return पूरा करने के लिए इतना या उससे भी ज़्यादा खर्च दुनिया भर में होना पड़ेगा, और लंबी अवधि में ऐसे budget के पास होने की कोई संभावना नहीं है
कंपनियों को लागत घटाना पसंद है, और जिस पल उन्हें लगेगा कि वही या बेहतर value पाने का कोई दूसरा तरीका है, वैसे ही जैसे वे कर्मचारियों की संख्या मनमाने ढंग से घटाती हैं, ऐसे budget भी जल्दी गायब हो जाएँगे
या फिर यह सिर्फ shareholders की short-term value की मांग की वजह से ही खत्म हो सकता है
यानी सिर्फ Claude Code और Cursor इस्तेमाल करने पर ही आसानी से $3,000 प्रति माह हो जाते हैं, और अगर Codex भी एक विकल्प हो तो यह $4,500 तक जा सकता है
और जैसा आपने ब्लॉग में लिखा था, अगर justification दे दी जाए तो इसे पार भी किया जा सकता है; यह एक soft cap है