- AI प्रतिस्पर्धा का मुख्य मापदंड commercialization है, और DeepSeek R1 के बाद OpenAI और Anthropic ने agents, Codex, Claude Code को अधिक तेज़ी से व्यवसाय में उतारा
- चीन में DeepSeek का रणनीतिक मूल्य राजस्व से अधिक Nvidia पर निर्भरता घटाने और inference को Huawei Ascend जैसे घरेलू stack पर ले जाने में है
- यूरोप ने FY 2023~2024 में भारत की software services पर लगभग 58.8 अरब डॉलर, और अगले वर्ष लगभग 67.1 अरब डॉलर खर्च किए, लेकिन केवल models से पर्याप्त value नहीं बनती
- सस्ती बिजली लागत भी महत्वपूर्ण है, लेकिन AWS·Azure·Google Cloud और YouTube·Microsoft 365·GitHub की cloud·data reach उससे अधिक निर्णायक है
- weaponized AI और Anthropic के Mythos जैसे frontier cyber models देशों और defense कंपनियों को closed stack और security through obscurity की ओर धकेल सकते हैं
अमेरिका कहाँ आगे है
- commercialization AI प्रतिस्पर्धा का मुख्य मापदंड है, और जनवरी 2025 में DeepSeek R1 द्वारा बाज़ार को झटका देने के बाद अमेरिकी कंपनियाँ अधिक तेज़ी से आगे बढ़ीं
- OpenAI ने agents और Codex को अधिक आक्रामक रूप से आगे बढ़ाया, और Anthropic ने Claude Code का व्यवसायीकरण किया
- चीन में भी प्रतिस्पर्धी हैं, लेकिन revenue, adoption, tools, और reach में अमेरिका आगे है
- चीन में DeepSeek का रणनीतिक मूल्य व्यावसायिक प्रदर्शन से अधिक Nvidia पर निर्भरता घटाने और inference को Huawei Ascend जैसे घरेलू stack पर स्थानांतरित करने में है
- यह supply chain autonomy को सहारा देता है, लेकिन यह लाभदायक AI leadership से अलग प्रश्न है
- SAP के Christian Klein का मानना था कि यूरोप को अधिक data centers की ज़रूरत नहीं है और केवल large language models पर्याप्त नहीं हैं; वास्तव में भी केवल models काफ़ी नहीं हैं
- यूरोप ने FY 2023~2024 में भारत की software services पर लगभग 58.8 अरब डॉलर, और अगले वर्ष लगभग 67.1 अरब डॉलर खर्च किए
- AI तब value बनाता है जब वह वास्तविक data, वास्तविक workflows, और वास्तविक products से जुड़ता है
- अमेरिका chips, power, data centers, cloud platforms, developer tools, consumer platforms, और enterprise software को एक साथ बना रहा है, इसलिए उसकी बढ़त बढ़ रही है
- papers की संख्या या engineers की संख्या AI leadership को सिद्ध नहीं करती
- असली कसौटी infrastructure financing, बड़े पैमाने पर model training·serving, और पूरी अर्थव्यवस्था में AI लागू करने की क्षमता है
बिजली से भी बड़ी cloud और data की ताकत
- बिजली लागत महत्वपूर्ण है क्योंकि आधुनिक GPU और TPU systems बिजली को compute में बदलते हैं, और सस्ती बिजली model cost को कम करती है
- बिजली दरों की तुलना में अमेरिका प्रमुख पश्चिमी यूरोपीय अर्थव्यवस्थाओं से सस्ता है, और कनाडा अमेरिका से भी सस्ता है
- इस तुलना में चीन और रूस की लागत अमेरिका से कम है
- घरेलू·व्यावसायिक बिजली दरें जर्मनी 0.436/0.279, ब्रिटेन 0.420/0.415, स्पेन 0.282/0.136, फ्रांस 0.274/0.174, अमेरिका 0.201/0.154, कनाडा 0.125/0.106, रूस 0.087/0.131, चीन 0.078/0.117 हैं
- cloud infrastructure और data बिजली से भी अधिक निर्णायक परत हैं
- अमेरिका AWS, Azure, Google Cloud जैसे वैश्विक hyperscalers के माध्यम से अमेरिकी कंपनियों के models को दुनिया भर में deploy कर सकता है
- YouTube एक video corpus है, Google Drive और Microsoft 365 रोज़मर्रा के office work के भीतर मौजूद हैं, और GitHub software development के भीतर स्थापित है
- ये distribution systems भी हैं और data platforms भी, और ये नए models को उन products के भीतर पहुँचाने देते हैं जिन्हें लोग हर दिन इस्तेमाल करते हैं
- केवल सस्ती बिजली के दम पर AI प्रतिस्पर्धा जीतना मुश्किल है
- अगर cloud scale, platform reach, developer ecosystem, और उपयोगी बड़े data flows तक पहुँच नहीं है, तो बिजली लागत कम होने पर भी हार हो सकती है
- अमेरिका के पास ये सभी तत्व एक साथ हैं, चीन के पास अपने बड़े घरेलू बाज़ार के भीतर इनका बड़ा हिस्सा है, लेकिन यूरोप के पास ऐसा नहीं है
- यूरोप के पास लंबे समय से मज़बूत engineering talent रहा है, लेकिन केवल talent काफ़ी नहीं है
- अमेरिकी hyperscalers पहले से ही बाज़ार पर हावी हैं, इसलिए बराबरी तक पहुँचना बहुत समय लेगा
- अगर यूरोप अभी वास्तव में किसी cloud champion को funding दे भी दे, तो infrastructure बनाना सिर्फ़ पहला चरण होगा; उसके बाद banks, manufacturers, और public institutions को उस platform पर लाना होगा
- इस प्रक्रिया में लगभग 10 साल लग सकते हैं, और इस बीच AWS, Azure, Google Cloud scale, software, और data में और आगे निकल जाएँगे
- Arkady Volozh, Nebius को यूरोपीय AI infrastructure कंपनी बनाने की कोशिश कर रहे हैं, लेकिन यूरोप अभी भी लगभग शुरुआती बिंदु पर है
- weaponized AI भी एक और मोर्चा है
- अगला चरण ऐसा हो सकता है जहाँ bot networks, cyber campaigns, और autonomous weapons में एक देश का AI दूसरे देश के AI से टकराए
- systems को इस तरह tune करना कठिन नहीं है कि वे प्रतिद्वंद्वियों को dehumanize करें, हिंसा को जायज़ ठहराएँ, या पूरी आबादी के समूहों को target करें
- जब models media, networks, और weapons में embedded हो जाते हैं, तो bias शक्ति में बदल जाता है, और AI प्रतिस्पर्धा एक security competition भी बन जाती है
- Anthropic का Mythos जैसे models देशों और defense कंपनियों को दूसरी दिशा में धकेल सकते हैं
- पुरानी Linux-शैली की समझ यह थी कि open code पर बहुत-सी नज़रें होती हैं, लेकिन frontier cyber models इससे उलटी तर्कशृंखला बना सकते हैं
- वे closed software, closed tools, closed firmware, और closed chips के ज़रिए security through obscurity की ओर ले जा सकते हैं
- अगर models target stack के code और architecture पर train नहीं हो सकते, तो सामान्यतः context और speed कम हो जाती है
- इससे systems सुरक्षित हो जाएँगे, यह ज़रूरी नहीं, लेकिन इससे hardware तक फैले proprietary stack का मूल्य बढ़ जाता है
1 टिप्पणियां
Hacker News की राय
Anthropic, OpenAI, Google ज़रूर प्रमुख हैं, लेकिन इससे भी बड़ा सवाल यह है कि इसे युद्ध क्यों कहा जा रहा है
चीन ने अपने संदर्भ में बड़ा लाभ हासिल किया है, और GPU डिज़ाइन व निर्माण क्षमता भी मजबूत की है
अगर यह सचमुच युद्ध है, तो Trump कानून के राज को नुकसान पहुँचाकर और अमेरिका के प्रति सद्भावना घटाकर अपने ही देश की टांग खींच रहे हैं। अगर दुनिया को लगे कि चीन को डेटा सौंपना मुश्किल है, और अमेरिका पर स्थिर सेवाओं के लिए भरोसा करना कठिन है, तो AI युद्ध जीतने पर भी अमेरिका को मिलने वाला लाभ सीमित हो सकता है
बल्कि Europe जैसे क्षेत्रों के लिए, जो अपना टेक स्टैक बना सकते हैं, यह अच्छी बात हो सकती है, और AI स्टैक इतना महंगा है कि चीन के मजबूत open source model दुनिया के लिए अमेरिका से भी ज़्यादा उपयोगी साबित हो सकते हैं
मुझे यह बेतुकी सोच लगती है, लेकिन संबंधित प्रेरक शक्ति वहीं से आ रही है। यह अभिव्यक्ति SF लेखक Charles Stross ने The Jennifer Morgue (2006) में गढ़ी थी
बेहतर बंदूक बना लेने से भी दुनिया पर कब्ज़ा नहीं किया जा सकता, क्योंकि उसे उठाने वालों की संख्या सीमित रहती है। लेकिन अगर कोई superintelligence बना ले, तो वह नए AI research पर राज कर सकता है, वैश्विक अर्थव्यवस्था को नियंत्रित कर सकता है, और लड़ाई भी बहुत बेहतर तरीके से बहुत तेज़ी से लड़ सकता है
मैंने इसे AI-generated content कहकर रिपोर्ट किया है। यह पोस्ट front page पर होने लायक नहीं है, और submitter की submission/comment history देखें तो moderation की ज़रूरत लगती है
“अमेरिका AI competition में सबसे महत्वपूर्ण commercialisation में जीत रहा है” — इस दावे पर, जीतने के कई मानदंड हो सकते हैं और commercialisation सबसे पहले दिमाग में नहीं आता
https://english.www.gov.cn/news/202604/15/content_WS69df29e6...
https://fortune.com/2026/05/03/chinese-court-layoffs-workers...
https://www.reuters.com/world/china/china-moves-regulate-dig...
यह दावा भी खास दमदार नहीं है कि YouTube, Google Drive, Microsoft 365, GitHub ही AI युग का डेटा बनाने और व्यवस्थित करने वाले प्लेटफ़ॉर्म हैं। ऐसे कहा जा रहा है मानो चीन में न प्लेटफ़ॉर्म हैं, न डेटा
अच्छा होगा अगर LLM-generated text के लिए disclosure या removal का कोई नियम हो। पूरा ब्लॉग भी AI-generated जैसा लगता है
समझ नहीं आता ऐसी बकवास HN पर कैसे ऊपर आ जाती है। HN culture में ऐसा क्या बदल गया कि यह चीज़ top तक पहुँच गई
community की ताकत पूरी तरह इस बात पर टिकी थी कि वह बहुत ज़्यादा जानी-पहचानी नहीं थी, लेकिन अब ऐसा नहीं रहा। जिस क्षण यह राजनीतिक propaganda platform की तरह इस्तेमाल होने लायक बड़ी हो गई, उसी क्षण यह बुद्धिजीवियों की जगह के रूप में मर गई
वैसे मैंने इस submission पर वोट नहीं किया
शीर्षक काफ़ी आकर्षक है, लेकिन सामग्री कूड़े जैसी low-quality generation है
जनता का विद्रोह सचमुच हो रहा है
नहीं, अमेरिका AI competition में जीत नहीं रहा, बस अभी आगे चल रहा है, और competition खत्म नहीं हुई
अगर आप 90% हिस्से तक आगे दौड़ें और आखिर में अपने ही पसीने पर फिसलकर गिर जाएँ, तो उसका क्या मतलब। अगर आप अरबों डॉलर जलाकर किसी भी कीमत पर सबसे बेहतरीन AI tech पाने की कोशिश करें, लेकिन rival उस प्रगति को distill करके 6~12 महीनों में पकड़ ले और लागत का सिर्फ 1% खर्च करे, तो बढ़त का महत्व घट जाता है
जिस commercialisation पर लेख ज़ोर देता है, उसमें भी अमेरिका market share खोना शुरू कर चुका है। हाल में जब अमेरिकी कंपनियों ने plan usage सख्त की, तो मैंने लोगों को cc/codex plans से glm/opencode plans पर जाते देखा। अगर यह रुझान मजबूत हुआ तो अमेरिकी कंपनियाँ मुश्किल में पड़ेंगी। हर किसी को frontier model नहीं चाहिए; लोग बस 20 डॉलर महीना देकर काफ़ी अच्छा model इस्तेमाल करना चाहते हैं
यह भी संभव है कि AI अंततः general-purpose server capacity जैसा बन जाए। अगर ग्राहक hyperscaler के बिना भी काम चला सकें, तो आज का पूरा market बाद में काफ़ी मूर्खतापूर्ण लग सकता है
मेरा मानना है कि AI जितना बेहतर होगा, उतना ही अधिक substitutable भी होगा। यह बिजली जैसी मूल्यवान चीज़ बन सकती है। बहुत-सी कंपनियाँ बिजली बनाकर पैसा कमाती हैं, लेकिन उतना नहीं जितना आज के निवेशक उम्मीद कर रहे हैं
सच में सिर्फ एक बचेगी या नहीं, यह बहस का विषय है, लेकिन Cuban के मुताबिक कम से कम उनकी सोच ऐसी ही है
कभी मुनाफ़ा जैसी चीज़ हुआ करती थी, और investment return जैसा भी कुछ होता था
अगर exit strategy Google को बेच देना है, तो revenue पर फोकस करना ठीक strategy है। लेकिन अगर आप खुद Google हैं, तो जो पैसा झोंका गया है वह किसी न किसी दिन वापस आना चाहिए। लगता है हम यह भूल गए हैं
अभी का commercialisation स्तर सिर्फ यह दिखाता है कि अमेरिका दूसरों से तेज़ी से investment जला रहा है। किसी दिन हालात बदल सकते हैं और यह bet सफल हो सकती है, लेकिन यह स्थिति जितनी एक-एक मिनट और चलती है, expected return को उस एक मिनट के नुकसान और उससे पहले के समय के interest तक को कवर करने लायक और बड़ा होना पड़ेगा। मुझे नहीं पता यह “जीत रहे हैं” जैसा कैसा दिखता है। TikTok
दीर्घकालिक विजेता वह होगा जो local model में सबसे अच्छा performance और सबसे कम memory usage ratio दे सकेगा
Anthropic, OpenAI, Mistral अभी बस वे कंपनियाँ हैं जो इस समय पैसा बना रही हैं, लेकिन वे अब भी profitable नहीं हैं और लंबे समय में traction व value खो देंगी
हालांकि OpenCode Go subscription आगे क्या रूप लेती है, यह ज़्यादा दिलचस्प है। यह big tech से सस्ती है, tokens भी ज़्यादा देती है, और सुधार की कोशिश के नाम पर हमारे data पर training भी नहीं करती
सिर्फ public data पर training का युग खत्म हो चुका है। उस data तक सबकी पहुँच है, लेकिन frontier models गिने-चुने ही हैं
दोनों रास्ते अलग हो जाएँगे। frontier models इतने महंगे हो जाएँगे कि अंततः उन तक सिर्फ nation-state actors की पहुँच रह जाएगी। Mythos में इसकी शुरुआत हो चुकी है
मुझे लगता है अमेरिका के जीतने की सबसे सरल व्याख्या यह है कि वह सबसे ज़्यादा पैसा झोंक रहा है — वह भी भारी अंतर से
AI कंपनियों और hyperscalers के बीच की circular IOUs दरअसल debt हैं, यानी money creation का एक रूप। हाँ, बहुत से वास्तविक dollars भी लग रहे हैं, लेकिन जो पैसा अस्तित्व में ही नहीं था उसे invest करना हमेशा भारी जोखिम होता है
नहीं, अमेरिका जीत नहीं रहा। ऐसा सिर्फ इसलिए दिखता है क्योंकि पश्चिम में Chinese models को work-related उपयोग के लिए प्रतिबंधित किया गया है
चीन open source frontier models में आगे है, इसलिए समझ नहीं आता कि इस competition में अमेरिका कैसे जीत रहा है। किसी बिंदु पर कंपनियाँ और व्यक्ति cloud व local दोनों में अपने models चलाने लगेंगे, और Chinese models हर जगह होंगे
उदाहरण के लिए
deepseek-r1-distill-qwen-7bको self-host करके चलाना ठीक है। लेकिन DeepSeek app डाउनलोड करके work device पर चलाना, ऐसी रोक लगाने वाले लोगों को स्वीकार नहीं होगा“अब Qwen भी इस्तेमाल कर सकते हैं?” — इससे अमेरिका को बहुत बड़ा झटका लगेगा, ऐसा नहीं लगता
दूर से देखने पर यह दावा टिकता नहीं। Anthropic, OpenAI, xAI, Google, Meta, Microsoft — कोई भी AI division में profit नहीं कमा रहा, और सब parent company या investor funding, खासकर investor money, के सहारे नुकसान झेल रहे हैं
Chinese models इन्हें पकड़ते जा रहे हैं, model मुफ्त दे रहे हैं, consumer-grade hardware पर भी चल जाते हैं, और उससे भी ज़्यादा महत्वपूर्ण, उन्हें सस्ते में train किया जाता है। AI models बेहद volatile products हैं जो कुछ ही हफ्तों में पुराने पड़ सकते हैं। आख़िरकार अंतहीन scaling के अलावा उनका कोई लक्ष्य नहीं दिखता, इसलिए उन्हें लगातार बेहतर models बनाने में संसाधन झोंकते रहना पड़ता है
वास्तविक user behavior अक्सर इतना ही होता है: “Gemini, XYZ में Claude से खराब है इसलिए मैं इसे नहीं उपयोग करता।” अगर Gemini models और खराब हों तो लोग Anthropic की ओर चले जाते हैं। फिर अगर Anthropic models दूसरों से खराब हो जाएँ तो क्या होगा? अगर product वस्तुनिष्ठ रूप से खराब है, तो commercialisation अच्छा होने का क्या मतलब
मैं मानता हूँ कि अमेरिका distribution, integration, enterprise contracts, ecosystem, infrastructure पर हावी है। लेख पूरी तरह गलत नहीं है, लेकिन यह प्रभुत्व नाज़ुक है और continuous upgrades माँगता है
अगर प्रतिद्वंद्वी हमेशा ठीक पीछे है और आपको लगातार infinite scaling करनी पड़ रही है, तो इसका अर्थ क्या है। infinite scaling संभव नहीं, और VC money भी किसी दिन सूख जाएगी। तब सबको नवीनतम models की वास्तविक लागत उठाने के लिए छोटा होना पड़ेगा, और subscription या दूसरी monetisation से वे विशाल लागतें वसूल करनी होंगी। हम SORA को बहुत तेज़ी से पैसा जलाने के कारण रुकते देख चुके हैं, और इस बीच चीन ने उससे कहीं बेहतर video models की श्रृंखला ला दी
models को दूसरे products में integrate करना भी अहम है, और इस क्षेत्र में भी open source पीछा कर रहा है; VC money सूखने पर उसके आगे निकलने की पूरी संभावना है
रिपोर्टों के अनुसार वे inference पक्ष में profitable हैं, और VC funding का उपयोग ज़्यादा inference चलाने के लिए data centers बनाने में हो रहा है। coding subscription models औसतन break-even के आसपास हो सकते हैं, लेकिन पैसा API में है
यह दावा भी बढ़ा-चढ़ाकर कहा गया है कि Chinese models consumer-grade hardware पर चलते हैं। DeepSeek v4 जैसे 1.6T token model को consumer hardware पर कोई नहीं चला रहा
training cost भी अमेरिकी models से बहुत कम नहीं है। Chinese big tech training को subsidise कर रही है, और ये models अमेरिकी frontier labs के 5T·10T models से छोटे व कमजोर हैं, इसलिए बस थोड़ा सस्ते हैं। अमेरिकी labs अधिक विविध reinforcement learning data पर भी पैसा खर्च करती हैं, और वह अंतर कई benchmarks के performance में दिखता है
Sora का उदाहरण तो उल्टा लेख की बात को साबित करता है। OpenAI ने Sora बंद नहीं किया; उसने सिर्फ subscription version और वह अजीब social network बंद किया, API के जरिए वह अब भी उपलब्ध है
Chinese video models भी API models हैं, और जैसे अमेरिकी frontier labs के लिए LLM profitable हो सकते हैं, वैसे उनके लिए भी profitable होने की संभावना है। video model pricing [1] में है; दायरा बड़ा है, लेकिन Google Veo और OpenAI Sora की कीमतें Chinese models के समान दायरे में हैं
[1] https://openrouter.ai/models?output_modalities=video
Anthropic ने दिलचस्प बात यह की है कि उसने अपना stack कई cloud providers के ऊपर रखा है। पहले उसने AWS पर उसे ऐसे स्तर तक चढ़ाया जो अब तक प्रमुख AI providers में कम ही देखा गया है, इसलिए अब जिज्ञासा है कि क्या अगला कदम GCP और Azure पर भी वैसा ही होगा
अगर कोई कंपनी अपने cloud में ELK stack की तरह अपना Claude stack रख सके, तो Azure और GCP तक यह संभव होने पर OpenAI को सचमुच तेजी से पकड़ना पड़ेगा
निजी तौर पर मैं ऐसा AI ज़्यादा उपयोग करना चाहूँगा जिसे मैं अपनी paid infrastructure पर चला सकूँ। outage होने पर वह isolated रहेगा, और उसे किसी दूसरी region या data center में fail over भी किया जा सकेगा
यह अब भी हैरानी की बात है कि Microsoft या Amazon अपने खुद के models को cloud products में पूरी ताकत से आगे नहीं बढ़ाते। Microsoft ने शायद Phi डाला हो, लेकिन उसे केंद्र में नहीं रखा। खासकर Copilot for Devs जैसी चीज़ों में, जहाँ Phi जैसे model के साथ सस्ता compute इस्तेमाल किया जा सकता था। Microsoft को तो Copilot का मतलब साफ़ दिखाने के लिए उसका नाम ही फिर से रखना चाहिए
compute को allocate करना hardware की समस्या है, लेकिन अच्छे model के लिए compute से बढ़कर चीज़ें चाहिए, और अच्छे AI engineers चाहिए। SpaceX, Amazon वगैरह hardware में बहुत अच्छे हो सकते हैं, लेकिन AI engineering में उतने नहीं
https://azure.microsoft.com/en-us/blog/introducing-anthropic...
https://docs.cloud.google.com/gemini-enterprise-agent-platfo...
Claude AWS Bedrock में भी काफ़ी समय से उपलब्ध है
नई “Claude Platform” घोषणा Bedrock में सीधे चलने वाले विकल्प की नहीं, बल्कि AWS पर Anthropic द्वारा संचालित version की है। फ़र्क यहाँ देखा जा सकता है: https://platform.claude.com/docs/en/build-with-claude/claude...
अपनी खुद की paid infrastructure पर इसे चलाने की माँग भी Claude बहुत पहले से पूरी करता आया है
OpenAI के Microsoft से अलग होने के कारणों में एक कारण AWS पर उपलब्ध होना भी था। उसे लगा कि AWS की मांग काफ़ी बड़ी है, और सिर्फ Azure तक सीमित रहना बाधा बन रहा था