1 पॉइंट द्वारा GN⁺ 3 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • AI प्रतिस्पर्धा का मुख्य मापदंड commercialization है, और DeepSeek R1 के बाद OpenAI और Anthropic ने agents, Codex, Claude Code को अधिक तेज़ी से व्यवसाय में उतारा
  • चीन में DeepSeek का रणनीतिक मूल्य राजस्व से अधिक Nvidia पर निर्भरता घटाने और inference को Huawei Ascend जैसे घरेलू stack पर ले जाने में है
  • यूरोप ने FY 2023~2024 में भारत की software services पर लगभग 58.8 अरब डॉलर, और अगले वर्ष लगभग 67.1 अरब डॉलर खर्च किए, लेकिन केवल models से पर्याप्त value नहीं बनती
  • सस्ती बिजली लागत भी महत्वपूर्ण है, लेकिन AWS·Azure·Google Cloud और YouTube·Microsoft 365·GitHub की cloud·data reach उससे अधिक निर्णायक है
  • weaponized AI और Anthropic के Mythos जैसे frontier cyber models देशों और defense कंपनियों को closed stack और security through obscurity की ओर धकेल सकते हैं

अमेरिका कहाँ आगे है

  • commercialization AI प्रतिस्पर्धा का मुख्य मापदंड है, और जनवरी 2025 में DeepSeek R1 द्वारा बाज़ार को झटका देने के बाद अमेरिकी कंपनियाँ अधिक तेज़ी से आगे बढ़ीं
    • OpenAI ने agents और Codex को अधिक आक्रामक रूप से आगे बढ़ाया, और Anthropic ने Claude Code का व्यवसायीकरण किया
    • चीन में भी प्रतिस्पर्धी हैं, लेकिन revenue, adoption, tools, और reach में अमेरिका आगे है
  • चीन में DeepSeek का रणनीतिक मूल्य व्यावसायिक प्रदर्शन से अधिक Nvidia पर निर्भरता घटाने और inference को Huawei Ascend जैसे घरेलू stack पर स्थानांतरित करने में है
    • यह supply chain autonomy को सहारा देता है, लेकिन यह लाभदायक AI leadership से अलग प्रश्न है
  • SAP के Christian Klein का मानना था कि यूरोप को अधिक data centers की ज़रूरत नहीं है और केवल large language models पर्याप्त नहीं हैं; वास्तव में भी केवल models काफ़ी नहीं हैं
    • यूरोप ने FY 2023~2024 में भारत की software services पर लगभग 58.8 अरब डॉलर, और अगले वर्ष लगभग 67.1 अरब डॉलर खर्च किए
    • AI तब value बनाता है जब वह वास्तविक data, वास्तविक workflows, और वास्तविक products से जुड़ता है
    • अमेरिका chips, power, data centers, cloud platforms, developer tools, consumer platforms, और enterprise software को एक साथ बना रहा है, इसलिए उसकी बढ़त बढ़ रही है
  • papers की संख्या या engineers की संख्या AI leadership को सिद्ध नहीं करती
    • असली कसौटी infrastructure financing, बड़े पैमाने पर model training·serving, और पूरी अर्थव्यवस्था में AI लागू करने की क्षमता है

बिजली से भी बड़ी cloud और data की ताकत

  • बिजली लागत महत्वपूर्ण है क्योंकि आधुनिक GPU और TPU systems बिजली को compute में बदलते हैं, और सस्ती बिजली model cost को कम करती है
    • बिजली दरों की तुलना में अमेरिका प्रमुख पश्चिमी यूरोपीय अर्थव्यवस्थाओं से सस्ता है, और कनाडा अमेरिका से भी सस्ता है
    • इस तुलना में चीन और रूस की लागत अमेरिका से कम है
    • घरेलू·व्यावसायिक बिजली दरें जर्मनी 0.436/0.279, ब्रिटेन 0.420/0.415, स्पेन 0.282/0.136, फ्रांस 0.274/0.174, अमेरिका 0.201/0.154, कनाडा 0.125/0.106, रूस 0.087/0.131, चीन 0.078/0.117 हैं
  • cloud infrastructure और data बिजली से भी अधिक निर्णायक परत हैं
    • अमेरिका AWS, Azure, Google Cloud जैसे वैश्विक hyperscalers के माध्यम से अमेरिकी कंपनियों के models को दुनिया भर में deploy कर सकता है
    • YouTube एक video corpus है, Google Drive और Microsoft 365 रोज़मर्रा के office work के भीतर मौजूद हैं, और GitHub software development के भीतर स्थापित है
    • ये distribution systems भी हैं और data platforms भी, और ये नए models को उन products के भीतर पहुँचाने देते हैं जिन्हें लोग हर दिन इस्तेमाल करते हैं
  • केवल सस्ती बिजली के दम पर AI प्रतिस्पर्धा जीतना मुश्किल है
    • अगर cloud scale, platform reach, developer ecosystem, और उपयोगी बड़े data flows तक पहुँच नहीं है, तो बिजली लागत कम होने पर भी हार हो सकती है
    • अमेरिका के पास ये सभी तत्व एक साथ हैं, चीन के पास अपने बड़े घरेलू बाज़ार के भीतर इनका बड़ा हिस्सा है, लेकिन यूरोप के पास ऐसा नहीं है
  • यूरोप के पास लंबे समय से मज़बूत engineering talent रहा है, लेकिन केवल talent काफ़ी नहीं है
    • अमेरिकी hyperscalers पहले से ही बाज़ार पर हावी हैं, इसलिए बराबरी तक पहुँचना बहुत समय लेगा
    • अगर यूरोप अभी वास्तव में किसी cloud champion को funding दे भी दे, तो infrastructure बनाना सिर्फ़ पहला चरण होगा; उसके बाद banks, manufacturers, और public institutions को उस platform पर लाना होगा
    • इस प्रक्रिया में लगभग 10 साल लग सकते हैं, और इस बीच AWS, Azure, Google Cloud scale, software, और data में और आगे निकल जाएँगे
    • Arkady Volozh, Nebius को यूरोपीय AI infrastructure कंपनी बनाने की कोशिश कर रहे हैं, लेकिन यूरोप अभी भी लगभग शुरुआती बिंदु पर है
  • weaponized AI भी एक और मोर्चा है
    • अगला चरण ऐसा हो सकता है जहाँ bot networks, cyber campaigns, और autonomous weapons में एक देश का AI दूसरे देश के AI से टकराए
    • systems को इस तरह tune करना कठिन नहीं है कि वे प्रतिद्वंद्वियों को dehumanize करें, हिंसा को जायज़ ठहराएँ, या पूरी आबादी के समूहों को target करें
    • जब models media, networks, और weapons में embedded हो जाते हैं, तो bias शक्ति में बदल जाता है, और AI प्रतिस्पर्धा एक security competition भी बन जाती है
  • Anthropic का Mythos जैसे models देशों और defense कंपनियों को दूसरी दिशा में धकेल सकते हैं
    • पुरानी Linux-शैली की समझ यह थी कि open code पर बहुत-सी नज़रें होती हैं, लेकिन frontier cyber models इससे उलटी तर्कशृंखला बना सकते हैं
    • वे closed software, closed tools, closed firmware, और closed chips के ज़रिए security through obscurity की ओर ले जा सकते हैं
    • अगर models target stack के code और architecture पर train नहीं हो सकते, तो सामान्यतः context और speed कम हो जाती है
    • इससे systems सुरक्षित हो जाएँगे, यह ज़रूरी नहीं, लेकिन इससे hardware तक फैले proprietary stack का मूल्य बढ़ जाता है

1 टिप्पणियां

 
GN⁺ 3 시간 전
Hacker News की राय
  • Anthropic, OpenAI, Google ज़रूर प्रमुख हैं, लेकिन इससे भी बड़ा सवाल यह है कि इसे युद्ध क्यों कहा जा रहा है
    चीन ने अपने संदर्भ में बड़ा लाभ हासिल किया है, और GPU डिज़ाइन व निर्माण क्षमता भी मजबूत की है
    अगर यह सचमुच युद्ध है, तो Trump कानून के राज को नुकसान पहुँचाकर और अमेरिका के प्रति सद्भावना घटाकर अपने ही देश की टांग खींच रहे हैं। अगर दुनिया को लगे कि चीन को डेटा सौंपना मुश्किल है, और अमेरिका पर स्थिर सेवाओं के लिए भरोसा करना कठिन है, तो AI युद्ध जीतने पर भी अमेरिका को मिलने वाला लाभ सीमित हो सकता है
    बल्कि Europe जैसे क्षेत्रों के लिए, जो अपना टेक स्टैक बना सकते हैं, यह अच्छी बात हो सकती है, और AI स्टैक इतना महंगा है कि चीन के मजबूत open source model दुनिया के लिए अमेरिका से भी ज़्यादा उपयोगी साबित हो सकते हैं

    • “इसे युद्ध क्यों कहा जाए” का जवाब यह है कि इसके पीछे यह अतिरंजित वादा छिपा है कि जो संगठन अभी भी काफी हद तक सैद्धांतिक AGI तक पहले पहुँच जाएगा, वह खुद को ईश्वरीय क्षमताओं तक bootstrap कर लेगा और Planetary Overlord स्थापित करके दुनिया पर राज करेगा
      मुझे यह बेतुकी सोच लगती है, लेकिन संबंधित प्रेरक शक्ति वहीं से आ रही है। यह अभिव्यक्ति SF लेखक Charles Stross ने The Jennifer Morgue (2006) में गढ़ी थी
    • अमेरिका किसी और तरह से कल्पना ही नहीं कर पाता। हर चीज़ युद्ध है, और अमेरिका को हमेशा जीतना ही है
    • यह युद्ध इसलिए बनता है क्योंकि निवेशक बाज़ार पर एकाधिकार चाहते हैं। वे मूलतः यही करते हैं, और आगे भी हमेशा यही चाहेंगे
    • क्या शीर्षक बदल दिया गया? अभी तो इसमें ‘war’ नहीं बल्कि race लिखा है
    • युद्ध जैसी भाषा आखिरकार इस डर से निकलती है कि singularity तक पहुँचने पर मानवीय पैमाने की सीमाएँ टूट जाएँगी और कोई बाकी सब पर भारी पड़ सकेगा
      बेहतर बंदूक बना लेने से भी दुनिया पर कब्ज़ा नहीं किया जा सकता, क्योंकि उसे उठाने वालों की संख्या सीमित रहती है। लेकिन अगर कोई superintelligence बना ले, तो वह नए AI research पर राज कर सकता है, वैश्विक अर्थव्यवस्था को नियंत्रित कर सकता है, और लड़ाई भी बहुत बेहतर तरीके से बहुत तेज़ी से लड़ सकता है
  • मैंने इसे AI-generated content कहकर रिपोर्ट किया है। यह पोस्ट front page पर होने लायक नहीं है, और submitter की submission/comment history देखें तो moderation की ज़रूरत लगती है
    “अमेरिका AI competition में सबसे महत्वपूर्ण commercialisation में जीत रहा है” — इस दावे पर, जीतने के कई मानदंड हो सकते हैं और commercialisation सबसे पहले दिमाग में नहीं आता
    https://english.www.gov.cn/news/202604/15/content_WS69df29e6...
    https://fortune.com/2026/05/03/chinese-court-layoffs-workers...
    https://www.reuters.com/world/china/china-moves-regulate-dig...
    यह दावा भी खास दमदार नहीं है कि YouTube, Google Drive, Microsoft 365, GitHub ही AI युग का डेटा बनाने और व्यवस्थित करने वाले प्लेटफ़ॉर्म हैं। ऐसे कहा जा रहा है मानो चीन में न प्लेटफ़ॉर्म हैं, न डेटा

    • Pangram के हिसाब से यह पूरी तरह AI-generated text है
      अच्छा होगा अगर LLM-generated text के लिए disclosure या removal का कोई नियम हो। पूरा ब्लॉग भी AI-generated जैसा लगता है
    • सही पकड़ा। मैं इसे भयानक लेख कहने में हिचक रहा था, लेकिन असल में यह वैसा ही है
    • काश किसी खास user को block करके उसकी पोस्ट न देखनी पड़े। OP जैसे लोग न हों तो front page कहीं बेहतर हो
  • समझ नहीं आता ऐसी बकवास HN पर कैसे ऊपर आ जाती है। HN culture में ऐसा क्या बदल गया कि यह चीज़ top तक पहुँच गई

    • https://paulgraham.com/submarine.html
    • यह ऐसी साइट है जहाँ कोई भी कुछ मिनटों में कई accounts बना सकता है, और abuse रोकने के उपाय भी न्यूनतम हैं
      community की ताकत पूरी तरह इस बात पर टिकी थी कि वह बहुत ज़्यादा जानी-पहचानी नहीं थी, लेकिन अब ऐसा नहीं रहा। जिस क्षण यह राजनीतिक propaganda platform की तरह इस्तेमाल होने लायक बड़ी हो गई, उसी क्षण यह बुद्धिजीवियों की जगह के रूप में मर गई
    • भले submission खुद कमजोर हो, उसका मूल premise फिर भी चर्चा लायक हो सकता है
      वैसे मैंने इस submission पर वोट नहीं किया
    • शायद इसलिए कि बहुत से लोग सामग्री देखे बिना सिर्फ शीर्षक देखकर upvote कर देते हैं
      शीर्षक काफ़ी आकर्षक है, लेकिन सामग्री कूड़े जैसी low-quality generation है
    • HN हो या कोई और जगह, बेकार लेख बहुत ऊपर आ जाते हैं
      जनता का विद्रोह सचमुच हो रहा है
  • नहीं, अमेरिका AI competition में जीत नहीं रहा, बस अभी आगे चल रहा है, और competition खत्म नहीं हुई
    अगर आप 90% हिस्से तक आगे दौड़ें और आखिर में अपने ही पसीने पर फिसलकर गिर जाएँ, तो उसका क्या मतलब। अगर आप अरबों डॉलर जलाकर किसी भी कीमत पर सबसे बेहतरीन AI tech पाने की कोशिश करें, लेकिन rival उस प्रगति को distill करके 6~12 महीनों में पकड़ ले और लागत का सिर्फ 1% खर्च करे, तो बढ़त का महत्व घट जाता है
    जिस commercialisation पर लेख ज़ोर देता है, उसमें भी अमेरिका market share खोना शुरू कर चुका है। हाल में जब अमेरिकी कंपनियों ने plan usage सख्त की, तो मैंने लोगों को cc/codex plans से glm/opencode plans पर जाते देखा। अगर यह रुझान मजबूत हुआ तो अमेरिकी कंपनियाँ मुश्किल में पड़ेंगी। हर किसी को frontier model नहीं चाहिए; लोग बस 20 डॉलर महीना देकर काफ़ी अच्छा model इस्तेमाल करना चाहते हैं

    • और अगर winner-takes-all जैसा कुछ हो ही नहीं? अगर शुरुआत से competition ही न हो? अगर अमेरिका जो कर रहा है वह सिर्फ संभावित रूप से अस्थिर debt और बेहद फूली हुई valuations के सहारे पैसा जलाना हो?
      यह भी संभव है कि AI अंततः general-purpose server capacity जैसा बन जाए। अगर ग्राहक hyperscaler के बिना भी काम चला सकें, तो आज का पूरा market बाद में काफ़ी मूर्खतापूर्ण लग सकता है
    • अगर कोई कहे कि फुटबॉल टीम first half में जीत रही है, तो क्या आप कहेंगे, “नहीं, जीत नहीं रही, बस आगे है”?
    • आगे होना तभी मायने रखता है जब यह winner-takes-all market हो। लेकिन national security कारणों से AI ऐसा market नहीं बन सकता
      मेरा मानना है कि AI जितना बेहतर होगा, उतना ही अधिक substitutable भी होगा। यह बिजली जैसी मूल्यवान चीज़ बन सकती है। बहुत-सी कंपनियाँ बिजली बनाकर पैसा कमाती हैं, लेकिन उतना नहीं जितना आज के निवेशक उम्मीद कर रहे हैं
    • Mark Cuban ने हाल की एक interview में कहा कि कंपनियाँ इस डर से चल रही हैं कि अंत में सिर्फ एक ही बचेगी। जैसे internet advertising में व्यावहारिक रूप से एक ही कंपनी बची है, वैसे ही वे वही एक बनना चाहती हैं
      सच में सिर्फ एक बचेगी या नहीं, यह बहस का विषय है, लेकिन Cuban के मुताबिक कम से कम उनकी सोच ऐसी ही है
  • कभी मुनाफ़ा जैसी चीज़ हुआ करती थी, और investment return जैसा भी कुछ होता था
    अगर exit strategy Google को बेच देना है, तो revenue पर फोकस करना ठीक strategy है। लेकिन अगर आप खुद Google हैं, तो जो पैसा झोंका गया है वह किसी न किसी दिन वापस आना चाहिए। लगता है हम यह भूल गए हैं
    अभी का commercialisation स्तर सिर्फ यह दिखाता है कि अमेरिका दूसरों से तेज़ी से investment जला रहा है। किसी दिन हालात बदल सकते हैं और यह bet सफल हो सकती है, लेकिन यह स्थिति जितनी एक-एक मिनट और चलती है, expected return को उस एक मिनट के नुकसान और उससे पहले के समय के interest तक को कवर करने लायक और बड़ा होना पड़ेगा। मुझे नहीं पता यह “जीत रहे हैं” जैसा कैसा दिखता है। TikTok

  • दीर्घकालिक विजेता वह होगा जो local model में सबसे अच्छा performance और सबसे कम memory usage ratio दे सकेगा
    Anthropic, OpenAI, Mistral अभी बस वे कंपनियाँ हैं जो इस समय पैसा बना रही हैं, लेकिन वे अब भी profitable नहीं हैं और लंबे समय में traction व value खो देंगी
    हालांकि OpenCode Go subscription आगे क्या रूप लेती है, यह ज़्यादा दिलचस्प है। यह big tech से सस्ती है, tokens भी ज़्यादा देती है, और सुधार की कोशिश के नाम पर हमारे data पर training भी नहीं करती

    • Claude अच्छा इसलिए है क्योंकि वह user chat histories और use cases पर reinforcement learning करता है, इसलिए data पर training न करना फ़ायदा नहीं बल्कि नुकसान है
      सिर्फ public data पर training का युग खत्म हो चुका है। उस data तक सबकी पहुँच है, लेकिन frontier models गिने-चुने ही हैं
    • local models बड़े cutting-edge models से मुकाबला नहीं कर सकते। जैसे iPhone उस supercomputer से मुकाबला नहीं करता जो nuclear simulation करता है
      दोनों रास्ते अलग हो जाएँगे। frontier models इतने महंगे हो जाएँगे कि अंततः उन तक सिर्फ nation-state actors की पहुँच रह जाएगी। Mythos में इसकी शुरुआत हो चुकी है
    • Mistral? उसका “revenue” शायद OpenAI और Anthropic का लगभग 1/150 है
  • मुझे लगता है अमेरिका के जीतने की सबसे सरल व्याख्या यह है कि वह सबसे ज़्यादा पैसा झोंक रहा है — वह भी भारी अंतर से

    • पैसा झोंकना भी नहीं, बल्कि मानो पैसा छापकर ठूँसना हो
      AI कंपनियों और hyperscalers के बीच की circular IOUs दरअसल debt हैं, यानी money creation का एक रूप। हाँ, बहुत से वास्तविक dollars भी लग रहे हैं, लेकिन जो पैसा अस्तित्व में ही नहीं था उसे invest करना हमेशा भारी जोखिम होता है
    • हो सकता है मैं capitalism को ठीक से न समझता हूँ, लेकिन क्या सामान्य सिद्धांत यह नहीं है कि “जो सबसे ज़्यादा profit कमाए वही जीतता है”? अगर सिर्फ spending से जीत तय हो, तो लगता है capitalist market के parameters ही बदलने पड़ेंगे
  • नहीं, अमेरिका जीत नहीं रहा। ऐसा सिर्फ इसलिए दिखता है क्योंकि पश्चिम में Chinese models को work-related उपयोग के लिए प्रतिबंधित किया गया है

    • सही कहा। बहुत से लोगों को पता ही नहीं कि GLM 5.1 और Kimi 2.6 frontier models के काफ़ी करीब हैं। Minimax 2.7, DeepSeek 4, Qwen, Xiaomi 2.5 Pro आदि भी हैं
      चीन open source frontier models में आगे है, इसलिए समझ नहीं आता कि इस competition में अमेरिका कैसे जीत रहा है। किसी बिंदु पर कंपनियाँ और व्यक्ति cloud व local दोनों में अपने models चलाने लगेंगे, और Chinese models हर जगह होंगे
    • मेरी समझ से model पर नहीं बल्कि platform पर रोक है
      उदाहरण के लिए deepseek-r1-distill-qwen-7b को self-host करके चलाना ठीक है। लेकिन DeepSeek app डाउनलोड करके work device पर चलाना, ऐसी रोक लगाने वाले लोगों को स्वीकार नहीं होगा
    • क्योंकि China-hosted models पर भरोसा नहीं किया जाता। यह भी commercialisation का 100% एक हिस्सा है
    • क्या पक्का सबूत है कि ये models quality के मामले में पश्चिमी models से बेहतर हो सकते हैं? या मामला ज़्यादा यह है कि प्रतिबंधों के कारण उन्हें training data और visibility पर्याप्त नहीं मिलती, इसलिए compete करना कठिन हो जाता है?
    • अगर qwen जैसी चीज़ें अधिक व्यापक रूप से इस्तेमाल होने लगें, तो क्या इससे अमेरिका की strategic position सचमुच बदल जाएगी? अमेरिका के पास सबसे अच्छे models हैं, और सबसे अच्छा infrastructure व hyperscalers बनाने वाली कंपनियाँ भी उसी के पास हैं
      “अब Qwen भी इस्तेमाल कर सकते हैं?” — इससे अमेरिका को बहुत बड़ा झटका लगेगा, ऐसा नहीं लगता
  • दूर से देखने पर यह दावा टिकता नहीं। Anthropic, OpenAI, xAI, Google, Meta, Microsoft — कोई भी AI division में profit नहीं कमा रहा, और सब parent company या investor funding, खासकर investor money, के सहारे नुकसान झेल रहे हैं
    Chinese models इन्हें पकड़ते जा रहे हैं, model मुफ्त दे रहे हैं, consumer-grade hardware पर भी चल जाते हैं, और उससे भी ज़्यादा महत्वपूर्ण, उन्हें सस्ते में train किया जाता है। AI models बेहद volatile products हैं जो कुछ ही हफ्तों में पुराने पड़ सकते हैं। आख़िरकार अंतहीन scaling के अलावा उनका कोई लक्ष्य नहीं दिखता, इसलिए उन्हें लगातार बेहतर models बनाने में संसाधन झोंकते रहना पड़ता है
    वास्तविक user behavior अक्सर इतना ही होता है: “Gemini, XYZ में Claude से खराब है इसलिए मैं इसे नहीं उपयोग करता।” अगर Gemini models और खराब हों तो लोग Anthropic की ओर चले जाते हैं। फिर अगर Anthropic models दूसरों से खराब हो जाएँ तो क्या होगा? अगर product वस्तुनिष्ठ रूप से खराब है, तो commercialisation अच्छा होने का क्या मतलब
    मैं मानता हूँ कि अमेरिका distribution, integration, enterprise contracts, ecosystem, infrastructure पर हावी है। लेख पूरी तरह गलत नहीं है, लेकिन यह प्रभुत्व नाज़ुक है और continuous upgrades माँगता है
    अगर प्रतिद्वंद्वी हमेशा ठीक पीछे है और आपको लगातार infinite scaling करनी पड़ रही है, तो इसका अर्थ क्या है। infinite scaling संभव नहीं, और VC money भी किसी दिन सूख जाएगी। तब सबको नवीनतम models की वास्तविक लागत उठाने के लिए छोटा होना पड़ेगा, और subscription या दूसरी monetisation से वे विशाल लागतें वसूल करनी होंगी। हम SORA को बहुत तेज़ी से पैसा जलाने के कारण रुकते देख चुके हैं, और इस बीच चीन ने उससे कहीं बेहतर video models की श्रृंखला ला दी
    models को दूसरे products में integrate करना भी अहम है, और इस क्षेत्र में भी open source पीछा कर रहा है; VC money सूखने पर उसके आगे निकलने की पूरी संभावना है

    • “AI division में profit नहीं कमा रहे” — इस हिस्से के लिए सबूत चाहिए
      रिपोर्टों के अनुसार वे inference पक्ष में profitable हैं, और VC funding का उपयोग ज़्यादा inference चलाने के लिए data centers बनाने में हो रहा है। coding subscription models औसतन break-even के आसपास हो सकते हैं, लेकिन पैसा API में है
      यह दावा भी बढ़ा-चढ़ाकर कहा गया है कि Chinese models consumer-grade hardware पर चलते हैं। DeepSeek v4 जैसे 1.6T token model को consumer hardware पर कोई नहीं चला रहा
      training cost भी अमेरिकी models से बहुत कम नहीं है। Chinese big tech training को subsidise कर रही है, और ये models अमेरिकी frontier labs के 5T·10T models से छोटे व कमजोर हैं, इसलिए बस थोड़ा सस्ते हैं। अमेरिकी labs अधिक विविध reinforcement learning data पर भी पैसा खर्च करती हैं, और वह अंतर कई benchmarks के performance में दिखता है
      Sora का उदाहरण तो उल्टा लेख की बात को साबित करता है। OpenAI ने Sora बंद नहीं किया; उसने सिर्फ subscription version और वह अजीब social network बंद किया, API के जरिए वह अब भी उपलब्ध है
      Chinese video models भी API models हैं, और जैसे अमेरिकी frontier labs के लिए LLM profitable हो सकते हैं, वैसे उनके लिए भी profitable होने की संभावना है। video model pricing [1] में है; दायरा बड़ा है, लेकिन Google Veo और OpenAI Sora की कीमतें Chinese models के समान दायरे में हैं
      [1] https://openrouter.ai/models?output_modalities=video
    • अगर Chinese models बड़े models से distillation न कर पाए होते, तो वे gpt2 या 3 के स्तर पर ही अटके रहते
  • Anthropic ने दिलचस्प बात यह की है कि उसने अपना stack कई cloud providers के ऊपर रखा है। पहले उसने AWS पर उसे ऐसे स्तर तक चढ़ाया जो अब तक प्रमुख AI providers में कम ही देखा गया है, इसलिए अब जिज्ञासा है कि क्या अगला कदम GCP और Azure पर भी वैसा ही होगा
    अगर कोई कंपनी अपने cloud में ELK stack की तरह अपना Claude stack रख सके, तो Azure और GCP तक यह संभव होने पर OpenAI को सचमुच तेजी से पकड़ना पड़ेगा
    निजी तौर पर मैं ऐसा AI ज़्यादा उपयोग करना चाहूँगा जिसे मैं अपनी paid infrastructure पर चला सकूँ। outage होने पर वह isolated रहेगा, और उसे किसी दूसरी region या data center में fail over भी किया जा सकेगा
    यह अब भी हैरानी की बात है कि Microsoft या Amazon अपने खुद के models को cloud products में पूरी ताकत से आगे नहीं बढ़ाते। Microsoft ने शायद Phi डाला हो, लेकिन उसे केंद्र में नहीं रखा। खासकर Copilot for Devs जैसी चीज़ों में, जहाँ Phi जैसे model के साथ सस्ता compute इस्तेमाल किया जा सकता था। Microsoft को तो Copilot का मतलब साफ़ दिखाने के लिए उसका नाम ही फिर से रखना चाहिए

    • SpaceX AI के साथ हाल का contract काफ़ी संकेतक है, खासकर इस मायने में कि वह बहुत कम इस्तेमाल होने वाले GPU compute का उपयोग कर रहा है
      compute को allocate करना hardware की समस्या है, लेकिन अच्छे model के लिए compute से बढ़कर चीज़ें चाहिए, और अच्छे AI engineers चाहिए। SpaceX, Amazon वगैरह hardware में बहुत अच्छे हो सकते हैं, लेकिन AI engineering में उतने नहीं
    • Claude पहले से Azure और GCP पर उपलब्ध है
      https://azure.microsoft.com/en-us/blog/introducing-anthropic...
      https://docs.cloud.google.com/gemini-enterprise-agent-platfo...
      Claude AWS Bedrock में भी काफ़ी समय से उपलब्ध है
      नई “Claude Platform” घोषणा Bedrock में सीधे चलने वाले विकल्प की नहीं, बल्कि AWS पर Anthropic द्वारा संचालित version की है। फ़र्क यहाँ देखा जा सकता है: https://platform.claude.com/docs/en/build-with-claude/claude...
      अपनी खुद की paid infrastructure पर इसे चलाने की माँग भी Claude बहुत पहले से पूरी करता आया है
      OpenAI के Microsoft से अलग होने के कारणों में एक कारण AWS पर उपलब्ध होना भी था। उसे लगा कि AWS की मांग काफ़ी बड़ी है, और सिर्फ Azure तक सीमित रहना बाधा बन रहा था
    • Claude पहले से Vertex पर है - https://docs.cloud.google.com/vertex-ai/generative-ai/docs/p...