2 पॉइंट द्वारा GN⁺ 2026-03-10 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • OpenAI ने टेक्सास के एबिलीन में Stargate डेटा सेंटर विस्तार योजना रोक दी है और अब अगली पीढ़ी के Nvidia chips इस्तेमाल करने वाली नई सुविधा पर ध्यान दे रही है
  • Oracle 100 अरब डॉलर से अधिक के debt-funded investment के जरिए AI infrastructure विस्तार को आगे बढ़ा रहा है, जबकि उसका free cash flow negative है
  • डेटा सेंटर निर्माण की रफ्तार chip generation replacement cycle का साथ नहीं दे पा रही, जिससे पूरे infrastructure investment पर तकनीकी अप्रचलन का जोखिम है
  • Nvidia हर साल नया GPU जारी कर रहा है, और नवीनतम Vera Rubin chip पिछली पीढ़ी की तुलना में inference performance में 5 गुना सुधार देती है
  • Oracle 100 अरब डॉलर से अधिक का कर्ज रखने वाला एकमात्र hyperscaler है, और उसका free cash flow negative में जा चुका है
  • Oracle का शेयर इस साल अब तक 23% गिर चुका है, जिससे AI infrastructure investment की sustainability को लेकर बाजार की चिंता बढ़ी है

OpenAI और Oracle की साझेदारी में पीछे हटना

  • OpenAI ने Oracle के साथ Stargate डेटा सेंटर विस्तार योजना वापस ले ली है और अगली पीढ़ी के Nvidia GPU इस्तेमाल करने वाले दूसरे इलाकों के बड़े क्लस्टरों की ओर रुख किया है
    • एबिलीन सुविधा में Nvidia Blackwell processors इस्तेमाल होने थे, लेकिन बिजली आपूर्ति एक साल बाद ही चालू होने वाली थी
    • OpenAI को उम्मीद है कि तब तक उसे और उन्नत Nvidia chips मिल जाएंगी और वह दूसरे क्षेत्रों में विस्तार कर सकेगी
  • Oracle ने उस साइट को सुरक्षित करने, hardware ऑर्डर करने, और अरबों डॉलर के construction और workforce investment पर पहले ही काम शुरू कर दिया था
  • Bloomberg ने यह खबर सबसे पहले दी थी। Oracle ने X पोस्ट में इसे "झूठी रिपोर्ट" कहा, लेकिन उसने सिर्फ मौजूदा प्रोजेक्ट की प्रगति का जिक्र किया और विस्तार योजना पर कुछ नहीं कहा

chip generation की रफ्तार और infrastructure निर्माण के बीच असंतुलन

  • AI chip upgrade cycle डेटा सेंटर निर्माण की गति से तेज हो चुकी है
    • Nvidia पहले हर 2 साल में नया उत्पाद लाता था, लेकिन अब हर साल नया GPU जारी कर रहा है
    • नवीनतम Vera Rubin chip, Blackwell की तुलना में inference performance 5 गुना बेहतर देती है
  • AI model विकसित करने वाली कंपनियां नवीनतम chips को प्राथमिकता देती हैं, क्योंकि performance gap का सीधा असर benchmarks, usage, revenue, और valuation पर पड़ता है
  • infrastructure कंपनियों को site acquisition, power connection, और facility completion में कम से कम 12 से 24 महीने लगते हैं, इसलिए तकनीकी पीढ़ी का अंतर लगभग तय है
  • लेकिन ग्राहक हर साल अपग्रेड होने वाले नवीनतम chips चाहते हैं, इसलिए निर्माण पूरा होने तक hardware के पुरानी पीढ़ी का हो जाने का जोखिम रहता है
  • आज साइन होने वाले सभी infrastructure contracts के लिए यह संभावना है कि power connection मिलने से पहले ही वे पुराने hardware में निवेश बन जाएं

Oracle का debt-driven expansion model

  • Oracle प्रमुख hyperscalers में एकमात्र ऐसा खिलाड़ी है जो कर्ज के सहारे AI infrastructure बढ़ा रहा है
    • कुल कर्ज 100 अरब डॉलर से अधिक है, और free cash flow negative हो चुका है
    • Google, Amazon, Microsoft अपने खुद के cash generation से निवेश कर रहे हैं
  • partner company Blue Owl ने अतिरिक्त सुविधाओं के लिए फंडिंग देने से इनकार किया और अधिकतम 30,000 कर्मचारियों की छंटनी योजना घोषित की
  • Oracle जल्द ही तीसरी तिमाही के नतीजे घोषित करने वाला है, और निवेशकों की नजर 50 अरब डॉलर के capital expenditure plan तथा funding sustain करने की क्षमता पर है

बाजार की प्रतिक्रिया और शेयर मूल्य रुझान

  • Oracle का शेयर इस साल 23% गिरा है और 2025 के सितंबर के उच्चतम स्तर की तुलना में आधे से ज्यादा गिर चुका है
  • निवेशक AI infrastructure investment की sustainability और कर्ज के बोझ पर ध्यान दे रहे हैं

GPU depreciation और पूरे AI बाजार के लिए जोखिम

  • GPU depreciation, Oracle से आगे बढ़कर पूरे AI infrastructure market पर असर डालने वाला जोखिम बन सकता है
  • chip performance improvement की रफ्तार और डेटा सेंटर निर्माण अवधि के बीच बेमेल AI infrastructure investment का एक प्रमुख जोखिम कारक है
  • यह संरचनात्मक समस्या पूरे AI ecosystem की efficiency और investment returns को प्रभावित कर सकती है

1 टिप्पणियां

 
GN⁺ 2026-03-10
Hacker News की राय
  • मैं छोटी open source LLM inference कंपनी Synthetic.new चलाता हूँ
    मुझे लगता है कि CNBC की रिपोर्टिंग सटीक नहीं है। Oracle ‘कल का डेटा सेंटर’ नहीं बना रहा, बल्कि Blackwell DC बना रहा है। समस्या यह है कि ‘आज का DC’ ‘कल’ पूरा होगा। तब तक Vera Rubin रिलीज़ हो चुका होगा और उसकी efficiency 5 गुना ज़्यादा होगी, लेकिन Oracle के दाम 5 गुना कम करने की संभावना कम है
    Nvidia की rack-scale मशीनें(GB200-NVL72, GB300-NVL72) पूरी तरह तैयार racks हैं, जिन्हें सिर्फ power और network से जोड़ना होता है। Oracle बस Vera Rubin racks खरीदकर नए DC में लगा दे तो वह ‘कल का DC’ ‘कल’ ही हासिल कर सकता है
    हालांकि, यह भी संभव है कि Oracle ने Blackwell की डिलीवरी कल के लिए पहले ही contract कर ली हो, या DC निर्माण में देरी के कारण GPU खाली पड़े हों। सिर्फ CNBC की रिपोर्ट से यह साफ नहीं है कि वास्तविक स्थिति कितनी गंभीर है

    • सिर्फ एक generation में 5 गुना efficiency improvement कुछ ज़्यादा ही लगता है। हाल के process shrink के कारण improvement की रफ्तार कम हुई है
      इस GPU performance/power benchmark को देखें तो, 1080 Ti(9 साल पहले) और 5090 के बीच फर्क लगभग 2.56 गुना है। वास्तविक workload में यह आँकड़ा कायम रहे, इसकी संभावना कम है
      पुराने डेटा सेंटर GPU भी अब तक अच्छे से इस्तेमाल हो रहे हैं
    • यह शायद रक्षा·गोपनीय वातावरण के लिए बनाई गई रणनीति होने की अधिक संभावना है। ऐसे माहौल में firmware validation, cryptographic certification आदि के कारण commercial release के 18~36 महीने बाद ही approval मिलता है
      पहले से deploy किए गए Blackwell civilian उपयोग के लिए रहेंगे, और सरकार को नया hardware अलग से खरीदना होगा। Oracle शायद इस security market के धीमे cycle को निशाना बना रहा है
      साथ ही, सरकार ने बड़े पैमाने पर GPU infrastructure सीधे चलाया हो, ऐसा लगभग नहीं हुआ है, इसलिए Oracle बाद में इस demand को absorb कर सकता है
    • CNBC की Deirdre Bosa ने भी कुछ ऐसा ही कहा। अंदर भी बहुत लोग हैं जिन्हें स्थिति की गंभीरता ठीक से नहीं पता
      Oracle लंबे समय में debt risk उठा रहा है, इसलिए यह फैसला उसका पहला संकेत हो सकता है
    • दूसरी रिपोर्टों के अनुसार वास्तव में construction delay ही हुआ है। Stargate site अभी भी तैयार की जा रही है, और GPU installation 2026 तक तय है
      Nvidia का दूसरी कंपनियों को अरबों डॉलर के Blackwell contracts देना भी production line चालू रखने की कोशिश जैसा लगता है। यह भी कहा जा रहा है कि पहले से deliver किए गए chips warehouse में पड़े हैं
    • यह मान लेना समझ में नहीं आता कि डेटा सेंटर किसी एक खास GPU generation से बंधा होता है। AWS भी हर नए Xeon के आने पर नई इमारत नहीं बनाता
  • Stargate project का मुख्य बिंदु ‘inference economics’ है
    hyperscaler infrastructure और specialized neoclouds के बीच लागत का अंतर लगभग 75% तक पहुँचता है। यही अंतर OpenAI जैसी कंपनियों के लिए खुद बनाना vs बाहर से खरीदना का फैसला मुश्किल बना देता है
    a7om.com पर 40 से अधिक vendors की inference pricing track की जा रही है, और यह data दिखाता है कि 500 अरब डॉलर के DC investment कितने जोखिमभरे हो सकते हैं

  • मैं इस बात से सहमत नहीं हूँ कि Stargate ‘कल का डेटा सेंटर’ है
    Oracle को Nvidia roadmap पता है, और वह 200kW/rack स्तर की power density को ध्यान में रखकर चरणों में निर्माण कर रहा है। बाद के phases Rubin और Feynman generation को भी पर्याप्त रूप से समा सकते हैं

    • 200kW/rack सच में बेहद विशाल power consumption है। इस पैमाने की facility की कल्पना करना मुश्किल है
    • अगर ऐसा है, तो फिर CNBC ने यह क्यों रिपोर्ट किया कि OpenAI ‘नए GPU चाहने के कारण जा रहा है’, यह सवाल उठता है। यह सिर्फ गलत रिपोर्टिंग है या अंदरूनी source की विकृत जानकारी, इसका स्पष्टीकरण चाहिए
  • मुझे पुराने डेटा सेंटर GPU का आगे क्या होता है, यह जानने में दिलचस्पी है। क्या इनके लिए secondary market है, या Nvidia no-resale clause लगाता है, यह जानना चाहूँगा

    • eBay पर पहले से A100/H100 खरीदे जा सकते हैं। बिजली के बिल के कारण घर में चलाना किफायती नहीं है, लेकिन कुछ लोग मज़े के लिए भी चलाते हैं
    • सामान्य server parts का used market सक्रिय है, लेकिन GPU इतना specialized equipment है कि व्यक्तिगत उपयोग मुश्किल है। H200 जैसी चीज़ को home PC में लगाना भी कठिन है
      GPU महँगे हैं, और यह भी अनिश्चित है कि Moore's law इस क्षेत्र में वैसे ही लागू होगी या नहीं। अगर performance improvement बड़ा नहीं रहा, तो replacement cycle भी लंबा होगा
    • AWS अभी भी T4 GPU(2018 में जारी) आधारित g4dn instances दे रहा है। बड़े cloud providers depreciation के बाद भी इन्हें लंबे समय तक चलाते हैं, इसलिए हमारे द्वारा छोड़े गए GPU वे शायद इस्तेमाल ही न करें
    • डेटा सेंटर GPU को 24/7 आधार पर 5~7 साल की durability के लिए design किया जाता है, लेकिन वास्तविक lifetime लगभग 3~4 साल होती है। Meta के benchmark के अनुसार हर साल लगभग 9% fail हो जाते हैं। शुरुआती 3 महीनों में failure rate खास तौर पर ऊँचा होता है
    • कुछ GPU liquid cooling-only racks के लिए बनाए जाते हैं, इसलिए वे सामान्य PC case में फिट नहीं बैठते। मैंने भी NEC SX Aurora TSUBASA खरीदा था, लेकिन उसमें fan नहीं था, इसलिए मुझे खुद 40mm के तीन fan लगाने पड़े
  • OpenAI को अब तक अपने सभी compute partners के साथ समस्याएँ रही हैं। इस बार की स्थिति में भी कुछ अतिशयोक्ति है। अगली पीढ़ी के chips और तेज़ी से दे सकने वाला partner वास्तव में लगभग कोई नहीं है

  • Oracle की financial structure और acquisition की संभावना ज़्यादा दिलचस्प विषय है
    सरकार, finance sector आदि के मुख्य उद्योग अब भी Oracle DB का इस्तेमाल करते हैं, लेकिन debt repayment के दबाव के कारण price increase जारी रहेगा। अंततः customer churn तेज़ होगा, और hostile acquisition एक व्यावहारिक विकल्प बन सकता है

    • IBM भी Oracle की तरह पुरानी तकनीक के सहारे अब तक चल रहा है, यह हैरानी की बात है
  • यह समझना मुश्किल है कि Oracle ने पुराने GPU बड़ी मात्रा में क्यों खरीदे। electronics तेजी से depreciate होते हैं, इसलिए 2 साल बाद इस्तेमाल होने वाले chips को अभी full price पर खरीदना अतार्किक investment जैसा लगता है

  • यह सवाल भी है कि क्या डेटा सेंटर हर साल GPU बदल सकते हैं

    • प्रतिस्पर्धी बने रहने के लिए हर साल upgrade ज़रूरी होता है