1 पॉइंट द्वारा GN⁺ 2026-01-07 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • AWS ने EC2 Capacity Blocks for ML की GPU instance कीमतें लगभग 15% बढ़ा दीं; ज़्यादातर regions में p5e.48xlarge और p5en.48xlarge instances की प्रति घंटा दरें क्रमशः $34.61→$39.80, $36.18→$41.61 हो गईं
  • US West (Northern California) region में यह बढ़ोतरी और अधिक रही, जहाँ कीमत $43.26→$49.75 हो गई
  • AWS ने ईमेल के ज़रिए कहा कि यह बदलाव supply and demand patterns को दर्शाता है
  • यह बढ़ोतरी पहले की GPU instance कीमतों में अधिकतम 45% कटौती की घोषणा (7 महीने पहले) के बाद आई है, और AWS द्वारा सीधे कीमत बढ़ाने के दुर्लभ मामलों में से एक है
  • यह घटना cloud industry में कीमतें केवल घटने की अनकही परंपरा के टूटने का संकेत है, और आगे चलकर दूसरे resource services पर भी असर डाल सकती है

AWS की GPU कीमत बढ़ोतरी का सार

  • AWS ने वीकेंड के शनिवार को EC2 Capacity Blocks for ML की कीमतें लगभग 15% बढ़ा दीं
    • p5e.48xlarge instance की प्रति घंटा कीमत $34.61 से $39.80 और p5en.48xlarge की $36.18 से $41.61 हो गई
    • US West (Northern California) region में कीमत $43.26 से $49.75 तक बढ़ी, यानी बढ़ोतरी और बड़ी रही
  • AWS के आधिकारिक pricing page पर यह लिखा था कि “2026 के जनवरी में कीमत अपडेट की जाएँगी,” लेकिन यह नहीं बताया गया था कि बदलाव किस दिशा में होगा
  • AWS ने ईमेल में समझाया कि “कीमतें supply and demand patterns के अनुसार बदलती हैं, और यह adjustment उस quarter के अपेक्षित pattern को दर्शाता है”

Capacity Blocks की प्रकृति और उपयोगकर्ता वर्ग

  • Capacity Blocks ऐसा मॉडल है जिसमें किसी निश्चित समय के लिए GPU resources reserve और guarantee किए जाते हैं, ताकि ML training workloads को स्थिर रूप से चलाया जा सके
    • एक दिन से लेकर कई हफ्तों बाद तक की किसी अवधि के लिए GPU instances बुक किए जा सकते हैं, और fixed upfront fee चुकानी होती है
  • इस service का उपयोग करने वाले ग्राहक आमतौर पर बड़े ML projects चलाने वाली enterprise teams होती हैं, जिनके budgets लाखों डॉलर तक होते हैं
  • AWS ने 7 महीने पहले GPU instances के on-demand और Savings Plan prices में अधिकतम 45% कटौती की थी, लेकिन इस बार की बढ़ोतरी केवल Capacity Blocks पर लागू हुई है

उद्योग और ग्राहकों पर प्रभाव

  • AWS पहले भी कीमतों में बदलाव करता रहा है, लेकिन सीधी कीमत बढ़ोतरी (line-item increase) बहुत कम देखने को मिलती है
    • पहले आम तौर पर pricing structure बदला जाता था, या इसे इस तरह पेश किया जाता था कि “ज़्यादातर ग्राहकों के लिए इसका असर कीमत घटने जैसा है”
  • यह बढ़ोतरी Azure और GCP को तुलना में फ़ायदा दे सकती है
    • दोनों competitors ML workloads आकर्षित करने के लिए आक्रामक हैं, और “AWS ने GPU कीमतें 15% बढ़ाईं” जैसी बात sales talking point बन सकती है
  • Enterprise Discount Program (EDP) का उपयोग करने वाले enterprise customers को, discount rate वही रहने पर भी, base price बढ़ने से वास्तविक लागत अधिक चुकानी पड़ेगी

बाज़ार की स्थिति और आगे का संकेत

  • दुनिया भर में GPU supply सीमित होने की स्थिति में यह बढ़ोतरी demand-supply imbalance के संकेत के रूप में देखी जा रही है
  • AWS ने 20 साल तक यह धारणा बनाई कि “कीमतें हमेशा नीचे जाती हैं,” लेकिन इस कदम ने उस बुनियादी मान्यता को तोड़ दिया
  • एक बार कीमत बढ़ाने के बाद अगर बाज़ार की प्रतिक्रिया सीमित रहती है, तो आगे और बढ़ोतरी की संभावना बढ़ जाती है
  • आगे चलकर Graviton instances या data transfer costs जैसी दूसरी services में भी इसी तरह के adjustment की संभावना जताई गई है
  • लेख में कहा गया है कि “cloud pricing केवल एक ही दिशा में जाती है” वाली धारणा जनवरी 2026 के एक शनिवार को खत्म हो गई

निष्कर्ष

  • यह GPU कीमत बढ़ोतरी AWS की pricing policy में एक turning point मानी जा रही है
  • इसने cloud market में cost stability पर भरोसे को झटका दिया है, और
    आगे supply-constrained resources में अतिरिक्त बढ़ोतरी की आशंका जताई जा रही है

1 टिप्पणियां

 
GN⁺ 2026-01-07
Hacker News की राय
  • GPU, RAM और हार्ड डिस्क की कीमतें सब बढ़ती देख, आखिरकार घरेलू कंप्यूटरों की जगह thin client लेने और सारी computing के subscription service में चले जाने वाला भविष्य याद आता है
    “स्टोरेज की ज़रूरत नहीं, cloud subscription लो”, “processing power की ज़रूरत नहीं, game streaming करो” जैसे नारे हक़ीक़त बन सकते हैं
    game कंपनियाँ पहले से ही hourly billing model पर विचार कर रही हैं, इसलिए Call of Duty या GTA जैसे games की संरचना पूरी तरह बदल सकती है
    physical media गायब हो सकती है, iPhone storage भी घट सकता है, और सब कुछ iCloud पर मजबूर किया जा सकता है
    कार ownership की जगह autonomous vehicle sharing, offline retail stores बंद होने के बाद drone delivery केंद्रित समाज जैसी तस्वीर भी सामने आती है

    • subscription service की कीमतें भी साथ-साथ बढ़ रही हैं। जिन लोगों ने पहले ही कंप्यूटर खरीद लिया है वे कुछ साल निकाल सकते हैं, लेकिन rental users पर इसका असर तुरंत पड़ रहा है
    • Christmas gift में मिला alarm clock (Hatch.co) सालाना 50 डॉलर subscription के बिना काम ही नहीं करता। consumers को total cost of ownership (TCO) बेहतर समझना चाहिए। शायद सरकार को home appliances की तरह annual cost sticker लगवाना चाहिए
    • supply chain इतनी नाज़ुक है कि, TSMC के 60% market share वाले हालात में अगर China Taiwan पर हमला करे तो दुनिया भर के CPU·GPU production का आधे से ज़्यादा हिस्सा गायब हो सकता है। तब iPhone की बिक्री पूरी तरह रुक सकती है, और एक PC की कीमत 5,000 डॉलर तक जा सकती है
    • MMORPG लंबे समय से monthly subscription model इस्तेमाल करते आए हैं। लेकिन ज़्यादातर games अगर hourly billing पर जाएँ तो शायद उनकी कमाई घटेगी। लोग games बहुत खरीदते हैं, पर वास्तव में खेलते बहुत कम हैं
    • इस रुझान को पहले ही Technofeudalism नाम के concept के रूप में सिद्धांतबद्ध किया जा चुका है (Wikipedia लिंक)
  • लेख के शीर्षक में “hopes you weren't paying attention” कुछ ज़्यादा ही सनसनीखेज़ लगता है
    यह GPU और RAM की मांग के supply से आगे निकल जाने वाली सीधी market dynamics जैसा दिखता है

    • The Register की पहचान ही ऐसे उकसाऊ headlines हैं। click खींचने की मंशा रहती है, लेकिन इस बार यह वाकई काम कर गया
    • GPU और RAM की supply weekend के बीच अचानक नहीं बदलती। शनिवार को ही कीमत बढ़ाने की कोई खास वजह नहीं थी
    • ग्राहक काम नहीं कर रहे होते ऐसे शनिवार को price hike घोषित करना सवाल खड़े करता है
    • high school economics से भी यह बात निकाली जा सकती है कि ऐसी कंपनियाँ अब तक बस debt और कमज़ोर productivity ही पैदा करती आई हैं
  • AWS price increase वाले लेख में “अपडेट होने वाला है” लिखा है, लेकिन दिशा (बढ़ोतरी है या कटौती) साफ़ नहीं की गई, यह भ्रमित करता है
    जो लोग पहले से customer हैं वे price page रोज़ नहीं देखते, इसलिए इस तरह की सूचना दरअसल opaque communication है

    • एक comment में 《The Hitchhiker's Guide to the Galaxy》 के “notice एक बंद शौचालय की दराज़ के अंदर था” वाले मज़ाक से AWS की announcement शैली पर तंज कसा गया
  • GPU depreciation period को 3 साल से 5 साल करने की आलोचना हुई थी, लेकिन यह price increase उल्टा यह दिखाती लगती है कि GPU की value life लंबी हो रही है

    • मैं expert नहीं हूँ, लेकिन price increase उल्टा छोटी lifespan का संकेत भी हो सकती है। supply कम हुई हो या demand बढ़ी हो, दोनों संभव हैं। GPU demand inelastic हो गई हो तो कीमतें और ऊपर जा सकती हैं
    • यह इस पर निर्भर करता है कि NVIDIA ने performance gains को कितना बढ़ा-चढ़ाकर पेश किया। अगर RL features, prefill/decode separation, nvfp4 जैसी architectural improvements से efficiency बढ़ी है, तो पुराने chips भी काफ़ी उपयोगी रहेंगे
    • high-end GPUs वास्तव में 6 साल से ज़्यादा चल सकते हैं। cooling अच्छी हो तो 10 साल के करीब भी। खासकर 80GB VRAM या उससे ऊपर वाले models की long-term value ज़्यादा है
  • cloud AI ज़्यादातर कंपनियों के लिए बस convenience tax है
    documents, prediction, monitoring, support, control systems जैसी चीज़ें local models से काफ़ी हद तक संभाली जा सकती हैं। data gravity, latency, privacy समस्याओं को देखते हुए edge hardware own करना ज़्यादा तर्कसंगत है

    • मैं भी LLM को कई इस्तेमालों के लिए prototype कर रहा हूँ, लेकिन cost से बड़ी समस्या reliability है। 99.95% और 99% के बीच का फ़र्क labor cost से भी बड़ा नुकसान करा सकता है। जिन क्षेत्रों में यह हिसाब लगाया जा सकता है, वहाँ अब भी इंसान बेहतर लगते हैं
  • लगता है पूरे AI industry पर जल्द ही price shock आने वाला है

    • हमारी team के पास API·infrastructure cost के उछलने की स्थिति के लिए कोई plan ही नहीं है। अभी लगभग मुफ़्त जैसे AI features marketing के लिए जोड़ रहे हैं, लेकिन जब असली cost लगेगी तो शायद सब हटाने पड़ें
    • आख़िरकार बहुत-सा इस्तेमाल China के open-weight models की ओर चला जाएगा। top-tier models को छोड़ दें तो ज़्यादातर use cases में वे पहले ही काफ़ी ‘good enough’ हैं
    • यह झटका सिर्फ AI industry को नहीं बल्कि हर industry को प्रभावित करेगा
    • मैं भी Claude user होने के नाते ऐसी price increase को लेकर चिंतित हूँ
  • AI सारे resources खींचकर दूसरे industries का दम घोंट रही है

    • Philip K. Dick और Frank Herbert ने पहले ही capitalism की इस स्थायी संरचना का काफ़ी सटीक पूर्वानुमान कर लिया था
  • सोचता हूँ कि क्या GPU price changes को घंटे के हिसाब से track करने वाली कोई service है

    • मैं उसी के लिए computeprices.com को एक साल से side project के तौर पर बना रहा हूँ
    • AWS का कुछ specific instances की कीमत बढ़ाना असामान्य है। लेकिन इससे बड़ा मुद्दा है बिना advance notice के price increase की opacity। customer के नज़रिए से यह भरोसा तोड़ने वाला तरीका है
  • Corey Quinn को The Register में देखकर अच्छा लगा

  • GPU की भारी खरीदारी से capital expenditure में तेज़ बढ़ोतरी memory जैसे दूसरे components की demand भी ऊपर धकेल रही है
    लेकिन सवाल है कि वे GPUs वास्तव में कितने इस्तेमाल हो रहे हैं। यह सोचने पर मजबूर करता है कि कहीं idle inventory का खर्च तो हम नहीं उठा रहे हैं