- AWS ने EC2 Capacity Blocks for ML की GPU instance कीमतें लगभग 15% बढ़ा दीं; ज़्यादातर regions में p5e.48xlarge और p5en.48xlarge instances की प्रति घंटा दरें क्रमशः $34.61→$39.80, $36.18→$41.61 हो गईं
- US West (Northern California) region में यह बढ़ोतरी और अधिक रही, जहाँ कीमत $43.26→$49.75 हो गई
- AWS ने ईमेल के ज़रिए कहा कि यह बदलाव supply and demand patterns को दर्शाता है
- यह बढ़ोतरी पहले की GPU instance कीमतों में अधिकतम 45% कटौती की घोषणा (7 महीने पहले) के बाद आई है, और AWS द्वारा सीधे कीमत बढ़ाने के दुर्लभ मामलों में से एक है
- यह घटना cloud industry में कीमतें केवल घटने की अनकही परंपरा के टूटने का संकेत है, और आगे चलकर दूसरे resource services पर भी असर डाल सकती है
AWS की GPU कीमत बढ़ोतरी का सार
- AWS ने वीकेंड के शनिवार को EC2 Capacity Blocks for ML की कीमतें लगभग 15% बढ़ा दीं
- p5e.48xlarge instance की प्रति घंटा कीमत $34.61 से $39.80 और p5en.48xlarge की $36.18 से $41.61 हो गई
- US West (Northern California) region में कीमत $43.26 से $49.75 तक बढ़ी, यानी बढ़ोतरी और बड़ी रही
- AWS के आधिकारिक pricing page पर यह लिखा था कि “2026 के जनवरी में कीमत अपडेट की जाएँगी,” लेकिन यह नहीं बताया गया था कि बदलाव किस दिशा में होगा
- AWS ने ईमेल में समझाया कि “कीमतें supply and demand patterns के अनुसार बदलती हैं, और यह adjustment उस quarter के अपेक्षित pattern को दर्शाता है”
Capacity Blocks की प्रकृति और उपयोगकर्ता वर्ग
- Capacity Blocks ऐसा मॉडल है जिसमें किसी निश्चित समय के लिए GPU resources reserve और guarantee किए जाते हैं, ताकि ML training workloads को स्थिर रूप से चलाया जा सके
- एक दिन से लेकर कई हफ्तों बाद तक की किसी अवधि के लिए GPU instances बुक किए जा सकते हैं, और fixed upfront fee चुकानी होती है
- इस service का उपयोग करने वाले ग्राहक आमतौर पर बड़े ML projects चलाने वाली enterprise teams होती हैं, जिनके budgets लाखों डॉलर तक होते हैं
- AWS ने 7 महीने पहले GPU instances के on-demand और Savings Plan prices में अधिकतम 45% कटौती की थी, लेकिन इस बार की बढ़ोतरी केवल Capacity Blocks पर लागू हुई है
उद्योग और ग्राहकों पर प्रभाव
- AWS पहले भी कीमतों में बदलाव करता रहा है, लेकिन सीधी कीमत बढ़ोतरी (line-item increase) बहुत कम देखने को मिलती है
- पहले आम तौर पर pricing structure बदला जाता था, या इसे इस तरह पेश किया जाता था कि “ज़्यादातर ग्राहकों के लिए इसका असर कीमत घटने जैसा है”
- यह बढ़ोतरी Azure और GCP को तुलना में फ़ायदा दे सकती है
- दोनों competitors ML workloads आकर्षित करने के लिए आक्रामक हैं, और “AWS ने GPU कीमतें 15% बढ़ाईं” जैसी बात sales talking point बन सकती है
- Enterprise Discount Program (EDP) का उपयोग करने वाले enterprise customers को, discount rate वही रहने पर भी, base price बढ़ने से वास्तविक लागत अधिक चुकानी पड़ेगी
बाज़ार की स्थिति और आगे का संकेत
- दुनिया भर में GPU supply सीमित होने की स्थिति में यह बढ़ोतरी demand-supply imbalance के संकेत के रूप में देखी जा रही है
- AWS ने 20 साल तक यह धारणा बनाई कि “कीमतें हमेशा नीचे जाती हैं,” लेकिन इस कदम ने उस बुनियादी मान्यता को तोड़ दिया
- एक बार कीमत बढ़ाने के बाद अगर बाज़ार की प्रतिक्रिया सीमित रहती है, तो आगे और बढ़ोतरी की संभावना बढ़ जाती है
- आगे चलकर Graviton instances या data transfer costs जैसी दूसरी services में भी इसी तरह के adjustment की संभावना जताई गई है
- लेख में कहा गया है कि “cloud pricing केवल एक ही दिशा में जाती है” वाली धारणा जनवरी 2026 के एक शनिवार को खत्म हो गई
निष्कर्ष
- यह GPU कीमत बढ़ोतरी AWS की pricing policy में एक turning point मानी जा रही है
- इसने cloud market में cost stability पर भरोसे को झटका दिया है, और
आगे supply-constrained resources में अतिरिक्त बढ़ोतरी की आशंका जताई जा रही है
1 टिप्पणियां
Hacker News की राय
GPU, RAM और हार्ड डिस्क की कीमतें सब बढ़ती देख, आखिरकार घरेलू कंप्यूटरों की जगह thin client लेने और सारी computing के subscription service में चले जाने वाला भविष्य याद आता है
“स्टोरेज की ज़रूरत नहीं, cloud subscription लो”, “processing power की ज़रूरत नहीं, game streaming करो” जैसे नारे हक़ीक़त बन सकते हैं
game कंपनियाँ पहले से ही hourly billing model पर विचार कर रही हैं, इसलिए Call of Duty या GTA जैसे games की संरचना पूरी तरह बदल सकती है
physical media गायब हो सकती है, iPhone storage भी घट सकता है, और सब कुछ iCloud पर मजबूर किया जा सकता है
कार ownership की जगह autonomous vehicle sharing, offline retail stores बंद होने के बाद drone delivery केंद्रित समाज जैसी तस्वीर भी सामने आती है
लेख के शीर्षक में “hopes you weren't paying attention” कुछ ज़्यादा ही सनसनीखेज़ लगता है
यह GPU और RAM की मांग के supply से आगे निकल जाने वाली सीधी market dynamics जैसा दिखता है
AWS price increase वाले लेख में “अपडेट होने वाला है” लिखा है, लेकिन दिशा (बढ़ोतरी है या कटौती) साफ़ नहीं की गई, यह भ्रमित करता है
जो लोग पहले से customer हैं वे price page रोज़ नहीं देखते, इसलिए इस तरह की सूचना दरअसल opaque communication है
GPU depreciation period को 3 साल से 5 साल करने की आलोचना हुई थी, लेकिन यह price increase उल्टा यह दिखाती लगती है कि GPU की value life लंबी हो रही है
cloud AI ज़्यादातर कंपनियों के लिए बस convenience tax है
documents, prediction, monitoring, support, control systems जैसी चीज़ें local models से काफ़ी हद तक संभाली जा सकती हैं। data gravity, latency, privacy समस्याओं को देखते हुए edge hardware own करना ज़्यादा तर्कसंगत है
लगता है पूरे AI industry पर जल्द ही price shock आने वाला है
AI सारे resources खींचकर दूसरे industries का दम घोंट रही है
सोचता हूँ कि क्या GPU price changes को घंटे के हिसाब से track करने वाली कोई service है
Corey Quinn को The Register में देखकर अच्छा लगा
GPU की भारी खरीदारी से capital expenditure में तेज़ बढ़ोतरी memory जैसे दूसरे components की demand भी ऊपर धकेल रही है
लेकिन सवाल है कि वे GPUs वास्तव में कितने इस्तेमाल हो रहे हैं। यह सोचने पर मजबूर करता है कि कहीं idle inventory का खर्च तो हम नहीं उठा रहे हैं