2 पॉइंट द्वारा GN⁺ 2026-04-20 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • दुनिया भर में general-purpose DRAM की सप्लाई की कमी के कारण अनुमान है कि 2027 के अंत तक भी मांग का केवल 60% ही पूरा हो पाएगा, और कुछ आकलनों के अनुसार यह स्थिति 2030 तक जारी रह सकती है
  • Samsung, SK Hynix, Micron जैसे प्रमुख निर्माता नए fab विस्तार पर काम कर रहे हैं, लेकिन इनमें से अधिकांश 2027~2028 से पहले चालू नहीं हो पाएंगे
  • मांग पूरी करने के लिए सालाना 12% उत्पादन वृद्धि जरूरी है, लेकिन वास्तविक नियोजित वृद्धि दर सिर्फ 7.5% है
  • नई सुविधाएं AI डेटा सेंटर के लिए HBM(High-Bandwidth Memory) उत्पादन पर केंद्रित हैं, इसलिए उपभोक्ता इलेक्ट्रॉनिक्स में इस्तेमाल होने वाले general-purpose DRAM की कमी दूर करने में इनकी सीमा है
  • smartphone, laptop, VR headset, gaming handheld जैसे कई consumer electronics उत्पादों की कीमतों में बढ़ोतरी पहले ही शुरू हो चुकी है

वैश्विक मेमोरी सप्लाई की कमी की स्थिति

  • Nikkei Asia की रिपोर्ट के मुताबिक, DRAM उत्पादन बढ़ाने के बावजूद निर्माताओं के लिए 2027 के अंत तक मांग का केवल 60% पूरा करना ही संभव होगा
  • SK Group के चेयरमैन ने कहा कि chip और wafer की कमी 2030 तक जारी रह सकती है

प्रमुख निर्माताओं की उत्पादन विस्तार योजनाएं

  • दुनिया के तीन सबसे बड़े मेमोरी निर्माताओं Samsung, SK Hynix, Micron सभी नए fab निर्माण को आगे बढ़ा रहे हैं
  • लेकिन अधिकांश नई सुविधाएं 2027 में, या जल्दी से जल्दी 2028 में ही चालू होंगी
  • 2026 के दौरान वास्तविक उत्पादन वृद्धि का अब तक का एकमात्र उदाहरण SK का Cheongju fab है, जो फरवरी में चालू हुआ

उत्पादन वृद्धि दर और मांग के बीच अंतर

  • Counterpoint Research के अनुसार, मांग पूरी करने के लिए 2026~2027 के दौरान हर साल 12% उत्पादन वृद्धि जरूरी है
  • वास्तविक नियोजित उत्पादन वृद्धि दर सिर्फ 7.5% है
  • योजना और जरूरत के बीच यही अंतर सप्लाई की कमी को लंबा खींचने वाला मुख्य कारण है

HBM को प्राथमिकता और consumer market पर असर

  • नए fab, AI डेटा सेंटर में इस्तेमाल होने वाली HBM(High-Bandwidth Memory) के उत्पादन पर केंद्रित हैं
  • निर्माता पहले से ही HBM को general-purpose DRAM पर प्राथमिकता दे रहे हैं, इसलिए computer और smartphone के लिए मेमोरी सप्लाई में सुधार कितना होगा, यह स्पष्ट नहीं है
  • इसी वजह से consumer electronics सेक्टर में कीमतों पर दबाव कम होगा या नहीं, यह अनिश्चित है

consumer electronics की कीमत बढ़ने के उदाहरण

  • RAM की कमी के कारण कई product categories में पहले ही कीमतें बढ़ चुकी हैं
    • Samsung Galaxy smartphone और tablet की कीमतें बढ़ीं
    • Microsoft Surface की कीमतें बढ़ीं
    • Meta Quest 3 / 3S VR headset की कीमत में 100 डॉलर की बढ़ोतरी
    • AYN के dual-screen gaming handheld की कीमत बढ़ी

1 टिप्पणियां

 
GN⁺ 2026-04-20
Hacker News की राय
  • मेरी समझ के अनुसार Samsung, SK Hynix, और Micron के पास मांग को पूरा करने लायक उत्पादन क्षमता नहीं है, और जो क्षमता है भी उसे DRAM की तुलना में HBM को प्राथमिकता दी जा रही है। HBM को consumer electronics में आसानी से मोड़ना मुश्किल लगता है, इसलिए आने वाले 3~4 साल तक आम consumer market के लिए हालात काफी कठिन दिखते हैं। ऊपर से OpenAI भी पूंजीगत दबाव में बंधा हुआ है, और उसकी burn rate व revenue को लेकर सवाल बढ़ रहे हैं, इसलिए इस RAM panic को भड़काने वाली उसकी खरीद प्रतिबद्धताएँ भी शायद अंत तक पूरी न हों, और आखिर में memory कंपनियों को inventory अपने सिर लेनी पड़ सकती है

    • इससे मुझे 2019 का Radeon VII याद आता है, जो 700 डॉलर का consumer GPU होते हुए भी HBM2 के साथ 1TB/s bandwidth देता था। उस समय AMD ने mid-range lineup तक में HBM डाला था, इसलिए यह समझना मुश्किल है कि जो तकनीक पहले आम उपभोक्ताओं को बेची जा सकती थी, उसे अब मानो दैवी तकनीक की तरह इतना महंगा और खास क्यों बताया जा रहा है
    • क्षेत्रीय कारक भी बड़े हैं। Netherlands में power grid saturation की वजह से data center बनाने वाली कंपनियों को, लागत चुका देने और connection guarantee मिलने के बाद भी, यह बताया जा रहा है कि 2030 से पहले grid access मुश्किल है। इसका मतलब है कि ऐसे data center के आधार पर memory capacity reserve हो रही है जो अभी बने भी नहीं हैं, इसलिए अगर construction टलता है या रद्द होता है, तो supply और demand का संतुलन और अजीब तरह से उलझ सकता है
    • मुझे लगता है memory कंपनियाँ हमेशा आखिर में बोझ उठाने वाली इकाई बनती रही हैं। कम से कम तीन बार मैंने ऐसा दृश्य देखा है
    • फिर भी इस बार memory कंपनियों ने पहले की तरह बड़े पैमाने पर capacity expansion नहीं किया, और मेरा मानना है कि यही फैसला inventory विस्फोट से बचने के लिए लिया गया था
    • मुझे लगता है Altman के तरह-तरह के infra निर्माण वादे टूटेंगे, और उम्मीद से जल्दी हालात oversupply की तरफ और झुकेंगे। मेरा आकलन है कि finance sector भी अब समझ रहा है कि ऐसे infra इतनी जल्दी बनाए नहीं जा सकते, और बन भी जाएँ तो उनसे मुनाफा नहीं निकलता
  • एक सवाल जो मैं अब तक सुलझा नहीं पाया हूँ, वह यह है: अगर AI software बनाना आसान कर देता है, तो कीमतें गिरेंगी; लेकिन जब AI पर खर्च पहले ही दुनिया के कुल software खर्च से कई गुना बड़ा हो चुका है, तो software कंपनियाँ वह लागत कैसे उठाएँगी, यह समझ नहीं आता। इसलिए मौजूदा RAM demand मुझे रेत पर खड़ी नींव जैसी लगती है, और अंत में इसके बड़े पैमाने की oversupply में बदलने की संभावना अधिक दिखती है

    • मैं इसे इतना दूर जाता हुआ नहीं देखता। LLM पहले ही एक tool के रूप में काफी उपयोगी है, इसलिए यह गायब नहीं होगा; असली सवाल आखिरकार scalability और cost reduction का है। छोटे खिलाड़ी इसे न भी अपना पाएँ, तो बड़े संगठन defense, resource development, finance जैसे क्षेत्रों में पहले इसके उपयोग ढूँढ सकते हैं। दूसरी ओर अगर लागत काफी गिरती है, तो छोटी टीमें भी इसे अपनाएँगी; लेकिन अगर यह बहुत सस्ता हो गया, तो संभावित ग्राहक घर पर खुद software बनाने लगेंगे—ऐसा एक विरोधाभास भी बन सकता है
    • analysts की गणना के अनुसार, iPhone user के लिए प्रति माह 35 डॉलर और Netflix subscriber के लिए प्रति माह 180 डॉलर की नई subscription जैसी जरूरत की बात तक कही जा रही है। Claude Max की कीमत बढ़ भी जाए, तब भी सभी Netflix users ऐसा खर्च देंगे, इस पर संदेह है। संबंधित बात Tom's Hardware लेख में देखी जा सकती है
    • सब लोग मानो Jevons paradox पर दांव लगा रहे हैं। यानी उम्मीद यह है कि AI अगला semiconductor, अगला internet बन जाए
    • मैं इसे एक Trojan horse की तरह देखता हूँ। ऐसा लगता है कि रणनीति यह है कि दुनिया इस तकनीक की आदी और उस पर निर्भर हो जाए
  • मुझे लगता है यह स्थिति लंबी चलेगी। कोविड के बाद manufacturers ने सीख लिया कि supply restriction से मुनाफा अधिकतम होता है, और अगर देखें कि car prices पहले की तरह आसानी से नीचे नहीं आईं, तो RAM भी शायद उसी रास्ते पर जा सकती है। Apple या OpenAI जैसे बड़े ग्राहकों के विपरीत, आम consumers बड़े contracts नहीं कर सकते, इसलिए आखिर में कीमत हमीं चुकाएँगे

  • मैं थोड़ा आशावादी हूँ। उम्मीद है कि यह घटना RAM को लापरवाही से इस्तेमाल करने वाले developers के लिए चेतावनी बनेगी, और आगे apps को ज़्यादा memory-efficient होना ही पड़ेगा

    • यह दृश्य मुझे कुछ-कुछ 1973 oil shock के बाद V8 engine युग के ढलने जैसा लगता है
    • लेकिन अभी demand को खींचने वाली चीज़ मुख्यतः inference है, इसलिए हो सकता है developers के पास सचमुच मजबूरी वाली optimization motivation उतनी न हो
    • मैं चाहता हूँ कि इस मौके पर Electron की पकड़ कमजोर पड़े। स्क्रीन पर साधारण कंटेंट दिखाने के लिए जहाँ 500KB काफी हो, वहाँ 300MB से बड़े app का इस्तेमाल मुझे कभी समझ नहीं आया
      • यह सचमुच सपने जैसा परिदृश्य लगता है
    • RAM बचाने के लिए अक्सर CPU ज़्यादा लगाना पड़ता है, इसलिए RAM की कीमत बढ़ने पर भी कुल मिलाकर यह हमेशा अच्छा trade-off नहीं होता
  • मुझे हैरानी हुई कि लेख में Google के TurboQuant का ज़िक्र ही नहीं था। यह 26 दिन पहले घोषित हुआ था, और कहा गया कि यह KV cache memory को 6 गुना घटाता है और speed को 8 गुना तक बढ़ा देता है; इसे llama.cpp में भी शामिल किया जा चुका है, जिससे बड़े context को छोटे model पर समझौता किए बिना चलाने में मदद मिलती है। हालांकि मैं भी अभी संदेहपूर्ण हूँ कि क्या इससे RAM समस्या वास्तव में काफी कम होगी। demand, बचत के असर से भी बड़ी हो सकती है। संबंधित लिंक के लिए यह HN पोस्ट देखी जा सकती है

    • industry में यह धारणा भी मजबूत है कि TurboQuant state-of-the-art SOTA नहीं है। bitrate-आधारित KV quantization के लिए बेहतर तरीके मौजूद हैं; उदाहरण के लिए SpectralQuant जैसे विकल्प हैं। ऊपर से 6x वाला आँकड़ा BF16 KV cache की तुलना वाला है, इसलिए मौजूदा 8-bit या 4-bit तरीकों से तुलना करने पर तस्वीर बदल जाती है
    • एक सुधार भी जरूरी है। TurboQuant पेपर वास्तव में अप्रैल 2025 arXiv पर आया था, और मौजूदा implementation लगभग 3.8x से 4.9x compression ही देता है; ऊपर दिए गए आँकड़ों के लिए GSM8K performance में काफी गिरावट स्वीकार करनी पड़ती है। speed भी baseline के मुकाबले 80~100% के आसपास है, यानी सुधार न भी मिले या उल्टा यह धीमा भी हो सकता है। implementation की स्थिति vLLM PR और चर्चा vLLM issue में देखी जा सकती है। मैं व्यक्तिगत रूप से DMS के साथ प्रयोग कर रहा हूँ, जो ज़्यादा promising लगता है और अन्य quantization के साथ भी जोड़ा जा सकता है। इससे भी बड़े gains Gemma 4 के SWA global hybrid, MLA, DSA, linear layers, SSM जैसे model architecture सुधारों से आते हैं, लेकिन मेरा मानना है कि अंततः Jevons paradox की वजह से ये भी कुल memory demand को कम नहीं करेंगे। सिर्फ मेरा coding tool ही हर महीने 10 से 15 अरब cache tokens इस्तेमाल करता है, और जब agents व mainstream developers का उपयोग बढ़ेगा, तो लोगों की token मांग की वास्तव में कोई ऊपरी सीमा नहीं दिखती
    • local models की दिशा में कम RAM, कम VRAM लक्ष्य वाला काम निश्चित रूप से मददगार है। उदाहरण के लिए Gemma 4 32B अब आम laptops पर भी चल सकता है, और मुझे यह दो साल पहले के SOTA gpt-4o-स्तर की intelligence जितना या उससे बेहतर लगता है। जब तक memory prices स्थिर होंगी, तब तक शायद Opus 4.7-स्तर के models भी local रूप से चल सकेंगे। बड़े models में अंतर्निहित knowledge ज़्यादा होती है, लेकिन web search जैसे tool calls का सही निर्णय ही काफी हद तक उसकी भरपाई कर सकता है
    • मेरे हिसाब से net effect यह नहीं होगा कि वही काम कम memory से हो, बल्कि यह होगा कि उसी memory से ज़्यादा काम किए जाएँ। कंपनियाँ अपने products के context window को और बड़ा करेंगी, और लोग वैसा ही इस्तेमाल करेंगे। memory के भविष्य की यह कुछ कड़वी हकीकत लगती है
    • फिर भी model को memory में लोड करके बनाए रखने की लागत अभी भी बड़ी है। उदाहरण के लिए अगर RAM 16GB है, तो महसूस होने वाला फायदा उतना बड़ा नहीं होगा
  • मुझे यह भी आश्चर्य हुआ कि लेख में चीन की नई memory कंपनियों की बात नहीं थी। उदाहरण के तौर पर यह लेख याद आता है

    • जैसा कि लेख में भी कहा गया है, CXMT advanced DRAM process में Samsung, SK Hynix, और Micron से लगभग 3 साल पीछे है, और 2026 की दूसरी छमाही की उसकी line, 2027 से पहले वैश्विक supply-demand balance पर बड़ा असर नहीं डाल पाएगी। दूसरी ओर मूल लेख 2028 में demand के supply से ऊपर जाने की बात करता है, इसलिए यह संभव है कि चीन का production वर्तमान तकनीकी स्तर तक पहुँचने में 2029 तक पहुँच जाए। लंबे समय में इससे कीमतें घटाने में मदद मिल सकती है, लेकिन तुरंत कमी रोक देने लायक production efficiency अभी नहीं दिखती
  • हाल ही में मैं gaming PC नया बनाना चाहता था, लेकिन price shock और individual parts की supply समस्याओं की वजह से इसे टालता रहा। फिर संयोग से पास के Microcenter में 5090 और high-end power supply के साथ लगभग full-option prebuilt 5,000 डॉलर से कम में दिख गया, और मैंने तुरंत खरीद लिया। करीब दस साल पहले तक prebuilt लेना सिर्फ उन्हीं के लिए विकल्प था जिनके पास बहुत पैसा हो और weekend का एक दिन भी न हो, लेकिन अब यह उल्टा बिना ज़्यादा सोचे लिया जा सकने वाला विकल्प लगा

    • मेरा अब भी मानना है कि मूल सिद्धांत खुद assemble करना बेहतर है। prebuilt में assembly cost जुड़ी होती है, इसलिए वह संरचनात्मक रूप से महँगा होना ही है, और motherboard या power supply जैसे कम दिखने वाले parts में समझौता किया गया हो, इसकी संभावना भी कम नहीं। हाँ, यह हो सकता है कि आपको बहुत अच्छा deal मिला हो, लेकिन वह अपवाद पूरे सिद्धांत को नहीं बदलता
  • मैं सोच रहा हूँ कि क्या यह घटना हमें और memory-efficient software इस्तेमाल करने की दिशा में धकेलेगी। आजकल बहुत छोटे-छोटे programs भी सैकड़ों MB RAM खा जाते हैं

    • मैंने भी वास्तव में vibe-coding करते समय RAM usage कम रखना एक स्पष्ट लक्ष्य बनाया है
  • मुझे लगता है आखिरकार optimization का युग आ गया है, और इसे लेकर मैं उत्साहित हूँ

    • लेकिन मैं थोड़ा संदेह में हूँ। जिन apps का मैं उपयोग करता हूँ, उनमें ज़्यादातर में lock-in बहुत मजबूत है, इसलिए या तो optimize करने की संगठनात्मक इच्छा नहीं होती, या optimize करने के लिए resources कम होते हैं। इसलिए व्यावहारिक optimization अक्सर बस इतना रह जाता है कि मैं भारी tools छोड़कर हल्के tools अपनाऊँ, और उम्मीद करूँ कि ऐसे बहुत से चुनाव मिलकर उन हल्के tools की वित्तीय स्थिति और development resources बेहतर करें
    • मैं लंबे समय से कहता आया हूँ कि OS developers को आक्रामक optimization पर ध्यान देना चाहिए। chip shortage के बिना भी semiconductor shrinking की गति पहले ही धीमी हो चुकी है, और software optimization हर hardware के लिए लाभकारी है, लेकिन यह सीधे sales नहीं बढ़ाती। उस दृष्टि से Linux कम बंधा हुआ है, और शायद Haiku OS जैसे विकल्पों पर फिर से ध्यान जाए—ऐसी कल्पना भी होती है
  • मेरी नज़र में RAM manufacturers अब भी production बढ़ाने में हिचकिचा रहे हैं। सोचता हूँ क्या वे investor से पहले ऐसे long-term demand signals देख रहे हैं जो बाकी लोग नहीं देख पा रहे

    • वे पहले कई बार बुरी तरह जल चुके हैं। DRAM industry में boom-bust cycle लंबे समय तक दोहराया गया है; demand बढ़ते ही सबने नए fabs बनाए, फिर prices गिर गईं, investment नहीं निकला, और कंपनियाँ डूबती रहीं। 80s, 90s, और 2000s में भी यही हुआ, और अब जब सिर्फ तीन manufacturers बचे हैं, तो शायद वे किसी से बेहतर जानते हैं कि demand मूल रूप से cyclical है
    • semiconductor industry 50 साल से अधिक समय से boom and bust industry रही है। संबंधित छवि भी है, और मैंने खुद 30 साल के career में वह दौर भी देखा है जब हम customer orders का सिर्फ 30% ही पूरा कर पाते थे, और वह दौर भी जब 2 साल बाद fab utilization 50% पर आकर losses होने लगे। एक आधुनिक fab बनाने में 20 अरब डॉलर और 3~4 साल लगते हैं, इसलिए अगर आपको लगता है कि AI bubble हो सकता है, तो demand collapse के बाद चमकती हुई खाली फैक्ट्रियों के साथ रह जाना बहुत जोखिम भरा दांव है
    • जो लोग हकीकत को देखते हैं, वे शायद सब इसी तरह सोचेंगे। OpenAI की purchase commitments जरूरत से ज्यादा अवास्तविक और अस्थिर लगती हैं
    • उनकी तरफ से देखें तो downside scenario उतना बड़ा भी न हो। यह संरचना लगभग cartel जैसी है, और RAM एक ऐसी चीज़ है जिसकी जरूरत तो रहेगी ही, इसलिए कम बनाकर भी उन्होंने price और demand के संतुलन में अपने लिए सबसे अनुकूल risk-reward की गणना की होगी। उपभोक्ताओं की goodwill या reputation से ज़्यादा अहम बात शायद यह है कि market को उनकी अधिक जरूरत है