- नवंबर 2023 में ChatGPT के लॉन्च के बाद H100 GPU की मांग तेज़ी से बढ़ी, जिससे प्रति घंटा किराया $4.70 से बढ़कर $8 से ऊपर पहुंच गया
- डेटा सेंटर प्रदाताओं ने अनुमान लगाया था कि यदि H100 को $4.50 प्रति घंटा से अधिक पर किराये पर दिया जाए तो निवेश की वसूली अवधि 2 साल से कम रहेगी
- लेकिन अगस्त 2024 तक छोटे क्लस्टरों में H100 GPU का किराया घटकर $1~$2 प्रति घंटा रह गया
डेटा सेंटर में H100 निवेश की लाभप्रदता के मानक
- $2.85 प्रति घंटा से अधिक: S&P500 रिटर्न से बेहतर प्रदर्शन संभव
- $2.85 प्रति घंटा से कम: S&P500 रिटर्न से कमजोर
- $1.65 प्रति घंटा से कम: 5 साल में निवेश घाटे की आशंका
H100 GPU के बाज़ार भाव में तेज़ गिरावट के मुख्य कारण
- open weight models के उभार से inference और fine-tuning की मांग बढ़ी
- दूसरी ओर छोटे और मध्यम स्तर के foundation model निर्माताओं का बाज़ार सिमटा
- कई कंपनियों और startups ने समझा कि अपना मॉडल train करने के बजाय मौजूदा open weight models को fine-tune करना ज़्यादा किफायती और प्रभावी है
- 70B से बड़े मॉडलों की training की योजना न रखने वाले startups और कंपनियों ने निवेश वापस लिया
- कई infrastructure providers ने 3-5 साल के long-term contracts के ज़रिये मुनाफ़ा सुरक्षित किया
- यह 2023 के AI peak के दौरान विभिन्न foundation model कंपनियों द्वारा दबाव में कराया गया था
- reserve nodes की unused capacity को दोबारा बेचना शुरू हुआ
- Facebook, Microsoft जैसे बड़े model निर्माताओं ने अपने खुद के clusters बना लिए, जिससे मौजूदा clusters की मांग घटी
- ChatGPT नवंबर 2022 में A100 series पर लॉन्च हुआ था, और H100 मार्च 2023 में आया। H100, A100 से 3 गुना अधिक शक्तिशाली था, लेकिन इसकी कीमत सिर्फ़ 2 गुना थी
- AMD MI300, Intel Gaudi3 जैसे H100 के विकल्प GPU का आगमन
- Ethereum के proof-of-stake में बदलने और Bitcoin mining में ASIC के प्रभुत्व के कारण GPU mining की मांग घटी
निहितार्थ
- H100 GPU की औसत लागत $50k से अधिक है, और 5 साल की आयु मानने पर कई तरह के rental models मौजूद हैं
- $2.85 प्रति घंटा से ऊपर होने पर stock market IRR को मात दी जा सकती है, लेकिन इससे नीचे जाने पर नुकसान हो सकता है
- नए H100 hardware में निवेश से घाटा होने की संभावना अधिक है
- discounted H100, बिजली की लागत, विशेष ग्राहक आवश्यकताओं जैसी अपवाद स्थितियों को छोड़कर
- दूसरी ओर H100 की गिरती कीमतें open weight AI के प्रसार के लिए catalyst बनेंगी
- developers और engineers द्वारा open models पर प्रयोग और application development के तेज़ होने की उम्मीद
- Featherless.AI 2,000 से अधिक open source AI models के लिए instant inference को $10 प्रति माह की निश्चित कीमत पर प्रदान करता है
- hardware profitability सुनिश्चित करने के लिए हर layer का optimization और customized GPU selection अनिवार्य है
GN⁺ की राय
- GPU बाज़ार में बदलाव: H100 GPU की कीमत में गिरावट GPU बाज़ार के तेज़ बदलाव को दिखाती है। इसका investors और infrastructure providers पर बड़ा असर पड़ेगा
- open source models का प्रभाव: Llama 3 जैसे open source models के आने से fine-tuning और inference की मांग बढ़ी है। इससे बड़े पैमाने की model training की मांग घटी है
- वैकल्पिक GPU का उभार: AMD और Intel के GPU, H100 के विकल्प के रूप में उभर रहे हैं, जिससे बाज़ार प्रतिस्पर्धा तेज़ हो रही है। इससे GPU कीमतों पर और दबाव पड़ सकता है
- AI applications के अवसर: GPU लागत में कमी AI application development के प्रवेश अवरोध को कम कर सकती है और अधिक innovation को बढ़ावा दे सकती है
- निवेश रणनीति पर पुनर्विचार की ज़रूरत: GPU infrastructure में निवेश के लिए सावधानीपूर्ण दृष्टिकोण चाहिए, और बाज़ार रुझानों पर कड़ी नज़र रखनी होगी
2 टिप्पणियां
llama की वजह से पैदा हुआ butterfly effect... दिलचस्प है। haha
Hacker News राय
$2 GPU देने वाली सेवाएँ अविश्वसनीय computing पर निर्भर हो सकती हैं, जिससे व्यवसाय जोखिम में पड़ सकता है। AWS ने उच्च-स्तरीय enterprise GPU infrastructure की reliability बढ़ाई है.
जिन data center के पास पहले से infrastructure है, वे H100 के ज़रिए बड़ा मुनाफ़ा कमा सके। लेकिन efficient market में ऐसे मौके हमेशा नहीं टिकते.
असली कमाई individual GPU/machine नहीं, बल्कि InfiniBand cluster किराए पर देने में है.
दुनिया भर में 16 H100 node की ज़रूरत वाली टीमें 50 से भी कम हैं। बहुत-सी टीमें मुनाफ़ा नहीं कमा पाएँगी.
कई founder मॉडल train करके investor को मनाने की कोशिश करते हैं, लेकिन वास्तव में मूल्यवान मॉडल train करने के मामले बहुत कम हैं.
AI research के चरम दौर में computing resource खरीद न पाने वाली university lab की पीड़ा जताई गई है.
यह स्थिति 'The Prize: The Epic Quest for Oil, Money & Power' में वर्णित तेल के boom-and-bust cycle की याद दिलाती है.
OpenAI को open source model की प्रगति के जवाब में अपने मॉडल लगातार बेहतर करने होंगे.
यह GPU rental farm के लिए बुरी ख़बर लगती है.
NVDA पर short position थोड़ा बढ़ाने की राय साझा की गई.