14 पॉइंट द्वारा GN⁺ 2026-03-08 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • 7 क्लाउड्स (44 प्रकार के VM) पर CPU प्रदर्शन और price-performance का बेंचमार्क, जिसमें single-thread, multi-thread, reserved और spot instances सहित व्यापक तुलना शामिल है
  • AMD EPYC Turin ने लगभग सभी बेंचमार्क में पहला स्थान हासिल किया और x86 जगत के नए शीर्ष CPU के रूप में उभरा
  • ऑन-डिमांड कीमत के मुकाबले प्रदर्शन में Hetzner और Oracle Cloud शीर्ष पर रहे, जबकि AWS ने Turin को छोड़कर कुल मिलाकर सबसे खराब price-performance दर्ज किया
  • Intel Granite Rapids ने पिछली पीढ़ी Emerald Rapids की performance instability समस्या को हल कर अधिक consistent performance दी, लेकिन Turin से अंतर अभी भी काफी बड़ा है
  • spot instances का उपयोग करने पर 3-वर्षीय reserved instances की तुलना में प्रति डॉलर लगभग 2 गुना प्रदर्शन मिल सकता है, इसलिए यह क्लाउड लागत अनुकूलन का प्रमुख साधन है

बेंचमार्क अवलोकन और कार्यप्रणाली

  • तुलना का दायरा: AWS, GCP, Azure, Oracle Cloud(OCI), Akamai(Linode), DigitalOcean, Hetzner — 7 प्रदाता, 44 VM प्रकार
  • लागत तुलना में एकरूपता के लिए सभी instances को 2vCPU, 2GB/vCPU RAM, 30GB SSD मानक पर कॉन्फ़िगर किया गया
  • AMD और Intel में SMT (hyperthreading) लागू होने पर 2vCPU = 1 physical core, जबकि ARM और कुछ x86 अपवादों (AWS C8a, C7a, GCP t2d) में 2vCPU = 2 physical cores
  • ऑन-डिमांड कीमतें अमेरिका के सबसे कम कीमत वाले region के आधार पर हैं, और ये 2026 जनवरी के समय की हैं; वर्तमान कीमत अलग से जांचनी होगी
  • उपयोग किए गए बेंचमार्क टूल: DKbench (मुख्य बेंचमार्क, Perl·C/XS आधारित 19 server workloads), Geekbench 5, 7zip, NGINX, FFmpeg/libx264, OpenSSL RSA4096(AVX512)
    • Geekbench 6 का उपयोग नहीं किया गया, क्योंकि multi-core measurement method को डिज़ाइन की दृष्टि से त्रुटिपूर्ण माना गया
  • performance range समझने के लिए कई regions में instances को बार-बार बनाकर और मापकर न्यूनतम–अधिकतम सीमा के रूप में दिखाया गया

CPU पीढ़ियों के अनुसार प्रदर्शन tier का अवलोकन

  • AMD: Rome → Milan → Genoa → Turin (पीढ़ी क्रम, नीचे→ऊपर)
  • Intel: Broadwell → Skylake → Cascade Lake → Ice Lake → Sapphire Rapids → Emerald Rapids → Granite Rapids
  • ARM: Ampere Altra → AmpereOne → AmpereOne M / AWS Graviton2 → Graviton3 → Graviton4 / Google Axion / Azure Cobalt 100
  • पुरानी CPU पीढ़ियों वाले प्रकार कम प्रदर्शन देने के बावजूद संचालन लागत के कारण उल्टे अधिक महंगे पड़ते हैं, इसलिए जहाँ संभव हो नवीनतम पीढ़ी में अपग्रेड करना चाहिए

single-thread प्रदर्शन परिणाम

  • AMD EPYC Turin कुल मिलाकर पहले स्थान पर रहा; इस स्तर की स्पष्ट बढ़त इस श्रृंखला में पहली बार दिखी
    • AWS C8a (Turin, SMT disabled) सबसे तेज़ Turin configuration था
    • GCP c4d में performance variation बड़ा था, और सस्ता n4d consistency के मामले में बेहतर रहा
  • Intel Granite Rapids: Emerald Rapids में boost clock निर्भरता और node contention के कारण जो performance instability थी, उसे दूर कर अधिक ऊँचा और consistent performance दिया
    • GCP Emerald Rapids में load बढ़ने पर प्रदर्शन गिरावट स्पष्ट थी, और GCP इसके लिए अलग से "consistent performance" mode (boost disabled) देता है
  • ARM पक्ष में Google Axion ने EPYC Genoa-स्तर का single-thread प्रदर्शन दिखाया और ARM server performance में शीर्ष पर रहा
    • Azure Cobalt 100, Graviton3 और Graviton4 के बीच रहा
    • Ampere AmpereOne M में AWS Graviton3 स्तर तक हल्का सुधार देखा गया
  • कम कीमत वाले प्रदाताओं में DigitalOcean के performance metrics गिरावट पर हैं; Akamai और Hetzner Milan instances के आधार पर अच्छे हैं, लेकिन instance बनाते समय performance level की गारंटी नहीं है

multi-thread प्रदर्शन और scalability

  • scalability: ARM और shared CPU instances ~100% के करीब रहे, यानी 2vCPU पर single vCPU की तुलना में लगभग 2 गुना प्रदर्शन मिला
    • SMT वाले x86 instances 100% से नीचे रहे, और 50% के करीब होने पर performance gain लगभग नहीं रहता
    • AMD परंपरागत रूप से Intel की तुलना में बेहतर SMT efficiency दिखाता है, जबकि Intel में Ice Lake के बाद सुधार का रुझान है
    • Akamai Turin instance ने SMT होने के बावजूद 71.9% जैसी असामान्य रूप से ऊँची scalability दर्ज की (कारण स्पष्ट नहीं)
    • SMT disabled instances: AWS C7a(Genoa), C8a(Turin), GCP t2d(Milan)
  • multi-thread का सबसे ताकतवर विकल्प: SMT disabled Turin आधारित AWS C8a ने चार्ट पर दबदबा बनाया
    • Google Axion पहले तुलना में शीर्ष पर रहे Genoa C7a के बराबर रहा
    • Graviton4 बहुत करीब रहा, उसके बाद Cobalt 100
    • निचले स्तर पर Intel Broadwell/Skylake/Ice Lake और AMD Rome रहे
  • 7zip: Turin कुल मिलाकर पहले स्थान पर रहा, लेकिन decompression में Axion और Graviton4 ने Turin को पीछे छोड़ा; Cobalt 100 ने केवल decompression में सर्वोच्च प्रदर्शन दिया
  • NGINX (100 connections): AWS C8a दूसरे स्थान की तुलना में लगभग 2 गुना रहा; Granite Rapids ने भी अच्छा प्रदर्शन किया
  • FFmpeg H264: Turin पहले स्थान पर रहा; Granite Rapids single-thread में क़रीब रहा; 2 पूरे cores उपयोग करने पर Axion ने Turin को छोड़कर अधिकांश SMT (single-core) instances को पीछे छोड़ दिया
  • OpenSSL RSA4096(AVX512): AMD ने अपनी extension support में Intel को पछाड़ दिया; Turin और Genoa दोनों ने Intel की सभी पीढ़ियों से बेहतर प्रदर्शन किया; Granite Rapids में Ice Lake की तुलना में बड़ा सुधार नहीं दिखा; ARM और पुराने AMD में AVX512 समर्थन नहीं होने से वे Intel Skylake से नीचे रहे

ऑन-डिमांड प्रदर्शन/कीमत तुलना

  • single-thread: Hetzner (shared core शामिल करने पर स्पष्ट रूप से पहले स्थान पर) और Oracle शीर्ष पर रहे; GCP n4d(Turin) और Linode उसके बाद
    • AWS ऑन-डिमांड में सबसे खराब price-performance वाला रहा; Turin AWS के भीतर सबसे अच्छा था, लेकिन पुरानी पीढ़ियाँ सबसे नीचे रहीं
  • multi-thread: Oracle ARM instance (AmpereOne M) पहले स्थान पर रहा, Hetzner और Linode shared core उसके क़रीब रहे
    • Google Axion, Azure Cobalt 100 और DigitalOcean droplet दूसरे tier में रहे
  • Hetzner shared core (CPX22, CAX11) उपलब्धता सीमाओं (केवल EU·AP regions, बार-बार out of stock) के बावजूद प्रति unit performance कीमत में अन्य प्रदाताओं से बहुत आगे रहे

reserved प्रदर्शन/कीमत तुलना

  • 1-वर्ष reserved: GCP Turin (n4d·c4d) Oracle के क़रीब रहा; Azure Cobalt 100 और Genoa ने भी प्रतिस्पर्धी price-performance दिखाया
    • AWS में C8a family सबसे बेहतर रही, और DoIT Flexsave जैसे third-party माध्यमों से reserved के बिना भी 1-वर्ष कीमत लागू हो सकती है
  • 3-वर्ष reserved single-thread: GCP Turin ने Oracle और Hetzner के dedicated VM को मामूली अंतर से पीछे छोड़ा; Azure ने भी Cobalt 100 और Genoa के साथ प्रतिस्पर्धी स्थिति बनाई
    • AWS ने 3-वर्षीय commitment पर भी Akamai और DigitalOcean से बेहतर price-performance दिया
  • 3-वर्ष reserved multi-thread: Azure Cobalt 100 अप्रत्याशित रूप से पहले स्थान पर रहा; GCP और OCI ARM उसके पीछे रहे; AWS और GCP Turin भी शीर्ष समूह के क़रीब रहे

spot/preemptible instances प्रदर्शन/कीमत तुलना

  • spot instances को क्लाउड में self-hosted server लागत के क़रीब पहुँचने का एकमात्र तरीका बताया गया
    • instance वापस लेने से पहले चेतावनी: AWS और OCI 2 मिनट, Azure और GCP 30 सेकंड
    • Oracle की discount rate स्थिर 50% है, जबकि बाकी 3 प्रदाताओं में region और समय के अनुसार बड़ा उतार-चढ़ाव है
  • single-thread spot: Oracle Turin अपनी स्थिर discount rate के कारण हमेशा शीर्ष पर रहा; GCP और Azure ने सबसे गहरी छूट दी (Genoa, Cobalt 100)
    • spot उपयोग करने पर 3-वर्ष reserved की तुलना में प्रति डॉलर लगभग 2 गुना प्रदर्शन मिल सकता है
  • multi-thread spot: Azure Cobalt 100 पहले स्थान पर रहा, OCI AmpereOne M दूसरे स्थान पर; GCP में region के अनुसार t2d(Milan) सर्वोत्तम price-performance दे सकता है; AWS मुश्किल से Turin के साथ Top 10 में पहुँचा

क्लाउड प्रदाताओं के अनुसार कुल मूल्यांकन

  • AWS: कुल ARM performance में Graviton5 private beta के कारण Google Axion से पीछे रहा, लेकिन x86 में सर्वोच्च प्रदर्शन non-SMT C8a(Turin) के साथ बरकरार है; ऑन-डिमांड कीमतें प्रतिस्पर्धियों से ऊँची हैं, लेकिन spot, reserved और Flexsave के उपयोग से प्रतिस्पर्धी बनती हैं; पुरानी पीढ़ी के instances पर छूट कम होने से C8a spot में भी सबसे अच्छा विकल्प है
  • GCP: 4th-gen ARM (Axion c4a) और AMD (Turin n4d·c4d) instances की सिफारिश की गई; n4d, c4d के लगभग समान प्रदर्शन के साथ सस्ता है; Granite Rapids बिना local SSD अतिरिक्त लागत के उपलब्ध नहीं है (फिलहाल min_cpu_platform असमर्थित); spot में region के अनुसार सर्वोत्तम instance type बदलता है
  • Azure: self-developed ARM Cobalt 100 का प्रदर्शन Google Axion से थोड़ा कम है, लेकिन कीमत प्रतिस्पर्धी है; Turin और Granite Rapids लेखन के समय private preview में हैं; 3-वर्ष reserved multi-thread में अप्रत्याशित रूप से पहले स्थान पर रहा
  • Oracle: छोटे प्रोजेक्ट्स के लिए मुफ़्त 4-core ARM VM(A1) की मज़बूत सिफारिश; paid instances भी ऑन-डिमांड आधार पर Big 3 के 1–3 वर्ष reserved pricing के बराबर value देते हैं; AmpereOne M(A4) और Turin E6 क्रमशः ARM और x86 के लिए सबसे अच्छे विकल्प हैं; A4 सीमित regions में उपलब्ध है
  • Akamai(Linode): shared core Linode ऑन-डिमांड में Hetzner और Oracle के बाद अच्छा price-performance देता है; instance बनाते समय CPU नहीं चुना जा सकता, इसलिए Milan है या नहीं यह सीधे जांचना पड़ता है (/proc/cpuinfo); dedicated instances में generation चुनना संभव है (G8=Turin), लेकिन single-thread प्रदर्शन असामान्य रूप से कम है
  • DigitalOcean: लंबे समय से upgrade न होने के कारण प्रदर्शन रैंकिंग गिरी है, और overload की स्थिति भी मौजूद है; instance upgrade की आसान सुविधा (one-click type change) जैसी convenience अब भी बनी हुई है
  • Hetzner: लंबे समय के उपयोगकर्ताओं में अच्छी प्रतिष्ठा, ज़्यादा overprovisioning नहीं (CX23 को छोड़कर); shared core CPX22(Genoa) और CAX11(ARM Altra) का price-performance सर्वोत्तम है, लेकिन ये केवल EU/AP regions में हैं और अक्सर out of stock रहते हैं; dedicated core CCX13 में data center के अनुसार performance variation है

अंतिम सिफारिशें

  • सबसे कम बजट: Oracle free tier → Hetzner (यदि EU·AP region स्वीकार्य हों) → spot instances (Azure ARM, Oracle·GCP ARM/AMD)
  • non-shared CPU में सर्वोत्तम price-performance (on-demand): Oracle AmpereOne M A4 या Turin E6; reserved में Azure Dpls_v6, GCP c4a/n4d, AWS C8a भी प्रतिस्पर्धी हैं
  • सर्वोच्च प्रदर्शन: AWS C8a (non-SMT Turin) single instance में सर्वोच्च प्रदर्शन देता है; Turin वाले सभी बड़े प्रदाताओं के instances उसके ठीक नीचे का शीर्ष tier बनाते हैं

1 टिप्पणियां

 
GN⁺ 2026-03-08
Hacker News की राय
  • हमने अपने CI में बड़े पैमाने पर टेस्ट चलाए। GCP के AMD Turin instances इस्तेमाल किए, और लेख में भी इन्हें सबसे तेज़ में गिना गया था
    लेकिन हैरानी की बात यह है कि AMD EPYC 4565p cloud के Turin की तुलना में single-core performance में अधिकतम 2 गुना तेज़ है
    GCP पर टेस्ट में 2 मिनट लगे, लेकिन 4565p पर वह सिर्फ 1 मिनट में खत्म हो गया। cloud में 4.1GHz था, जबकि मेरी मशीन 5.1GHz boost बनाए रखती है
    GCP में 8vCPU के लिए $130 प्रति माह (spot instance) लगते हैं, जबकि मेरा 4565p $500 का CPU है, 32vCPU के साथ, और पूरा सिस्टम $2,000 से भी कम का है
    मेरा मानना है कि CI के लिए अपने रैक में मशीन लगाना कहीं ज़्यादा efficient है। कुछ महीनों में cloud cost की भरपाई हो जाती है, और performance भी 2 गुना है

    • Hetzner में 8vCPU configuration लगभग €10~€48 प्रति माह है, और €104 में Ryzen 9 7950X3D (लगभग 4565p जैसा) + 128GB DDR5 + 2TB SSD के 2 drive वाला setup मिल सकता है
      यूरोपीय कंपनियों के margin अमेरिका की तुलना में काफी कम हैं। सीधी गणना में 17 महीने लगते हैं, और colocation cost जोड़ें तो लगभग 8 साल में बराबरी होती है
    • अगर $2,000 की मशीन पर $100 प्रति माह colocation cost लग रही है, तो कुछ ही महीनों में लागत निकल आने वाली बात सही नहीं लगती
      मुफ्त colo हो तब भी 1 साल से ज़्यादा लगेगा
    • मैं पहले एक price comparison site चलाता था (baremetalsavings.com)
      आजकल developers को bare metal मुश्किल लगता है, लेकिन असल में cloud भी उतना ही या उससे ज़्यादा complex है
    • Datapacket और OVH भी 4565p देते हैं। यह CPU एक hidden gem है। ज़्यादातर workloads में performance और price-performance, दोनों में top-tier है
    • Blacksmith.sh भी ऐसा ही concept है। फर्क बस इतना है कि आपको खुद hardware host नहीं करना पड़ता
  • मैं Google Compute Engine VM टीम में काम करता हूँ। यह benchmark वाकई बहुत अच्छी तरह संकलित था

    1. Turin एक monster है
    2. price-performance के लिहाज़ से Hetzner खासकर छोटे projects के लिए शानदार है
    3. DigitalOcean में अभी भी काफी पुराना hardware है, लेकिन हाल में उसने कुछ हिस्सों को 5th-gen Xeon processors से अपडेट किया है
    • Hetzner की असली ताकत dedicated servers में दिखती है
  • Genoa, Milan से बड़ा jump था, लेकिन Turin उससे भी बड़ा है। AMD आजकल सच में बहुत अच्छा कर रहा है। Lisa Su की टीम के लिए तालियाँ

    • लेकिन AMD अभी भी software ecosystem में कमज़ोर है। NVIDIA के trillion-dollar company बनने की वजह वहीं है
      MI300 जैसे accelerators specs के हिसाब से competitive हैं, लेकिन software stack कमज़ोर होने की वजह से कोई ध्यान नहीं देता
  • Vultr और HostHatch भी देखने लायक options हैं

  • मैंने अपने gaming PC (9800X3D, 8-core 5.2GHz) पर कुछ तुलना की
    7-Zip और Geekbench के नतीजे देखें तो desktop CPU single-thread और multi-thread दोनों में कहीं तेज़ है
    C8A की single-thread performance ठीक है, लेकिन memory performance बहुत खराब है

  • मुझे जानना है कि Oracle Cloud से बाहर निकलना कितना आसान है। benchmark अच्छे आए हैं, लेकिन सुना है license lock-in बहुत ज़्यादा है

    • वह लेख मैंने लिखा था। मैं Oracle की बिल्कुल सिफारिश नहीं करता। pricing policy और lock-in बहुत ज़्यादा हैं
      हाँ, cost इतनी सस्ती है कि छोटे projects मैं अभी भी Oracle Cloud पर रखता हूँ। DBaaS इस्तेमाल नहीं करता, सिर्फ Linux VM चलाता हूँ
    • मैं कई सालों से काम के लिए Oracle Cloud इस्तेमाल कर रहा हूँ। अगर proprietary DBaaS न इस्तेमाल करें तो माइग्रेट करना उल्टा आसान है, और egress traffic भी free है
      लेकिन UX सच में भयानक है
    • मैंने trial के लिए आवेदन किया था, लेकिन कुछ ही दिनों में account बंद हो गया और VM delete हो गए। payment details जोड़ भी नहीं सका
      sales team लगातार संपर्क करती रही, लेकिन समाधान नहीं हुआ। Reddit पर भी बहुत लोगों का यही अनुभव था
    • मैंने free tier इस्तेमाल किया था, लेकिन account बनाना जटिल था और कम usage होने पर instances बंद कर दिए जाते थे। कुल मिलाकर interface पुराना लगा
    • Oracle Cloud में हर बार login करते समय मन में आता है, ‘मुझे login क्यों करना पड़ रहा है?’
  • मैं अभी भी कुछ सौ डॉलर में खरीदे गए ROME EPYC CPU इस्तेमाल कर रहा हूँ। power efficiency अच्छी नहीं है, लेकिन multi-thread performance 9950X से बेहतर है

  • यह देखकर अच्छा लगता है कि मेरा 36 euro वाला 250/250 fiber internet अभी भी काफ़ी competitive है

  • अभी भी अपना hardware रखना कहीं सस्ता लगता है। खासकर development/test environment में तो और भी ज़्यादा
    समझ नहीं आता कि बड़ी कंपनियाँ, जिनकी capital cost AWS से कम होती है, फिर भी cloud में क्यों जाती हैं

    • जब cloud पहली बार आया था, तब server order करने में 3 महीने तक लग जाते थे, और power, cooling, management labor cost भी बहुत थे
      लेकिन अब यह AWS engineer cost तक शामिल करने वाला ढांचा बन गया है, इसलिए व्यवहार में यह अब भी महँगा है
      आजकल servers 288 cores तक आते हैं, इसलिए अपना अतिरिक्त capacity रखकर चलाना पूरी तरह संभव है
    • मैंने दो ग्राहकों को colo में migrate कराया, और cost savings बहुत नाटकीय थीं
      मुख्य workloads अपने hardware पर चलाकर, साथ में cloud storage इस्तेमाल करना भी पूरी तरह संभव है
    • cloud का अपने hardware से महँगा होना तो स्वाभाविक है। लेकिन multi-region और management convenience की वजह से लोग उसे चुनते हैं
      असल में “सब कर रहे हैं” वाला कारण उससे भी बड़ा है
    • “हम AWS से Hetzner गए और 89% cost कम हुई” जैसी पोस्टें भी बहुत हैं
      संबंधित लेख देखें
    • लेकिन खुद hardware को maintain और update करना operational overhead के लिहाज़ से भारी पड़ता है, इसलिए cloud की flexibility अभी भी आकर्षक है
  • यह विडंबना है कि Oracle अच्छा price-performance विकल्प दिखता है, लेकिन उस पर लंबे समय तक भरोसा कर पाना मुश्किल लगता है