3 पॉइंट द्वारा GN⁺ 2024-10-13 | 1 टिप्पणियां | WhatsApp पर शेयर करें

AMD का Turin: 5वीं पीढ़ी का EPYC लॉन्च

  • 5 गीगाहर्ट्ज़ सर्वर CPU
    • यह AMD के नए सर्वर CPU, EPYC 9575F, का परिचय है, और पिछली Granite Rapids कवरेज से अलग यह लेख सीधे hands-on अनुभव पर आधारित है.
    • Zen 5 core के mobile और desktop versions के अंतर पहले ही कवर किए जा चुके हैं, इसलिए यह लेख Turin के memory subsystem में हुए बदलावों पर केंद्रित है.

मेमोरी बैंडविड्थ

  • 9575F ने लगभग 52GB/s memory read bandwidth, 48GB/s write bandwidth, और 95GB/s read-modify-write bandwidth दर्ज की.
  • एक single CCD में memory bandwidth उपयोग को देखें तो, एक single core पूरे CCD memory read bandwidth का आधे से कम, write bandwidth का लगभग 55%, और read-modify-write bandwidth का 2/3 से अधिक उपयोग कर सकता है.
  • 9575F में desktop Zen 5 parts की तुलना में CCD के लिए bandwidth काफी अधिक है, क्योंकि यह GMI3-W के माध्यम से IO die को 2 GMI links देता है.
  • Turin DDR5-6400MT/s तक support करता है, लेकिन यह केवल कुछ खास systems में channel per 1 DIMM के रूप में उपलब्ध है. अधिकांश systems 6000MT/s support करते हैं, और channel per 2 DIMM कॉन्फ़िगरेशन में यह 4400 MT/s तक गिर जाता है.

मेमोरी latency

  • Turin की unloaded memory latency, Genoa के समान है.
  • load स्थिति में memory latency मापने पर, single CCD के load में होने पर unloaded स्थिति की तुलना में लगभग 39 नैनोसेकंड की वृद्धि हुई, और पूरे system के load में होने पर लगभग 31 नैनोसेकंड की वृद्धि हुई.
  • CCD के भीतर latency लगभग 45ns, CCDs के बीच latency लगभग 150ns, और sockets के बीच latency लगभग 260ns है, जो Genoa की तुलना में अधिक है.

क्लॉक स्पीड

  • 9575F के सभी 64 cores single-thread test में अधिकतम 5GHz तक पहुँच सकते हैं, और memory bandwidth test में 8 cores 5GHz पर चलते हैं.
  • Cinebench 2024 में जब 128 threads सक्रिय होते हैं, तब 9575F लगभग 4.3GHz बनाए रखता है, जबकि web server/TLS transaction workload में यह लगभग 4.9GHz दर्ज करता है.

निष्कर्ष

  • AMD का Turin एक अनुमानित पीढ़ीगत अपडेट है, जो high-core-count SKU और low-core-count high-frequency SKU देकर अलग-अलग बाज़ारों की ज़रूरतें पूरी करता है.
  • Turin, Naples से Rome जैसी क्रांतिकारी छलांग की बजाय, Milan से Genoa जैसी क्रमिक प्रगति के अधिक करीब है, जिसमें memory bandwidth वृद्धि, core count वृद्धि, और core updates शामिल हैं.
  • यह पीढ़ी प्रतिस्पर्धी ecosystem में काफ़ी value देती है और कई लोगों के लिए दिलचस्प होगी.

GN⁺ का सार

  • AMD का Turin सर्वर CPU बाज़ार में एक महत्वपूर्ण प्रगति है, खासकर memory bandwidth और core performance में हुए सुधारों के कारण.
  • यह लेख AMD की नवीनतम तकनीक को समझना चाहने वालों के लिए उपयोगी है, और server performance optimization में रुचि रखने वाले engineers के लिए मददगार हो सकता है.
  • Turin जैसी सुविधाओं वाले उत्पादों में Intel की Xeon series शामिल है, और AMD के साथ तुलना करके हर उत्पाद की खूबियों और सीमाओं को समझा जा सकता है.

1 टिप्पणियां

 
GN⁺ 2024-10-13
Hacker News टिप्पणियाँ
  • AMD EPYC 9175F एक असामान्य प्रोडक्ट है, जिसमें 16 core और 512MB L3 cache है। यह शायद उन ग्राहकों के लिए है जो "per-core" license cost को न्यूनतम रखना चाहते हैं। सोच रहा हूँ कि क्या Oracle अभी भी इसी तरह license करता है

    • HFT जैसे खास उद्देश्यों के लिए पूरा algorithm L3 में रखकर न्यूनतम latency हासिल की जा सकती है
    • लेकिन ज़्यादा संभावना है कि यह मुख्य रूप से software licensing से जुड़ा मामला है
  • Phoronix ने 196-core Turin Dense और 192-core AmpereOne की comparative review की है

    • Ampere का MSRP $5.5K है, EPYC का $15K है
    • Turin 196 का performance 1.6 गुना बेहतर है
    • Ampere energy consumption में 1.2 गुना ज़्यादा efficient है
    • वास्तविक $/performance के हिसाब से Ampere 192-core, Turin Dense 196-core से 1.7 गुना बेहतर है
  • $5.5K में AmpereOne 192-core CPU (274w) या Turin Dense 48-core CPU (300w) खरीदा जा सकता है

    • Ampere अगले साल 256-core, 3nm, 12 memory channel वाला प्रोडक्ट लॉन्च करने की योजना में है, जो Turin Dense और Sierra Forest के performance मुकाबले में बेहतर चुनौती देने वाला हो सकता है
    • फिलहाल $/performance ही उनका value proposition है
  • Qualcomm के Nuvia-आधारित server chip के performance में बहुत दिलचस्पी है

    • अगर ARM के client core improvements कोई संकेत हैं, तो यह देखना बहुत दिलचस्प होगा कि AWS Graviton, Google Axion, Microsoft Cobalt, Nvidia Grace, Alibaba Yitian जैसे in-house chips बेहतर Neoverse cores के साथ कैसे मुकाबला करेंगे
    • Nuvia vs ARM vs AmpereOne की प्रतिस्पर्धा देखने लायक होगी
  • अभी शायद server CPU का स्वर्ण युग चल रहा है

    • 7 साल पहले सिर्फ Intel Xeon था
    • अब कई विकल्प मौजूद हैं
  • Hetzner पर AMD Turin bare metal server तैनात होते देखने का इंतज़ार है

    • पिछली generation भी पहले से शानदार value देती थी, लेकिन इस बार यह उससे एक कदम आगे लगता है
  • 20 साल पहले प्रति CPU सिर्फ 1-2 core होते थे, और dual-socket server में 4 core होना भी किस्मत की बात थी

    • अब एक ही server में लगभग 400 core हो सकते हैं
    • ARM के core अधिक हो सकते हैं, लेकिन अभी के लिए उनका performance इन जितना अच्छा नहीं है
  • जिन्हें Substack की ओर बदलाव पसंद नहीं है, उनके लिए एक वैकल्पिक साइट है

  • मैं 12 साल पुराना Dell PowerEdge dual Xeon के साथ चला रहा हूँ

    • इंतज़ार है कि पहली पीढ़ी के Epyc server eBay पर सस्ते मिलना शुरू हों
  • ChipsAndCheese नई tech publications में से एक है, और खासकर deep benchmark में इसकी समझ बेहतरीन है

    • Anandtech, TechReport, HardCOP जैसी पुरानी tech sites के गायब हो जाने के बाद, अच्छा है कि कोई नया publisher इस शैली को बनाए रख पा रहा है
  • Factorio 2.0 के लिए बिल्कुल सही समय पर लॉन्च हुआ है

  • 9965 को वास्तव में काम करते देखना चाहता हूँ

    • ये parts वाकई हैरान करने वाले हैं
    • इस generation की machine खरीदने की योजना है
  • वीडियो में 1:11 पर TDP chart है

    • 125-500W पर यह काफ़ी गर्म चलता है