AMD का चिपलेट APU: Strix Halo का अवलोकन

(chipsandcheese.com)

1 पॉइंट द्वारा GN⁺ 2025-10-20 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Strix Halo AMD का सबसे बड़ा क्लाइंट-उन्मुख चिपलेट APU है, जिसे उच्च-प्रदर्शन CPU और GPU वर्कलोड को एक साथ प्रोसेस करने के लिए डिज़ाइन किया गया है
इसमें 16-कोर Zen 5 और 40 RDNA 3.5 iGPU कंप्यूट यूनिट हैं, जो डेस्कटॉप-ग्रेड CPU और मिड-रेंज डिस्क्रीट GPU के करीब का प्रदर्शन प्रदान करते हैं
LPDDR5X-8000 मेमोरी बस और 32MB Infinity Cache के साथ, यह हाई बैंडविड्थ और लो-लेटनसी वातावरण देता है
iGPU प्रदर्शन मौजूदा मोबाइल APU को काफ़ी पीछे छोड़ देता है, और कुछ परिस्थितियों में मिड-रेंज डिस्क्रीट GPU से भी मुकाबला कर सकता है
ML (Machine Learning) प्रदर्शन ROCm सपोर्ट के इंतज़ार में है, इसलिए भविष्य के लिए स्केलेबिलिटी और क्षमता विस्तार की उम्मीद है

परिचय और उत्पाद अवलोकन

Strix Halo, AMD द्वारा CES 2025 में लॉन्च किया गया पहला कंज़्यूमर-फेसिंग चिपलेट APU है
मोबाइल प्रोसेसर होने के बावजूद डेस्कटॉप-जैसा हाई-परफॉर्मेंस लक्ष्य रखता है, और 55W~120W TDP रेंज का समर्थन करता है, जबकि अलग डिस्क्रीट ग्राफिक्स के बिना ही हाई-परफॉर्मेंस देता है
16-कोर Zen 5 आर्किटेक्चर (ड्युअल 8-कोर CCD) का इस्तेमाल करता है और डेस्कटॉप उत्पादों के समान 512b FPU अपनाता है
5.1GHz अधिकतम बूस्ट क्लॉक (desktop Ryzen 9 9950X से 600MHz कम) का समर्थन करता है
मुख्य GPU के रूप में RDNA 3.5 iGPU: 40 कंप्यूट यूनिट, 32MB Infinity Cache, 2.9GHz बूस्ट क्लॉक → RX 7600 XT~RX 7700 स्तर की कंप्यूटिंग क्षमता
256b LPDDR5X-8000 मेमोरी बस (मैक्स 256GB/s, सभी घटकों द्वारा साझा; RX 7600 XT के 288GB/s से थोड़ा कम, पुराने APU की तुलना में कहीं बेहतर) का उपयोग

परीक्षण वातावरण और डिवाइस

वास्तविक वर्कलोड प्रदर्शन मापने के लिए Asus ROG Flow Z13 (2025) और HP ZBook Ultra G1a 14” का उपयोग किया गया
ROG Flow Z13 का उपयोग गेमिंग-फोकस्ड परीक्षण के लिए किया गया, जबकि ZBook Ultra G1a का इस्तेमाल माइक्रो-बेंचमार्किंग में हुआ

CPU दृष्टिकोण से मेमोरी सबसिस्टम

मेमोरी लेटेंसी: Strix Point (~128ns) की तुलना में Strix Halo (~123ns) लगभग बराबर है
CPU को IO die के भीतर मौजूद 32MB Infinity Cache तक सीधे एक्सेस की अनुमति नहीं है; यह आधिकारिक रूप से इंटरव्यू के जरिए पुष्टि हुई है
डेस्कटॉप CPU (9950X) की लेटेंसी 75~80ns है, जो मोबाइल चिप्स से काफी कम है
मेमोरी बैंडविड्थ: 16 कोर केवल रीड-Modify-Add ऑपरेशन में 175GB/s से अधिक और रीड में 124GB/s तक हासिल कर सकते हैं
- सिंगल CCD बैंडविड्थ 64GB/s (रीड) और 43GB/s (राइट), यानी वास्तविक कुल करीब 103GB/s
- डेस्कटॉप की तरह CCD-IO die लिंक 2000MHz पर चलता है, जिसमें प्रति चक्र 32 बाइट ट्रांसफर होता है

CPU प्रदर्शन

Strix Halo CPU में पिछले जनरेशन के डेस्कटॉप फ्लैगशिप (7950X) के समान इंटीजर परफॉर्मेंस है, हालांकि क्लॉक स्पीड 11.7% कम है
फ्लोटिंग-पॉइंट परफॉर्मेंस वर्तमान फ्लैगशिप (9950X) के करीब है, और कुछ सब-टेस्ट में पलटाव (ओवरटेक) के संकेत दिखे
SPEC CPU 2017 Integer/FP subtests में Strix Halo, 9950X के करीब या कुछ मामलों में आगे दिखा, लेकिन LPDDR5X बस की थोड़ी ज्यादा लेटेंसी के कारण मामूली अंतर रह गया

GPU दृष्टिकोण से मेमोरी आर्किटेक्चर

Strix Halo GPU का मेमोरी बैंडविड्थ सभी मोबाइल SoC में सबसे ऊँचे स्तरों में से एक है
लेकिन RTX 5070 Mobile की तुलना में इसका मेमोरी बैंडविड्थ लगभग 50% कम है
Infinity Cache (MALL) परफॉर्मेंस 5070M L2 से 40% बेहतर है, और साइज भी 33% ज्यादा है। 4MB L2 cache लगभग 2.5TB/s बैंडविड्थ देता है
Strix Halo का L2 cache लेटेंसी 5070M L2 से कम है, जबकि 32MB MALL लेटेंसी 5070M L2 के करीब है
कुल मेमोरी लेटेंसी 5070M की तुलना में 35% कम है

GPU Throughput

फ्लोटिंग-पॉइंट थ्रूपुट: Strix Point से लगभग 2.5 गुना, और 5070M के बराबर या उससे अधिक
- FP16 आउटपुट में 5070M अपेक्षित स्तर से थोड़ा पीछे रहा (संभवतः बेंचमार्क-स्पेसिफ़िक एनोमली)
इंटीजर थ्रूपुट: 5070M, Radeon 8060S से बेहतर है

GPU प्रदर्शन और गेमिंग

एक iGPU के रूप में Strix Halo पिछले Intel/AMD iGPU के मुकाबले जबरदस्त बढ़त देता है और डिस्क्रीट GPU के करीब प्रतिस्पर्धी प्रदर्शन दिखाता है
हाई-डेल्टा गेम (Cyberpunk 2077) टेस्ट में:
- बैटरी मोड: Radeon 8060S ने समान सेटअप पर 5070M के मुकाबले 1080p पर 7.5% बेहतर प्रदर्शन किया
- AC पावर मोड: 1080p पर Radeon 8060S 2.5% आगे रहा, जबकि 1440p पर 5070M 8.3% आगे रहा
- सेटिंग्स/पावर कंडीशन्स के बारीक बदलाव पर दोनों ही मजबूत दावेदारी दिखाते हैं; यानी iGPU का डिस्क्रीट GPU से लगभग समकक्ष प्रदर्शन संभव है
Fluid X3D और compute-heavy workloads में Radeon 8060S पहले के Intel/AMD iGPU को पूरी तरह पीछे छोड़ता है

निष्कर्ष

Strix Halo का उद्देश्य एक हाई-परफॉर्मेंस CPU-GPU इंटीग्रेटेड SoC प्रदान करना है, और यह विभिन्न उपयोग के मामलों में मजबूत प्रदर्शन देता है
यह डेस्कटॉप Zen 5 CPU और मिड-रेंज डिस्क्रीट GPU से भी प्रतियोगिता कर सकता है, मोबाइल और डेस्कटॉप दोनों में उपयोगी है
इफ़िशिएन्सी और इंटीग्रेशन (iGPU का लाभ) बनाए रखते हुए भी इसमें हाई परफॉर्मेंस मौजूद है
यह हाई-एंड डेडिकेटेड GPU से ऊपर नहीं आता, लेकिन कम्पैक्ट/इंटीग्रेटेड फ़ॉर्म फ़ैक्टर डिवाइसेज़ में अपनी लचीलापन और प्रदर्शन से मजबूत विकल्प देता है
ML परफॉर्मेंस अभी ROCm सपोर्ट डिले के कारण आगे के अध्ययन की मांग करती है; भविष्य में स्केल और हाई-कैपेसिटी मेमोरी बस आर्किटेक्चर (Apple Max/Ultra जैसा) की संभावना पर चर्चा है
संभावना है कि Strix Halo की सफल डिजाइन-रणनीति आगे चलकर AMD की हाई-परफॉर्मेंस APU लाइनअप के विस्तार की आधारशिला बनेगी

1 टिप्पणियां

GN⁺ 2025-10-20

Hacker News राय

मैं इस प्रोडक्ट वाले mini PC को ज़रूर आज़माना चाहूँगा, लेकिन यूरोप में यह बहुत महंगा है या फिर खरीदना ही लगभग नामुमकिन है, चीन से सीधे मंगाने में भी AS की समस्या को लेकर हिचकिचाहट है, ROCm 7 पहले से ही ज़्यादातर Linux distributions पर चल रहा है, इसलिए इसे workstation या घर में LLM या Ollama और दूसरी services के लिए home inference server के रूप में इस्तेमाल करना वाकई बढ़िया होगा
- मुझे एक ऐसा प्रोडक्ट मिला जो Germany से ship होता है और जिसकी कीमत भी अपेक्षाकृत ठीक है BOSGAME M5 AI Mini Desktop संदर्भ के लिए
- क्या आपने Corsair AI Workstation 300 Desktop PC देखा है, यह चुने गए मॉडल के हिसाब से 2000~2700 euro का है, और VAT को ध्यान में रखें तो अमेरिकी डॉलर के हिसाब से (1700~2300USD) लगभग समान लगता है Corsair AI Workstations
- मैंने framework desktop 395 128Gb version को 1900 euro से थोड़ा कम में ऑर्डर किया, अतिरिक्त configuration और shipping मिलाकर 2000 euro से थोड़ा ज़्यादा दिया, लेकिन मुझे यह कीमत बहुत महंगी नहीं लगी
- मेरी समझ से इसकी ऊँची कीमत का मुख्य कारण high-bandwidth memory है (हालांकि वास्तविक high-performance GPU की तुलना में memory bandwidth उतनी भी ज़्यादा नहीं है)
- ROCm में काफी प्रगति हुई है, लेकिन RX9070XT desktop पर मुझे कुछ समस्याएँ भी हुईं, इसलिए AI काम के लिए फिलहाल मैं Nvidia या Apple solutions की सिफारिश करूँगा, हालांकि मुझे लगता है कि यह जल्द बराबरी कर लेगा, price/performance के हिसाब से सबसे अच्छा AI system अब भी खुद assembled desktop है जिसमें दो RTX 3090 लगे हों (बेशक dual-card support वाला board चाहिए), और फिर बस उसे अलमारी में रखकर चलाइए
mobile dGPU, और (आखिरकार हकीकत बने) DGX Spark products की तुलना में, यह बाज़ार अभी पूरी तरह mature नहीं लगा बल्कि एक ऐसा segment लगा जिसमें अभी काफी potential बचा है, DGX Spark इतना देर से क्यों आया यह पता नहीं, लेकिन इसकी वजह से AMD को पहले market share लेने का मौका मिला, discrete GPU (mobile समेत) की ताकत memory bandwidth है, और कमजोरी है ऊँची power consumption और memory capacity (CUDA को फिलहाल अलग रखता हूँ, हालांकि वह निश्चित ही बहुत बड़ा factor है), अगर DGX Spark small desktop जोड़ा जाए तो 200Gb dual network ports के साथ कई devices पर RDMA इस्तेमाल किया जा सकता है, इसलिए उतनी ही संख्या के Strix Halo 395 की तुलना में इसकी utilization ज़्यादा हो सकती है, लेकिन वास्तविक काम में शायद मैं DGX Spark के 4 units की जगह GPU server या Threadripper GPU workstation इस्तेमाल करूँगा, और DGX Spark का laptop में न जा पाना भी Strix Halo के पक्ष में है, कुल मिलाकर मुझे लगता है कि यह एक नया niche market है, और आने वाली कई generations में यह किस रूप में टिकेगा यह देखना दिलचस्प होगा
- अगली generation में AMD का Medusa Halo आने वाला है, जिसमें 384-bit LPDDR6 bus होने की बात है, उस स्थिति में Strix Halo की तुलना में 2x memory और 1.7x bandwidth संभव हो सकती है, Strix Halo inference platform के रूप में सफल दिख रहा है इसलिए यह market segment आगे भी बढ़ेगा
- संदर्भ के लिए, 200Gb dual नहीं बल्कि 200Gb single या 100Gb dual है
- “dGPU” का मतलब आमतौर पर discrete GPU होता है, क्या आप शायद “iGPU” (integrated graphics) कहना चाह रहे थे, Strix Halo products को gaming के लिए भी market किया जा रहा है लेकिन वास्तविक performance थोड़ी असंगत लगती है, CPU जरूरत से ज़्यादा तेज़ है जबकि iGPU performance अपेक्षाकृत कमज़ोर है, हालांकि matrix multiplication (matmul) performance निश्चित ही काफी मजबूत होगी
- DGX Spark का मुख्य उद्देश्य local AI model development और testing जैसा लगता है, Strix Halo एक amd64-आधारित iGPU है इसलिए यह पारंपरिक PC कामों के लिए भी उपयोगी है और local AI target device के रूप में भी काफी है, मेरी राय में Strix Halo laptops में discrete GPU युग के अंत की शुरुआत जैसा है, Nvidia भी शायद इसे समझ रहा है और Intel के साथ मिलकर iGPU solution बनाने की कोशिश कर रहा है
निराशा की बात यह है कि लॉन्च हुए आधा साल हो चुका है लेकिन इस्तेमाल करने लायक laptops सिर्फ दो हैं, और उनमें high-performance model केवल Z13 है, Framework का product भी है लेकिन कई देशों में खरीदा नहीं जा सकता, इसलिए इसका ग्राहक वर्ग काफी सीमित लगता है, मुझे Z13 बहुत पसंद है लेकिन यह भी साफ तौर पर niche है, पता नहीं chip manufacturing में समस्या है या Apple सारी production ले जा रहा है
- HP ZBook Ultra की US pricing बहुत ऊँची थी, लेकिन यूरोप में यह सामान्य laptops जैसी लगी इसलिए उचित महसूस हुई, मुझे अफसोस बस इतना है कि launch के पहले दिन ऑर्डर कर दिया और 128GB version का इंतज़ार नहीं कर पाया, लेकिन battery और performance के मामले में अब तक जिन भी heavy workloads से मैं गुज़रा हूँ, उनमें इसका कोई प्रतिद्वंद्वी नहीं था, और laptops के अलावा Beelink जैसी कंपनियाँ भी उचित कीमत वाले NUC बना रही हैं, मैं इस बात से सहमत हूँ कि supply shortage ने अवसर का आकलन कठिन बना दिया
- HP ZBook Ultra G1a में अधिकतम 128GB RAM configuration मिल सकती है, इसलिए यह एक अच्छा विकल्प है
- Beelink, GMKtec, Minisforum, Corsair ये brands भी products लॉन्च कर रहे हैं
- यूरोप के ज़्यादातर हिस्सों में Z13 को 32GB से ज़्यादा RAM configuration में नहीं खरीदा जा सकता, और 2~3 साल की warranty भी आम तौर पर नहीं मिलती, इसलिए नाखुशी है कि अंत में शायद मुझे कमज़ोर RAM/CPU/GPU वाला Framework 13 खरीदना पड़े
High Yield ने silicon level पर 395 chip का deep analysis वाला वीडियो डाला है, देखना उपयोगी होगा High Yield - 395 Chip Deep Dive
मैं जानना चाहता हूँ कि framework desktop में TDP (power limit) को और ज़्यादा इस्तेमाल किया जा सकता है या नहीं, इस desktop की cooling उसी chip वाले laptops की तुलना में कहीं बेहतर लगती है, इसलिए शायद वास्तविक performance में फर्क हो
- इसे 140W sustained, 160W burst (लगभग 10 सेकंड) तक सेट किया जा सकता है
- मैंने power consumption को मापा नहीं है, लेकिन मैं Framework mainboard को बड़े ITX case में डालकर बेहतर cooling के साथ इस्तेमाल कर रहा हूँ, मेरे main PC का 7950X3D और Strix unit core/thread count में समान हैं, और performance measurements में भी लगभग कोई अंतर नहीं है, यानी laptop में desktop-class computing performance मिलना अपने आप में चौंकाने वाली बात है
मैंने कहीं पढ़ा था कि इस APU की energy efficiency Apple products जितनी ऊँची न होने का एक बड़ा कारण Epyc architecture के साथ साझा करने के लिए लिया गया कोई design decision है, और उस वजह से low-power पर efficiency कम होने वाला trade-off किया गया, क्या कोई इसकी पुष्टि कर सकता है
- Hardware Canucks की review में M4 Pro (3nm 2nd gen) और 395+ (4nm) को 50W पर test किया गया था, और performance काफी समान थी, इसलिए इसे 3nm बनाम 4nm process difference से समझाया जा सकता है YouTube review
- APU भी अच्छा है, लेकिन memory bandwidth में यह m3 ultra की बराबरी कभी नहीं कर पाएगा, हालांकि कीमत बहुत कम है, मैं अपने पुराने desktop को बदलने के बारे में सोच रहा हूँ, और यह महत्वपूर्ण है कि company से बाहरी GPU (A6000 आदि) थोड़ी देर के लिए उधार लेकर setup में ज़्यादा समय न लगे
मैंने framework desktop खरीदकर टेस्ट किया है, आकार में छोटा होने के बावजूद यह सचमुच प्रभावशाली machine है, उम्मीद है आगे ऐसे products engineering community से और ज़्यादा ध्यान और भागीदारी खींचेंगे, vulkan या rocm का अच्छा support वाला ecosystem सबके लिए अच्छा होगा
एक संबंधित सवाल है, अगर desktop Zen 5 CPU + RX 7600 XT + memory के साथ build किया जाए, तो क्या Strix Halo या Apple Silicon की तरह system memory और GPU के बीच shared memory bandwidth वाला कुछ सस्ता बनाया जा सकता है, और क्या उचित कीमत पर बड़े LLMs भी local में चल पाएँगे, साथ ही मैं पूरी तरह निश्चित नहीं हूँ लेकिन मेरी समझ है कि memory sharing सिर्फ APU में होती है, discrete GPU में नहीं, क्या यह सही है
- memory भौतिक रूप से अलग GPU में “unified” नहीं होती, ऐसे मामलों में access PCIe bus के ज़रिए होता है, जिससे काफी bandwidth bottleneck आता है, PCIe 5.0 x16 की अधिकतम सीमा 64GB/s है, और सभी GPU इसका समर्थन भी नहीं करते
क्या graphics performance 5070M के मुकाबले की है, यह जानना चाहूँगा, अगर कीमत और power consumption ठीक हो तो यह बहुत आकर्षक लगता है
- power consumption लगभग 75W है, इसे manually बढ़ाया भी जा सकता है लेकिन किसी भी स्थिति में 100W से नीचे ही रहता है (यह जानकारी Z13 पर खोजबीन करते समय मिली), chip खुद इससे अधिक power संभाल सकता है, और ASUS आमतौर पर laptops में 130W से ज़्यादा भी देता है, इसलिए 75W का आंकड़ा थोड़ा अप्रत्याशित लगा
मैं जानना चाहता हूँ कि GPU performance की तुलना m-series Mac में आने वाले GPU से कैसी है

AMD का चिपलेट APU: Strix Halo का अवलोकन

परिचय और उत्पाद अवलोकन

परीक्षण वातावरण और डिवाइस

CPU दृष्टिकोण से मेमोरी सबसिस्टम

CPU प्रदर्शन

GPU दृष्टिकोण से मेमोरी आर्किटेक्चर

GPU Throughput

GPU प्रदर्शन और गेमिंग

निष्कर्ष

संबंधित पढ़ाई

1 टिप्पणियां

Hacker News राय