- Raspberry Pi 5 पर AMD, Intel, Nvidia GPU चलाकर डेस्कटॉप PC से तुलना करने वाले प्रयोग में पाया गया कि कई मामलों में प्रदर्शन हानि केवल 2~5% के स्तर तक सीमित रही
- Jellyfin ट्रांसकोडिंग, GravityMark रेंडरिंग, LLM/AI inference, और मल्टी GPU कॉन्फ़िगरेशन समेत चार श्रेणियों का परीक्षण कर efficiency और cost-performance का मूल्यांकन किया गया
- 4 Nvidia RTX A5000 जोड़ने वाले एक उदाहरण में Intel सर्वर की तुलना में 2% के भीतर प्रदर्शन अंतर देखा गया, जहाँ PCIe switch के जरिए GPU के बीच memory sharing ने अहम भूमिका निभाई
- Raspberry Pi eGPU सिस्टम की कुल लागत लगभग $350~400 रही, जबकि PC की लागत $1500~2000 थी; बिजली खपत भी Pi में काफी कम रही (idle पर 4~5W बनाम 30W)
- यह एक ऐसा उदाहरण है जो दिखाता है कि Raspberry Pi बड़े GPU को प्रभावी ढंग से उपयोग करने के लिए कम-ऊर्जा, कम-लागत वाले वैकल्पिक प्लेटफ़ॉर्म के रूप में संभावनाशील है
प्रयोग का सारांश
- Raspberry Pi 5 की PCIe Gen 3 x1 bandwidth (8 GT/s) सीमा को ध्यान में रखते हुए भी GPU उपयोग की व्यवहारिकता को सत्यापित किया गया
- तुलना के लिए नवीनतम डेस्कटॉप PC (PCIe Gen 5 x16, 512 GT/s) लिया गया
- परीक्षण श्रेणियाँ थीं मीडिया ट्रांसकोडिंग (Jellyfin), GPU रेंडरिंग (GravityMark), LLM/AI प्रदर्शन, और मल्टी GPU कॉन्फ़िगरेशन
- Dolphin ICS के PCIe Gen 4 external switch और 3-slot backplane का उपयोग कर 2 GPU एक साथ चलाने का प्रयोग किया गया
4 GPU से जुड़े Raspberry Pi का मामला
- GitHub उपयोगकर्ता mpsparrow ने 4 Nvidia RTX A5000 GPU को एक ही Pi से जोड़ा
- Llama 3 70B मॉडल चलाते समय Intel सर्वर की तुलना में 2% के भीतर प्रदर्शन अंतर रहा (11.83 vs 12 tokens/sec)
- PCIe switch के माध्यम से GPU के बीच memory sharing संभव हुई, जिससे Pi की bandwidth सीमा को आंशिक रूप से दरकिनार किया गया
- single GPU कॉन्फ़िगरेशन में भी कुछ कार्यों में डेस्कटॉप के बराबर या उससे बेहतर प्रदर्शन देखा गया
लागत और दक्षता की तुलना
- Raspberry Pi eGPU कॉन्फ़िगरेशन: लगभग $350~400, Intel PC कॉन्फ़िगरेशन: लगभग $1500~2000
- idle बिजली खपत: Pi 4~5W, PC 30W
- GPU को छोड़कर समान शर्तों में लागत और ऊर्जा दक्षता दोनों में Pi आगे रहा
Jellyfin ट्रांसकोडिंग बेंचमार्क
- Nvidia 4070 Ti के उपयोग पर PC raw throughput (2GB/s) में आगे रहा
- Pi में PCIe 850MB/s और USB SSD 300MB/s स्तर दर्ज किया गया
- लेकिन H.264/H.265 मीडिया स्ट्रीमिंग में Pi ने भी 1080p और 4K ट्रांसकोडिंग को सहज रूप से संभाला
- NVENC hardware encoding समर्थित था, और 2 एक-साथ ट्रांसकोडिंग भी स्थिर रहीं
- AMD GPU में ट्रांसकोडिंग स्थिरता से जुड़ी कुछ समस्याएँ सामने आईं
GravityMark रेंडरिंग परीक्षण
- परीक्षण मुख्यतः AMD GPU पर केंद्रित था; PC थोड़ा तेज़ था, लेकिन अंतर बहुत कम था
- RX 460 के उपयोग पर Pi ने PC से बेहतर efficiency (performance/W) दर्ज की
- PCIe Gen 3 bandwidth वाले पुराने GPU में Pi को सापेक्ष लाभ मिला
AI और LLM प्रदर्शन तुलना
- AMD Radeon AI Pro R9700 (32GB VRAM) परीक्षण में अपेक्षा से कम प्रदर्शन मिला; संभवतः driver या BAR सेटिंग समस्या रही
- Nvidia RTX 3060 (12GB) के उपयोग पर Llama 2 13B मॉडल में Pi, PC से तेज़ रहा
- efficiency measurement में Pi, power के मुकाबले throughput में PC से बेहतर निकला
- RTX 4090 परीक्षण में भी बड़े मॉडल (Qwen3 30B) के आधार पर 5% के भीतर प्रदर्शन अंतर रहा, और कई मामलों में efficiency में Pi आगे रहा
- CUDA backend और Vulkan backend दोनों Pi पर सामान्य रूप से चले
ड्यूल GPU कॉन्फ़िगरेशन प्रयोग
- Dolphin PCIe इंटरकनेक्ट बोर्ड और MXH932 HBA का उपयोग किया गया
- ACS निष्क्रिय करने पर GPU के बीच direct memory access संभव हुआ
- अलग-अलग GPU मॉडल (4070, A4000) के संयोजन में VRAM pooling समर्थित नहीं था, इसलिए प्रदर्शन सुधार सीमित रहा
- समान GPU कॉन्फ़िगरेशन में बड़े मॉडल (Qwen3 30B आदि) चलाना संभव हुआ
- AMD RX 7900 XT + R9700 संयोजन में driver समस्या के कारण कुछ मॉडल नहीं चल सके
- Intel PC कुल मिलाकर तेज़ रहा, लेकिन Pi ने भी बड़े मॉडलों में क़रीबी प्रदर्शन बनाए रखा
निष्कर्ष
- absolute performance और convenience में PC आगे है
- लेकिन GPU-केंद्रित workloads और कम-ऊर्जा, कम-लागत वाले वातावरण में Raspberry Pi एक व्यावहारिक विकल्प हो सकता है
- idle पर 20~30W की बचत, और Rockchip·Qualcomm आधारित SBC इससे भी बेहतर efficiency और I/O bandwidth दे सकते हैं
- प्रयोग का उद्देश्य Pi की सीमाओं और GPU computing संरचना को समझना था, और इसी प्रक्रिया में छोटे सिस्टम की क्षमता भी सामने आई
अभी कोई टिप्पणी नहीं है.