7 पॉइंट द्वारा GN⁺ 2024-09-29 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • 2020 में चिप लेआउट डिज़ाइन करने के लिए एक नई reinforcement learning विधि पेश करने वाला preprint प्रकाशित किया गया
  • इस विधि को बाद में Nature में प्रकाशित किया गया और open source के रूप में उपलब्ध कराया गया
  • आज हम एक Nature addendum प्रकाशित कर रहे हैं, जिसमें इस विधि और चिप डिज़ाइन क्षेत्र पर इसके प्रभाव को विस्तार से समझाया गया है
  • साथ ही, हम pre-trained checkpoints जारी कर रहे हैं, model weights साझा कर रहे हैं, और AlphaChip नाम की घोषणा कर रहे हैं
  • कंप्यूटर चिप्स ने artificial intelligence (AI) में उल्लेखनीय प्रगति को आगे बढ़ाया है, और AlphaChip AI का उपयोग करके चिप डिज़ाइन को तेज़ और अनुकूलित करता है
  • इस विधि का उपयोग Google के custom AI accelerator, Tensor Processing Unit (TPU), की हाल की 3 पीढ़ियों में अतिमानवीय स्तर के चिप लेआउट डिज़ाइन करने के लिए किया गया है
  • AlphaChip वास्तविक engineering समस्याओं को हल करने के लिए इस्तेमाल किए गए शुरुआती reinforcement learning approaches में से एक है
  • कई हफ्तों या महीनों के मानव श्रम के बजाय, यह कुछ घंटों में अतिमानवीय या समान स्तर के चिप लेआउट तैयार करता है, और ये लेआउट दुनिया भर के data centers से लेकर mobile phones तक विभिन्न चिप्स में उपयोग किए जाते हैं

AlphaChip कैसे काम करता है

  • चिप लेआउट डिज़ाइन करना कोई सरल काम नहीं है
  • कंप्यूटर चिप कई आपस में जुड़े blocks से बनी होती है, जो circuit components की परतों और बेहद पतली wires से एक-दूसरे से जुड़ी होती हैं
  • साथ ही, कई जटिल और परस्पर उलझी हुई design constraints होती हैं जिन्हें एक साथ पूरा करना पड़ता है
  • इसी जटिलता के कारण, चिप डिज़ाइनर 60 साल से अधिक समय से chip floorplanning process को automate करने में संघर्ष करते आए हैं
  • AlphaGo और AlphaZero की तरह, हमने AlphaChip को chip floorplanning को एक तरह के game के रूप में देखने के लिए बनाया
  • एक खाली grid से शुरू करके, AlphaChip एक बार में एक circuit component को रखता है और तब तक इसे दोहराता है जब तक सभी components की placement पूरी नहीं हो जाती
  • इसके बाद इसे अंतिम layout की गुणवत्ता के आधार पर reward मिलता है
  • एक नई "edge-based" graph neural network के माध्यम से, AlphaChip आपस में जुड़े chip components के बीच संबंध सीख सकता है और पूरे chip में generalize कर सकता है, जिससे यह हर नए layout डिज़ाइन के साथ बेहतर होता जाता है

AI का उपयोग करके Google के AI accelerator chips डिज़ाइन करना

  • 2020 में घोषणा के बाद से AlphaChip Google की TPU की सभी पीढ़ियों के लिए अतिमानवीय स्तर के चिप लेआउट तैयार करता आ रहा है
  • ये chips Google की Transformer architecture पर आधारित बड़े AI models को संभव बनाते हैं
  • TPU, Gemini जैसे large language models से लेकर Imagen और Veo जैसे image और video generators तक, शक्तिशाली generative AI systems के केंद्र में है
  • ये AI accelerators Google की AI services का भी मुख्य हिस्सा हैं और Google Cloud के माध्यम से बाहरी उपयोगकर्ताओं को उपलब्ध कराए जाते हैं
  • TPU layouts डिज़ाइन करने के लिए, AlphaChip पहले पिछली पीढ़ियों के विभिन्न chip blocks, जैसे on-chip और inter-chip network blocks, memory controllers, और data transfer buffers, पर अभ्यास करता है (इसे pre-training कहा जाता है)
  • इसके बाद वर्तमान TPU blocks पर AlphaChip चलाकर उच्च गुणवत्ता वाले layouts तैयार किए जाते हैं
  • पिछले approaches से अलग, AlphaChip मानव विशेषज्ञों की तरह, जितने अधिक chip placement task instances हल करता है, उतना ही बेहतर और तेज़ होता जाता है
  • AlphaChip ने हर नई TPU पीढ़ी, जिसमें नवीनतम Trillium (6वीं पीढ़ी) भी शामिल है, के लिए बेहतर चिप लेआउट डिज़ाइन किए हैं और पूरे floorplan का अधिक बड़ा हिस्सा प्रदान किया है, जिससे design cycle तेज़ हुई है और अधिक उच्च-प्रदर्शन वाले chips बने हैं

AlphaChip का व्यापक प्रभाव

  • Alphabet, research community, और chip design industry में फैले applications के माध्यम से AlphaChip के प्रभाव को देखा जा सकता है
  • TPU जैसे विशेष AI accelerators के डिज़ाइन से आगे बढ़कर, AlphaChip ने Alphabet के भीतर अन्य chips के लिए भी layouts तैयार किए हैं, जैसे Google का पहला Arm-आधारित general-purpose data center CPU, Axion processor
  • बाहरी संगठनों ने भी AlphaChip को अपनाया है और उस पर आगे काम किया है (उदाहरण के लिए, दुनिया की अग्रणी chip design कंपनियों में से एक MediaTek ने Samsung phones में उपयोग होने वाले Dimensity Flagship 5G जैसे अपने सबसे उन्नत chips के विकास को तेज़ करने के साथ-साथ power, performance, और chip area में सुधार के लिए AlphaChip का विस्तार किया है)
  • AlphaChip ने chip design के लिए AI कार्यों में तेज़ उछाल पैदा किया है, और इसका विस्तार logic synthesis तथा macro selection जैसे chip design के अन्य महत्वपूर्ण चरणों तक हुआ है

भविष्य के chips बनाना

  • हमारा मानना है कि AlphaChip में computer architecture से लेकर manufacturing तक, chip design cycle के हर चरण को optimize करने की क्षमता है
  • यह smartphones, medical devices, agricultural sensors जैसी रोज़मर्रा की devices में मिलने वाले custom hardware के chip design को बदल सकता है
  • AlphaChip के भविष्य के versions अभी विकसित किए जा रहे हैं, और हम इस क्षेत्र में नवाचार जारी रखने तथा chips को अधिक तेज़, सस्ता और power-efficient बनाने वाले भविष्य के लिए community के साथ सहयोग करने की उम्मीद करते हैं

GN⁺ की राय

  • AlphaChip का AI-आधारित approach chip design क्षेत्र में क्रांति ला रहा है। खास तौर पर chip layout design process को automate करने में इसने बड़ी प्रगति की है
  • AlphaChip वास्तविक engineering समस्याओं पर reinforcement learning लागू करने के शुरुआती उदाहरणों में से एक है, और यह एक अच्छा उदाहरण है कि AI का उपयोग वास्तविक दुनिया में कैसे किया जा सकता है
  • TPU डिज़ाइन पर AlphaChip का प्रभाव AI accelerator hardware के विकास में एक महत्वपूर्ण मील का पत्थर होगा। बेहतर AI accelerators अधिक शक्तिशाली AI models को संभव बनाएंगे, और इससे AI की प्रगति और तेज़ होगी
  • हालांकि, AI design tools पर अत्यधिक निर्भरता मानव डिज़ाइनरों की विशेषज्ञता के क्षरण का कारण बन सकती है। लंबे समय में, AI और मानव विशेषज्ञों के बीच सहयोग सबसे वांछनीय होगा
  • इसी तरह के AI-आधारित design tools में Cadence का Cerebus, Synopsys का DSO.ai आदि शामिल हैं। आगे चलकर AI-आधारित design automation tools के बीच प्रतिस्पर्धा तेज़ होने की संभावना है

1 टिप्पणियां

 
GN⁺ 2024-09-29
Hacker News राय
  • Google के Nature पेपर की EDA CAD क्षेत्र के शोधकर्ताओं ने आलोचना की
    • Google के एक आंतरिक शोधकर्ता का प्रत्युत्तर पेपर: "Stronger Baselines for Evaluating Deep Reinforcement Learning in Chip Placement"
    • UCSD रिसर्च टीम का 2023 ISPD पेपर: "Assessment of Reinforcement Learning for Macro Placement"
    • Igor Markov का आलोचनात्मक पेपर: "The False Dawn: Reevaluating Google's Reinforcement Learning for Chip Macro Placement"
  • Google के RL macro placement algorithm की तुलना अन्य आधुनिक algorithms के साथ निष्पक्ष रूप से नहीं की गई
    • यह दावा किया गया कि macro placement में यह इंसानों से बेहतर प्रदर्शन करता है, लेकिन यह मौजूदा mixed placement algorithms के प्रदर्शन तक नहीं पहुंचता
    • RL तकनीक अन्य algorithms की तुलना में अधिक computing resources मांगती है, और placement समस्या के लिए नया representation सीखने के बजाय एक surrogate function सीखती है
  • Google के काम को लेकर संदेह है, और इस पर अपनी निजी वेबसाइट पर एक विस्तृत पोस्ट लिखी गई
  • ऐसे मामले रहे हैं जहां Google के शोधकर्ताओं को परेशान किए जाने के बाद वे Anthropic चले गए
    • संबंधित लेख: "Google Brain AI Researcher Fired Tension"
  • TSMC इस बात पर जोर देता है कि नवीनतम chip design automation software में TDP के लिए logic design चुनने की क्षमता है
    • यह Dennard scaling को बनाए रखने का एक तरीका हो सकता है
    • प्रकाश की गति और भौतिक निकटता अब भी महत्वपूर्ण हैं, लेकिन यह जानने की जिज्ञासा है कि thermal throttling से बचने से कितना लाभ मिलेगा
  • chip design की quality को मापने के तरीके पर सवाल
    • यह जिज्ञासा है कि Google द्वारा रिपोर्ट किए गए metrics वैध हैं या सिर्फ खुद को बेहतर दिखाने के लिए हैं
    • chip design की "quality" बहुआयामी है और काफी हद तक use case पर निर्भर करती है
    • data center chips और mobile phone camera या automobile chips बहुत अलग दिखेंगे
    • यह जिज्ञासा है कि इस खास समस्या/कार्य में "बेहतर" होने का वास्तव में क्या मतलब है
  • Eurisco का कभी placement और routing कार्यों के लिए उपयोग किया जाता था, और उसने बहुत अच्छा प्रदर्शन किया
    • Eurisco का उपयोग Traveler TCS गेम के combat starship fleets को डिजाइन करने के लिए किया गया था
    • Eurisco ने VLSI design में सीखी गई symmetry-based placement का उपयोग किया
    • यह जिज्ञासा है कि क्या AlphaChip के heuristics का उपयोग कहीं और भी किया जा सकता है
  • Google का chip design काम "विवादास्पद" है
    • यह जिज्ञासा है कि बिना कुछ नया किए केवल PR क्यों किया जा रहा है
  • कई DeepX papers को उचित CS forums के बजाय Nature में भेजे जाने की समस्या
    • अगर chip design में बेहतर काम किया जा रहा है, तो उसे ISPD या ISCA जैसी जगहों पर जमा किया जाना चाहिए
    • यह स्पष्ट नहीं है कि Nature ऐसे papers को कैसे संभालता है
  • "superhuman" शब्द का बार-बार उपयोग क्यों किया जा रहा है, इस पर सवाल
    • algorithms का उपयोग इन कार्यों के लिए किया जाता है, और इंसान खरबों transistors को हाथ से place नहीं करते
  • काश PCB design/layout के लिए भी ऐसे tools होते
  • यह जिज्ञासा है कि memory-based computing शोध से प्रतिस्पर्धी उत्पादों में बदलने के कितने करीब है
    • memristor जैसे प्रयोगों को बड़े पैमाने पर विस्तार देने के लिए बहुत आक्रामक निवेश का समय आ गया है, ऐसा माना जाता है
    • इस पर चर्चा हो रही है कि AI data centers के लिए कितने नए reactors की आवश्यकता होगी