AI ने RFIC डिज़ाइन की “ब्लैक मैजिक” सीख ली
(spectrum.ieee.org)- RFIC 5G, automotive radar और satellite communication जैसी wireless technologies की बुनियाद है, लेकिन electromagnetic, thermal और packaging reliability को साथ में संतुलित करना पड़ता है, इसलिए यह अब भी manual work पर आधारित कठिन समस्या बनी हुई है
- Princeton के शोधकर्ताओं ने human design templates को शुरुआती आधार बनाने के बजाय, reinforcement learning और inverse design को जोड़कर architecture, circuit topology, device parameters और electromagnetic interfaces को शुरू से खोजा
- AI-आधारित emulator मनमाने 2D electromagnetic structures के scattering parameters को milliseconds में predict करता है, जिससे पारंपरिक electromagnetic solvers की minutes-to-hours वाली iterations बहुत कम हो जाती हैं
- 2023 में 30~100GHz millimeter-wave power amplifier में इसने उस समय के silicon-based power amplifiers में bandwidth, output और efficiency के combination के लिहाज़ से सबसे अच्छा परिणाम दिया, और 2024 में multiport IC structures भी minutes में generate किए
- AI ऐसे circuits भी बना सकता है जो काम न करें, इसलिए verification के लिए human supervision ज़रूरी है, और general-purpose model तक पहुंचने के लिए NDA से बंधे RFIC और analog design data को साझा करने वाला open ecosystem चाहिए
RFIC डिज़ाइन “ब्लैक मैजिक” क्यों बना रहा
- RFIC वह core circuit है जो devices को wireless तरीके से information transmit और receive करने देता है, और autonomous vehicles, quantum communication, 6G और satellite communication की प्रगति भी अधिक उन्नत RF chips पर निर्भर करती है
- CPU या GPU डिज़ाइन standardized science के करीब पहुंच चुके हैं, लेकिन RF डिज़ाइन अब भी लंबे अनुभव से सीखी जाने वाली manual craft जैसा है
- RFIC डिज़ाइन एक साथ कई physical domains को संभालता है
- Maxwell equations यह तय करते हैं कि electromagnetic fields active और passive devices के साथ कैसे interact करते हैं
- thermodynamics यह नियंत्रित करता है कि operation के दौरान heat कैसे पैदा और हटाई जाती है
- thermal expansion और contraction यह तय करते हैं कि chip और package temperature changes में reliably टिक पाएंगे या नहीं
- इन सभी physical constraints को साथ में देखना पड़ता है, इसलिए design space बहुत बड़ा हो जाता है और एक performance metric बढ़ाने पर दूसरा बिगड़ जाने वाला trade-off अक्सर सामने आता है
पारंपरिक RFIC डिज़ाइन flow और bottleneck
- 5G millimeter-wave handset के लिए 28GHz power amplifier डिज़ाइन करने में पहले circuit architecture और topology तय करनी पड़ती है
- RFIC architecture घर के blueprint की तरह तय करता है कि कौन-से components चाहिए और signal paths कैसे होंगे
- power amplifier में amplification stages की संख्या एक महत्वपूर्ण factor होती है
- RFIC area का अधिकांश हिस्सा transistors नहीं बल्कि inductors, transmission lines जैसे passive devices और electromagnetic structures घेरते हैं
- 5G signals 28GHz और 39GHz पर, satellite communication 26.5~40GHz या उससे ऊपर, और automotive radar 77GHz पर काम करते हैं; RFIC ऐसे high frequencies पर signal energy को सूक्ष्म electromagnetic structures से नियंत्रित करता है
- अगर signal path अगली component से ठीक से match न करे, तो impedance matching की समस्या होती है, जिसमें energy आगे जाने के बजाय पीछे reflect हो जाती है
- engineers components के बीच सूक्ष्म transition structures डिज़ाइन करके reflections घटाते हैं
- ये structures signal transfer के अलावा splitting, combining और multipath distribution के लिए भी इस्तेमाल हो सकते हैं
- अगर specifications पूरी न हों, तो topology या architecture फिर से बदलकर simulation दोहराना पड़ता है, और एक नए chip design में कई साल और करोड़ों से अरबों डॉलर तक लग सकते हैं
templates से बाहर AI डिज़ाइन approach
- पहले के research में machine learning का इस्तेमाल circuit templates optimize करने के लिए हुआ, लेकिन वह अब भी humans द्वारा बनाई गई existing design libraries पर निर्भर था
- Princeton टीम का लक्ष्य यह था कि बिना किसी pre-made topology के algorithm architecture, constituent circuits और electromagnetic passive structures के सभी parameters को शुरू से तय करे
- इस approach का शुरुआती बिंदु पारंपरिक optimization से अलग है
- पारंपरिक तरीका humans द्वारा बनाए गए structure में transistor sizes या passive device shapes जैसे parameters को tune करता है
- नया तरीका लगभग blank starting point से candidate circuit combinations बनाता है, performance trade-offs को map करता है और design space को explore करता है
- यह approach AlphaGo Zero की तरह human examples का अनुसरण करने के बजाय अपनी exploration और evaluation से design strategy विकसित करती है
- algorithm circuit, electromagnetics और दोनों के co-design को सीखकर end-to-end RFIC design का लक्ष्य रखता है
reinforcement learning और inverse design का संयोजन
- पहला चरण reinforcement learning framework है, जो optimal system architecture, circuit topology, device parameters और electromagnetic interface characteristics तय करता है
- reinforcement learning agent खेल सीखने वाले कंप्यूटर की तरह कई combinations आज़माता है, actions और scores के संबंध को देखकर बेहतर circuits खोजता है
- training में कुछ दिन से एक हफ्ता लगते हैं
- training पूरी होने के बाद circuits बहुत तेज़ी से डिज़ाइन किए जा सकते हैं
- दूसरा चरण inverse design है, जिसमें desired scattering parameters देने वाली physical electromagnetic structure खोजी जाती है
- scattering parameters यह मापते हैं कि signal component के भीतर जाने पर आगे बढ़ता है या पीछे reflect होता है
- यह structural engineering में target space बनाने के लिए arches या support structures खोजने जैसा है
- RFIC inverse design में circuit behavior और interconnects/passive devices की electromagnetic response को एक साथ match करना पड़ता है, इसलिए इसे सिर्फ iterative manual search से हल करना मुश्किल है
AI emulator ने electromagnetic design iterations घटाईं
- शोधकर्ताओं ने RF circuit simulator को AI-आधारित emulator से बदल दिया
- यह model arbitrary 2D structures को input के रूप में लेकर Maxwell equations को सीधे solve किए बिना scattering parameters predict करता है
- इससे पारंपरिक electromagnetic solver का minutes-to-hours वाला काम milliseconds तक सिमट जाता है
- emulator को image processing में मजबूत convolutional neural network के आधार पर बनाया गया
- structure images में वह spatial information होती है जिससे electromagnetic performance predict की जा सकती है
- शोधकर्ताओं ने scattering parameters से labeled बहुत-सी random pixel structures के जरिए model को train किया
- reinforcement learning-based inverse design और AI emulator को जोड़कर end-to-end AI designer बनाया गया और इसे power amplifier design पर लागू किया गया
इंसानों से अलग RF architecture के नतीजे
- 2023 में प्रकाशित proof of concept 30~100GHz millimeter-wave band power amplifier पर केंद्रित था
- यह range संबंधित 5G और radar frequencies के अधिकांश हिस्से को कवर करती है
- final design ने उस समय के silicon-based power amplifiers में wide bandwidth, output power और efficiency के combination के लिहाज़ से सबसे अच्छा प्रदर्शन दिया, और record efficiency बनाए रखी
- generated electromagnetic paths इंसानों द्वारा आम तौर पर सोची जाने वाली regular और symmetric structures से अलग, random patterns या QR code जैसे दिखे
- इससे पता चलता है कि ऐतिहासिक रूप से इस्तेमाल किए गए templates आधुनिक design goals के लिए optimal के करीब ही हों, इसकी कोई गारंटी नहीं है
- इसके बाद शोधकर्ताओं ने model को अधिक input/output ports वाले structures तक बढ़ाया
- 2 ports में 4 scattering parameters होते हैं, जबकि 4 ports में 16, इसलिए complexity तेज़ी से बढ़ती है
- 2024 के multiport integrated circuits research में दिखाया गया कि AI algorithm multiport structures भी संभाल सकता है
- पहले multiport electromagnetic simulations में कई दिन या कई हफ्ते लगते थे, लेकिन यह model नए structures को minutes में evolve कर देता है
- reinforcement learning framework और inverse design को मिलाकर specifications से fabrication-ready layout तक generate करने वाला flow दिखाया गया, और इसे low-noise amplifiers, subterahertz, broadband power amplifiers पर लागू किया गया
व्याख्येय AI डिज़ाइन
- RFIC testing और debugging में डिज़ाइन जितना समय लग सकता है या उससे भी अधिक मुश्किल हो सकती है, इसलिए engineers ऐसी interpretable structures पसंद करते हैं जिन्हें समस्या आने पर समझा और सुधारा जा सके
- शोधकर्ताओं ने image generation AI में इस्तेमाल होने वाले diffusion models को RFIC structure generation में लागू किया
- text prompt के बजाय scattering parameters को input के रूप में दिया जाता है और output में RFIC की electromagnetic structure generate होती है
- spatial frequency dial को input में शामिल कर designers को output structure के रूप को नियंत्रित करने दिया गया
- low spatial frequency: पारंपरिक और व्याख्येय रूप
- medium spatial frequency: भूलभुलैया जैसी structures
- high spatial frequency: pixelated या लगभग random रूप वाली structures
- prompt से output तक पूरी प्रक्रिया में लगभग 6 मिनट लगते हैं, और अगर scattering parameters Maxwell equations के तहत physically realizable हों, तो उनसे मेल खाती structure generate की जा सकती है
बाकी सीमाएँ और data की चुनौती
- AI-आधारित design approach ने RF community का ध्यान खींचा है और पारंपरिक bottom-up design flow को उलटना शुरू कर दिया है
- फिर भी कुछ unresolved questions बचे हुए हैं
- यह method कितनी अच्छी तरह generalize कर सकती है
- क्या यह लगातार high performance दे सकती है
- क्या यह सभी संभावित trade-offs को समग्र रूप से optimize कर सकती है
- क्या यह RFIC से आगे बढ़कर ऐसे दूसरे circuits भी invent कर सकती है जिन्हें humans ने पहले कभी न बनाया हो
- AI hallucination करके ऐसे खराब circuits बना सकता है जो काम ही न करें, इसलिए verification में human supervision लगातार ज़रूरी रहेगी
- general foundational model बनाने के लिए electromagnetic और circuit behavior के governing laws सीखने हेतु large-scale data चाहिए
- ImageNet 1.4 करोड़ विविध और human-labeled images वाला उदाहरण है, जिसने image recognition models को generalize करने में मदद की
- RFIC और analog design में भी इसी स्तर के scale और diversity वाला data चाहिए
- ऐसा data दुनिया भर की कंपनियों और labs की simulations में बहुत मात्रा में मौजूद है, लेकिन अधिकांश NDA के पीछे बंद है
- Natcast U.S. CHIPS and Science Act’s R&D program चलाता था और next-generation wireless, sensing और defense technologies के लिए shared infrastructure और innovation को मजबूत कर सकता था, लेकिन organization और machine learning/RFIC से जुड़े programs बंद कर दिए गए
- अगर RFIC क्षेत्र AI researchers और chip designers के बीच सहयोग बढ़ाए और एक open ecosystem बनाए, तो AI-based IC design की क्षमता का और बड़ा उपयोग किया जा सकता है
1 टिप्पणियां
Hacker News की राय
पुराने समय की genetic algorithm search याद आ गई। अंदाज़ा लगाकर verify करने का तरीका काफ़ी शक्तिशाली हो सकता है, खासकर अगर बीच में agent की guidance जोड़ी जा सके
https://en.wikipedia.org/wiki/Evolved_antenna
शुरुआत के लिए: https://sci-hub.ru/storage/moscow/4324/11d145b2c2c3ab320f70b...
मुझे उत्सुकता है कि असली theory कहीं न कहीं सुंदर और elegant होनी चाहिए—यह आम अपेक्षा अगले सौ साल टिकेगी या नहीं। क्या पता वास्तविक प्राकृतिक घटनाओं को सबसे अच्छी तरह उन बेहद गंदी equations के ढेर से समझाया जा सके, जिन्हें केवल मशीनें ही संभाल और reason कर सकती हों; ऐसा हुआ तो काफ़ी दुखद लगेगा
Physicists का “perfect spherical cow” मान लेने वाला मज़ाक भी इसी संदर्भ में है, और सच कहें तो “the unreasonable effectiveness of mathematics” essay का मूल भी इसी के करीब है। बात यह है कि mathematical approximation दुनिया को इतना अच्छी तरह समझा देता है—यह अपने आप में irrationally surprising है
Occam's razor एक उपयोगी heuristic है, लेकिन यह हमें simpler explanations की ओर bias भी कर देता है
AI design का एक बढ़िया उपयोग patent pollution है। AI से बड़ी मात्रा में design variations बनाकर website पर publish कर दिए जाएं, और बाद में अगर patent आए तो overlapping हिस्सों का उपयोग करके उसे invalid किया जा सके या कम से कम उसका scope घटाया जा सके। क्योंकि patent की generalization prior art से सीमित होती है
बाद में उन्होंने एक local TEDx event में अपना logic समझाया और कुछ हद तक ध्यान खींचा [1], और मुझे याद है कि legal commentators ने इसे खास तवज्जो नहीं दी थी, कहते हुए कि judges रोज़मर्रा में इससे कहीं ज्यादा subtle differences तय करते हैं। फिर भी कोशिश प्यारी थी
[0] https://allthemusic.info/
[1] https://m.youtube.com/watch?v=sJtm0MoOgiU and
https://www.the-independent.com/tech/music-copyright-algorit...
थोड़ा frustrating है। AI बहुत काम कर सकता है, लेकिन LLMs, Monte Carlo, genetic algorithms, expert systems, और दूसरी statistical magic जैसी traditional machine learning को लगातार मिलाते हुए, पहले से स्थापित morally neutral machine-learning activities और LLM/Stable Diffusion को लेकर चिंताओं को बहुत aggressive तरीके से एक साथ बांधा जा रहा है
और शायद यही इरादा भी हो सकता है, ऐसा भी लगता है
जब कहना हो कि किसी चीज़ में बड़ी प्रगति हुई है, तो sci-fi ने human achievements की भविष्यवाणी की—इस popular-science समझ से जोड़ना कम effort और ज्यादा impact वाला तरीका है। अगर लोगों को excited करना पहला लक्ष्य है, तो बात सही-सही पहुंचाना लक्ष्य नहीं है
“इंसान तो इसकी कल्पना भी नहीं कर पाए थे” कहना बढ़ा-चढ़ाकर कहा गया लगता है। फिर भी यह काफी संभव लगता है कि machine learning algorithm brute-force search से ऐसे chip design तक पहुंच सकते हैं जिन्हें किसी ने आजमाया ही नहीं था, और उनमें से कुछ हमारे लिए उपयोगी हो सकते हैं। कंप्यूटर के लिए यह काफी वाजिब काम है
लेख से एक बात समझ आती है कि ऐसी प्रगति करने के लिए verified chip design के बुनियादी building blocks को छोड़ना पड़ा। सोचता हूं कि क्या यही बात आम coding पर भी लागू होगी। क्या AI coding की हैरतअंगेज breakthroughs असल में Rust और Python की वजह से अटकी हुई हैं? क्या AI tools को बस जितना संभव हो उतने low level पर code करने देना चाहिए?
यह पुराना लेख याद आ गया: https://www.damninteresting.com/on-the-origin-of-circuits/
इंटरनेट पर मिले छोटे खजानों में से एक है
पास की एक दूसरी comment में lab-grown designs की robustness की बात हुई थी, और Damn Interesting लेख में मेरे लिए सबसे दिलचस्प हिस्सा भी यही था कि evolved program को training में इस्तेमाल हुए उस एक physical FPGA से अलग नहीं किया जा सकता था। यह RFIC learning model simulator का इस्तेमाल करता है, इसलिए मुझे जिज्ञासा है कि simulator जिस physical hardware पर चलता है, उसकी विशेषताएं training से पर्याप्त रूप से isolate रहती हैं या नहीं, ताकि अलग-अलग hardware पर simulator चलाने पर भी designs करीब-करीब वैसा ही behave करें
ज्यादा स्पष्ट सवाल यह है कि simulator में evolve हुए design के actual physical hardware पर भी उम्मीद के मुताबिक काम करने की कोई संभावना है या नहीं। इस बाद वाले पर मेरी intuition ‘नहीं’ कहती है, लेकिन यह फिर भी दिलचस्प research लगती है, और मैं अक्सर सोचता हूं कि FPGA में वास्तव में क्या हुआ था इसे ठीक से समझना reinforcement learning को सच में handle करने की prerequisite हो सकता है
यह लेख पोस्ट करने के लिए अच्छा लगा, और अगर इस क्षेत्र से जुड़े आपके पास और पसंदीदा links हों तो भेजें
सबसे बड़ा सवाल यह है कि ऐसा design कितना robust है
paper में यह तो दिखाया गया है कि actual device measurements predictions से अच्छी तरह match करते हैं, लेकिन text में इसे explicitly address करने वाला हिस्सा मुझे नहीं मिला। साथ ही दिखाए गए कुछ systems में traditionally designed sub-blocks भी शामिल हैं, इसलिए संभव है कि वे कुछ जिम्मेदारी संभाल रहे हों
शायद मुझे लग रहा है कि यह मेरी नौकरी के पीछे पड़ा है इसलिए मैं बेवजह टेढ़ी नजर से देख रहा हूं, या शायद वे चाहते हैं कि हम ऐसा ही सोचें
असल में जीतने वाली चीज, मेरे हिसाब से, manufacturing/environmental variations और model limitations के बावजूद टिक सकने वाला simple idea होता है। जैसे feedback या symmetry। लेकिन यहां जो दिख रहा है, वह लगभग इसका उलटा है। मैंने कुछ बार circuit parameters को blindly optimize किया है, और आखिर में जब “यहां symmetry चाहिए” या “यहां ज्यादा bandwidth चाहिए” जैसी कोई छूटी हुई simple idea समझ में आती थी, तो सब पूरी तरह अर्थपूर्ण लगने लगता था। इसलिए सोचता हूं कि अगर इस structure के कुछ pixels ही बदले जाएं तो क्या कोई ज्यादा simple चीज सामने आएगी
और अनिवार्य तौर पर “genetic antenna” का जिक्र भी करना होगा
text के अनुसार AI की भूमिका optimization process में electromagnetic simulator की जगह लेकर structure के behavior का अनुमान लगाना है, और यह simulation से कई orders of magnitude तेज बताया गया है
सुनने में ठीक लगता है, लेकिन इस पर भरोसा करने के लिए मैं AI training में इस्तेमाल हुई geometry से काफी अलग structures पर AI के estimates और actual measurements के बीच का difference देखना चाहूंगा। साथ ही यह भी देखना होगा कि AI model की speed की तुलना ठीक किस simulator से की गई है
electromagnetic fields और electronic circuits में accuracy और speed के बीच trade-off करने वाली कई simulation approaches होती हैं। इसलिए मुझे यकीन नहीं कि AI inference जरूरी तौर पर कम-accuracy वाली तेज simulations से बहुत कम समय लेगा। ऐसी simulations भी AI estimates से ज्यादा accurate और reliable हो सकती हैं
चूंकि आपने पहले ही कह दिया है, तो “काफी simple idea समझ में आना” वाली बात से जुड़ी एक बात जोड़ूं: मेरे खयाल से ऐसे computer-aided design का एक बड़ा फायदा “innovization”[1] है। शब्द थोड़ा awkward है, लेकिन मुद्दा यह है कि ऐसे systems किसी particular process की गहरी समझ तक ले जाते हैं। इसे खुद अनुभव करने पर यह काफी मजेदार एहसास होता है
[1]: https://dl.acm.org/doi/10.1145/1143997.1144266
इस article में बताए गए methods नए नहीं हैं। scientists दशकों पहले से genetic algorithms से ऐसे antennas design कर रहे थे जिन्हें कोई समझ नहीं पाता था, लेकिन वे अच्छा काम करते थे
यह कोई इतना जादुई काम नहीं है। article में भी कहा गया है कि RFIC design सामान्य RF engineering से कहीं आगे, designer के ज्ञान और अनुभव पर बहुत निर्भर black magic जैसा है, और ऐसे modeling/design tools की मदद लेता है जो कुछ दशक पहले supercomputer-level होते
AI जो कर सकता है वह है सभी संभव results को breadth-first तरीके से explore करना और फिर सबसे अच्छा performance देने वाले को चुनना। यह इंसान के “यह रास्ता अच्छा लग रहा है, इसे और खोदकर देखें” वाले तरीके से अलग है