शीर्षक: क्या घरेलू उपकरणों के MCU firmware को AI द्वारा 100% विकसित करने वाला परिदृश्य संभव है

मूल लेख: Samsung Tech Blog - https://techblog.samsung.com/blog/article/90

  • Samsung Electronics ने 'Harness Engineering' को घरेलू उपकरणों (range hood) के MCU firmware development में लागू करके यह सत्यापित किया कि क्या बिना मानव coding हस्तक्षेप के AI agent योजना-इम्प्लीमेंटेशन-वेरीफिकेशन को स्वायत्त रूप से दोहराते हुए firmware को 100% बना सकता है

  • यहाँ 'harness' का मतलब मॉडल को अधिक स्मार्ट बनाना नहीं, बल्कि ऐसा work environment डिजाइन करना है जिससे AI इच्छित परिणाम दे सके—जैसे आवश्यक जानकारी, निषिद्ध बातें, self-verification loop, folder structure, specification documents, coding standards, और build/linter। developer की भूमिका 'code writer' से बदलकर 'specification और harness designer' की हो जाती है

  • मुख्य सिद्धांत है "जिस specification को AI verify नहीं कर सकता, वह specification अस्तित्व में ही नहीं है।" जो requirements document नहीं की गई हैं, वे न तो implementation का आधार बन सकती हैं और न verification का, इसलिए वे 'अस्तित्वहीन requirements' के बराबर हैं। उदाहरण के लिए, अगर यह न बताया जाए कि airflow को Low-Mid-High रखना है या On-Off, तो AI मनमाना निर्णय लेगा। शुरुआती बिंदु legacy specifications और developers की 'implicit knowledge' को AI के उपयोग योग्य रूप में व्यवस्थित करने वाली 'specification design' है

  • बिखरी हुई specifications को docs/ folder केंद्रित रूप से फिर से व्यवस्थित किया गया। product behavior को behavior/ में, design rationale को design/ में, hardware configuration और initialization जानकारी को hardware/ में रखा गया, और communication specs, state machines, तथा communication protocols को भी अलग-अलग folders में व्यवस्थित किया गया। इसके साथ AI work rules वाला AGENTS.md और layer structure तथा dependency rules को परिभाषित करने वाला ARCHITECTURE.md जोड़कर harness का आधार पूरा किया गया। नतीजतन documents ने 'Single Source of Truth' की भूमिका निभाई

  • specification/implementation/verification के तीन प्रकार के harnesses के अलावा, Samsung-विशेष MCU specifications, MCU debugger उपयोग विधि, और 220V power को भौतिक रूप से बंद-चालू करने वाले USB Switch आदि को 'skills' के रूप में दिया गया। SDD/TDD/BDD के जरिए implementation scope को नियंत्रित किया गया, और Build/Test/Lint quality gates पार करने पर ही अगला चरण आगे बढ़ता है

  • AUTOPILOT loop Zero-Base code से शुरू होकर योजना-इम्प्लीमेंटेशन-वेरीफिकेशन को स्वायत्त रूप से दोहराता है। इस दौरान 'generate करने वाले agent' और 'evaluate/verify करने वाले agent' को अलग रखा गया, ताकि AI अपने ही output का उदार मूल्यांकन न कर सके

  • सबसे कठिन कार्य यह था कि AI अपने परिणाम को 'वास्तविक MCU' पर सीधे सत्यापित कर सके, ऐसा environment बनाना। verification environment में PC पर Codex AI + JTAG-आधारित MCU debugger + power control के लिए USB Switch शामिल थे, और Codex AI debugger तथा switch दोनों को नियंत्रित करता था। debugger सीधे MCU की स्थिति को read/write करता है, और USB Switch 220V power को on/off करके non-recoverable स्थिति में भी AI को स्वयं set initialize करने देता है

  • AI को product specifications, protocol और packet जानकारी, MCU datasheet, debugger उपयोग विधि, source code और variable structure, तथा power On/Off करने के तरीके दिए गए। AI specification document का विश्लेषण करके 'स्वायत्त इच्छा' से test scenarios निकालता है, debugger के जरिए वास्तविक set में key input inject करता है (memory Write), फिर state values को variables के रूप में पढ़ता है (memory Read), और scenario के अनुसार Pass/Fail का निर्णय स्वयं करता है। यानी 'operation scenario + memory Write + memory Read' ये तीन तत्व जब आपस में जुड़ते हैं, तभी autonomous automated verification संभव होती है

  • परिणाम: सभी 5 बार बिना मानव हस्तक्षेप के स्वायत्त completion हुआ (प्रति बार लगभग 4.5~5.5 घंटे), और basic operation completion लगभग 95% रही। कमी वाली लगभग 5% मुख्यतः HAL (UART, Timer, WatchDog, Clock आदि, वास्तविक HW verification क्षेत्र) में आई, जिसे 1~4 घंटे की मानव debugging से पूरा किया जा सकता है

  • development period में औसतन 50~70% कमी की संभावना की पुष्टि हुई। हालांकि, यह approvals/reviews/releases को छोड़कर केवल शुद्ध development time के आधार पर AI का अनुमान है, और शुरुआती investment तथा 'ऐसे पूर्ण verification standards स्थापित करना जिनमें मानव को code review करने की भी आवश्यकता न पड़े' इसका व्यापक प्रसार करने की चुनौती बनी हुई है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.