- यह एक self-referential AI agent system है जो अपनी learning और problem-solving प्रक्रिया को खुद बेहतर बनाता है, ताकि human engineering पर निर्भरता कम हो सके; यह मौजूदा recursive self-improvement तरीकों में मौजूद fixed meta-mechanism की सीमाओं को पार करता है
- इसकी संरचना task agent (लक्ष्य कार्य पूरा करने वाला) और meta agent (खुद को और task agent को संशोधित करने वाला) को एक editable program में एकीकृत करती है
- मौजूदा Darwin Gödel Machine (DGM) केवल coding domain में self-improvement कर सकती थी, लेकिन HyperAgents इसे coding, paper review, robotics, और math grading जैसे कई domains तक बढ़ाता है
- meta-level modification procedure खुद भी editable है, इसलिए metacognitive self-modification इसका मुख्य अंतर है, जिसमें improvement mechanism को भी improve किया जा सकता है
- प्रयोगों में पुष्टि हुई कि meta-level improvements domains के बीच transfer हो सकते हैं और runs के बीच accumulate हो सकते हैं; यह general-purpose self-accelerating AI systems की संभावना दिखाने वाला research है
मौजूदा self-improvement systems की सीमाएँ
- self-improving AI systems का लक्ष्य human engineering पर निर्भरता कम करने के लिए learning और problem-solving प्रक्रिया को अपने आप बेहतर बनाना है
- मौजूदा recursive self-improvement approaches fixed और manually designed meta-level mechanisms पर निर्भर करते हैं, इसलिए system कितनी तेजी से बेहतर हो सकता है इस पर एक मूलभूत सीमा मौजूद रहती है
Darwin Gödel Machine (DGM) और coding domain की सीमा
- DGM (Zhang et al., 2025b) ऐसा system है जिसने coding domain में open-ended self-improvement की संभावना दिखाई
- यह एक single coding agent से शुरू होकर self-modified variants को बार-बार generate और evaluate करता है, और future improvements के लिए stepping-stone archive का विस्तार करता है
- क्योंकि evaluation और self-modification दोनों ही coding tasks हैं, इसलिए coding ability में सुधार सीधे self-improvement ability में सुधार से जुड़ जाता है
- लेकिन ऐसी domain-specific alignment आम तौर पर coding के बाहर के क्षेत्रों में लागू नहीं होती; यही इसकी सीमा है
HyperAgents framework की संरचना
- HyperAgents एक self-referential agent है, जो दो components को एक single editable program में जोड़ता है
- task agent: लक्ष्य कार्य हल करने की भूमिका
- meta agent: खुद को और task agent को modify करने की भूमिका
- सबसे अहम बात यह है कि meta-level modification procedure भी editable है, जिससे metacognitive self-modification संभव होता है
- यानी सिर्फ task-solving behavior ही नहीं, बल्कि future improvements पैदा करने वाले mechanism को भी improve किया जा सकता है
DGM-Hyperagents (DGM-H)
- DGM का विस्तार करके इसे DGM-Hyperagents (DGM-H) के रूप में विकसित किया गया
- improvement procedure को खुद evolve होने की अनुमति देकर, यह task performance और self-modification ability के बीच domain-specific alignment assumption को हटाता है
- सैद्धांतिक रूप से यह किसी भी computable task में self-accelerating progress को support करने की क्षमता रखता है
प्रयोगों के नतीजे और domain coverage
- coding, paper review, robotics reward design, और Olympiad-level math solution grading सहित कई domains में experiments किए गए
- DGM-H ने समय के साथ लगातार performance improvement दिखाया
- self-improvement या open-ended exploration के बिना baselines, और मौजूदा DGM की तुलना में भी इसने बेहतर performance हासिल की
meta-level improvements का transfer और accumulation
- पाया गया कि DGM-H नए agents बनाने वाली process को ही improve करता है
- उदाहरण: persistent memory, performance tracking जैसे meta-level improvements सामने आए
- इन meta-level improvements में domains के बीच transfer करने और runs के बीच accumulate होने की क्षमता है
safety considerations
- सभी experiments sandboxing, human oversight जैसी safety precautions के तहत किए गए
- इसमें self-improving systems के संदर्भ में safety के अर्थ और self-improving systems के व्यापक निहितार्थों पर भी चर्चा शामिल है
महत्व
- DGM-Hyperagents केवल बेहतर solutions खोजने तक सीमित नहीं है, बल्कि यह ऐसे open-ended AI system की संभावना दिखाता है जो improve करने के तरीके को ही लगातार improve करता रहता है
अभी कोई टिप्पणी नहीं है.