- Google DeepMind ने RoboCat पेश किया, जो रोबोटिक arm के ज़रिए कई तरह के काम करता है और खुद सीखता है.
- यह Gato (स्पेनिश में 'बिल्ली') पर आधारित है, जो एक multi-modal model है और वास्तविक तथा simulation, दोनों environments में काम कर सकता है.
- self-improvement के लिए यह पहले नए काम के बारे में वास्तविक डेटा इकट्ठा करता है.
- वास्तविक डेटा के आधार पर base model को fine-tune करके एक spinoff agent बनाया जाता है.
- नया agent लगभग 10,000 बार अभ्यास करके training dataset तैयार करता है.
- वास्तविक डेटा और self-generated डेटा को RoboCat के training dataset में जोड़ा जाता है.
- RoboCat का नया version train किया जाता है.
- इसके जरिए यह अधिक joints या अधिक grippers वाले नए robotic arm के अनुसार कुछ ही घंटों में अनुकूलित हो सकता है.
- साथ ही training का एक virtuous cycle बनता है, और किसी खास काम में 36% success rate दिखाने वाला शुरुआती model दोगुने से अधिक बढ़कर 74% तक पहुंच गया.
3 टिप्पणियां
आख़िरकार AI के लिए real world से मिलने और उसे अनुभव करने का मंच खुल रहा है।
HN थ्रेड की टिप्पणियाँ बहुत मज़ेदार हैं।
मेरे मन में भी लगभग यही बात आई थी:
क्या RoboCat से मेरी ही रोबोट बिल्ली की उम्मीद थी? थोड़ा निराशाजनक है...कम से कम रोबोटिक arm पर बिल्ली का sticker तो लगा देते।
पेपर का सारांश कुछ इस तरह है।
RoboCat रोबोट मैनिपुलेशन के लिए एक self-improving एजेंट है। इसे कई simulations और वास्तविक robot arm का उपयोग करने वाले रोबोट कार्यों के बड़े और विविध dataset पर train किया जाता है।
RoboCat के मुख्य लक्ष्य इस प्रकार हैं।
मुख्य परिणाम इस प्रकार हैं।
संक्षेप में, RoboCat, जो रोबोट मैनिपुलेशन के लिए बड़े और विविध dataset पर train किया गया एक self-improving एजेंट है, यह दिखाता है कि fine-tuning और self-improvement के माध्यम से यह नए कार्यों और robots पर बहुत कम डेटा के साथ generalize कर सकता है। बड़े पैमाने पर heterogeneous robotic experience का उपयोग करने की इसकी क्षमता robot learning को बदलने की क्षमता रखती है।