- DeepMind ने Scalable Instructable Multiworld Agent(SIMA) पेश किया
-
- Google DeepMind का AI और गेमिंग के क्षेत्र में लंबा इतिहास रहा है, Atari गेम्स से लेकर मानव ग्रैंडमास्टर स्तर पर StarCraft II खेलने वाले AlphaStar सिस्टम तक
- SIMA, 3D वर्चुअल वातावरणों के लिए एक general-purpose AI एजेंट है, जो विभिन्न वीडियो गेम वातावरणों में प्राकृतिक भाषा के निर्देशों का पालन कर सकता है
- यह शोध किसी एक गेम पर फोकस करने के बजाय सामान्य और निर्देश-आधारित गेमप्ले AI एजेंट की ओर बदलाव का लक्ष्य रखता है
- इसे विभिन्न गेम डेवलपर्स के साथ सहयोग करके कई वीडियो गेम्स में प्रशिक्षित किया गया
- यह पहली बार दिखाता है कि AI एजेंट विशाल गेम दुनियाओं को समझ सकते हैं और उनमें प्राकृतिक भाषा निर्देशों के अनुसार कार्य कर सकते हैं
वीडियो गेम्स से सीखना
- SIMA को Hello Games के No Man’s Sky और Tuxedo Labs के Teardown सहित 9 अलग-अलग वीडियो गेम्स में प्रशिक्षित और परीक्षण किया गया
- इसे विविध वातावरणों से परिचित कराने के लिए गेम डेवलपर्स के साथ मिलकर 8 गेम स्टूडियो के साथ साझेदारी की गई
- SIMA ने सरल navigation और menu इस्तेमाल करने से लेकर resource mining, spaceship उड़ाने और helmet crafting तक कई तरह की skills सीखी
- इसे Unity पर बने नए वातावरण Construction Lab सहित 4 research environments में भी इस्तेमाल किया गया
SIMA: एक बहुमुखी AI एजेंट
- SIMA एक AI एजेंट है जो अलग-अलग वातावरणों को पहचान और समझ सकता है, फिर दिए गए लक्ष्य को हासिल करने के लिए actions ले सकता है
- इसमें सटीक image-language mapping के लिए एक model और स्क्रीन पर आगे क्या होगा इसका अनुमान लगाने वाला video model शामिल है
- इसे गेम source code या किसी विशेष API तक पहुंच की जरूरत नहीं होती; केवल स्क्रीन images और उपयोगकर्ता द्वारा दिए गए सरल प्राकृतिक भाषा निर्देश ही पर्याप्त हैं
- SIMA keyboard और mouse output का उपयोग करके गेम के मुख्य character को नियंत्रित करता है और इन निर्देशों को पूरा करता है
गेम्स और अन्य वातावरणों में सामान्यीकरण
- कई गेम्स पर प्रशिक्षित एजेंट ने केवल एक गेम पर प्रशिक्षित एजेंट की तुलना में बेहतर प्रदर्शन किया
- केवल प्रशिक्षित वातावरणों में ही नहीं, बल्कि पहले कभी न देखे गए वातावरणों में भी मानव-स्तरीय प्रदर्शन के लिए और अधिक शोध की आवश्यकता है
- SIMA का प्रदर्शन भाषा पर निर्भर है, और भाषा प्रशिक्षण या निर्देशों के बिना यह ठीक-ठाक लेकिन बिना उद्देश्य के व्यवहार करता है
AI एजेंट रिसर्च में प्रगति
- SIMA के नतीजे सामान्य भाषा-आधारित AI एजेंट्स के विकास की क्षमता दिखाते हैं
- यह शुरुआती चरण का शोध है, और उम्मीद है कि अधिक प्रशिक्षण वातावरणों व अधिक सक्षम models को जोड़कर SIMA को और आगे बढ़ाया जाएगा
- अंतिम लक्ष्य ऐसे सामान्य AI सिस्टम और एजेंट बनाना है जो लोगों के लिए ऑनलाइन और वास्तविक दुनिया में उपयोगी तरीके से विभिन्न कार्यों को समझ सकें और उन्हें सुरक्षित रूप से कर सकें
GN⁺ की राय
- SIMA एक महत्वपूर्ण शोध है जो दिखाता है कि AI विभिन्न वातावरणों में इंसानों की तरह निर्देश समझकर कार्य कर सकता है
- इस तरह का शोध ऐसा भविष्य खोल सकता है जिसमें AI केवल साधारण कार्य करने तक सीमित न रहकर जटिल रणनीतिक योजना और multi-tasking भी कर सके
- हालांकि, AI को मानव-स्तरीय प्रदर्शन तक पहुंचने के लिए अभी काफी शोध और प्रगति की जरूरत है
- इस तकनीक को वास्तविक दुनिया की समस्याओं के समाधान में कैसे लागू किया जा सकता है, और AI की generalization क्षमता की संभावित सीमाएं क्या हो सकती हैं, इस पर चर्चा जरूरी है
- समान क्षमताओं वाले अन्य AI प्रोजेक्ट्स में OpenAI Gym भी शामिल है, जो विभिन्न वीडियो गेम्स में सीख सकने वाला एक AI प्लेटफ़ॉर्म है
1 टिप्पणियां
Hacker News की राय