Google SIMA - 3D वर्चुअल वातावरणों के लिए जनरेटिव AI एजेंट

(deepmind.google)

8 पॉइंट द्वारा GN⁺ 2024-03-14 | 1 टिप्पणियां | WhatsApp पर शेयर करें

DeepMind ने Scalable Instructable Multiworld Agent(SIMA) पेश किया
- - Google DeepMind का AI और गेमिंग के क्षेत्र में लंबा इतिहास रहा है, Atari गेम्स से लेकर मानव ग्रैंडमास्टर स्तर पर StarCraft II खेलने वाले AlphaStar सिस्टम तक
SIMA, 3D वर्चुअल वातावरणों के लिए एक general-purpose AI एजेंट है, जो विभिन्न वीडियो गेम वातावरणों में प्राकृतिक भाषा के निर्देशों का पालन कर सकता है
यह शोध किसी एक गेम पर फोकस करने के बजाय सामान्य और निर्देश-आधारित गेमप्ले AI एजेंट की ओर बदलाव का लक्ष्य रखता है
इसे विभिन्न गेम डेवलपर्स के साथ सहयोग करके कई वीडियो गेम्स में प्रशिक्षित किया गया
यह पहली बार दिखाता है कि AI एजेंट विशाल गेम दुनियाओं को समझ सकते हैं और उनमें प्राकृतिक भाषा निर्देशों के अनुसार कार्य कर सकते हैं

वीडियो गेम्स से सीखना

SIMA को Hello Games के No Man’s Sky और Tuxedo Labs के Teardown सहित 9 अलग-अलग वीडियो गेम्स में प्रशिक्षित और परीक्षण किया गया
इसे विविध वातावरणों से परिचित कराने के लिए गेम डेवलपर्स के साथ मिलकर 8 गेम स्टूडियो के साथ साझेदारी की गई
SIMA ने सरल navigation और menu इस्तेमाल करने से लेकर resource mining, spaceship उड़ाने और helmet crafting तक कई तरह की skills सीखी
इसे Unity पर बने नए वातावरण Construction Lab सहित 4 research environments में भी इस्तेमाल किया गया

SIMA: एक बहुमुखी AI एजेंट

SIMA एक AI एजेंट है जो अलग-अलग वातावरणों को पहचान और समझ सकता है, फिर दिए गए लक्ष्य को हासिल करने के लिए actions ले सकता है
इसमें सटीक image-language mapping के लिए एक model और स्क्रीन पर आगे क्या होगा इसका अनुमान लगाने वाला video model शामिल है
इसे गेम source code या किसी विशेष API तक पहुंच की जरूरत नहीं होती; केवल स्क्रीन images और उपयोगकर्ता द्वारा दिए गए सरल प्राकृतिक भाषा निर्देश ही पर्याप्त हैं
SIMA keyboard और mouse output का उपयोग करके गेम के मुख्य character को नियंत्रित करता है और इन निर्देशों को पूरा करता है

गेम्स और अन्य वातावरणों में सामान्यीकरण

कई गेम्स पर प्रशिक्षित एजेंट ने केवल एक गेम पर प्रशिक्षित एजेंट की तुलना में बेहतर प्रदर्शन किया
केवल प्रशिक्षित वातावरणों में ही नहीं, बल्कि पहले कभी न देखे गए वातावरणों में भी मानव-स्तरीय प्रदर्शन के लिए और अधिक शोध की आवश्यकता है
SIMA का प्रदर्शन भाषा पर निर्भर है, और भाषा प्रशिक्षण या निर्देशों के बिना यह ठीक-ठाक लेकिन बिना उद्देश्य के व्यवहार करता है

AI एजेंट रिसर्च में प्रगति

SIMA के नतीजे सामान्य भाषा-आधारित AI एजेंट्स के विकास की क्षमता दिखाते हैं
यह शुरुआती चरण का शोध है, और उम्मीद है कि अधिक प्रशिक्षण वातावरणों व अधिक सक्षम models को जोड़कर SIMA को और आगे बढ़ाया जाएगा
अंतिम लक्ष्य ऐसे सामान्य AI सिस्टम और एजेंट बनाना है जो लोगों के लिए ऑनलाइन और वास्तविक दुनिया में उपयोगी तरीके से विभिन्न कार्यों को समझ सकें और उन्हें सुरक्षित रूप से कर सकें

GN⁺ की राय

SIMA एक महत्वपूर्ण शोध है जो दिखाता है कि AI विभिन्न वातावरणों में इंसानों की तरह निर्देश समझकर कार्य कर सकता है
इस तरह का शोध ऐसा भविष्य खोल सकता है जिसमें AI केवल साधारण कार्य करने तक सीमित न रहकर जटिल रणनीतिक योजना और multi-tasking भी कर सके
हालांकि, AI को मानव-स्तरीय प्रदर्शन तक पहुंचने के लिए अभी काफी शोध और प्रगति की जरूरत है
इस तकनीक को वास्तविक दुनिया की समस्याओं के समाधान में कैसे लागू किया जा सकता है, और AI की generalization क्षमता की संभावित सीमाएं क्या हो सकती हैं, इस पर चर्चा जरूरी है
समान क्षमताओं वाले अन्य AI प्रोजेक्ट्स में OpenAI Gym भी शामिल है, जो विभिन्न वीडियो गेम्स में सीख सकने वाला एक AI प्लेटफ़ॉर्म है

1 टिप्पणियां

GN⁺ 2024-03-14

Hacker News की राय

TI7 में pro Dota खिलाड़ियों के खिलाफ खेल सकने वाले OpenAI का डेमो सामने आया था, उसे भूलना मुश्किल है। Dota एक बेहद जटिल और कठिन गेम है। इस अनुभव ने मेरे करियर पर बड़ा असर डाला।
उम्मीद है कि डेवलपर्स इस तकनीक का उपयोग करके NPCs में और जान डाल सकेंगे। कई RPGs में स्वतंत्र जीवन जीने वाले NPCs के वादे कभी वास्तव में दिखने लायक नतीजों तक नहीं पहुँचे, लेकिन AI के साथ शायद अब हम उसके करीब पहुँच रहे हैं।
MMORPGs में bots का इस्तेमाल पहले से ही एक गंभीर समस्या है, जो player economy को विकृत कर रहा है और सभी के गेम अनुभव को खराब कर रहा है। इन gold farmers को रोकने का cat-and-mouse game कहीं अधिक कठिन हो जाएगा।
robot apocalypse के सच होने वाली science fiction अब शायद science fiction नहीं रही। क्योंकि "दिलचस्प" हिंसक गेम, उबाऊ real-world simulator से कहीं सस्ते और अधिक उपलब्ध हैं।
game development CI tool के रूप में इसका उपयोग दिलचस्प होगा। सिर्फ UI ही नहीं, बल्कि writing और game flow को validate करने वाले end-to-end playthrough tests भी। मैं ऐसे reports की कल्पना कर सकता हूँ जैसे: "पहला पेड़ काटने में लगा समय: +20%"।
यह तकनीक + Vtuber तकनीक + दर्शकों से इंटरैक्ट करने वाला chatbot + voice conversion तकनीक == game influencer automation
मैं सोच रहा हूँ कि StarCraft II में DeepMind के AlphaStar की तुलना में SIMA कितना अच्छा प्रदर्शन कर पाएगा, और अगर मैं high-level निर्देश दूँ और SIMA उन्हें execute करे तो क्या होगा। फिर एक अशुभ-सी भावना आती है कि शायद इस तरह के war games का परीक्षण पहले से हो रहा हो। कुछ अनुरोध execute करने से पहले चिंता जताने और पुष्टि माँगने वाला एक reverse failsafe भी चाहिए होगा।
इससे Ender’s Game की याद आती है, जहाँ वे एक बच्चे को यह सोचकर कंप्यूटर गेम खिलाते हैं कि वह सिर्फ खेल रहा है, जबकि उससे एक alien जाति का विनाश करा देते हैं।
अप्रैल 2017 का Nvidia का "GeForce GTX G-Assist" मजाक शायद जल्द ही सच हो सकता है।
यह देखकर हैरानी होती है कि वे 2019 से Transformer-XL का उपयोग कर रहे हैं — मुझे नहीं पता था कि अब भी XLNet जैसी architecture इस्तेमाल करने वाले लोग हैं।

Google SIMA - 3D वर्चुअल वातावरणों के लिए जनरेटिव AI एजेंट

वीडियो गेम्स से सीखना

SIMA: एक बहुमुखी AI एजेंट

गेम्स और अन्य वातावरणों में सामान्यीकरण

AI एजेंट रिसर्च में प्रगति

GN⁺ की राय

संबंधित पढ़ाई

1 टिप्पणियां

Hacker News की राय