कंप्यूटर साइंस > मशीन लर्निंग
- शीर्षक: Adversarial Policies Beat Superhuman Go AIs
- लेखक: Tony T. Wang, Adam Gleave, Tom Tseng, Kellin Pelrine, Nora Belrose, Joseph Miller, Michael D. Dennis, Yawen Duan, Viktor Pogrebniak, Sergey Levine, Stuart Russell
- जमा करने की तिथि: 1 नवम्बर 2022 (v1), अंतिम संशोधन 13 जुलाई 2023 (v4)
सारांश
- शोधकर्ताओं ने शीर्ष-दर्जे के Go AI सिस्टम KataGo पर विरोधी (adversarial) नीति प्रशिक्षण चलाकर सुपरह्यूमन सेटअप में 97% से अधिक जीत दर हासिल की।
- विरोधी नीति का उद्देश्य केवल अच्छी तरह गो खेलना नहीं, बल्कि ऐसे खेलना है कि KataGo गंभीर गलती करने पर मजबूर हो जाए।
- यह हमला अन्य सुपरह्यूमन Go AI पर भी zero-shot स्थानांतरण करता है, और इतना समझने योग्य है कि मानव विशेषज्ञ बिना किसी एल्गोरिदमिक मदद के भी लगातार सुपरह्यूमन AI को हरा सकें।
- विरोधी प्रशिक्षण वाले KataGo एजेंट में भी यह मुख्य कमजोरी बनी रहती है।
- परिणाम दिखाते हैं कि सुपरह्यूमन AI सिस्टम भी चौंकाने वाले फेल्योर मोड रख सकते हैं।
अतिरिक्त जानकारी
- पेपर स्थिति: ICML 2023 में स्वीकृत
- विषय: Machine Learning (cs.LG); Artificial Intelligence (cs.AI); Cryptography and Security (cs.CR); Machine Learning (stat.ML)
- ACM वर्गीकरण: I.2.6
- उद्धरण: arXiv:2211.00241 [cs.LG] (या arXiv:2211.00241v4 [cs.LG] यदि यही संस्करण हो)
- सबमिशन इतिहास:
- [v1] 1 नवम्बर 2022
- [v2] 9 जनवरी 2023
- [v3] 18 फरवरी 2023
- [v4] 13 जुलाई 2023
विधि
- PDF और अन्य फ़ॉर्मेट में पेपर तक पहुँचना
- संबंधित शोधपत्र और उद्धरण टूल उपलब्ध
arXiv जानकारी
- arXiv शोध-पत्र साझा करने का एक प्लेटफ़ॉर्म है जो विभिन्न विषयों पर पेपर उपलब्ध कराता है।
1 टिप्पणियां
Hacker News टिप्पणी
एक उपयोगकर्ता ने कहा कि पेपर पहले पढ़ने में चौंका देने वाला लगता है, लेकिन समझने में मुश्किल है। उसे गो और गो AI के बारे में थोड़ा पता है, जबकि शतरंज और शतरंज AI के बारे में काफी जानकारी होने के बाद भी, पेपर में स्पष्टता की कमी और तकनीकी शब्दों की अधिकता के कारण समझना कठिन लगता है।
उसने शतरंज के कुछ edge case उदाहरण देकर Stockfish और Lc0 के मूल्यांकन की तुलना की।
गो में एक amateur खिलाड़ी भी कभी-कभी अप्रत्याशित चालों से चुनौतीपूर्ण प्रतिद्वंद्वी बन सकता है।
उसने याद दिलाया कि Deep Blue के बाद शतरंज खिलाड़ियों ने कंप्यूटर के खिलाफ अपनी रणनीतियाँ बेहतर बना ली थीं।
उसने यह भी कहा कि शतरंज में भी अधिक गणना करना जीत में मदद करता है।
उसने 2022 से 2023 के बीच संशोधित किए गए पेपर का ज़िक्र करते हुए कहा कि शायद उसने इसे पहले कहीं पढ़ा हो।
उसने कहा कि इंसानों के पास भी अभी उम्मीद है।
उसका कहना था कि यह पेपर शायद गो AI में adversarial strategy की defense को इंटीग्रेट करने में इस्तेमाल होगा।
वह कहता है कि 'हमारे परिणाम दिखाते हैं कि सुपरह्यूमन AI सिस्टम्स के भी हैरान कर देने वाले फेल्योर मोड हो सकते हैं' वाला निष्कर्ष खाली लगता है।