1 पॉइंट द्वारा GN⁺ 2024-12-25 | 1 टिप्पणियां | WhatsApp पर शेयर करें

कंप्यूटर साइंस > मशीन लर्निंग

  • शीर्षक: Adversarial Policies Beat Superhuman Go AIs
  • लेखक: Tony T. Wang, Adam Gleave, Tom Tseng, Kellin Pelrine, Nora Belrose, Joseph Miller, Michael D. Dennis, Yawen Duan, Viktor Pogrebniak, Sergey Levine, Stuart Russell
  • जमा करने की तिथि: 1 नवम्बर 2022 (v1), अंतिम संशोधन 13 जुलाई 2023 (v4)

सारांश

  • शोधकर्ताओं ने शीर्ष-दर्जे के Go AI सिस्टम KataGo पर विरोधी (adversarial) नीति प्रशिक्षण चलाकर सुपरह्यूमन सेटअप में 97% से अधिक जीत दर हासिल की।
  • विरोधी नीति का उद्देश्य केवल अच्छी तरह गो खेलना नहीं, बल्कि ऐसे खेलना है कि KataGo गंभीर गलती करने पर मजबूर हो जाए।
  • यह हमला अन्य सुपरह्यूमन Go AI पर भी zero-shot स्थानांतरण करता है, और इतना समझने योग्य है कि मानव विशेषज्ञ बिना किसी एल्गोरिदमिक मदद के भी लगातार सुपरह्यूमन AI को हरा सकें।
  • विरोधी प्रशिक्षण वाले KataGo एजेंट में भी यह मुख्य कमजोरी बनी रहती है।
  • परिणाम दिखाते हैं कि सुपरह्यूमन AI सिस्टम भी चौंकाने वाले फेल्योर मोड रख सकते हैं।

अतिरिक्त जानकारी

  • पेपर स्थिति: ICML 2023 में स्वीकृत
  • विषय: Machine Learning (cs.LG); Artificial Intelligence (cs.AI); Cryptography and Security (cs.CR); Machine Learning (stat.ML)
  • ACM वर्गीकरण: I.2.6
  • उद्धरण: arXiv:2211.00241 [cs.LG] (या arXiv:2211.00241v4 [cs.LG] यदि यही संस्करण हो)
  • सबमिशन इतिहास:
    • [v1] 1 नवम्बर 2022
    • [v2] 9 जनवरी 2023
    • [v3] 18 फरवरी 2023
    • [v4] 13 जुलाई 2023

विधि

  • PDF और अन्य फ़ॉर्मेट में पेपर तक पहुँचना
  • संबंधित शोधपत्र और उद्धरण टूल उपलब्ध

arXiv जानकारी

  • arXiv शोध-पत्र साझा करने का एक प्लेटफ़ॉर्म है जो विभिन्न विषयों पर पेपर उपलब्ध कराता है।

1 टिप्पणियां

 
GN⁺ 2024-12-25
Hacker News टिप्पणी
  • एक उपयोगकर्ता ने कहा कि पेपर पहले पढ़ने में चौंका देने वाला लगता है, लेकिन समझने में मुश्किल है। उसे गो और गो AI के बारे में थोड़ा पता है, जबकि शतरंज और शतरंज AI के बारे में काफी जानकारी होने के बाद भी, पेपर में स्पष्टता की कमी और तकनीकी शब्दों की अधिकता के कारण समझना कठिन लगता है।

    • वह मानता है कि शायद यह पेपर अपने आइडिया को छिपा रहा है, जबकि आइडिया काफ़ी सरल और हैरानी पैदा करने वाला हो सकता है।
  • उसने शतरंज के कुछ edge case उदाहरण देकर Stockfish और Lc0 के मूल्यांकन की तुलना की।

    • पहले केस में Stockfish और Lc0 दोनों ने White को थोड़ा-सा बेहतर माना।
    • दूसरे और तीसरे केस में दोनों ने Black के जीतने का अनुमान लगाया।
    • चौथे केस में Lc0 समझ गया, लेकिन Stockfish नहीं समझ पाया।
  • गो में एक amateur खिलाड़ी भी कभी-कभी अप्रत्याशित चालों से चुनौतीपूर्ण प्रतिद्वंद्वी बन सकता है।

    • असामान्य तरह की चालें कभी-कभी असरदार हो सकती हैं।
  • उसने याद दिलाया कि Deep Blue के बाद शतरंज खिलाड़ियों ने कंप्यूटर के खिलाफ अपनी रणनीतियाँ बेहतर बना ली थीं।

    • गो में, क्योंकि स्थान (search space) बड़ा है, इसलिए अधिक एंटी-कम्प्यूटर रणनीतियाँ मौजूद होने की संभावना है।
    • यह मूल्यांकन फंक्शन (evaluation function) की कमजोरियों का उपयोग करने की तरह है।
  • उसने यह भी कहा कि शतरंज में भी अधिक गणना करना जीत में मदद करता है।

    • Elo जीत की माप है, और अगर इसे कठिनाई (difficulty) समझ लिया जाए तो गलत निष्कर्ष निकल सकता है।
  • उसने 2022 से 2023 के बीच संशोधित किए गए पेपर का ज़िक्र करते हुए कहा कि शायद उसने इसे पहले कहीं पढ़ा हो।

    • वह जिज्ञासु था कि यह approach Leela-style के शतरंज इंजन पर कितना प्रभावी है।
  • उसने कहा कि इंसानों के पास भी अभी उम्मीद है।

  • उसका कहना था कि यह पेपर शायद गो AI में adversarial strategy की defense को इंटीग्रेट करने में इस्तेमाल होगा।

    • यह केवल जिज्ञासा नहीं है, बल्कि AI development की व्यापक स्थिति को भी दिखाता है।
  • वह कहता है कि 'हमारे परिणाम दिखाते हैं कि सुपरह्यूमन AI सिस्टम्स के भी हैरान कर देने वाले फेल्योर मोड हो सकते हैं' वाला निष्कर्ष खाली लगता है।

    • इसका भविष्य की 'superintelligence' से कोई सीधा अर्थ नहीं निकलता, और ऐसे 'failure mode' मौजूद भी हो सकते हैं या नहीं भी।