शतरंज ग्रैंडमास्टर स्तर बिना किसी एल्गोरिद्म के
- यह repository "शतरंज ग्रैंडमास्टर स्तर बिना किसी एल्गोरिद्म के" नामक शोधपत्र का implementation प्रदान करती है
- हाल की machine learning सफलताएँ मुख्य रूप से बड़े attention-आधारित architecture और अभूतपूर्व पैमाने के dataset की वजह से संभव हुई हैं
- यह शोधपत्र शतरंज के लिए बड़े पैमाने के training के प्रभाव की जाँच करता है
- पारंपरिक chess engine के विपरीत, यह जटिल heuristic या explicit search पर निर्भर नहीं करता
- 27 करोड़ parameters वाले transformer model को 1 करोड़ chess games के dataset पर supervised learning से प्रशिक्षित किया गया
- Stockfish 16 engine के action values का उपयोग करके हर board पर annotation किया गया, जिससे लगभग 15 अरब data points तैयार हुए
- सबसे बड़े model ने मनुष्यों के खिलाफ Lichess blitz Elo 2895 दर्ज किया और explicit search एल्गोरिद्म के बिना भी कठिन chess puzzles हल किए
- इसने AlphaZero के policy और value network (बिना search) तथा GPT-3.5-turbo-instruct को पीछे छोड़ा
- model और dataset size की व्यवस्थित जाँच से दिखाया गया कि मज़बूत chess performance केवल पर्याप्त scale पर ही उभरती है
- परिणामों को सत्यापित करने के लिए design choices और hyperparameters पर व्यापक प्रयोग किए गए
GN⁺ का सार
- यह project एक महत्वपूर्ण शोध है जो दिखाता है कि शतरंज में पारंपरिक search एल्गोरिद्म के बिना भी उच्च performance हासिल की जा सकती है
- बड़े dataset और transformer model का उपयोग करके यह chess engine की नई संभावनाओं की खोज करता है
- AlphaZero जैसे मौजूदा शक्तिशाली chess engine की तुलना में यह बेहतर performance दिखाता है
- यह शतरंज में रुचि रखने वालों के लिए रोचक और उपयोगी जानकारी देता है, और machine learning के नए application की संभावनाएँ प्रस्तुत करता है
- समान विशेषताओं वाले project में AlphaZero और Leela Chess Zero शामिल हैं
1 टिप्पणियां
Hacker News राय
मनचाहे स्तर का शतरंज प्रतिद्वंद्वी ढूंढना मुश्किल है। ज़्यादातर इंजन search depth कम करके कठिनाई घटाते हैं, लेकिन यह प्रभावी नहीं होता
एक उपयोगकर्ता ने शतरंज से जुड़े knowledge distillation पर प्रस्तुति दी थी, जिसमें बताया गया कि जटिल non-linear search फ़ंक्शन को शतरंज जैसे standard input के लिए quasi-linear transformer model में कैसे distill किया जा सकता है
शतरंज neural network में रुचि रखने वालों के लिए, PyTorch का उपयोग करने वाला आसान code और मौजूदा सर्वश्रेष्ठ प्रदर्शन वाले शतरंज neural network जैसी architecture देने वाला एक GitHub repository सुझाया गया है
LC0 network और DeepMind के transformer network की तुलना करने वाली एक blog post मौजूद है
"Grandmaster-Level Chess Without Search" पेपर बड़े attention-based architecture और dataset के महत्व पर ज़ोर देता है, और शतरंज सीखने के लिए 270M parameter transformer model का उपयोग करता है
बड़ा synthetic dataset पारंपरिक search का उपयोग करके बनाया गया था, जो transformer model में search tree को encode करने जैसा है
Matthew Sadler ने Leela Zero को intuitive तरीके से खेलने के लिए सेट किया था, और इसने search के बिना भी प्रभावी रूप से training games खेले
शतरंज को solve करने पर बहुत बड़ा tree बनता है, और इसे optimize करने के लिए दो approaches हैं
FEN string को fixed-length string में बदलकर board state encode की जाती है, और actions को store करने के लिए UCI notation का उपयोग किया जाता है