DeepMind ने AlphaGo और AlphaZero के मुख्य तत्व को open source में जारी किया
(twitter.com/DrJimFan)- यह
Mctx(MCTS-in-JAX)नाम के Repo के अंदर मौजूद है - Monte Carlo Tree Search(MCTS) algorithm को JAX-native रूप में implement करने वाली बेहद तेज़ library
- turn-based गेम्स में "चयन → विस्तार → simulation → strategy tree node update" तरीके से सबसे अच्छा move चुनने वाला search algorithm
- यह AlphaGo का सबसे जटिल component है, और इसे efficient बनाना बेहद महत्वपूर्ण है
- इसका उपयोग सिर्फ AlphaGo में ही नहीं, बल्कि AlphaZero(Go, Chess, Shogi) और MuZero(AlphaZero + Atari गेम्स) में भी होता है
1 टिप्पणियां
मैंने यह ट्वीट खुद HN पर देखा था: https://news.ycombinator.com/item?id=34801636
असल में यह Repo सार्वजनिक हुए लगभग 1 साल हो चुका है, और कुछ टिप्पणियों में इसकी आलोचना भी है कि यह पूरा AlphaGo नहीं है, तो क्या यह शीर्षक भ्रामक नहीं है।
यह भी कहा जा रहा है कि मूल AlphaGo का implementation tensorflow/TPU पर है, और यह सिर्फ उसका JAX में पुनःimplementation है।