Beyond A*: Transformer का उपयोग करके बेहतर planning
- Transformer models ने कई application क्षेत्रों में बड़ी प्रगति की है, लेकिन जटिल decision-making tasks को हल करने में वे पारंपरिक symbolic planning methods से पीछे रहे हैं.
- शोधकर्ताओं ने Transformer को train करके जटिल planning tasks हल करने की एक विधि प्रस्तुत की है और Searchformer नाम का एक model विकसित किया है, जो पारंपरिक A* search की तुलना में अधिकतम 26.8% कम search steps का उपयोग करते हुए भी पहले कभी न देखी गई Sokoban puzzles को 93.7% मामलों में optimal रूप से हल करता है.
- Searchformer एक encoder-decoder Transformer model है जिसे A* search के व्यवहार की भविष्यवाणी करने के लिए train किया गया है, और expert iteration के माध्यम से fine-tune किया गया है ताकि यह A* search की तुलना में कम search steps लेते हुए भी optimal plans बना सके.
training method और performance
- training method में A* के search behavior को token sequence के रूप में व्यक्त किया जाता है, जो symbolic planning में उन क्षणों को दर्शाता है जब search tree में states जोड़े और हटाए जाते हैं.
- maze navigation पर किए गए ablation study में Searchformer, optimal plan को सीधे predict करने वाले baseline model से बहुत बेहतर प्रदर्शन करता है, जबकि model size 5-10 गुना छोटा है और training dataset 10 गुना छोटा है.
- शोधकर्ताओं ने दिखाया कि Searchformer, Sokoban जैसे बड़े और अधिक जटिल decision-making tasks में solved tasks के अनुपात को बढ़ाने और search behavior को छोटा करने में प्रभावी है.
GN⁺ की राय
- यह शोध artificial intelligence क्षेत्र में Transformer models के नए उपयोग की संभावनाओं को दिखाता है. जटिल decision-making tasks को हल करने में मौजूदा symbolic methods की तुलना में अधिक efficient approach प्रस्तुत करके यह AI के application दायरे को विस्तारित करने वाली एक महत्वपूर्ण प्रगति है.
- Searchformer model कम resources का उपयोग करके अधिक तेज़ और efficient problem-solving क्षमता दिखाता है. यह विशेष रूप से resource-constrained environments में AI को लागू करते समय बड़ा लाभ हो सकता है.
- यह शोध संकेत देता है कि AI तकनीक की प्रगति केवल अधिक data और बड़े models पर निर्भर हुए बिना भी, अधिक बुद्धिमान methodologies और algorithms में सुधार के माध्यम से हासिल की जा सकती है. sustainability और efficiency के दृष्टिकोण से यह AI research के लिए बहुत रोचक और उपयोगी approach है.
1 टिप्पणियां
Hacker News की राय