1. DeepMind टीम ने घोषणा की कि उसने हाइरार्किकल पॉलिसी आर्किटेक्चर और रियल-टाइम adaptation तकनीक का उपयोग करके रोबोट टेबल टेनिस एजेंट को शौकिया इंसानों के स्तर की प्रतिस्पर्धी क्षमता तक पहुंचा दिया है।
  2. इस रोबोट को zero-shot simulation-to-reality transfer (sim-to-real), वास्तविक मैच adaptation, और असल मानव प्रतिद्वंद्वियों के साथ मैच परीक्षण के जरिए सत्यापित किया गया।
  3. परिणामस्वरूप, इसने शुरुआती खिलाड़ियों के खिलाफ 100% और मध्य-स्तर के खिलाड़ियों के खिलाफ 55% जीत दर दिखाई, जिससे स्पष्ट रूप से मध्य-स्तर के मानव के बराबर प्रतिस्पर्धी प्रदर्शन सिद्ध हुआ।

1. शोध की पृष्ठभूमि और योगदान

  • टेबल टेनिस एक जटिल खेल है जिसमें रणनीति और हाई-स्पीड motor control दोनों की एक साथ आवश्यकता होती है, इसलिए यह रोबोट के लिए मानव-स्तर की चुनौती पेश करता है।

  • पिछला शोध केवल साधारण rally तक सीमित था, और वास्तविक इंसानों के साथ प्रतिस्पर्धी मैच खेलना इस शोध में पहली बार दिखाया गया है

  • इस शोध के योगदान इस प्रकार हैं:

    • हाइरार्किकल पॉलिसी आर्किटेक्चर (HLC + LLC)
    • zero-shot sim-to-real transfer तकनीक
    • रियल-टाइम प्रतिद्वंद्वी adaptation सिस्टम
    • 29 वास्तविक मानव खिलाड़ियों के साथ user evaluation experiment

2. सिस्टम संरचना और प्रशिक्षण विधि

  • निचला कंट्रोलर (LLC) में विशिष्ट कौशलों (forehand, backhand, serve आदि) के लिए विशेषीकृत पॉलिसी और skill descriptor होते हैं।
  • ऊपरी कंट्रोलर (HLC) मैच की स्थिति, प्रतिद्वंद्वी के आँकड़े, और प्रत्येक LLC की विशेषताओं को ध्यान में रखकर उपयुक्त कौशल चुनता है।
  • प्रशिक्षण प्रक्रिया प्रारंभिक मानव डेटा → simulation → वास्तविक मैच अनुप्रयोग → iterative learning के क्रम में चलती है, जिससे स्वचालित curriculum learning संरचना बनती है।

3. प्रदर्शन मूल्यांकन और सीमाओं का विश्लेषण

  • कुल 29 मानव खिलाड़ियों के साथ, जिनकी क्षमता अलग-अलग थी, मैच खेले गए:

    • शुरुआती: 100% जीत
    • मध्य-स्तर: 55% जीत
    • उन्नत स्तर और उससे ऊपर: सभी मैच हारे
      → कुल जीत दर: 45% (मैच आधार पर), 46% (सेट आधार पर)
  • गुणात्मक मूल्यांकन में प्रतिभागियों ने इसे “मज़ेदार और इमर्सिव” बताया, और औसतन 5 मिनट में से 4 मिनट से अधिक समय स्वेच्छा से खेला।

  • कमियाँ:

    • underspin को संभालने में कमजोरी
    • नीची आती गेंदों पर प्रतिक्रिया में कठिनाई
      → यह टेबल टेनिस टेबल से टकराव से बचाव और spin estimation की कठिनाइयों के कारण है, जो आगे सुधार के विषय हैं

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.