• Eureka, LLM (GPT-4) का उपयोग करके ऐसे reward algorithm (software code) अपने-आप जनरेट करता है, जो रोबोट को जटिल कार्य करने के लिए train करते हैं
  • इसने रोबोटिक हाथ को इंसानों की तरह "पेन घुमाने" का कौशल train किया
  • इसके अलावा Eureka रोबोट को दराज़ और कैबिनेट खोलना, गेंद फेंकना और पकड़ना, तथा कैंची चलाने जैसे काम भी सिखाता है
  • task-specific prompt या पहले से परिभाषित reward template की ज़रूरत नहीं होती, और इसमें human feedback को आसानी से शामिल किया जा सकता है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.