6 पॉइंट द्वारा xguru 2023-05-11 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • मॉडल अपलोड करने पर उपयोगकर्ता मूल्यांकन करते हैं — यह दुनिया की पहली ओपन कम्युनिटी चैलेंज है
  • 10 जून को Season 1 Episode 1 शुरू होगा, और 12 हफ्तों तक $250k का पुरस्कार दिया जाएगा
  • प्रतियोगिता का तरीका
    • 170M उपयोगकर्ता-जनित signals पर सीधे प्रशिक्षित Chai Reward Model (GPT-2) को open source के रूप में जारी किया गया है
    • इस मॉडल का उपयोग offline evaluation में किया जा सकता है या RLHF pipeline के हिस्से के रूप में integrate किया जा सकता है
    • language model training में लागत बहुत अधिक आती है, इसलिए ताकि कोई भी प्रतियोगिता में भाग ले सके, विभिन्न base models पर प्रयोग करने की योजना है
    • अपलोड किए गए मॉडल के लिए internal AI Safety Classifier से यह जांचा जाएगा कि उसे deploy किया जा सकता है या नहीं, और फिर user A/B testing के लिए सार्वजनिक किया जाएगा
    • लगभग 10 लाख से अधिक वास्तविक उपयोगकर्ता मूल्यांकन करेंगे

1 टिप्पणियां

 
xguru 2023-05-11

Super Saiyan और Fusion से मिले हुए जैसा Llama का इमेज काफ़ी प्रभावशाली है।