- मॉडल अपलोड करने पर उपयोगकर्ता मूल्यांकन करते हैं — यह दुनिया की पहली ओपन कम्युनिटी चैलेंज है
- 10 जून को Season 1 Episode 1 शुरू होगा, और 12 हफ्तों तक $250k का पुरस्कार दिया जाएगा
- प्रतियोगिता का तरीका
- 170M उपयोगकर्ता-जनित signals पर सीधे प्रशिक्षित Chai Reward Model (GPT-2) को open source के रूप में जारी किया गया है
- इस मॉडल का उपयोग offline evaluation में किया जा सकता है या RLHF pipeline के हिस्से के रूप में integrate किया जा सकता है
- language model training में लागत बहुत अधिक आती है, इसलिए ताकि कोई भी प्रतियोगिता में भाग ले सके, विभिन्न base models पर प्रयोग करने की योजना है
- अपलोड किए गए मॉडल के लिए internal AI Safety Classifier से यह जांचा जाएगा कि उसे deploy किया जा सकता है या नहीं, और फिर user A/B testing के लिए सार्वजनिक किया जाएगा
- लगभग 10 लाख से अधिक वास्तविक उपयोगकर्ता मूल्यांकन करेंगे
1 टिप्पणियां
Super Saiyan और Fusion से मिले हुए जैसा Llama का इमेज काफ़ी प्रभावशाली है।