Yi - अगली पीढ़ी का ओपन सोर्स द्विभाषी LLM
(github.com/01-ai)- डेवलपर्स द्वारा शुरुआत से प्रशिक्षित अगली पीढ़ी का ओपन सोर्स large language model
- द्विभाषी मॉडल के लक्ष्य के साथ 3T बहुभाषी corpus पर प्रशिक्षित, और language understanding, common-sense reasoning, reading comprehension जैसी क्षमताओं में मजबूत प्रदर्शन दिखाता है
- 6B और 34B pre-trained language models पर आधारित, और chatbot model, 200K long-context model, depth upscaling model, vision-language model तक विस्तारित
- Yi-34B-Chat मॉडल
- AlpacaEval leaderboard में GPT-4 Turbo के बाद दूसरे स्थान पर रहा और अन्य LLMs को पीछे छोड़ा
- अंग्रेज़ी और चीनी दोनों में मौजूदा open source models से बेहतर प्रदर्शन करता है और विभिन्न benchmarks में पहला स्थान प्राप्त करता है
- Llama जैसी ही model architecture अपनाता है, लेकिन यह Llama का derived model नहीं है. Llama के weights का उपयोग नहीं करता
- विभिन्न sizes में उपलब्ध है, और specific requirements के अनुसार मॉडल को fine-tune किया जा सकता है
- chat models
- Yi-34B-Chat, Yi-34B-Chat-4bits, Yi-34B-Chat-8bits
- Yi-6B-Chat, Yi-6B-Chat-4bits, Yi-6B-Chat-8bits
- base models
- Yi-34B, Yi-34B-200K
- Yi-9B
- Yi-6B, Yi-6B-200K
- chat models
1 टिप्पणियां
Hacker News प्रतिक्रियाएँ