- research और commercial use, दोनों के लिए उपलब्ध open source large language model
- Llama 1 की तुलना में 40% अधिक, 2 ट्रिलियन token data पर train किया गया
- 2 गुना context length: 4096
- तीन model sizes: 7B, 13B, 70B
- inference, coding, proficiency और knowledge test सहित कई benchmarks में अन्य open source language models (MPT, Falcon, Llama-1) से बेहतर performance
- public data sources पर train किया गया, और fine-tuned Llama-2-chat भी public instruction sets और 10 लाख से अधिक human annotations का उपयोग करता है
- Reinforcement Learning from Human Feedback (RLHF) का उपयोग। इसमें Rejection Sampling और Proximal Policy Optimization (PPO) शामिल हैं
- download में शामिल चीजें
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card
1 टिप्पणियां
Hacker News राय