- research और commercial, दोनों उपयोगों के लिए उपलब्ध open source large language model
- Llama 1 की तुलना में 40% अधिक, 2 ट्रिलियन token data पर train किया गया
- 2 गुना context length: 4096
- तीन model sizes: 7B, 13B, 70B
- reasoning, coding, proficiency और knowledge test सहित कई benchmark में अन्य open source language models (MPT, Falcon, Llama-1) से बेहतर प्रदर्शन
- सार्वजनिक data sources पर train किया गया, और fine-tuned Llama-2-chat भी सार्वजनिक instruction sets तथा 10 लाख से अधिक human annotations का उपयोग करता है
- download में शामिल चीज़ें
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card
3 टिप्पणियां
क्या इस बार भी कोई "जनहित" के मकसद से torrent magnet जारी कर देगा?
इस बार इसकी ज़रूरत नहीं, सीधे जारी किया गया है
क्षेत्र के हिसाब से फर्क है, लेकिन आकलन लगभग GPT-3.5 के करीब या उससे भी बेहतर आ रहे हैं.
यह पूरी तरह open जैसा लगता है, लेकिन एक अहम पाबंदी है. अगर कोई "7 अरब MAU से अधिक वाली सेवा" है, तो उसे Meta से लाइसेंस मांगना होगा, और Meta मना भी कर सकता है.
लगता है जैसे कह रहे हों, "Google, TikTok तुम लोग मत इस्तेमाल करो!"
Microsoft ने तेजी दिखाते हुए Llama 2 को Azure पर इस्तेमाल के लिए उपलब्ध करा दिया है.
https://blogs.microsoft.com/blog/2023/…
लगता है Microsoft, OpenAI के साथ भी और Meta के साथ भी, अच्छे रिश्ते बनाए हुए है.