19 पॉइंट द्वारा xguru 2023-07-19 | 3 टिप्पणियां | WhatsApp पर शेयर करें
  • research और commercial, दोनों उपयोगों के लिए उपलब्ध open source large language model
  • Llama 1 की तुलना में 40% अधिक, 2 ट्रिलियन token data पर train किया गया
  • 2 गुना context length: 4096
  • तीन model sizes: 7B, 13B, 70B
  • reasoning, coding, proficiency और knowledge test सहित कई benchmark में अन्य open source language models (MPT, Falcon, Llama-1) से बेहतर प्रदर्शन
  • सार्वजनिक data sources पर train किया गया, और fine-tuned Llama-2-chat भी सार्वजनिक instruction sets तथा 10 लाख से अधिक human annotations का उपयोग करता है
  • download में शामिल चीज़ें
    • Model code
    • Model Weights
    • README (User Guide)
    • Responsible Use Guide
    • License
    • Acceptable Use Policy
    • Model Card

3 टिप्पणियां

 
kuroneko 2023-07-19

क्या इस बार भी कोई "जनहित" के मकसद से torrent magnet जारी कर देगा?

 
tpdns90321 2023-07-19

इस बार इसकी ज़रूरत नहीं, सीधे जारी किया गया है

 
xguru 2023-07-19

क्षेत्र के हिसाब से फर्क है, लेकिन आकलन लगभग GPT-3.5 के करीब या उससे भी बेहतर आ रहे हैं.

यह पूरी तरह open जैसा लगता है, लेकिन एक अहम पाबंदी है. अगर कोई "7 अरब MAU से अधिक वाली सेवा" है, तो उसे Meta से लाइसेंस मांगना होगा, और Meta मना भी कर सकता है.

लगता है जैसे कह रहे हों, "Google, TikTok तुम लोग मत इस्तेमाल करो!"

Microsoft ने तेजी दिखाते हुए Llama 2 को Azure पर इस्तेमाल के लिए उपलब्ध करा दिया है.
https://blogs.microsoft.com/blog/2023/…

लगता है Microsoft, OpenAI के साथ भी और Meta के साथ भी, अच्छे रिश्ते बनाए हुए है.