Meta AI ने Code Llama 70B मॉडल जारी किया
(twitter.com/AIatMeta)- Llama 2 को code-विशेष dataset के साथ अधिक data sampling और लंबे training के जरिए विकसित किया गया, जो code generation के लिए एक high-performance LLM है
- HumanEval में 67.8 स्कोर के साथ यह open models में सबसे बेहतरीन performance दिखाता है
- पिछले license की तरह, इसे research और commercial दोनों उद्देश्यों के लिए इस्तेमाल किया जा सकता है
- 3 मॉडल
- CodeLlama-70B
- CodeLlama-70B-Python
- CodeLlama-70B-Instruct
- अब 4 sizes में उपलब्ध: 7B/13B/34B/70B
4 टिप्पणियां
अगर इसे M2 Max या उससे ऊपर पर लोकल तौर पर चलाया जा सके, तो यह सबसे बेहतरीन toy बन सकता है।
क्वांटाइज़ होने पर शायद यह अच्छी तरह चलेगा। थोड़ा इंतज़ार करें तो शायद आ ही जाएगा।
ऊपर दिया गया लिंक Meta से access request करने का लिंक है, लेकिन Hugging Face पर यह पहले से ही पूरी तरह सार्वजनिक है
https://huggingface.co/codellama
Hacker News की राय