- 128K context length, 8 भाषाओं का समर्थन, और 405B मॉडल जोड़ा गया (8B, 70B, 405B)
- open source instruction-tuned AI मॉडल, जिन्हें कोई भी fine-tune, refine कर सकता है और कहीं भी deploy कर सकता है
- नया जारी किया गया 405B मॉडल MMLU (general), Human Eval (coding), GSM8K (math) benchmarks में GPT-4o के लगभग बराबर या उससे बेहतर स्तर तक पहुँचा
- flexibility और control के मामले में शीर्ष स्तर का AI मॉडल
- community को synthetic data generation और model distillation जैसे नए workflows का उपयोग करने में सक्षम बनाता है
- 15 ट्रिलियन से अधिक tokens का उपयोग करके train किया गया, और 16,000 से अधिक H100 GPU का इस्तेमाल किया गया
- upgraded 70B मॉडल अधिकांश benchmarks में GPT-3.5 Turbo से काफी आगे निकलता है
3 टिप्पणियां
वाह, 405B को चलाने के लिए GPU को कैसे configure करना होगा, यही सोच रहा हूँ।
405B शायद सीधे fine-tuning या serving के लिए नहीं लगता। CEO ने distillation का कई बार ज़िक्र किया है, इसलिए लगता है कि यह teacher मॉडल के रूप में हल्के मॉडलों की गुणवत्ता बढ़ाने वाली fine-tuning के काम के लिए हो सकता है.
Hacker News की राय
Llama 3.1 मॉडल्स के प्रदर्शन में सुधार हुआ है
GPT-4o और Llama 3.1 405B मॉडल की तुलना
Groq.com पर बेहद कम latency के साथ नए मॉडल्स से बात की जा सकती है
सही hardware का उपयोग किया जाए तो घर पर भी GPT-4o से टक्कर लेने वाला LLM चलाया जा सकता है
Ollama, Huggingface, Groq आदि पर मॉडल्स को लोकल में चलाया जा सकता है
Ollama पर 70B वर्ज़न चलाकर देखा गया और नतीजा बहुत अच्छा था
Claude 3.5 Sonnet coding tasks के लिए बहुत अच्छा है
open source मॉडल्स की pricing को लेकर सवाल