Meta Llama 3.2 जारी - ओपन कस्टमाइज़ेबल मॉडल के साथ edge AI और vision को बदलने वाली तकनीक
(ai.meta.com)-
Meta ने Llama 3.2 जारी किया
- इसमें छोटे और मध्यम vision LLMs (11B और 90B) तथा हल्के text-only मॉडल (1B और 3B) शामिल हैं
- Qualcomm और MediaTek हार्डवेयर पर उपलब्ध है और Arm प्रोसेसर के लिए optimized है
- ऐसे मॉडल जो summary, instruction following, और rewriting कार्यों के लिए उपयुक्त हैं
-
Llama 3.2 मॉडल की विशेषताएँ
- 11B और 90B vision मॉडल image understanding कार्यों में उत्कृष्ट हैं
- torchtune का उपयोग कर custom applications के लिए fine-tuning संभव
- torchchat का उपयोग कर local deployment संभव
- Meta AI smart assistant के माध्यम से उपयोग किया जा सकता है
-
Llama Stack deployment
- single-node, on-premises, cloud, और on-device वातावरण में Llama मॉडलों के साथ काम को सरल बनाता है
- AWS, Databricks, Dell Technologies, Fireworks, Infosys, Together AI के साथ सहयोग में deployment
-
Llama 3.2 मॉडल डाउनलोड
- llama.com और Hugging Face से डाउनलोड किया जा सकता है
- AMD, AWS, Databricks, Dell, Google Cloud, Groq, IBM, Intel, Microsoft Azure, NVIDIA, Oracle Cloud, Snowflake आदि partner platforms पर तुरंत development संभव
-
Llama 3.2 का प्रदर्शन
- 11B और 90B मॉडल document-level understanding, image captioning, और visual grounding कार्यों के लिए उपयुक्त हैं
- 1B और 3B मॉडल multilingual text generation और tool calling capabilities प्रदान करते हैं
- local पर चलाने पर तुरंत response और उच्च privacy बनाए रखते हैं
-
मॉडल मूल्यांकन
- 150 से अधिक benchmark datasets पर प्रदर्शन का मूल्यांकन
- Claude 3 Haiku और GPT4o-mini के साथ प्रतिस्पर्धी प्रदर्शन
-
Vision मॉडल
- image input support के लिए नया model architecture पेश किया गया
- text-only क्षमताओं को बनाए रखते हुए image और text prompts को जोड़कर गहरी understanding और reasoning संभव
-
हल्के मॉडल
- pruning और knowledge distillation methods का उपयोग कर 1B और 3B मॉडल विकसित किए गए
- local पर कुशलतापूर्वक चलाए जा सकते हैं
-
Llama Stack deployment
- Llama Stack API के माध्यम से standardized interface प्रदान करता है
- विभिन्न वातावरणों में Llama मॉडलों के साथ काम को सरल बनाता है
-
System-level safety
- Llama Guard 3 11B Vision जारी किया गया
- Llama Guard 3 1B मॉडल deployment cost को काफी कम करता है
-
Llama 3.2 का उपयोग
- डेवलपर्स को आवश्यक tools और resources प्रदान करता है
- Llama 3.2 और Llama Stack का उपयोग कर innovative applications विकसित किए जा सकते हैं
GN⁺ की संक्षिप्त समीक्षा
- Llama 3.2 edge और mobile devices पर चलने वाले हल्के मॉडलों सहित विभिन्न vision और text मॉडल प्रदान करता है
- Qualcomm, MediaTek, Arm आदि के साथ सहयोग के माध्यम से विभिन्न हार्डवेयर पर optimized performance प्रदान करता है
- Llama Stack deployment के जरिए डेवलपर्स को विभिन्न वातावरणों में आसानी से Llama मॉडल उपयोग करने में मदद मिलती है
- Llama 3.2 उच्च privacy और तुरंत response प्रदान करता है, इसलिए यह local applications के विकास के लिए उपयुक्त है
- यह Claude 3 Haiku और GPT4o-mini के साथ प्रतिस्पर्धा करने लायक प्रदर्शन देता है और विभिन्न benchmarks में उत्कृष्ट परिणाम साबित करता है
1 टिप्पणियां
Hacker News राय
नए 1B मॉडल के प्रदर्शन से हैरानी हुई। डाउनलोड साइज 1.3GB है
"The Llama jumped over the ______!" उदाहरण में 1-hot encoding के साथ "wall" 100% संभावना के साथ सही उत्तर है
Meta की Llama टीम की openness से प्रभावित हूँ। सिर्फ मॉडल access ही नहीं, बल्कि इसे कैसे बनाया गया यह भी सार्वजनिक किया गया है
शुरुआती सवाल: ऐसा मॉडल चाहिए जिसमें software engineer की क्षमता 10 गुना हो, लेकिन मानवीय ज्ञान की ज़रूरत न हो। क्या ऐसा कोई मॉडल है?
Ollama में 3B मॉडल इस्तेमाल किया। optics, biology, और Rust पर सवालों के जवाब तेज़ी से देता है और इसमें काफी ज्ञान है
Ollama ब्लॉग पोस्ट: लिंक
llama3.2:3b-instruct-q8_0 मॉडल 3.1 8b-q4 से बेहतर प्रदर्शन देता है। MacBook Pro M1 पर यह तेज़ भी है और नतीजे भी बेहतर हैं
क्या Ollama के लिए किसी web UI client की सिफारिश कर सकते हैं?
पूछा गया कि क्या नवीनतम LLM benchmarks वाला कोई leaderboard है
3B मॉडल multimodal (Norwegian) में काफ़ी अच्छा था, लेकिन कभी-कभी बहुत सारे बेमतलब जवाब देता है। यह 8B से अधिक संवेदनशील है, लेकिन Gemma 2 2B से अधिक उपयोगी है