- Mistral Large एक अत्याधुनिक टेक्स्ट जनरेशन मॉडल है, जिसमें शीर्ष स्तर की reasoning क्षमता है
- यह कई भाषाओं में जटिल reasoning कार्य कर सकता है और टेक्स्ट समझने, रूपांतरण करने, और कोड जनरेट करने में इस्तेमाल किया जा सकता है
- MMLU benchmark में इसने मजबूत प्रदर्शन दिखाया है, और API के माध्यम से सामान्य रूप से उपलब्ध मॉडलों में यह दुनिया का दूसरा सबसे उच्च रैंक वाला मॉडल है
- GPT-4 86.4% के बाद 81.2%, Claude 2 78.5%, Gemini Pro 71.8%
Mistral Large की नई खूबियां और ताकत
- यह अंग्रेज़ी, फ़्रेंच, स्पैनिश, जर्मन और इटालियन में native स्तर की दक्षता रखता है, और व्याकरण व सांस्कृतिक संदर्भ की सूक्ष्म समझ प्रदान करता है
- 32K token context window के ज़रिए बड़े दस्तावेज़ों में सटीक information recall संभव है
- सटीक निर्देशों का पालन करने की क्षमता डेवलपर्स को अपनी moderation policies डिज़ाइन करने देती है, और यही le Chat की system-level moderation settings में उपयोग होती है
- इसमें function calling की सुविधा अंतर्निहित है, जो la Plateforme में लागू restricted output mode के साथ मिलकर बड़े पैमाने पर application development और tech stack modernization को संभव बनाती है
Microsoft के साथ partnership के ज़रिए Azure पर मॉडल उपलब्ध
- Mistral का लक्ष्य अग्रणी AI को सार्वभौमिक बनाना है, और इसके लिए यह Azure पर open और commercial models उपलब्ध करा रहा है
- Mistral के मॉडल La Plateforme और Azure के माध्यम से उपयोग किए जा सकते हैं, और इन्हें सीधे उपयोगकर्ता के environment में deploy भी किया जा सकता है
- La Plateforme को Mistral के यूरोपीय infrastructure पर सुरक्षित रूप से host किया गया है, जबकि Azure के माध्यम से यह Azure AI Studio और Azure Machine Learning में उपलब्ध है
- self-deployment सबसे संवेदनशील use cases के लिए model weights तक पहुंच देता है, और अधिक जानकारी के लिए success stories पढ़ी जा सकती हैं और टीम से संपर्क किया जा सकता है
Mistral Large की क्षमताएं
- Mistral Large standard benchmarks में अग्रणी LLM मॉडलों की तुलना में मजबूत reasoning क्षमता दिखाता है
- multilingual क्षमता में भी Mistral Large, फ़्रेंच, जर्मन, स्पैनिश और इटालियन में LLaMA 2 70B से काफी आगे है
- coding और math कार्यों में भी यह शीर्ष स्तर का प्रदर्शन दिखाता है
नया Mistral Small, low-latency workloads के लिए optimized
- Mistral Large के साथ, latency और cost के लिए optimized नए मॉडल Mistral Small को भी लॉन्च किया गया है
- Mistral Small, Mixtral 8x7B से बेहतर प्रदर्शन और कम latency देता है, और open-weight offerings तथा flagship models के बीच एक परिष्कृत मध्यवर्ती समाधान है
- Mistral Small, Mistral Large जैसी ही RAG enablement और function calling innovations का उपयोग करता है
- यह प्रतिस्पर्धी कीमत वाले open-weight endpoints और नए optimized model endpoints प्रदान करता है, जिससे performance/cost trade-off पर व्यापक दृष्टि मिलती है
JSON format और function calling
- JSON format mode यह सुनिश्चित करता है कि language model output वैध JSON हो
- function calling के ज़रिए डेवलपर्स अपने tool sets को Mistral endpoints से जोड़ सकते हैं, जिससे internal code, API या database के साथ अधिक जटिल interaction संभव होता है
- function calling और JSON format केवल mistral-small और mistral-large में उपलब्ध हैं, और जल्द ही सभी endpoints के लिए formatting support जोड़ा जाएगा
GN⁺ की राय
- Mistral Large एक AI language model है जिसमें multilingual support और advanced reasoning क्षमता है, और इसकी कई भाषाओं में जटिल कार्य करने की क्षमता विशेष रूप से उल्लेखनीय है.
- इस मॉडल में GPT-4 जैसे मौजूदा मॉडलों के साथ प्रतिस्पर्धा करने की क्षमता है, और खासकर कई भाषाओं के समर्थन से इसकी global market में उपयोगिता बढ़ती है.
- Azure के साथ partnership, Mistral AI के मॉडलों को अधिक व्यापक user base तक पहुंचाने का अवसर देती है, और cloud-based AI services की scalability और accessibility को मजबूत करती है.
- Mistral Small जैसे optimized मॉडलों की लॉन्चिंग, उन कंपनियों के लिए आकर्षक विकल्प हो सकती है जिन्हें cost-efficient और low-latency AI solutions की ज़रूरत है.
- JSON format और function calling सुविधाएं डेवलपर्स को AI मॉडलों को अपने applications के साथ अधिक आसानी से integrate करने देती हैं, जिससे AI तकनीक की practical utility और flexibility बढ़ती है.
1 टिप्पणियां
Hacker News की राय
मार्केटिंग सामग्री की ईमानदारी की सराहना की गई। बाज़ार के अग्रणी उत्पाद से कम benchmark स्कोर दिखाना, Google द्वारा benchmark को चुनिंदा तरीके से इस्तेमाल करने से बेहतर माना गया।
यह राय भी थी कि उन्होंने पहले ही बहुत काम किया है, लेकिन open source community में योगदान देने के अपने वादे की फिर से पुष्टि करने वाली बात भी होती तो अच्छा होता। इसे उनकी brand पहचान का एक प्रमुख हिस्सा माना गया था।
miquप्रकरण के बाद अधिक open weights आने की उम्मीद के साथ नज़र रखी गई, लेकिन लगता है कि नतीजों का इंतज़ार करना होगा।बदलावों का अपडेट: API endpoint नाम बदले गए और model endpoint जोड़े गए, नए model जारी किए गए, और मौजूदा models के अपडेट तथा नियोजित deprecation की सूचना दी गई।
नई API सुविधाएँ: Mistral Small और Mistral Large models में function calling और JSON mode का उपयोग संभव है।
La Plateforme: multi-currency payment system जोड़ा गया और enterprise platform features पेश किए गए।
Le Chat: Mistral models के साथ आसानी से इंटरैक्ट करने के लिए नया chat interface जारी किया गया।
नए model को LLM CLI tool के plugin में जोड़ दिया गया। अब इसे इस तरह इस्तेमाल किया जा सकता है।
Le Chat का इस्तेमाल करके आज आई कुछ coding समस्याएँ हल करके देखीं, और इसने ChatGPT (GPT-4 सहित) से कहीं बेहतर जवाब दिए। यह निश्चित नहीं है कि कुछ लोगों के कहने के अनुसार लागत घटाने के लिए ChatGPT की गुणवत्ता गिराई गई है या नहीं, लेकिन इन कुछ समस्याओं में Mistral के जवाबों की गुणवत्ता कहीं बेहतर थी।
Le Chat के अस्तित्व के बारे में पता नहीं था। Mistral का उपयोग करने वाला ChatGPT प्रतिद्वंद्वी चाहिए था, और product name के आगे "le" लगाया जाना भी पसंद आया।
Azure पर Mistral, GPT-4 से थोड़ा सस्ता है।
यह सवाल उठाया गया कि open weights को लेकर सारा शोर क्या अब ख़त्म हो चुका है, और क्या यह आगे भी बंद ही रहेगा।
parameter size की जानकारी कहीं भी नहीं है; यह जानबूझकर है या कुछ छूट गया है, इस पर सवाल किया गया।
यह कुछ-कुछ ऐसा है जैसे कई interchangeable CPU architectures मौजूद हों। हर नए LLM के आने पर यह उम्मीद बनती है कि monopolies और कम होंगी, इसलिए स्थिति बेहतर होगी। open source models के बिना भी OpenAI अपना मिशन पहले ही पूरा कर चुका लगता है।