Mistral 3 मॉडल परिवार का लॉन्च
(mistral.ai)- Mistral 3 श्रृंखला में 3B, 8B, 14B के छोटे मॉडल और 41B सक्रिय पैरामीटर तथा 675B कुल पैरामीटर वाले Mistral Large 3 के साथ अगली पीढ़ी का ओपन सोर्स AI मॉडल परिवार मौजूद है।
- सभी मॉडल Apache 2.0 लाइसेंस के तहत सार्वजनिक किए गए हैं, जिससे डेवलपर्स और कंपनियाँ इन्हें स्वतंत्र रूप से उपयोग और कस्टमाइज़ कर सकती हैं।
- Mistral Large 3 ने NVIDIA H200 GPU 3000 पर प्रशिक्षण के लिए Mixture-of-Experts आर्किटेक्चर अपनाया है और मल्टीलिंगुअल बातचीत और इमेज समझ में शीर्ष स्तर का प्रदर्शन हासिल किया है।
- Ministral 3 को एज (edge) उपयोग के लिए डिज़ाइन किया गया है, जो बेहतर लागत-प्रति-प्रदर्शन देती है, और इसका reasoning वेरिएंट मॉडल ने AIME ‘25 में 85% सटीकता दर्ज की।
- Mistral 3 को Mistral AI Studio, Hugging Face, AWS, Azure जैसे मुख्य प्लेटफ़ॉर्म पर तुरंत उपयोग किया जा सकता है, और इसका लक्ष्य ओपन AI इकोसिस्टम का विस्तार करना है।
Mistral 3 अवलोकन
- Mistral 3, Mistral AI की अगली पीढ़ी की मॉडल परिवार है, जिसमें छोटे dense मॉडल (3B, 8B, 14B) और बड़ा sparse मॉडल Mistral Large 3 शामिल है।
- Mistral Large 3 एक Mixture-of-Experts (MoE) संरचना है जिसमें 41B सक्रिय पैरामीटर और 675B कुल पैरामीटर हैं।
- सभी मॉडल Apache 2.0 लाइसेंस के तहत सार्वजनिक हैं, इसलिए ओपनसोर्स समुदाय इन्हें उपयोग कर सकता है।
- मॉडल कई कम्प्रेशन फॉर्मैट में उपलब्ध हैं, जिससे डिस्ट्रिब्यूटेड इंटेलिजेंस के जरिए पहुँच आसान होती है।
- Ministral मॉडल परिवार को लागत के मुकाबले सर्वश्रेष्ठ प्रदर्शन अनुपात वाला OSS मॉडल माना जाता है।
Mistral Large 3: ओपन-वेट्स आधारित शीर्ष मॉडल
- Mistral Large 3 एक ओपन-वेट्स मॉडल है, जिसे NVIDIA H200 GPU 3000 से शुरू से प्रशिक्षण दिया गया है।
- Mixtral श्रृंखला के बाद का पहला Mixture-of-Experts मॉडल, जो Mistral के पूर्व-प्रशिक्षण (pre-training) तकनीकी विकास को दर्शाता है।
- प्रशिक्षण के बाद, सामान्य प्रॉम्प्ट परफॉर्मेंस में यह शीर्ष ओपन-वेट्स मॉडलों के बराबर प्रदर्शन देता है, और इमेज समझ तथा अंग्रेज़ी के बाहर की मल्टीलिंगुअल बातचीत में भी उत्कृष्ट परिणाम देता है।
- LMArena लीडरबोर्ड में OSS non-reasoning मॉडल 2nd, कुल OSS मॉडल 6th स्थान।
- बेस (base) और इनस्ट्रक्ट (instruct) ट्यूनिंग संस्करण जारी किए गए हैं, जबकि reasoning संस्करण जल्द लॉन्च होने वाला है।
NVIDIA·vLLM·Red Hat के साथ सहयोग
- Mistral Large 3 को ओपनसोर्स समुदाय में आसानी से उपलब्ध कराने के लिए vLLM और Red Hat के साथ काम किया गया है।
- llm-compressor से बने NVFP4 फॉर्मैट चेकपॉइंट उपलब्ध कराए गए हैं।
- vLLM के जरिए Blackwell NVL72, 8×A100, 8×H100 सिस्टम पर कुशल निष्पादन संभव है।
- NVIDIA के साथ मिलकर TensorRT-LLM, SGLang आदि में लो-प्रिसिशन इनफरेंस (low-precision inference) को सपोर्ट किया गया है।
- इसमें Blackwell attention और MoE kernels, prefill/decode अलग-अलग सर्विंग, तथा speculative decoding फीचर जोड़े गए हैं।
- DGX Spark, RTX PC, Jetson डिवाइस जैसे edge वातावरणों के लिए भी ऑप्टिमाइज़्ड डिप्लॉयमेंट सपोर्ट उपलब्ध है।
Ministral 3: एज के लिए इंटेलिजेंट मॉडल
- एज और लोकल वातावरण के लिए Ministral 3 श्रृंखला को 3B, 8B और 14B की तीन साइज में उपलब्ध कराया गया है।
- हर मॉडल के base, instruct, reasoning तीनों वेरिएंट उपलब्ध हैं।
- सभी वेरिएंट में इमेज समझ और बहुभाषी प्रोसेसिंग की क्षमता शामिल है।
- लागत-प्रति-प्रदर्शन में यह शीर्ष OSS मॉडल है, और instruct मॉडल प्रतिस्पर्धी मॉडलों के बराबर या बेहतर प्रदर्शन के साथ टोकन खर्च को एक-दसवां कर देता है।
- reasoning वेरिएंट मॉडल सटीकता-केंद्रित सेटिंग में मजबूत प्रदर्शन दिखाते हैं, और 14B मॉडल ने AIME ‘25 में 85% accuracy हासिल की।
तैनाती और पहुंच
- Mistral 3 तुरंत इन प्लेटफ़ॉर्म पर उपलब्ध है:
- Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, Modal, IBM WatsonX, OpenRouter, Fireworks, Unsloth AI, Together AI
- NVIDIA NIM और AWS SageMaker पर जल्द उपलब्ध होने वाला है।
- उद्यमों के लिए कस्टम मॉडल ट्रेनिंग सेवा उपलब्ध है।
- डोमेन-विशिष्ट काम, प्राइवेट डाटासेट पर प्रदर्शन सुधार, और स्पेशलाइज़्ड एन्वायरनमेंट डिप्लॉयमेंट का समर्थन।
Mistral 3 का मुख्य मूल्य
- फ्रंटियर परफॉर्मेंस और ओपन एक्सेस: क्लोज्ड मॉडल के स्तर का प्रदर्शन ओपन सोर्स में उपलब्ध।
- मल्टीमोडल और मल्टीलिंगुअल सपोर्ट: 40 से अधिक भाषाओं में टेक्स्ट, इमेज और लॉजिकल अंडरस्टैंडिंग।
- स्केलेबल दक्षता: 3B से 675B पैरामीटर रेंज तक, एज से लेकर एंटरप्राइज तक कवरेज।
- एडैप्टिव उपयोगिता: कोडिंग, डॉक्यूमेंट एनालिसिस, टूल-इंटीग्रेशन आदि कई वर्कफ़्लो में लागू।
आगे के चरण
- मॉडल डॉक्यूमेंट्स और टेक्निकल रिसोर्स Mistral Docs तथा AI Governance Hub पर उपलब्ध हैं।
- Hugging Face और Mistral AI प्लेटफ़ॉर्म के जरिए तुरंत API उपयोग संभव।
- एंटरप्राइज कस्टम ट्रेनिंग और फाइन-ट्यूनिंग के लिए पूछताछ चैनल उपलब्ध।
- समुदाय से जुड़ाव Twitter/X, Discord, GitHub पर संभव।
निष्कर्ष
- Mistral 3 का लक्ष्य पारदर्शिता, एक्सेसिबिलिटी और सहयोगी विकास के आधार पर ओपन AI इकोसिस्टम को आगे बढ़ाना है।
- reasoning, efficiency और वास्तविक-world अनुप्रयोग में नए अवसर खोलते हुए यह “समझ को एक्शन में बदलने वाला” अगली पीढ़ी का ओपन मॉडल बनकर उभरेगा।
1 टिप्पणियां
Hacker News राय
मैं phrasing.app में large language models (LLM) का उपयोग करके डेटा को एक समान फ़ॉर्मैट में व्यवस्थित करता हूँ
कुछ महीने पहले मैंने mistral-3-medium-0525 पर स्विच किया, क्योंकि gpt-5 अक्सर अजीब आउटपुट देता था
Mistral तेज़ है, सस्ता है, और फ़ॉर्मैट निर्देशों का सटीक पालन करता है। बेंचमार्क की तुलना में वास्तविक उपयोग में यह कहीं बेहतर है
बहुत कम मामलों में (0.1%) यह अजीब परिणाम देता है, लेकिन gpt-5 की 15% विफलता दर की तुलना में यह कहीं अधिक स्थिर है
मैं जल्द ही नए मॉडलों को भी टेस्ट करके नतीजे साझा करूँगा
API में सबसे बड़ा फ़ायदा यही लगता है कि मॉडल उम्मीद के मुताबिक काम करता है
अब मैं Openrouter के ज़रिए ज़रूरत के हिसाब से मॉडल चुनकर इस्तेमाल कर रहा हूँ
मेरा मानना है कि हाल में ad-supported chatbots के बढ़ने की वजह यह है कि बेंचमार्क के उलट, असली users को अंतर महसूस नहीं होता और वे paid subscriptions रद्द कर देते हैं
आज भी OpenAI ने एक महीने का free trial ऑफ़र किया, मानो उसे याद ही न हो कि मैं दो महीने पहले भी इसका उपयोग कर चुका हूँ
खासकर mistral-small को batch API के साथ इस्तेमाल करने पर cost-performance बहुत अच्छा मिलता है
overfitting वास्तविक उपयोगिता को कम कर सकता है, और Chatbot Arena भी ऐसे ही practical-use evaluation की वजह से बना था
लेकिन उस पर भी यह आलोचना है कि वह फ़ॉर्मैट मिलाने या चापलूसी जैसे तत्वों की ओर झुक जाता है
अंत में, मुझे लगता है कि task-specific specialized models की ज़्यादा ज़रूरत है
लेकिन phrasing.app का “Hand-crafted by humans” वाला वाक्यांश थोड़ा विडंबनापूर्ण लगा, क्योंकि वास्तव में वह advanced LLM का उपयोग कर रहा है
क्या आपने Mistral की error rate की तुलना gpt-5.1 की complex tasks में failure rate से की है?
और क्या Mistral के पास Tool Use model भी है? अगर कोई नया coding model आए तो अच्छा लगेगा
यह दिलचस्प है कि नया बड़ा मॉडल DeepseekV2 architecture का उपयोग करता है
आधिकारिक पेज पर इसका ज़िक्र नहीं है, लेकिन open source models का नए structures अपनाना अच्छी बात है
K2 ने भी ऐसा ही approach लिया था, और वास्तविक code (
mistral_large_3.py) देखें तो यह DeepseekV3 पर आधारित है“विज्ञान हमेशा openness और sharing पर आगे बढ़ता है” — इस अर्थ में ऐसी पारदर्शिता अच्छी लगती है
अब मैं घर पर 14B मॉडल को टेस्ट करने वाला हूँ, और Vision feature जुड़ने से भी उत्साहित हूँ
Hugging Face पेज पर भी साफ़ लिखा है कि Mistral Large 3 multimodal tasks में Vision-specialized models से पीछे है
यह चौंकाने वाला है कि 3B Vision model सीधे browser में चल रहा है
3GB मॉडल डाउनलोड करने के बाद यह तुरंत चल सकता है, और Hugging Face demo भी है
Simon Willison की पोस्ट भी देखने लायक है
मैं ऐसी सुविधा की कल्पना कर सकता हूँ जो सिर्फ़ आवाज़ ही नहीं, बल्कि वीडियो में हो रही गतिविधियों को भी समझाकर बताए
यूरोप की Mistral को इतने समय बाद फिर सक्रिय देखकर अच्छा लगा
Apache 2.0 license के साथ open source में वापसी भी सकारात्मक है
कुछ समय तक consumer GPU के लिए छोटे मॉडलों में यह सबसे अच्छा था, और उम्मीद है कि इस बार Ministral 14B भी बेंचमार्क जितना अच्छा निकले
अगर यह केवल यूरोप के भीतर होता, तो इस स्तर की AI training funding मिलना मुश्किल था
नए मॉडल अच्छे हैं, लेकिन OpenAI·Google·Anthropic जैसे SOTA मॉडलों से तुलना न होना थोड़ा खलता है
इसलिए इसकी overall position समझना मुश्किल है
top model 1491 points पर है, जबकि Mistral 1418 पर, यानी performance gap छोटा है
GPT-OSS से भी तुलना न करना थोड़ा conservative move लगता है
मैं यूरोप की कोशिशों का समर्थन करता हूँ
सच कहूँ तो ऐसा लगा कि Deepseek 3.2 ने कल सारी चर्चा अपनी ओर खींच ली
अफ़सोस है कि इस बार तुलना Deepseek 3.1 के आधार पर की गई
आधिकारिक समाचार के अनुसार 3.2 में बड़ा सुधार हुआ है
अच्छे model weights public करने का incentive अभी भी मेरी समझ से बाहर है
OpenAI अगर gpt-oss जैसे benchmark models जारी कर रहा है तो शायद वह PR के लिए हो,
और लगता है कि चीनी कंपनियाँ भी अमेरिकी big tech की स्थिति हिलाने के लिए ऐसी ही रणनीति अपना रही हैं
मुझे संदेह है कि आगे भी अच्छे open-weight models लगातार आते रहेंगे या नहीं
open weights enterprise fine-tuning services जैसे secondary revenue channels खोल देते हैं
transparency, control, privacy, और cost reduction enterprise के लिए महत्वपूर्ण हैं
इसलिए लंबे समय में यह open ecosystem closed models की हिस्सेदारी खा सकता है
संबंधित सेवाओं के लिए Mistral Custom Model Training देखें
Kaggle की AIME3 competition में भी यह ऊपर बना हुआ है
open models जारी करने से valuation तेज़ी से बढ़ती है और GPU हासिल करना आसान होता है
लेकिन अगर अंततः sustainable business model नहीं निकलता, तो यह बड़ी समस्या होगी
Gemini बेंचमार्क में आगे है, लेकिन वास्तविक उपयोगिता कमज़ोर लगती है
मैंने कई मॉडलों के aggregate benchmark scores की तुलना की
Gemini 3.0 Pro 84.8 के साथ पहले स्थान पर है, DeepSeek 3.2 83.6 पर, और GPT-5.1 69.2 पर
Mistral Large 3 का स्कोर 41.9 है, जो कम है, लेकिन 14B·8B·3B models SOTA स्तर के हैं
और इनमें Qwen3 जैसी censorship issues नहीं हैं
मैं जानना चाहूँगा कि किन क्षेत्रों में Gemini इतना मजबूत है
बेंचमार्क में Gemini सबसे ऊपर है, लेकिन वास्तविक उपयोग में यह ChatGPT या Claude से कमज़ोर लगता है
यह ज़्यादा बकवास करता है, और लगता है कि Google सिर्फ़ benchmark scores बढ़ा रहा है
उम्मीद है कि Mistral जैसे open source इस बाज़ार में हिस्सेदारी ले लेंगे
वे ecosystem के संतुलनकारी तत्व की तरह काम करते हैं और monopoly रोकने में मायने रखते हैं
शायद इसलिए कि यह उसके training data में अच्छी तरह शामिल क्षेत्र था