- Mistral 3 श्रृंखला में 3B, 8B, 14B के छोटे मॉडल और 41B सक्रिय पैरामीटर तथा 675B कुल पैरामीटर वाले Mistral Large 3 के साथ अगली पीढ़ी का ओपन सोर्स AI मॉडल परिवार मौजूद है।
- सभी मॉडल Apache 2.0 लाइसेंस के तहत सार्वजनिक किए गए हैं, जिससे डेवलपर्स और कंपनियाँ इन्हें स्वतंत्र रूप से उपयोग और कस्टमाइज़ कर सकती हैं।
- Mistral Large 3 ने NVIDIA H200 GPU 3000 पर प्रशिक्षण के लिए Mixture-of-Experts आर्किटेक्चर अपनाया है और मल्टीलिंगुअल बातचीत और इमेज समझ में शीर्ष स्तर का प्रदर्शन हासिल किया है।
- Ministral 3 को एज (edge) उपयोग के लिए डिज़ाइन किया गया है, जो बेहतर लागत-प्रति-प्रदर्शन देती है, और इसका reasoning वेरिएंट मॉडल ने AIME ‘25 में 85% सटीकता दर्ज की।
- Mistral 3 को Mistral AI Studio, Hugging Face, AWS, Azure जैसे मुख्य प्लेटफ़ॉर्म पर तुरंत उपयोग किया जा सकता है, और इसका लक्ष्य ओपन AI इकोसिस्टम का विस्तार करना है।
Mistral 3 अवलोकन
- Mistral 3, Mistral AI की अगली पीढ़ी की मॉडल परिवार है, जिसमें छोटे dense मॉडल (3B, 8B, 14B) और बड़ा sparse मॉडल Mistral Large 3 शामिल है।
- Mistral Large 3 एक Mixture-of-Experts (MoE) संरचना है जिसमें 41B सक्रिय पैरामीटर और 675B कुल पैरामीटर हैं।
- सभी मॉडल Apache 2.0 लाइसेंस के तहत सार्वजनिक हैं, इसलिए ओपनसोर्स समुदाय इन्हें उपयोग कर सकता है।
- मॉडल कई कम्प्रेशन फॉर्मैट में उपलब्ध हैं, जिससे डिस्ट्रिब्यूटेड इंटेलिजेंस के जरिए पहुँच आसान होती है।
- Ministral मॉडल परिवार को लागत के मुकाबले सर्वश्रेष्ठ प्रदर्शन अनुपात वाला OSS मॉडल माना जाता है।
Mistral Large 3: ओपन-वेट्स आधारित शीर्ष मॉडल
- Mistral Large 3 एक ओपन-वेट्स मॉडल है, जिसे NVIDIA H200 GPU 3000 से शुरू से प्रशिक्षण दिया गया है।
- Mixtral श्रृंखला के बाद का पहला Mixture-of-Experts मॉडल, जो Mistral के पूर्व-प्रशिक्षण (pre-training) तकनीकी विकास को दर्शाता है।
- प्रशिक्षण के बाद, सामान्य प्रॉम्प्ट परफॉर्मेंस में यह शीर्ष ओपन-वेट्स मॉडलों के बराबर प्रदर्शन देता है, और इमेज समझ तथा अंग्रेज़ी के बाहर की मल्टीलिंगुअल बातचीत में भी उत्कृष्ट परिणाम देता है।
- LMArena लीडरबोर्ड में OSS non-reasoning मॉडल 2nd, कुल OSS मॉडल 6th स्थान।
- बेस (base) और इनस्ट्रक्ट (instruct) ट्यूनिंग संस्करण जारी किए गए हैं, जबकि reasoning संस्करण जल्द लॉन्च होने वाला है।
NVIDIA·vLLM·Red Hat के साथ सहयोग
- Mistral Large 3 को ओपनसोर्स समुदाय में आसानी से उपलब्ध कराने के लिए vLLM और Red Hat के साथ काम किया गया है।
- llm-compressor से बने NVFP4 फॉर्मैट चेकपॉइंट उपलब्ध कराए गए हैं।
- vLLM के जरिए Blackwell NVL72, 8×A100, 8×H100 सिस्टम पर कुशल निष्पादन संभव है।
- NVIDIA के साथ मिलकर TensorRT-LLM, SGLang आदि में लो-प्रिसिशन इनफरेंस (low-precision inference) को सपोर्ट किया गया है।
- इसमें Blackwell attention और MoE kernels, prefill/decode अलग-अलग सर्विंग, तथा speculative decoding फीचर जोड़े गए हैं।
- DGX Spark, RTX PC, Jetson डिवाइस जैसे edge वातावरणों के लिए भी ऑप्टिमाइज़्ड डिप्लॉयमेंट सपोर्ट उपलब्ध है।
Ministral 3: एज के लिए इंटेलिजेंट मॉडल
- एज और लोकल वातावरण के लिए Ministral 3 श्रृंखला को 3B, 8B और 14B की तीन साइज में उपलब्ध कराया गया है।
- हर मॉडल के base, instruct, reasoning तीनों वेरिएंट उपलब्ध हैं।
- सभी वेरिएंट में इमेज समझ और बहुभाषी प्रोसेसिंग की क्षमता शामिल है।
- लागत-प्रति-प्रदर्शन में यह शीर्ष OSS मॉडल है, और instruct मॉडल प्रतिस्पर्धी मॉडलों के बराबर या बेहतर प्रदर्शन के साथ टोकन खर्च को एक-दसवां कर देता है।
- reasoning वेरिएंट मॉडल सटीकता-केंद्रित सेटिंग में मजबूत प्रदर्शन दिखाते हैं, और 14B मॉडल ने AIME ‘25 में 85% accuracy हासिल की।
तैनाती और पहुंच
- Mistral 3 तुरंत इन प्लेटफ़ॉर्म पर उपलब्ध है:
- Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, Modal, IBM WatsonX, OpenRouter, Fireworks, Unsloth AI, Together AI
- NVIDIA NIM और AWS SageMaker पर जल्द उपलब्ध होने वाला है।
- उद्यमों के लिए कस्टम मॉडल ट्रेनिंग सेवा उपलब्ध है।
- डोमेन-विशिष्ट काम, प्राइवेट डाटासेट पर प्रदर्शन सुधार, और स्पेशलाइज़्ड एन्वायरनमेंट डिप्लॉयमेंट का समर्थन।
Mistral 3 का मुख्य मूल्य
- फ्रंटियर परफॉर्मेंस और ओपन एक्सेस: क्लोज्ड मॉडल के स्तर का प्रदर्शन ओपन सोर्स में उपलब्ध।
- मल्टीमोडल और मल्टीलिंगुअल सपोर्ट: 40 से अधिक भाषाओं में टेक्स्ट, इमेज और लॉजिकल अंडरस्टैंडिंग।
- स्केलेबल दक्षता: 3B से 675B पैरामीटर रेंज तक, एज से लेकर एंटरप्राइज तक कवरेज।
- एडैप्टिव उपयोगिता: कोडिंग, डॉक्यूमेंट एनालिसिस, टूल-इंटीग्रेशन आदि कई वर्कफ़्लो में लागू।
आगे के चरण
- मॉडल डॉक्यूमेंट्स और टेक्निकल रिसोर्स Mistral Docs तथा AI Governance Hub पर उपलब्ध हैं।
- Hugging Face और Mistral AI प्लेटफ़ॉर्म के जरिए तुरंत API उपयोग संभव।
- एंटरप्राइज कस्टम ट्रेनिंग और फाइन-ट्यूनिंग के लिए पूछताछ चैनल उपलब्ध।
- समुदाय से जुड़ाव Twitter/X, Discord, GitHub पर संभव।
निष्कर्ष
- Mistral 3 का लक्ष्य पारदर्शिता, एक्सेसिबिलिटी और सहयोगी विकास के आधार पर ओपन AI इकोसिस्टम को आगे बढ़ाना है।
- reasoning, efficiency और वास्तविक-world अनुप्रयोग में नए अवसर खोलते हुए यह “समझ को एक्शन में बदलने वाला” अगली पीढ़ी का ओपन मॉडल बनकर उभरेगा।
अभी कोई टिप्पणी नहीं है.