• Mistral 3 श्रृंखला में 3B, 8B, 14B के छोटे मॉडल और 41B सक्रिय पैरामीटर तथा 675B कुल पैरामीटर वाले Mistral Large 3 के साथ अगली पीढ़ी का ओपन सोर्स AI मॉडल परिवार मौजूद है।
  • सभी मॉडल Apache 2.0 लाइसेंस के तहत सार्वजनिक किए गए हैं, जिससे डेवलपर्स और कंपनियाँ इन्हें स्वतंत्र रूप से उपयोग और कस्टमाइज़ कर सकती हैं।
  • Mistral Large 3 ने NVIDIA H200 GPU 3000 पर प्रशिक्षण के लिए Mixture-of-Experts आर्किटेक्चर अपनाया है और मल्टीलिंगुअल बातचीत और इमेज समझ में शीर्ष स्तर का प्रदर्शन हासिल किया है।
  • Ministral 3 को एज (edge) उपयोग के लिए डिज़ाइन किया गया है, जो बेहतर लागत-प्रति-प्रदर्शन देती है, और इसका reasoning वेरिएंट मॉडल ने AIME ‘25 में 85% सटीकता दर्ज की।
  • Mistral 3 को Mistral AI Studio, Hugging Face, AWS, Azure जैसे मुख्य प्लेटफ़ॉर्म पर तुरंत उपयोग किया जा सकता है, और इसका लक्ष्य ओपन AI इकोसिस्टम का विस्तार करना है।

Mistral 3 अवलोकन

  • Mistral 3, Mistral AI की अगली पीढ़ी की मॉडल परिवार है, जिसमें छोटे dense मॉडल (3B, 8B, 14B) और बड़ा sparse मॉडल Mistral Large 3 शामिल है।
    • Mistral Large 3 एक Mixture-of-Experts (MoE) संरचना है जिसमें 41B सक्रिय पैरामीटर और 675B कुल पैरामीटर हैं।
    • सभी मॉडल Apache 2.0 लाइसेंस के तहत सार्वजनिक हैं, इसलिए ओपनसोर्स समुदाय इन्हें उपयोग कर सकता है।
  • मॉडल कई कम्प्रेशन फॉर्मैट में उपलब्ध हैं, जिससे डिस्ट्रिब्यूटेड इंटेलिजेंस के जरिए पहुँच आसान होती है।
  • Ministral मॉडल परिवार को लागत के मुकाबले सर्वश्रेष्ठ प्रदर्शन अनुपात वाला OSS मॉडल माना जाता है।

Mistral Large 3: ओपन-वेट्स आधारित शीर्ष मॉडल

  • Mistral Large 3 एक ओपन-वेट्स मॉडल है, जिसे NVIDIA H200 GPU 3000 से शुरू से प्रशिक्षण दिया गया है।
    • Mixtral श्रृंखला के बाद का पहला Mixture-of-Experts मॉडल, जो Mistral के पूर्व-प्रशिक्षण (pre-training) तकनीकी विकास को दर्शाता है।
  • प्रशिक्षण के बाद, सामान्य प्रॉम्प्ट परफॉर्मेंस में यह शीर्ष ओपन-वेट्स मॉडलों के बराबर प्रदर्शन देता है, और इमेज समझ तथा अंग्रेज़ी के बाहर की मल्टीलिंगुअल बातचीत में भी उत्कृष्ट परिणाम देता है।
  • LMArena लीडरबोर्ड में OSS non-reasoning मॉडल 2nd, कुल OSS मॉडल 6th स्थान।
  • बेस (base) और इनस्ट्रक्ट (instruct) ट्यूनिंग संस्करण जारी किए गए हैं, जबकि reasoning संस्करण जल्द लॉन्च होने वाला है

NVIDIA·vLLM·Red Hat के साथ सहयोग

  • Mistral Large 3 को ओपनसोर्स समुदाय में आसानी से उपलब्ध कराने के लिए vLLM और Red Hat के साथ काम किया गया है।
    • llm-compressor से बने NVFP4 फॉर्मैट चेकपॉइंट उपलब्ध कराए गए हैं।
    • vLLM के जरिए Blackwell NVL72, 8×A100, 8×H100 सिस्टम पर कुशल निष्पादन संभव है।
  • NVIDIA के साथ मिलकर TensorRT-LLM, SGLang आदि में लो-प्रिसिशन इनफरेंस (low-precision inference) को सपोर्ट किया गया है।
    • इसमें Blackwell attention और MoE kernels, prefill/decode अलग-अलग सर्विंग, तथा speculative decoding फीचर जोड़े गए हैं।
  • DGX Spark, RTX PC, Jetson डिवाइस जैसे edge वातावरणों के लिए भी ऑप्टिमाइज़्ड डिप्लॉयमेंट सपोर्ट उपलब्ध है।

Ministral 3: एज के लिए इंटेलिजेंट मॉडल

  • एज और लोकल वातावरण के लिए Ministral 3 श्रृंखला को 3B, 8B और 14B की तीन साइज में उपलब्ध कराया गया है।
    • हर मॉडल के base, instruct, reasoning तीनों वेरिएंट उपलब्ध हैं।
    • सभी वेरिएंट में इमेज समझ और बहुभाषी प्रोसेसिंग की क्षमता शामिल है।
  • लागत-प्रति-प्रदर्शन में यह शीर्ष OSS मॉडल है, और instruct मॉडल प्रतिस्पर्धी मॉडलों के बराबर या बेहतर प्रदर्शन के साथ टोकन खर्च को एक-दसवां कर देता है।
  • reasoning वेरिएंट मॉडल सटीकता-केंद्रित सेटिंग में मजबूत प्रदर्शन दिखाते हैं, और 14B मॉडल ने AIME ‘25 में 85% accuracy हासिल की।

तैनाती और पहुंच

  • Mistral 3 तुरंत इन प्लेटफ़ॉर्म पर उपलब्ध है:
    • Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, Modal, IBM WatsonX, OpenRouter, Fireworks, Unsloth AI, Together AI
    • NVIDIA NIM और AWS SageMaker पर जल्द उपलब्ध होने वाला है।
  • उद्यमों के लिए कस्टम मॉडल ट्रेनिंग सेवा उपलब्ध है।
    • डोमेन-विशिष्ट काम, प्राइवेट डाटासेट पर प्रदर्शन सुधार, और स्पेशलाइज़्ड एन्वायरनमेंट डिप्लॉयमेंट का समर्थन।

Mistral 3 का मुख्य मूल्य

  • फ्रंटियर परफॉर्मेंस और ओपन एक्सेस: क्लोज्ड मॉडल के स्तर का प्रदर्शन ओपन सोर्स में उपलब्ध।
  • मल्टीमोडल और मल्टीलिंगुअल सपोर्ट: 40 से अधिक भाषाओं में टेक्स्ट, इमेज और लॉजिकल अंडरस्टैंडिंग।
  • स्केलेबल दक्षता: 3B से 675B पैरामीटर रेंज तक, एज से लेकर एंटरप्राइज तक कवरेज।
  • एडैप्टिव उपयोगिता: कोडिंग, डॉक्यूमेंट एनालिसिस, टूल-इंटीग्रेशन आदि कई वर्कफ़्लो में लागू।

आगे के चरण

  • मॉडल डॉक्यूमेंट्स और टेक्निकल रिसोर्स Mistral Docs तथा AI Governance Hub पर उपलब्ध हैं।
  • Hugging Face और Mistral AI प्लेटफ़ॉर्म के जरिए तुरंत API उपयोग संभव।
  • एंटरप्राइज कस्टम ट्रेनिंग और फाइन-ट्यूनिंग के लिए पूछताछ चैनल उपलब्ध।
  • समुदाय से जुड़ाव Twitter/X, Discord, GitHub पर संभव।

निष्कर्ष

  • Mistral 3 का लक्ष्य पारदर्शिता, एक्सेसिबिलिटी और सहयोगी विकास के आधार पर ओपन AI इकोसिस्टम को आगे बढ़ाना है।
  • reasoning, efficiency और वास्तविक-world अनुप्रयोग में नए अवसर खोलते हुए यह “समझ को एक्शन में बदलने वाला” अगली पीढ़ी का ओपन मॉडल बनकर उभरेगा।

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.