4 पॉइंट द्वारा GN⁺ 2025-12-03 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Mistral 3 श्रृंखला में 3B, 8B, 14B के छोटे मॉडल और 41B सक्रिय पैरामीटर तथा 675B कुल पैरामीटर वाले Mistral Large 3 के साथ अगली पीढ़ी का ओपन सोर्स AI मॉडल परिवार मौजूद है।
  • सभी मॉडल Apache 2.0 लाइसेंस के तहत सार्वजनिक किए गए हैं, जिससे डेवलपर्स और कंपनियाँ इन्हें स्वतंत्र रूप से उपयोग और कस्टमाइज़ कर सकती हैं।
  • Mistral Large 3 ने NVIDIA H200 GPU 3000 पर प्रशिक्षण के लिए Mixture-of-Experts आर्किटेक्चर अपनाया है और मल्टीलिंगुअल बातचीत और इमेज समझ में शीर्ष स्तर का प्रदर्शन हासिल किया है।
  • Ministral 3 को एज (edge) उपयोग के लिए डिज़ाइन किया गया है, जो बेहतर लागत-प्रति-प्रदर्शन देती है, और इसका reasoning वेरिएंट मॉडल ने AIME ‘25 में 85% सटीकता दर्ज की।
  • Mistral 3 को Mistral AI Studio, Hugging Face, AWS, Azure जैसे मुख्य प्लेटफ़ॉर्म पर तुरंत उपयोग किया जा सकता है, और इसका लक्ष्य ओपन AI इकोसिस्टम का विस्तार करना है।

Mistral 3 अवलोकन

  • Mistral 3, Mistral AI की अगली पीढ़ी की मॉडल परिवार है, जिसमें छोटे dense मॉडल (3B, 8B, 14B) और बड़ा sparse मॉडल Mistral Large 3 शामिल है।
    • Mistral Large 3 एक Mixture-of-Experts (MoE) संरचना है जिसमें 41B सक्रिय पैरामीटर और 675B कुल पैरामीटर हैं।
    • सभी मॉडल Apache 2.0 लाइसेंस के तहत सार्वजनिक हैं, इसलिए ओपनसोर्स समुदाय इन्हें उपयोग कर सकता है।
  • मॉडल कई कम्प्रेशन फॉर्मैट में उपलब्ध हैं, जिससे डिस्ट्रिब्यूटेड इंटेलिजेंस के जरिए पहुँच आसान होती है।
  • Ministral मॉडल परिवार को लागत के मुकाबले सर्वश्रेष्ठ प्रदर्शन अनुपात वाला OSS मॉडल माना जाता है।

Mistral Large 3: ओपन-वेट्स आधारित शीर्ष मॉडल

  • Mistral Large 3 एक ओपन-वेट्स मॉडल है, जिसे NVIDIA H200 GPU 3000 से शुरू से प्रशिक्षण दिया गया है।
    • Mixtral श्रृंखला के बाद का पहला Mixture-of-Experts मॉडल, जो Mistral के पूर्व-प्रशिक्षण (pre-training) तकनीकी विकास को दर्शाता है।
  • प्रशिक्षण के बाद, सामान्य प्रॉम्प्ट परफॉर्मेंस में यह शीर्ष ओपन-वेट्स मॉडलों के बराबर प्रदर्शन देता है, और इमेज समझ तथा अंग्रेज़ी के बाहर की मल्टीलिंगुअल बातचीत में भी उत्कृष्ट परिणाम देता है।
  • LMArena लीडरबोर्ड में OSS non-reasoning मॉडल 2nd, कुल OSS मॉडल 6th स्थान।
  • बेस (base) और इनस्ट्रक्ट (instruct) ट्यूनिंग संस्करण जारी किए गए हैं, जबकि reasoning संस्करण जल्द लॉन्च होने वाला है

NVIDIA·vLLM·Red Hat के साथ सहयोग

  • Mistral Large 3 को ओपनसोर्स समुदाय में आसानी से उपलब्ध कराने के लिए vLLM और Red Hat के साथ काम किया गया है।
    • llm-compressor से बने NVFP4 फॉर्मैट चेकपॉइंट उपलब्ध कराए गए हैं।
    • vLLM के जरिए Blackwell NVL72, 8×A100, 8×H100 सिस्टम पर कुशल निष्पादन संभव है।
  • NVIDIA के साथ मिलकर TensorRT-LLM, SGLang आदि में लो-प्रिसिशन इनफरेंस (low-precision inference) को सपोर्ट किया गया है।
    • इसमें Blackwell attention और MoE kernels, prefill/decode अलग-अलग सर्विंग, तथा speculative decoding फीचर जोड़े गए हैं।
  • DGX Spark, RTX PC, Jetson डिवाइस जैसे edge वातावरणों के लिए भी ऑप्टिमाइज़्ड डिप्लॉयमेंट सपोर्ट उपलब्ध है।

Ministral 3: एज के लिए इंटेलिजेंट मॉडल

  • एज और लोकल वातावरण के लिए Ministral 3 श्रृंखला को 3B, 8B और 14B की तीन साइज में उपलब्ध कराया गया है।
    • हर मॉडल के base, instruct, reasoning तीनों वेरिएंट उपलब्ध हैं।
    • सभी वेरिएंट में इमेज समझ और बहुभाषी प्रोसेसिंग की क्षमता शामिल है।
  • लागत-प्रति-प्रदर्शन में यह शीर्ष OSS मॉडल है, और instruct मॉडल प्रतिस्पर्धी मॉडलों के बराबर या बेहतर प्रदर्शन के साथ टोकन खर्च को एक-दसवां कर देता है।
  • reasoning वेरिएंट मॉडल सटीकता-केंद्रित सेटिंग में मजबूत प्रदर्शन दिखाते हैं, और 14B मॉडल ने AIME ‘25 में 85% accuracy हासिल की।

तैनाती और पहुंच

  • Mistral 3 तुरंत इन प्लेटफ़ॉर्म पर उपलब्ध है:
    • Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, Modal, IBM WatsonX, OpenRouter, Fireworks, Unsloth AI, Together AI
    • NVIDIA NIM और AWS SageMaker पर जल्द उपलब्ध होने वाला है।
  • उद्यमों के लिए कस्टम मॉडल ट्रेनिंग सेवा उपलब्ध है।
    • डोमेन-विशिष्ट काम, प्राइवेट डाटासेट पर प्रदर्शन सुधार, और स्पेशलाइज़्ड एन्वायरनमेंट डिप्लॉयमेंट का समर्थन।

Mistral 3 का मुख्य मूल्य

  • फ्रंटियर परफॉर्मेंस और ओपन एक्सेस: क्लोज्ड मॉडल के स्तर का प्रदर्शन ओपन सोर्स में उपलब्ध।
  • मल्टीमोडल और मल्टीलिंगुअल सपोर्ट: 40 से अधिक भाषाओं में टेक्स्ट, इमेज और लॉजिकल अंडरस्टैंडिंग।
  • स्केलेबल दक्षता: 3B से 675B पैरामीटर रेंज तक, एज से लेकर एंटरप्राइज तक कवरेज।
  • एडैप्टिव उपयोगिता: कोडिंग, डॉक्यूमेंट एनालिसिस, टूल-इंटीग्रेशन आदि कई वर्कफ़्लो में लागू।

आगे के चरण

  • मॉडल डॉक्यूमेंट्स और टेक्निकल रिसोर्स Mistral Docs तथा AI Governance Hub पर उपलब्ध हैं।
  • Hugging Face और Mistral AI प्लेटफ़ॉर्म के जरिए तुरंत API उपयोग संभव।
  • एंटरप्राइज कस्टम ट्रेनिंग और फाइन-ट्यूनिंग के लिए पूछताछ चैनल उपलब्ध।
  • समुदाय से जुड़ाव Twitter/X, Discord, GitHub पर संभव।

निष्कर्ष

  • Mistral 3 का लक्ष्य पारदर्शिता, एक्सेसिबिलिटी और सहयोगी विकास के आधार पर ओपन AI इकोसिस्टम को आगे बढ़ाना है।
  • reasoning, efficiency और वास्तविक-world अनुप्रयोग में नए अवसर खोलते हुए यह “समझ को एक्शन में बदलने वाला” अगली पीढ़ी का ओपन मॉडल बनकर उभरेगा।

1 टिप्पणियां

 
GN⁺ 2025-12-03
Hacker News राय
  • मैं phrasing.app में large language models (LLM) का उपयोग करके डेटा को एक समान फ़ॉर्मैट में व्यवस्थित करता हूँ
    कुछ महीने पहले मैंने mistral-3-medium-0525 पर स्विच किया, क्योंकि gpt-5 अक्सर अजीब आउटपुट देता था
    Mistral तेज़ है, सस्ता है, और फ़ॉर्मैट निर्देशों का सटीक पालन करता है। बेंचमार्क की तुलना में वास्तविक उपयोग में यह कहीं बेहतर है
    बहुत कम मामलों में (0.1%) यह अजीब परिणाम देता है, लेकिन gpt-5 की 15% विफलता दर की तुलना में यह कहीं अधिक स्थिर है
    मैं जल्द ही नए मॉडलों को भी टेस्ट करके नतीजे साझा करूँगा

    • पहले मैं कई chatbot subscriptions लेता था, लेकिन अब Grok, ChatGPT, Gemini, Deepseek, Mistral को बारी-बारी से इस्तेमाल करता हूँ
      API में सबसे बड़ा फ़ायदा यही लगता है कि मॉडल उम्मीद के मुताबिक काम करता है
      अब मैं Openrouter के ज़रिए ज़रूरत के हिसाब से मॉडल चुनकर इस्तेमाल कर रहा हूँ
      मेरा मानना है कि हाल में ad-supported chatbots के बढ़ने की वजह यह है कि बेंचमार्क के उलट, असली users को अंतर महसूस नहीं होता और वे paid subscriptions रद्द कर देते हैं
      आज भी OpenAI ने एक महीने का free trial ऑफ़र किया, मानो उसे याद ही न हो कि मैं दो महीने पहले भी इसका उपयोग कर चुका हूँ
    • मेरा अनुभव भी ऐसा ही रहा। Mistral मॉडल बेंचमार्क में सबसे ऊपर नहीं हैं, लेकिन classification या summarization जैसे सरल कामों में सबसे अधिक efficient हैं
      खासकर mistral-small को batch API के साथ इस्तेमाल करने पर cost-performance बहुत अच्छा मिलता है
    • मुझे लगता है कि LLM को बेंचमार्क से आँकने के तरीके की सीमाएँ हैं
      overfitting वास्तविक उपयोगिता को कम कर सकता है, और Chatbot Arena भी ऐसे ही practical-use evaluation की वजह से बना था
      लेकिन उस पर भी यह आलोचना है कि वह फ़ॉर्मैट मिलाने या चापलूसी जैसे तत्वों की ओर झुक जाता है
      अंत में, मुझे लगता है कि task-specific specialized models की ज़्यादा ज़रूरत है
    • Mistral मॉडल के use cases साझा करने के लिए धन्यवाद
      लेकिन phrasing.app का “Hand-crafted by humans” वाला वाक्यांश थोड़ा विडंबनापूर्ण लगा, क्योंकि वास्तव में वह advanced LLM का उपयोग कर रहा है
    • क्या आपका मतलब है कि gpt-5 15% संभावना से अजीब आउटपुट देता है?
      क्या आपने Mistral की error rate की तुलना gpt-5.1 की complex tasks में failure rate से की है?
      और क्या Mistral के पास Tool Use model भी है? अगर कोई नया coding model आए तो अच्छा लगेगा
  • यह दिलचस्प है कि नया बड़ा मॉडल DeepseekV2 architecture का उपयोग करता है
    आधिकारिक पेज पर इसका ज़िक्र नहीं है, लेकिन open source models का नए structures अपनाना अच्छी बात है
    K2 ने भी ऐसा ही approach लिया था, और वास्तविक code (mistral_large_3.py) देखें तो यह DeepseekV3 पर आधारित है
    “विज्ञान हमेशा openness और sharing पर आगे बढ़ता है” — इस अर्थ में ऐसी पारदर्शिता अच्छी लगती है
    अब मैं घर पर 14B मॉडल को टेस्ट करने वाला हूँ, और Vision feature जुड़ने से भी उत्साहित हूँ

    • आखिरकार ऐसा लगता है कि R&D का ज़्यादातर हिस्सा Deepseek की नकल पर गया, और एकमात्र अतिरिक्त feature Vision पर कम ध्यान दिया गया
      Hugging Face पेज पर भी साफ़ लिखा है कि Mistral Large 3 multimodal tasks में Vision-specialized models से पीछे है
    • सच कहूँ तो आजकल मुझे लगता है कि architecture differences से ज़्यादा data, tuning, और pipeline model performance तय करते हैं
    • हर चीज़ को public करने की माँग करना, और फिर वही public चीज़ इस्तेमाल होने पर उसकी आलोचना करना, मुझे double standard लगता है
  • यह चौंकाने वाला है कि 3B Vision model सीधे browser में चल रहा है
    3GB मॉडल डाउनलोड करने के बाद यह तुरंत चल सकता है, और Hugging Face demo भी है
    Simon Willison की पोस्ट भी देखने लायक है

    • ऐसी तकनीक से दृष्टिबाधित लोगों के लिए real-time video description tool जैसे accessibility tools बनाए जा सकते हैं
      मैं ऐसी सुविधा की कल्पना कर सकता हूँ जो सिर्फ़ आवाज़ ही नहीं, बल्कि वीडियो में हो रही गतिविधियों को भी समझाकर बताए
  • यूरोप की Mistral को इतने समय बाद फिर सक्रिय देखकर अच्छा लगा
    Apache 2.0 license के साथ open source में वापसी भी सकारात्मक है
    कुछ समय तक consumer GPU के लिए छोटे मॉडलों में यह सबसे अच्छा था, और उम्मीद है कि इस बार Ministral 14B भी बेंचमार्क जितना अच्छा निकले

    • सच कहूँ तो मुझे लगता है कि यह उपलब्धि अमेरिकी VC funding की वजह से संभव हुई
      अगर यह केवल यूरोप के भीतर होता, तो इस स्तर की AI training funding मिलना मुश्किल था
  • नए मॉडल अच्छे हैं, लेकिन OpenAI·Google·Anthropic जैसे SOTA मॉडलों से तुलना न होना थोड़ा खलता है
    इसलिए इसकी overall position समझना मुश्किल है

    • LMArena results देखें तो Mistral Large 3 28वें स्थान पर है, और top models से इसका score gap बहुत बड़ा नहीं है
      top model 1491 points पर है, जबकि Mistral 1418 पर, यानी performance gap छोटा है
    • लेकिन लगता है कि ऐसी तुलना advertising regulations में फँस सकती है, इसलिए कंपनियाँ इससे बचती हैं
    • वैसे भी Mistral को शायद पता होगा कि closed models से सीधे मुकाबला करना मुश्किल है
      GPT-OSS से भी तुलना न करना थोड़ा conservative move लगता है
    • मुझे लगता है कि comparison results न प्रकाशित करना ही बहुत कुछ कह देता है
  • मैं यूरोप की कोशिशों का समर्थन करता हूँ

    • लेकिन यह नहीं भूलना चाहिए कि यूरोप में भी लंदन का DeepMind जैसे सक्रिय AI research केंद्र हैं
    • संतुलन के लिए मैं “Windows 11 अमेरिका की महानतम रचना है” वाला मज़ाक जोड़ना चाहूँगा
  • सच कहूँ तो ऐसा लगा कि Deepseek 3.2 ने कल सारी चर्चा अपनी ओर खींच ली
    अफ़सोस है कि इस बार तुलना Deepseek 3.1 के आधार पर की गई
    आधिकारिक समाचार के अनुसार 3.2 में बड़ा सुधार हुआ है

  • अच्छे model weights public करने का incentive अभी भी मेरी समझ से बाहर है
    OpenAI अगर gpt-oss जैसे benchmark models जारी कर रहा है तो शायद वह PR के लिए हो,
    और लगता है कि चीनी कंपनियाँ भी अमेरिकी big tech की स्थिति हिलाने के लिए ऐसी ही रणनीति अपना रही हैं
    मुझे संदेह है कि आगे भी अच्छे open-weight models लगातार आते रहेंगे या नहीं

    • क्योंकि closed models से पैसा कमाना मुश्किल है
      open weights enterprise fine-tuning services जैसे secondary revenue channels खोल देते हैं
      transparency, control, privacy, और cost reduction enterprise के लिए महत्वपूर्ण हैं
      इसलिए लंबे समय में यह open ecosystem closed models की हिस्सेदारी खा सकता है
      संबंधित सेवाओं के लिए Mistral Custom Model Training देखें
    • gpt-oss सिर्फ़ benchmark model नहीं है, बल्कि वास्तव में math problem solving में बहुत मजबूत है
      Kaggle की AIME3 competition में भी यह ऊपर बना हुआ है
    • अभी revenue model स्पष्ट नहीं है, इसलिए AI कंपनियाँ सबसे अच्छे मॉडल बनाने से ज़्यादा VC funding हासिल करने पर ध्यान दे रही हैं
      open models जारी करने से valuation तेज़ी से बढ़ती है और GPU हासिल करना आसान होता है
      लेकिन अगर अंततः sustainable business model नहीं निकलता, तो यह बड़ी समस्या होगी
    • gpt-oss की tool calling performance बेहतरीन है और कुल मिलाकर यह स्थिर है
    • Google के बारे में यह मजबूत धारणा है कि वह benchmarks को manipulate करता है
      Gemini बेंचमार्क में आगे है, लेकिन वास्तविक उपयोगिता कमज़ोर लगती है
  • मैंने कई मॉडलों के aggregate benchmark scores की तुलना की
    Gemini 3.0 Pro 84.8 के साथ पहले स्थान पर है, DeepSeek 3.2 83.6 पर, और GPT-5.1 69.2 पर
    Mistral Large 3 का स्कोर 41.9 है, जो कम है, लेकिन 14B·8B·3B models SOTA स्तर के हैं
    और इनमें Qwen3 जैसी censorship issues नहीं हैं

    • मुझे Gemini 3 और GPT-5.1/Opus 4.5 के बीच इतना बड़ा gap देखकर हैरानी है
      मैं जानना चाहूँगा कि किन क्षेत्रों में Gemini इतना मजबूत है
  • बेंचमार्क में Gemini सबसे ऊपर है, लेकिन वास्तविक उपयोग में यह ChatGPT या Claude से कमज़ोर लगता है
    यह ज़्यादा बकवास करता है, और लगता है कि Google सिर्फ़ benchmark scores बढ़ा रहा है
    उम्मीद है कि Mistral जैसे open source इस बाज़ार में हिस्सेदारी ले लेंगे

    • open-weight LLM का उद्देश्य closed models को हराना नहीं है
      वे ecosystem के संतुलनकारी तत्व की तरह काम करते हैं और monopoly रोकने में मायने रखते हैं
    • मैंने on-prem k8s cluster बनाना सीखते समय Gemini का उपयोग किया, और इस विषय में यह बहुत सटीक था
      शायद इसलिए कि यह उसके training data में अच्छी तरह शामिल क्षेत्र था
    • मेरे सवालों के हिसाब से Gemini 3 में GPT-5.1 की तुलना में hallucination कम थे
    • व्यक्तिगत रूप से Gemini ने मुझे सबसे ज़्यादा निराश किया, और इसकी अत्यधिक प्रचार-प्रसार वाली छवि अस्वाभाविक लगती है
    • coding के अलावा दूसरे कामों में Gemini Google Search integration की वजह से अधिक आसानी से आधार दे सकता है