Mistral AI Now Summit नोट्स
(koenvangilst.nl)- Mistral सिर्फ एक मॉडल कंपनी से आगे बढ़कर compute, model, platform और consulting को जोड़ने वाली पूरी AI stack कंपनी की दिशा में बढ़ रही है
- पेरिस के 40MW data center और अतिरिक्त data center योजनाओं को आगे रखते हुए, यह customer-owned और on-premise execution वाले open customized models को अपनी अलग पहचान बना रही है
- नए मॉडल घोषणाओं से अधिक फोकस partnerships पर था, और ASML, BNP Paribas, Amazon Alexa+ सहयोग तथा Vibe for Work की घोषणा मुख्य बिंदु रहे
- agent systems में harness context, persistence और learning जोड़ता है, जबकि reasoning को error recovery और transparency बनाए रखने के लिए अहम माना गया
- छोटे और specialized models तथा on-premise deployment regulated industries और European enterprises के लिए बनाई गई रणनीति हैं, जिनका फोकस AGI race से अधिक व्यावहारिक ROI पर है
Mistral की पोजिशनिंग
- Mistral सिर्फ एक model company बनकर नहीं रहना चाहती, बल्कि compute, model, platform और consulting को शामिल करने वाली पूरी AI stack बनाने की दिशा में आगे बढ़ रही है
- इसके पास पेरिस में 40MW data center है, और Sweden सहित अतिरिक्त data centers की भी योजना है
- Anthropic या OpenAI से इसका अंतर यह है कि इसके efficient, open और customized models को ग्राहक खुद own कर सकते हैं और on-premise चला सकते हैं
- इवेंट का संदेश नए models या technical innovation से अधिक partnerships पर केंद्रित था
- ASML, BNP Paribas, Amazon Alexa+ के साथ सहयोग को AI से वास्तविक समस्याओं का समाधान करने वाले उदाहरणों के रूप में पेश किया गया
- Vibe for Work पेश किया गया, और इसे Claude for Work जैसे उत्पाद के रूप में बताया गया
प्रोडक्ट रणनीति और उपयोग के उदाहरण
-
agent systems और harness
- सिर्फ model पर्याप्त नहीं है; harness context, persistence और learning जोड़ने की भूमिका निभाता है
- reasoning को वह मुख्य तत्व माना गया जो system को वापस जाकर सुधार करने, errors से उबरने और transparency बनाए रखने में सक्षम बनाता है
- संगठन की best practices को skills के रूप में capture किया जाता है, और वे AI agents के साथ काम करने की प्रक्रिया में विकसित होती हैं
-
छोटे और specialized models
- Mistral ऐसे उदाहरण पेश करती है जहां छोटे, तेज और स्पष्ट फोकस वाले models energy efficiency और speed में बड़े general-purpose models से बेहतर साबित होते हैं
- Document AI OCR के लिए एक model है, और EU Patent Office इसका उपयोग बड़े पैमाने पर OCR के लिए करता है
- Voxtral एक multilingual speech model है, और इसका उपयोग Europe में Amazon Alexa+ को चलाने के लिए किया जाता है
- Robostral का उपयोग ASML के साथ industrial robotics में किया जाता है
- जिन agentic applications में token usage बहुत अधिक होता है, वहां raw performance जितनी ही speed और efficiency भी महत्वपूर्ण हो जाती है
-
sovereignty और on-premise deployment
- BNP Paribas Belgium में KYC उद्देश्यों के लिए Mistral models को on-premise चलाता है, जिससे sensitive data बैंक के अंदर ही रहता है
- Abanca app के भीतर 10 लाख से अधिक ग्राहकों की sensitive information को बड़े पैमाने पर process करने के लिए agent orchestration का उपयोग करता है
- regulated industries में मौजूद European कंपनियों के लिए यह US hyperscalers पर निर्भरता कम करने वाला एक विकल्प हो सकता है
-
humanities में उपयोग
- Austrian Academy of Sciences की research team ने Mistral के coding LLM Codestral को fine-tune करके हजारों साल पुराने papyrus fragments पढ़ने लायक बनाया
- इस काम ने Egypt के रेगिस्तान में मिले 1.8 लाख documents के collection को सुलभ बनाने में योगदान दिया
- इसे ऐसा काम बताया गया जिसे AI के बिना पूरा करने में 2,000 साल से अधिक लगते
- Austrian Academy of Sciences का Apollo project इस बात का उदाहरण है कि AI humanities में भी योगदान दे सकता है
-
European AI partner रणनीति
- Mistral का विज़न AGI race जीतने से अधिक, अभी के समय में वास्तविक ROI देने वाला European full-stack AI partner बनने के करीब है
- इस रणनीति की सफलता इस बात पर निर्भर करेगी कि अधिक European कंपनियां Mistral के approach को अपनाती हैं या नहीं
- open models, on-premise deployment और enterprise partnerships का संयोजन EU की कई बड़ी organizations के लिए आकर्षक हो सकता है
- US tech giants पर अंध निर्भरता का दौर खत्म होता दिख रहा है, और एक गंभीर European AI player का उभरना महत्वपूर्ण है
चुने हुए टेक टॉपिक आगे भी पाना चाहते हैं?
Telegram चैनल फ़ॉलो करें. @GeekNewsIN
1 टिप्पणियां
Hacker News टिप्पणियाँ
मैं सच में Mistral और task-specific small models का समर्थन करता हूँ, लेकिन 2025 की तीसरी तिमाही के बाद से Mistral बहुत पीछे रह गया है
अब प्रतिस्पर्धा करने के लिए कम-से-कम मध्यम context length पर अच्छे reasoning models चला पाने चाहिए, और Mistral में वह क्षमता नहीं दिखती
अभी small model क्षेत्र में Gemma4 और Qwen3.6 सबसे अच्छे हैं, और Mistral का “small” model 120B है, यानी parameters लगभग 4 गुना ज़्यादा हैं, फिर भी यह अपने चौथाई आकार के models से भी ठीक से प्रतिस्पर्धा नहीं कर पाता
एक साल पहले Mistral Small 3.1 के समय यह दौड़ में बना हुआ था, लेकिन अब इसकी मौजूदगी लगभग गायब हो चुकी है
अगर Mistral on-premise और task-specific small model बाज़ार को सच में निशाना बना रहा है, तो r/localLlama के लोगों को उत्साहित कर सके ऐसा model बनाना एक काफ़ी अच्छा proxy metric हो सकता है
conference में नए models पर ज़्यादा बात न होना भी चिंता की बात है। मेरी नज़र में वही सबसे बड़ा focus area होना चाहिए
समझ नहीं आता कि अड़चन कहाँ है। पैसा, compute resources, capability, या training data—पता नहीं
सच में अच्छे models बनाने के लिए शायद frontier model outputs जैसे काफ़ी संदिग्ध data पर train करना पड़ता है, और मुझे डर है कि Mistral शायद बहुत ज़्यादा European और enterprise-customer-oriented है, इसलिए वह ऐसा risk नहीं ले पा रहा
आखिर में शायद यह Dailymotion जैसी zombie company बनकर रह जाएगा
उदाहरण के लिए, मैं Claude Code में default रूप से इस्तेमाल होने वाले, Opus के software-only subset जैसे किसी model की बात कर रहा हूँ
वह छोटा होगा, deploy और use करने में सस्ता होगा, और शायद तेज़ भी
उस समय Mistral को तैयार रहना चाहिए, लेकिन हाल की प्रगति देखकर यथार्थवादी तौर पर ज़्यादा उम्मीद नहीं है
Mistral 4 में प्रति token 6B active parameters हैं, इसलिए भले ही 4090 पर प्रति token 3~3.5 parameters फिट किए जा सकें, लगभग 240GB download और storage की ज़रूरत local पर इसे आज़माने की सीमा के काफ़ी करीब है
कई models डाउनलोड करके उनका मूल्यांकन करने की स्थिति में तो और भी ज़्यादा, और इससे दूसरों के लिए पुराने Mistral/Magistral models की तरह आगे fine-tuning बनाना भी मुश्किल हो जाता है
मैंने एक उत्कृष्ट सरकारी IT अधिकारी का भाषण सुना, जो models का मूल्यांकन कर रहे थे और मौजूदा स्थिति से काफ़ी असंतुष्ट थे
वे Mistral का उपयोग करना चाहते हैं, और कुछ मामलों में यह एकमात्र EU-based model भी है जिसे इस्तेमाल किया जा सकता है, लेकिन वे यह भी जानते हैं कि इसकी performance सच में खराब है और लगातार पिछड़ती जा रही है
Mistral शायद इस आधार पर लाभदायक व्यवसाय बना ले कि EU उपयोग मामलों में, खराब होने पर भी, वही एकमात्र संभव model है। यह दुखद है और देखना भी तकलीफ़देह है
मैं सच में चाहता हूँ कि यूरोप AI development और research में भाग ले, और मैं Mistral का भी मज़बूती से समर्थन करता था
लेकिन technical gap बहुत ज़्यादा बढ़ता जा रहा है। अगर इसे ठीक नहीं किया गया, तो यह एक और सबूत होगा कि यूरोप बड़े tech companies को अच्छे नतीजों के साथ चला नहीं सकता
व्यावहारिक रूप से देखें तो लगभग सभी चीनी labs काफ़ी बेहतर कर रही हैं। DeepSeek की बात छोड़ भी दें, तब भी MiMo 2.5 और Minimax 2.7 जैसी चीज़ें Mistral ने नहीं बनाई हैं
Mistral की ओर के models या तो कमज़ोर हैं, या बड़े और धीमे हैं, या उनमें mixture of experts (MoE) नहीं है, इसलिए वे अच्छे नहीं लगते
यूरोप ने जन-उन्माद के चरम समय में जल्दबाज़ी में बनाए गए इस कानून से खुद अपने पैर पर कुल्हाड़ी मारी, और अब कोई भी समझदार कंपनी वहाँ कुछ बनाने की कोशिश नहीं करेगी
अमेरिका या चीन में AI startup एक लड़के और एक कंप्यूटर से शुरू हो सकता है, लेकिन यूरोप में उसी लड़के को बारह वकीलों की ज़रूरत पड़ती है
Mistral के पास head start, बहुत आशाजनक शुरुआती models, और पर्याप्त investment होने के बावजूद उसका प्रभाव गायब हो जाना शायद इन सारे regulations का पालन करने की कोशिश का नतीजा हो सकता है
उसकी technical report ने मुझ पर गहरी छाप छोड़ी थी। बेशक, MoE का विचार खुद उससे पहले से मौजूद था, यह मैं जानता हूँ
अगर Mixtral model family को और आगे बढ़ाया गया होता, तो शायद आज उसकी प्रतिष्ठा Qwen series जैसी होती। यह एक छूटा हुआ मौका है
उसकी तुलना में मुझे लगता है कि यूरोप काफ़ी अच्छा कर रहा है
BNP Paribas बेल्जियम में KYC के लिए Mistral मॉडल को on-premise चला रहा है, और यह महत्वपूर्ण है कि संवेदनशील डेटा बैंक के भीतर ही रहता है
Abanca भी ऐप के 20 लाख ग्राहकों जैसी बड़ी मात्रा की संवेदनशील ग्राहक जानकारी को प्रोसेस करने के लिए agent orchestration का उपयोग कर रहा है
विनियमित उद्योगों की यूरोपीय कंपनियों के लिए यह अमेरिकी hyperscalers पर निर्भर रहने की तुलना में एक बेहतर विकल्प है, और Mistral का on-premise तथा यूरोप-होस्टेड मॉडल पर ध्यान देना बहुत ही समझदारी भरी दिशा है
सभी लोग full-deployment engineering या customer-specific engineering कर रहे हैं, क्योंकि नहीं तो वे सिर्फ token cost पर margin जोड़ने वाली कंपनी जैसे दिखते हैं
फिर Neo-SaaS कंपनियाँ पैसा ले जाएँगी। इसके अलावा Mistral का AI और कौन खरीदेगा, और विकल्प ही क्या हैं
इसके बजाय वह multilingual models, OCR, speech जैसे दूसरे क्षेत्रों पर फोकस करता दिखता है
मॉडल परिचय पेज भी यही दिखाता है, लेकिन वह इतना विविध है और categories व model names इतने ज़्यादा हैं कि हमेशा भ्रम होता है
उम्मीद है उनके फैसलों का अच्छा नतीजा निकले
यूरोपीय startups के लिए enterprise B2B हमेशा ऐसी जगह लगा है जहाँ वे मरने जाते हैं
मैं इवेंट में शामिल हुआ था, और प्रतिभागियों का पैमाना प्रभावशाली था; प्रमुख यूरोपीय listed companies के leaders सब वहाँ थे
बुलाए गए partners की संख्या भी दिलचस्प थी। Microsoft, Accenture, EY से लेकर alpic.ai और lingo.dev जैसे startups तक, काफी विविधता थी
लगता है M&A की दिशा में भी उनकी गतिविधि तेज हो रही है
बिज़नेस से अलग, वेबसाइट डिज़ाइन वाकई शानदार है: https://mistral.ai/
Mistral से ईमेल आया कि devstral जैसे कुछ dedicated models, शायद अधिकांश, अगस्त तक चरणबद्ध तरीके से बंद किए जा रहे हैं और अब generic models इस्तेमाल करने को कहा जा रहा है
लागत घातीय रूप से बढ़ रही है
उसमें लिखा था कि Devstral 2(devstral-2512 और devstral-latest) से अधिक शक्तिशाली मॉडल Mistral Medium 3.5(mistral-medium-3-5,
reasoning_effortको "high" पर सेट करके) पर जाने की सिफारिश की जाती है, और कीमत input/output के प्रति 10 लाख tokens पर $1.5/$7.5 हैयह पहले के $0.4/$2 से बदला गया है
फिर भी, ईमेल मिलने के बाद मैंने उम्मीद की कि यह अगले कुछ महीनों में कोई नया और बेहतर मॉडल लाने का संकेत हो
इसमें कोई moat बिल्कुल नहीं दिखती। यह data center वाली software consulting company जैसी लगती है
ऊपर से पोस्ट में कहा गया है कि कई ग्राहक इन मॉडलों को on-premise इस्तेमाल करते हैं, तो data center भी कोई खास बढ़त नहीं है
ऐसा क्या है जो सरकारी समर्थन पाने वाले किसी भी startup को छोटे open-source models को fine-tune करने से रोक सके
मैं यह दावा नहीं कर रहा कि यह सच है, बस इतना कि ऐसी परिकल्पना की जा सकती है
एक यूरोपीय होने के नाते मैं इससे 100 गुना सहमत हूँ
इन खिलाड़ियों में Mistral की दिशा और पारदर्शिता मुझे सच में बहुत पसंद है
कहा जा रहा है कि Abanca ऐप के 20 लाख ग्राहकों की “विशाल” मात्रा वाली संवेदनशील ग्राहक जानकारी को प्रोसेस करने के लिए agent orchestration का उपयोग कर रहा है, तो मुझे नहीं पता कि विशाल के लिए मेरा पैमाना बिगड़ा हुआ है या नहीं
20 लाख users हों तो डेटा कुछ सौ MB ही नहीं होगा? प्रति user डेटा ज़्यादा भी हो तो शायद कुछ GB होगा
प्रस्तुति से मैंने जो समझा, उसके अनुसार उन्होंने सीमित जिम्मेदारी वाले agents और शायद छोटे models का उपयोग किया ताकि जवाब तेज, स्थिर और बहुत महँगा न हो
दूसरी तरफ, ऐसे व्यवसाय रक्षात्मक रूप से काफ़ी मजबूत हो सकते हैं, लेकिन आम तौर पर उतनी ऊँची profitability तक नहीं पहुँचते