Mistral AI ने Le Chat में Deep Research, Voice, Projects आदि जोड़े

(mistral.ai)

3 पॉइंट द्वारा GN⁺ 2025-07-18 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Mistral AI ने Le Chat में 5 नए फीचर जोड़े हैं, जिससे यूज़र की खोज, अभिव्यक्ति और संगठन को अधिक स्वाभाविक और शक्तिशाली बनाया गया है
Deep Research मोड जटिल सवालों को तेज़ी से संरचित research report में व्यवस्थित करने की सुविधा देता है
Voice मोड नए voice model Voxtral के ज़रिए स्वाभाविक और तेज़ बातचीत संभव बनाता है, और टाइपिंग के बिना भी इस्तेमाल किया जा सकता है
Magistral-आधारित multilingual reasoning फीचर कई भाषाओं में स्पष्ट और गहराई वाले जवाब बनाता है, और एक ही वाक्य में भाषा बदलना भी संभव है
Projects फीचर बातचीत, दस्तावेज़ और आइडिया को project इकाइयों में व्यवस्थित और याद रखता है, इसलिए यह लंबे समय के काम के लिए भी उपयुक्त है

What’s new in Le Chat.

1. Deep Research mode

जटिल विषयों पर तेज़ी से संरचित report format में research करने वाला फीचर
यूज़र के सवाल को छोटे हिस्सों में विभाजित करता है, विश्वसनीय स्रोत ढूँढता है, और उसे संगठित रिपोर्ट के रूप में तैयार करता है
इसमें tool-आधारित Deep Research agent का उपयोग होता है, लेकिन यूज़र अनुभव सरल, पारदर्शी और सहयोगी जैसा महसूस होता है

2. Voice mode

Voxtral नाम के नए voice model का उपयोग करके स्वाभाविक voice conversation संभव
टहलते समय idea brainstorming, बाहर रहते हुए तेज़ सवाल-जवाब, मीटिंग की dictation जैसी कई स्थितियों के लिए उपयुक्त
कम latency के साथ यूज़र की बोलने की गति का साथ देता है

3. Natively multilingual reasoning

Magistral reasoning model पर आधारित होकर कई भाषाओं में जटिल सवालों का स्पष्ट जवाब देता है
स्पैनिश में proposal draft लिखना, जापानी में क़ानूनी अवधारणाएँ समझाना जैसे multilingual उपयोग मामलों के लिए लाभदायक
वाक्य के भीतर भाषा बदलना (code switching) भी संभव

4. Projects

संबंधित बातचीत को context-केंद्रित folder structure में व्यवस्थित करता है
हर project अपनी अलग library और tool settings की स्थिति याद रखता है
document upload, library content लाना, बातचीत और आइडिया के साथ एकसमान कार्य वातावरण बनाए रखता है
घर बदलने की योजना, product feature design, और long-term project management जैसी जरूरतों में उपयोगी

5. Advanced image editing

सामान्य text-to-image generation tools से अलग, बनी हुई image को भी सीधे edit किया जा सकता है
उदाहरण: “ऑब्जेक्ट हटाना”, “किसी दूसरे शहर में ले जाना” जैसे prompts से scene में बदलाव संभव
लोगों, वस्तुओं और design elements को संगति के साथ बनाए रखते हुए series के रूप में edit किया जा सकता है

1 टिप्पणियां

GN⁺ 2025-07-18

Hacker News राय

इमेज एडिटिंग फीचर वाकई बहुत शानदार लगता है, बल्कि ऐसा महसूस होता है कि यही इसकी मुख्य ताकत है, फिर भी यह बात उतनी स्पष्ट नहीं दिखती। OpenAI के मॉडल अक्सर पूरी इमेज को बदल देते हैं और क्वेरी से असंबंधित हिस्सों की डिटेल भी खराब कर देते हैं, लेकिन यह मॉडल क्वेरी से असंबंधित हिस्सों को लगभग पूरी तरह सुरक्षित रखते हुए सिर्फ़ मनचाहा एडिट बहुत अच्छे से लागू करता है, यही बात सबसे ज़्यादा प्रभावशाली लगी। हालांकि, आउटपुट resolution थोड़ा निराशाजनक है (इनपुट इमेज इससे काफ़ी बड़ी थी, लेकिन रिज़ल्ट इमेज 1184px है)। मैंने अपने home office की फोटो अपलोड करके कहा, "नीचे के हल्के फटे हुए ग्रे panels को पूरी तरह नया जैसा restore कर दो," और इसका रिज़ल्ट काफ़ी बेहतरीन था। आउटपुट क्वालिटी मूल इमेज से बहुत हल्की-सी कम है, लेकिन उम्मीद है कि यह हिस्सा भी जल्द बेहतर हो जाएगा
- इनपुट इमेज: https://i.imgur.com/t0WCKAu.jpeg
- रिज़ल्ट इमेज: https://i.imgur.com/xb99lmC.png
- लगता है ऐसी तकनीक Craigslist को बड़ा झटका दे सकती है। मान लीजिए आप फोटो देखकर सोचते हैं कि कार बिल्कुल ठीक है, लेकिन वहाँ पहुँचने पर पता चलता है कि fender दबा हुआ है, bonnet में छेद है, और headlight भी टूटी हुई है।
  एक बार एक real estate agent ने AI से घर की तस्वीरों को पूरी तरह नया जैसा बना दिया था, जबकि घर काफ़ी जर्जर था। लोग जब असल में देखने पहुँचे तो बहुत ग़ुस्सा हुए। agent का कहना था कि यह staging का ही एक रूप है, लेकिन इस मामले में यह तर्क बिल्कुल नहीं चला। आखिरकार listing हटा दी गई, और कई लोग वहाँ मरम्मत के लिए भी आने लगे थे (संभव है वे परिवार के लोग रहे हों, लेकिन पक्का नहीं)
- वैसे, आपने जो इनपुट और रिज़ल्ट इमेज लिंक दिए हैं, वे एक जैसे हैं। मैं भी पहले दोनों में फर्क ढूँढने की कोशिश में उलझ गया था
- कुछ खास tasks के लिए Kontext शायद बेहतर है, और संभव है Mistral भी इसी का उपयोग कर रहा हो। सबसे बड़ी बात, यह तेज़ और सस्ता है।
  लेकिन OpenAI ने भी कल नया high-resolution image editing फीचर जोड़ा है। अभी पता नहीं कि यह सिर्फ़ API में है या chat UI में भी आएगा। उसी prompt और input image पर मिला रिज़ल्ट: https://i.imgur.com/w5Q0UQm.png
- OpenAI की नई घोषणा: https://x.com/OpenAIDevs/status/1945538534884135132
- यह Black Forest Labs के Flux Kontext का इस्तेमाल कर रहा है, और यह सच में शानदार मॉडल है
- इमेज रिज़ल्ट में किताबों के शीर्षक बिगड़ गए हैं
अब जाकर लगता है कि EU जागा है। इस बात पर गर्व महसूस होता है। OpenAI के साथ मेरा contract ख़त्म होते ही मैं तुरंत Mistral पर शिफ्ट करने की योजना बना रहा हूँ। यूरोप को support करना चाहिए, Viva La France
- सच कहूँ तो मैं सिर्फ़ Mistral Large 3 का इंतज़ार कर रहा हूँ। इसके संकेत पहले ही मिल चुके हैं, और लगता है कि यह जल्द ही नए Le Chat का default language model बन जाएगा।
  मई में आए Mistral Medium 3 ब्लॉग पोस्ट के "One more thing" में यह बात थी:
मार्च में Mistral Small, आज Medium, और जल्द ही 'large' लॉन्च की तैयारी। Medium मॉडल पहले से ही दूसरे open source flagship models (Llama 4 Maverick आदि) से साफ़ तौर पर बेहतर है, इसलिए अगला कदम देखने लायक होगा
अगर यह वर्ज़न आ गया, तो शायद अब सबसे बेहतरीन बड़े मॉडलों से अंतर भी बहुत मायने नहीं रखेगा। Cerebras की तेज़ speed, ChatGPT से तुलना करें तब भी, सच में बेहतरीन user experience देती है
मैं MRF, यानी Model Release Fatigue, से जूझ रहा हूँ। इतने बड़े मॉडल इतनी तेज़ी से आ रहे हैं कि IDE में बार-बार मॉडल बदलकर देखना पड़ता है, और जो चीज़ पहले तक अच्छी लगती थी, उसे फिर चालू करो तो अब उतनी अच्छी नहीं लगती।
Claude 4, gpt, llama, Gemini 2.5, pro-mini, mistral… हर दिन बदलते-बदलते सच में सिर घूमने लगता है
यह LLM मॉडल switching से होने वाली थकान है
- मैं समझ सकता हूँ कि तुम्हें ऐसा क्यों लग रहा है, लेकिन मुझे लगता है कि इतने सारे विकल्पों का लगातार आना वास्तव में बहुत अच्छी बात है। innovation की रफ़्तार भी शानदार है। अगर हर समय सिर्फ़ सबसे अच्छा मॉडल ही इस्तेमाल करना है, तो यह मुश्किल सफर होगा, लेकिन ठहराव या monopoly से तो यह कहीं बेहतर है
- इसलिए मैं इन नई तकनीकों को लगभग इस्तेमाल ही नहीं करता (हालाँकि वे मज़ेदार हैं)। मेरा इरादा है कि 2026 के दूसरे half के आसपास इन्हें खुद आज़माऊँ। तब तक local models और hardware और विकसित हो चुके होंगे।
  जो लोग अभी इन experimental versions को संभाल रहे हैं, उन्हें सलाम
- यही competition की असली अच्छी बात है। मैं हमेशा premium models ही इस्तेमाल करता हूँ, फिर भी लगभग पैसा नहीं खर्च करता। promotions या लगभग मुफ़्त जैसे मौके हमेशा मिलते रहते हैं
- इतना पीछे भागने की ज़रूरत नहीं है। अपने लिए एक ऐसा मॉडल चुन लो जो अच्छा काम करे, और उसी का लगातार उपयोग करो, वही काफ़ी है
- पुराने versions की performance गिरने का कारण यह है कि service providers resources नए versions पर केंद्रित कर देते हैं। और पुराने versions के training data cutoff का असर भी होता है (जैसे: claude sonnet 3.5→3.7)।
  मैं व्यक्तिगत रूप से सिर्फ़ Claude/Anthropic का उपयोग करता हूँ। वह मुझे बेहतर समझता है। वह काफ़ी smart है, इसलिए हर बार latest version की ज़रूरत नहीं पड़ती
Voxtral की रिलीज़ इसलिए दिलचस्प लगी क्योंकि competitive open source audio transcription (speech-to-text) फिर से सक्रिय होता दिख रहा है। यह ज़रूर सवाल उठता है कि क्या सच में LLM backbone की ज़रूरत थी, लेकिन approach फिर भी रोचक है
- असल में, इससे कहीं ज़्यादा शक्तिशाली open source speech recognition (STT) models मौजूद हैं।
  Mistral की press release से ऐसा लगता है मानो यह Whisper के बाद सबसे बेहतरीन हो, लेकिन जिन मॉडलों से इसकी तुलना की गई है वे वास्तव में top-tier नहीं हैं।
  open benchmark: https://huggingface.co/spaces/hf-audio/open_asr_leaderboard
  और संदर्भ के लिए, Mistral ने जिस Scribe से तुलना की, वह 10वें स्थान पर है।
  यह अंग्रेज़ी benchmark है, लेकिन इसमें कई multilingual models भी हैं, इसलिए देखना उपयोगी रहेगा (जैसे: https://huggingface.co/nvidia/canary-1b-flash)
अब मुझे open code या open weights से ज़्यादा open data models में दिलचस्पी है, यानी ऐसे मॉडल जिनके डेटा की ethical verifiability भी हो।
उदाहरण के लिए, मैं ऐसा मॉडल इस्तेमाल करना चाहूँगा जो बता सके कि मेरे द्वारा निर्दिष्ट resource उसके training data में शामिल था या नहीं
आजकल AI उद्योग को देखकर यह धारणा हटती नहीं कि सब बस OpenAI की services की नकल कर रहे हैं।
दूसरी कंपनियों की services भी ढाँचे में थोड़ी अलग होंगी, लेकिन मूल रूप से वही सेवाएँ लगती हैं।
innovation भी उतना ज़्यादा नहीं दिखता
- अगर आप इन्हें वास्तव में इस्तेमाल करें, तो ये बिल्कुल एक जैसी नहीं लगतीं। coding जैसे रोज़मर्रा के कामों में मॉडल-दर-मॉडल अंतर बहुत बड़ा होता है
- अब पूरी दुनिया मानो f(input: string): string फ़ंक्शन के ऊपर नई services बना रही है। ऐसे में चीज़ों का एक जैसा दिखना स्वाभाविक है
- OpenAI का Deep Research फीचर भी Google से ही लिया गया था। नाम भी वही रखा गया, और Mistral ने भी वही किया
- बल्कि यह एक healthy market competition की निशानी है। Apple जैसा दशकों तक innovation करने वाला उदाहरण भी monopoly-style gatekeeping का ही परिणाम है
- अंततः लगभग वही तकनीक हर जगह लागू हो रही है। फ़र्क मुख्य रूप से training data और compute power का ही है
मैं ChatGPT बहुत ज़्यादा इस्तेमाल करता हूँ। Le Chat भी एक बार आज़माना चाहता हूँ, लेकिन जानना चाहता हूँ कि क्या कोई बड़ा फर्क महसूस होगा या दोनों लगभग समान हैं
अगर आपने अभी तक OpenAI का Deep Research फीचर इस्तेमाल नहीं किया है, तो ज़रूर करें। अभी तक मुझे उसका कोई सही विकल्प नहीं मिला। Google का भी इस्तेमाल किया, लेकिन उसने खास प्रभावित नहीं किया।
engineers के लिए trade-off research करते समय यह बहुत बड़ा time saver साबित हो सकता है
- Anthropic का Research फीचर भी काफ़ी अच्छा है। मुझे लगता है कि यह OpenAI के स्तर का है।
  Google का paid version थोड़ा ज़्यादा accurate है, लेकिन उसकी रिपोर्टें इतनी लंबी-चौड़ी होती हैं कि पढ़ना मुश्किल हो जाता है। ऐसा लगता है जैसे कोई college student सिर्फ़ word count पूरा करने के लिए रिपोर्ट खींच रहा हो
- मुझे खास तौर पर market research में इससे बहुत मदद मिली (startup से जुड़ी चीज़ों में)। ऐसा लगा जैसे मैंने किसी समझदार junior planner/PM assistant को hire कर लिया हो
- Kimi 2 का research फीचर भी आज़माने लायक है। उसके नतीजे उम्मीद से कहीं बेहतर निकले, यह देखकर मैं चकित रह गया
- OpenAI और Gemini के नतीजे काफ़ी अलग आते हैं। यह कहना मुश्किल है कि कौन बेहतर है, बस दोनों साफ़ तौर पर अलग हैं
- Perplexities भी बुरा नहीं है। हालांकि, मेरे पास OpenAI का paid subscription नहीं है, इसलिए सीधी तुलना नहीं कर सकता
prompt examples खास अच्छे नहीं हैं। उदाहरण के लिए, personal planning वाला जवाब Deep Research के बिना सीधे जवाब देने पर कहीं बेहतर आता है (उसमें सिर्फ़ visa वाला हिस्सा ही ठीक से जवाब देता है)
क्या Voxtral को Futo Android keyboard में लागू किया जा सकता है, यह जानने में दिलचस्पी है

Mistral AI ने Le Chat में Deep Research, Voice, Projects आदि जोड़े

What’s new in Le Chat.

1. Deep Research mode

2. Voice mode

3. Natively multilingual reasoning

4. Projects

5. Advanced image editing

संबंधित पढ़ाई

1 टिप्पणियां

Hacker News राय