- Mistral AI ने Le Chat में 5 नए फीचर जोड़े हैं, जिससे यूज़र की खोज, अभिव्यक्ति और संगठन को अधिक स्वाभाविक और शक्तिशाली बनाया गया है
- Deep Research मोड जटिल सवालों को तेज़ी से संरचित research report में व्यवस्थित करने की सुविधा देता है
- Voice मोड नए voice model Voxtral के ज़रिए स्वाभाविक और तेज़ बातचीत संभव बनाता है, और टाइपिंग के बिना भी इस्तेमाल किया जा सकता है
- Magistral-आधारित multilingual reasoning फीचर कई भाषाओं में स्पष्ट और गहराई वाले जवाब बनाता है, और एक ही वाक्य में भाषा बदलना भी संभव है
- Projects फीचर बातचीत, दस्तावेज़ और आइडिया को project इकाइयों में व्यवस्थित और याद रखता है, इसलिए यह लंबे समय के काम के लिए भी उपयुक्त है
What’s new in Le Chat.
1. Deep Research mode
- जटिल विषयों पर तेज़ी से संरचित report format में research करने वाला फीचर
- यूज़र के सवाल को छोटे हिस्सों में विभाजित करता है, विश्वसनीय स्रोत ढूँढता है, और उसे संगठित रिपोर्ट के रूप में तैयार करता है
- इसमें tool-आधारित Deep Research agent का उपयोग होता है, लेकिन यूज़र अनुभव सरल, पारदर्शी और सहयोगी जैसा महसूस होता है
2. Voice mode
- Voxtral नाम के नए voice model का उपयोग करके स्वाभाविक voice conversation संभव
- टहलते समय idea brainstorming, बाहर रहते हुए तेज़ सवाल-जवाब, मीटिंग की dictation जैसी कई स्थितियों के लिए उपयुक्त
- कम latency के साथ यूज़र की बोलने की गति का साथ देता है
3. Natively multilingual reasoning
- Magistral reasoning model पर आधारित होकर कई भाषाओं में जटिल सवालों का स्पष्ट जवाब देता है
- स्पैनिश में proposal draft लिखना, जापानी में क़ानूनी अवधारणाएँ समझाना जैसे multilingual उपयोग मामलों के लिए लाभदायक
- वाक्य के भीतर भाषा बदलना (code switching) भी संभव
4. Projects
- संबंधित बातचीत को context-केंद्रित folder structure में व्यवस्थित करता है
- हर project अपनी अलग library और tool settings की स्थिति याद रखता है
- document upload, library content लाना, बातचीत और आइडिया के साथ एकसमान कार्य वातावरण बनाए रखता है
- घर बदलने की योजना, product feature design, और long-term project management जैसी जरूरतों में उपयोगी
5. Advanced image editing
- सामान्य text-to-image generation tools से अलग, बनी हुई image को भी सीधे edit किया जा सकता है
- उदाहरण: “ऑब्जेक्ट हटाना”, “किसी दूसरे शहर में ले जाना” जैसे prompts से scene में बदलाव संभव
- लोगों, वस्तुओं और design elements को संगति के साथ बनाए रखते हुए series के रूप में edit किया जा सकता है
1 टिप्पणियां
Hacker News राय
इमेज एडिटिंग फीचर वाकई बहुत शानदार लगता है, बल्कि ऐसा महसूस होता है कि यही इसकी मुख्य ताकत है, फिर भी यह बात उतनी स्पष्ट नहीं दिखती। OpenAI के मॉडल अक्सर पूरी इमेज को बदल देते हैं और क्वेरी से असंबंधित हिस्सों की डिटेल भी खराब कर देते हैं, लेकिन यह मॉडल क्वेरी से असंबंधित हिस्सों को लगभग पूरी तरह सुरक्षित रखते हुए सिर्फ़ मनचाहा एडिट बहुत अच्छे से लागू करता है, यही बात सबसे ज़्यादा प्रभावशाली लगी। हालांकि, आउटपुट resolution थोड़ा निराशाजनक है (इनपुट इमेज इससे काफ़ी बड़ी थी, लेकिन रिज़ल्ट इमेज 1184px है)। मैंने अपने home office की फोटो अपलोड करके कहा, "नीचे के हल्के फटे हुए ग्रे panels को पूरी तरह नया जैसा restore कर दो," और इसका रिज़ल्ट काफ़ी बेहतरीन था। आउटपुट क्वालिटी मूल इमेज से बहुत हल्की-सी कम है, लेकिन उम्मीद है कि यह हिस्सा भी जल्द बेहतर हो जाएगा
इनपुट इमेज: https://i.imgur.com/t0WCKAu.jpeg
रिज़ल्ट इमेज: https://i.imgur.com/xb99lmC.png
लगता है ऐसी तकनीक Craigslist को बड़ा झटका दे सकती है। मान लीजिए आप फोटो देखकर सोचते हैं कि कार बिल्कुल ठीक है, लेकिन वहाँ पहुँचने पर पता चलता है कि fender दबा हुआ है, bonnet में छेद है, और headlight भी टूटी हुई है।
एक बार एक real estate agent ने AI से घर की तस्वीरों को पूरी तरह नया जैसा बना दिया था, जबकि घर काफ़ी जर्जर था। लोग जब असल में देखने पहुँचे तो बहुत ग़ुस्सा हुए। agent का कहना था कि यह staging का ही एक रूप है, लेकिन इस मामले में यह तर्क बिल्कुल नहीं चला। आखिरकार listing हटा दी गई, और कई लोग वहाँ मरम्मत के लिए भी आने लगे थे (संभव है वे परिवार के लोग रहे हों, लेकिन पक्का नहीं)
वैसे, आपने जो इनपुट और रिज़ल्ट इमेज लिंक दिए हैं, वे एक जैसे हैं। मैं भी पहले दोनों में फर्क ढूँढने की कोशिश में उलझ गया था
कुछ खास tasks के लिए Kontext शायद बेहतर है, और संभव है Mistral भी इसी का उपयोग कर रहा हो। सबसे बड़ी बात, यह तेज़ और सस्ता है।
लेकिन OpenAI ने भी कल नया high-resolution image editing फीचर जोड़ा है। अभी पता नहीं कि यह सिर्फ़ API में है या chat UI में भी आएगा। उसी prompt और input image पर मिला रिज़ल्ट: https://i.imgur.com/w5Q0UQm.png
OpenAI की नई घोषणा: https://x.com/OpenAIDevs/status/1945538534884135132
यह Black Forest Labs के Flux Kontext का इस्तेमाल कर रहा है, और यह सच में शानदार मॉडल है
इमेज रिज़ल्ट में किताबों के शीर्षक बिगड़ गए हैं
अब जाकर लगता है कि EU जागा है। इस बात पर गर्व महसूस होता है। OpenAI के साथ मेरा contract ख़त्म होते ही मैं तुरंत Mistral पर शिफ्ट करने की योजना बना रहा हूँ। यूरोप को support करना चाहिए, Viva La France
मई में आए Mistral Medium 3 ब्लॉग पोस्ट के "One more thing" में यह बात थी:
मैं MRF, यानी Model Release Fatigue, से जूझ रहा हूँ। इतने बड़े मॉडल इतनी तेज़ी से आ रहे हैं कि IDE में बार-बार मॉडल बदलकर देखना पड़ता है, और जो चीज़ पहले तक अच्छी लगती थी, उसे फिर चालू करो तो अब उतनी अच्छी नहीं लगती।
Claude 4, gpt, llama, Gemini 2.5, pro-mini, mistral… हर दिन बदलते-बदलते सच में सिर घूमने लगता है
यह LLM मॉडल switching से होने वाली थकान है
मैं समझ सकता हूँ कि तुम्हें ऐसा क्यों लग रहा है, लेकिन मुझे लगता है कि इतने सारे विकल्पों का लगातार आना वास्तव में बहुत अच्छी बात है। innovation की रफ़्तार भी शानदार है। अगर हर समय सिर्फ़ सबसे अच्छा मॉडल ही इस्तेमाल करना है, तो यह मुश्किल सफर होगा, लेकिन ठहराव या monopoly से तो यह कहीं बेहतर है
इसलिए मैं इन नई तकनीकों को लगभग इस्तेमाल ही नहीं करता (हालाँकि वे मज़ेदार हैं)। मेरा इरादा है कि 2026 के दूसरे half के आसपास इन्हें खुद आज़माऊँ। तब तक local models और hardware और विकसित हो चुके होंगे।
जो लोग अभी इन experimental versions को संभाल रहे हैं, उन्हें सलाम
यही competition की असली अच्छी बात है। मैं हमेशा premium models ही इस्तेमाल करता हूँ, फिर भी लगभग पैसा नहीं खर्च करता। promotions या लगभग मुफ़्त जैसे मौके हमेशा मिलते रहते हैं
इतना पीछे भागने की ज़रूरत नहीं है। अपने लिए एक ऐसा मॉडल चुन लो जो अच्छा काम करे, और उसी का लगातार उपयोग करो, वही काफ़ी है
पुराने versions की performance गिरने का कारण यह है कि service providers resources नए versions पर केंद्रित कर देते हैं। और पुराने versions के training data cutoff का असर भी होता है (जैसे: claude sonnet 3.5→3.7)।
मैं व्यक्तिगत रूप से सिर्फ़ Claude/Anthropic का उपयोग करता हूँ। वह मुझे बेहतर समझता है। वह काफ़ी smart है, इसलिए हर बार latest version की ज़रूरत नहीं पड़ती
Voxtral की रिलीज़ इसलिए दिलचस्प लगी क्योंकि competitive open source audio transcription (speech-to-text) फिर से सक्रिय होता दिख रहा है। यह ज़रूर सवाल उठता है कि क्या सच में LLM backbone की ज़रूरत थी, लेकिन approach फिर भी रोचक है
Mistral की press release से ऐसा लगता है मानो यह Whisper के बाद सबसे बेहतरीन हो, लेकिन जिन मॉडलों से इसकी तुलना की गई है वे वास्तव में top-tier नहीं हैं।
open benchmark: https://huggingface.co/spaces/hf-audio/open_asr_leaderboard
और संदर्भ के लिए, Mistral ने जिस Scribe से तुलना की, वह 10वें स्थान पर है।
यह अंग्रेज़ी benchmark है, लेकिन इसमें कई multilingual models भी हैं, इसलिए देखना उपयोगी रहेगा (जैसे: https://huggingface.co/nvidia/canary-1b-flash)
अब मुझे open code या open weights से ज़्यादा open data models में दिलचस्पी है, यानी ऐसे मॉडल जिनके डेटा की ethical verifiability भी हो।
उदाहरण के लिए, मैं ऐसा मॉडल इस्तेमाल करना चाहूँगा जो बता सके कि मेरे द्वारा निर्दिष्ट resource उसके training data में शामिल था या नहीं
आजकल AI उद्योग को देखकर यह धारणा हटती नहीं कि सब बस OpenAI की services की नकल कर रहे हैं।
दूसरी कंपनियों की services भी ढाँचे में थोड़ी अलग होंगी, लेकिन मूल रूप से वही सेवाएँ लगती हैं।
innovation भी उतना ज़्यादा नहीं दिखता
अगर आप इन्हें वास्तव में इस्तेमाल करें, तो ये बिल्कुल एक जैसी नहीं लगतीं। coding जैसे रोज़मर्रा के कामों में मॉडल-दर-मॉडल अंतर बहुत बड़ा होता है
अब पूरी दुनिया मानो
f(input: string): stringफ़ंक्शन के ऊपर नई services बना रही है। ऐसे में चीज़ों का एक जैसा दिखना स्वाभाविक हैOpenAI का Deep Research फीचर भी Google से ही लिया गया था। नाम भी वही रखा गया, और Mistral ने भी वही किया
बल्कि यह एक healthy market competition की निशानी है। Apple जैसा दशकों तक innovation करने वाला उदाहरण भी monopoly-style gatekeeping का ही परिणाम है
अंततः लगभग वही तकनीक हर जगह लागू हो रही है। फ़र्क मुख्य रूप से training data और compute power का ही है
मैं ChatGPT बहुत ज़्यादा इस्तेमाल करता हूँ। Le Chat भी एक बार आज़माना चाहता हूँ, लेकिन जानना चाहता हूँ कि क्या कोई बड़ा फर्क महसूस होगा या दोनों लगभग समान हैं
अगर आपने अभी तक OpenAI का Deep Research फीचर इस्तेमाल नहीं किया है, तो ज़रूर करें। अभी तक मुझे उसका कोई सही विकल्प नहीं मिला। Google का भी इस्तेमाल किया, लेकिन उसने खास प्रभावित नहीं किया।
engineers के लिए trade-off research करते समय यह बहुत बड़ा time saver साबित हो सकता है
Anthropic का Research फीचर भी काफ़ी अच्छा है। मुझे लगता है कि यह OpenAI के स्तर का है।
Google का paid version थोड़ा ज़्यादा accurate है, लेकिन उसकी रिपोर्टें इतनी लंबी-चौड़ी होती हैं कि पढ़ना मुश्किल हो जाता है। ऐसा लगता है जैसे कोई college student सिर्फ़ word count पूरा करने के लिए रिपोर्ट खींच रहा हो
मुझे खास तौर पर market research में इससे बहुत मदद मिली (startup से जुड़ी चीज़ों में)। ऐसा लगा जैसे मैंने किसी समझदार junior planner/PM assistant को hire कर लिया हो
Kimi 2 का research फीचर भी आज़माने लायक है। उसके नतीजे उम्मीद से कहीं बेहतर निकले, यह देखकर मैं चकित रह गया
OpenAI और Gemini के नतीजे काफ़ी अलग आते हैं। यह कहना मुश्किल है कि कौन बेहतर है, बस दोनों साफ़ तौर पर अलग हैं
Perplexities भी बुरा नहीं है। हालांकि, मेरे पास OpenAI का paid subscription नहीं है, इसलिए सीधी तुलना नहीं कर सकता
prompt examples खास अच्छे नहीं हैं। उदाहरण के लिए, personal planning वाला जवाब Deep Research के बिना सीधे जवाब देने पर कहीं बेहतर आता है (उसमें सिर्फ़ visa वाला हिस्सा ही ठीक से जवाब देता है)
क्या Voxtral को Futo Android keyboard में लागू किया जा सकता है, यह जानने में दिलचस्पी है