MiniMax-M3 की एंट्री, प्रमुख बेंचमार्क प्रदर्शन में GPT-5.5 और Gemini 3.1 Pro से आगे, जबकि लागत सिर्फ 5-10%
(venturebeat.com)चीनी AI startup MiniMax ने open weights आधारित multimodal large language model 'M3' लॉन्च किया है, जो मौजूदा अमेरिकी commercial models की तुलना में सिर्फ 5~10% लागत पर GPT-5.5 और Gemini 3.1 Pro से बेहतर प्रदर्शन करता है.
पूर्ण अनुवाद
चीनी AI startup MiniMax ने frontier-स्तर की coding performance और 10 लाख token context window वाले multimodal large language model 'M3' को लॉन्च करके वैश्विक enterprise AI बाज़ार में बड़ी हलचल पैदा कर दी है. M3 को आने वाले 10 दिनों के भीतर Hugging Face और GitHub के ज़रिये 'Open Weights' open source license के तहत वितरित किया जाएगा, ताकि कंपनियां इसे अपने internal servers पर locally download करके custom optimization कर सकें. अभी इसे लॉन्च ऑफर के तहत 10 लाख input tokens पर $0.3 और output tokens पर $1.20 (कुल लागत $1.50 ) में दिया जा रहा है, और सामान्य कीमत लागू होने पर भी यह प्रमुख अमेरिकी commercial models की लागत का सिर्फ 8~20% {p:14} ही रहेगा, जिससे यह लागत के मामले में Google, OpenAI और Anthropic जैसे अमेरिकी tech दिग्गजों पर भारी पड़ता है.
M3 द्वारा इतनी नाटकीय लागत कटौती हासिल करने का मुख्य कारण 'MiniMax Sparse Attention (MSA)' architecture है, जिसने पारंपरिक transformer की quadratic computation cost explosion समस्या को हल किया है. MSA तकनीक data को high-precision blocks में विभाजित करके केवल ज़रूरी queries को dynamically match करती है, जिससे hardware efficiency अधिकतम हो जाती है. 10 लाख tokens प्रोसेस करते समय यह computation requirement को पहले के मुकाबले 20वें हिस्से {p:5} तक घटा देती है और decoding speed को 15 गुना तक बढ़ा देती है. इसी संरचनात्मक नवाचार के आधार पर M3 ने autonomous software engineering capability को मापने वाले SWE-Bench Pro में 59.0% {p:59} स्कोर किया, जिससे इसने closed model GPT-5.5 और Gemini 3.1 Pro को पीछे छोड़ दिया. Web browsing और information retrieval performance (BrowseComp 83.5% {p:84}) में भी इसने Claude Ops 4.7 के पिछले रिकॉर्ड को पार कर लिया.
हाल ही में जारी सबसे उच्च-प्रदर्शन वाले closed model Claude Ops 4.8 (SWE-Bench Pro 69.2% ) की तुलना में ultra-high-difficulty reasoning क्षेत्र में कुछ performance gap मौजूद है, लेकिन M3 भारी API subscription fee के बिना भी शक्तिशाली local automation benchmark प्रदान करता है. इसके साथ ही MiniMax ने M3 से लैस 'MiniMax Code' agent product line भी पेश की है, जो खुद code लिखती है, स्वतंत्र verification loop चलाती है और autonomously सुधार करती है. कंपनी ने $20 प्रति माह (Plus) से शुरू होने वाली aggressive pricing भी लागू की है. सख्त data privacy और regulatory compliance की आवश्यकता वाले enterprise environment में M3 का open weights उपलब्ध होना cloud data leakage risk को मूल रूप से रोक सकता है और कंपनियों को अपनी विशिष्ट core assets को आंतरिक रूप से सुरक्षित रखने के लिए बेहतरीन cost-performance दे सकता है.
लेखक की एक पंक्ति
इसे ollama cloud में इस्तेमाल करके देखना चाहिए
2 टिप्पणियां
मॉडल की तुलना का पैमाना शायद सच में थोड़ा बढ़ा-चढ़ाकर बताया गया है, लेकिन कीमत वाकई चौंकाने वाली है।
मैं अभी इसे इस्तेमाल कर रहा हूँ, और दूसरे Chinese models की तरह लिखते-लिखते अचानक Chinese निकल आने वाली समस्या इसमें नहीं है। लगता है tool call भी अच्छी तरह करता है।