MiniMax M2 मॉडल का मुख्य सारांश
- मॉडल अवलोकन: चीन की MiniMax का M2 मॉडल (230 अरब पैरामीटर, selective activation संरचना) Claude Opus 4.1 से बेहतर प्रदर्शन दिखाता है, जबकि इसकी लागत Claude Sonnet की 8% ($0.30/10 लाख input tokens) है और गति 2 गुना तेज़ है।
- दक्षता में नवाचार: MoE संरचना के जरिए केवल आवश्यक पैरामीटर सक्रिय करके लागत में 92% कमी, और व्यावहारिक उपयोग पर केंद्रित विकास (जटिल coding·agent कार्यों का समाधान)।
- बेंचमार्क प्रदर्शन: Intelligence Index में 61 अंक (open source में नंबर 1), SWE-bench में 69.4 अंक, Terminal-Bench में 46.3 अंक, BrowseComp में 44 अंक — Claude·Gemini मॉडलों के करीब या उनसे बेहतर।
- वास्तविक उपयोग: गणित·coding·agent workflow (data analysis·issue investigation·programming) में उत्कृष्ट, और developer tests के जरिए error fixing क्षमता साबित।
- उपयोग का तरीका: वेब सेवा (https://agent.minimax.io/) पर मुफ्त उपयोग, API integration, और Hugging Face open source (MIT license) डाउनलोड की सिफारिश (कुछ विशेष settings आवश्यक)।
- महत्व: open source मॉडलों के उभार के साथ AI प्रतिस्पर्धा दक्षता और व्यावहारिकता-केंद्रित दिशा में बदल रही है।
3 टिप्पणियां
अगर यह 23B होता (मुख्य लेख में 230B है), तो लगा था कि शायद इसे mac mini पर भी चला सकते हैं..
मैं भी... यह सुनकर कि 23B, Claude 4.1 Opus के स्तर का है, Hugging Face पर गया था, लेकिन 230B निकला, तो निराशा हुई.....
यह 23 अरब नहीं, बल्कि 230 अरब पैरामीटर हैं।