1 पॉइंट द्वारा recast7838 4 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Moonshot AI ने एजेंट-केंद्रित ओपन-वेट कोडिंग मॉडल 'Kimi K2.7-Code' लॉन्च किया है, जो पिछले मॉडल की तुलना में कोडिंग प्रदर्शन को काफी बेहतर बनाता है और reasoning token खपत को 30% कम करता है।


पूर्ण अनुवाद

इस सप्ताह, Moonshot AI ने Kimi K2.7-Code लॉन्च किया। यह कोडिंग के लिए विशेष रूप से बनाया गया एक एजेंट-केंद्रित मॉडल है। मॉडल weights संशोधित MIT लाइसेंस के तहत Hugging Face पर वितरित किए जाएंगे। इसे Kimi API और Kimi Code के माध्यम से भी इस्तेमाल किया जा सकता है। K2.7-Code का लक्ष्य सामान्य बातचीत नहीं, बल्कि दीर्घकालिक software engineering कार्य हैं। यह मॉडल कई चरणों में योजना बनाता है, कोड संशोधित करता है, tools चलाता है और debugging करता है। Moonshot AI इसे एक subscription-based coding platform के साथ जोड़कर पेश कर रहा है.

Kimi K2.7-Code स्पेक

K2.7-Code एक Mixture-of-Experts (MoE) मॉडल है। इसमें कुल 1 ट्रिलियन (1T) parameters हैं, जिनमें से प्रति token 32 बिलियन (32B) parameters सक्रिय होते हैं। यह संरचना ऐसी है कि कुल 384 experts में से प्रति token 8 experts चुने जाते हैं और 1 expert साझा होता है। इसमें 1 dense layer सहित कुल 61 layers हैं।

attention mechanism में MLA का उपयोग किया गया है, और feedforward path में SwiGLU लागू किया गया है। MoonViT vision encoder image और video input के लिए 400 मिलियन (400M) parameters जोड़ता है। यह मॉडल native INT4 quantization के साथ उपलब्ध है। इसका context window 256K tokens (262,144) है। इसमें दो सीमाएँ हैं। Thinking mode अनिवार्य है, और इसे निष्क्रिय करने पर API error लौटता है। sampling parameters temperature 1.0, top_p 0.95, n 1 और penalty 0.0 पर फिक्स हैं। डिफ़ॉल्ट maximum output 32,768 tokens है। इसे vLLM, SGLang और KTransformers का उपयोग करके self-host किया जा सकता है। Hugging Face repository का आकार डिस्क पर लगभग 595GB है, जो बहुत बड़ा है। यह laptop मॉडल नहीं, बल्कि server-grade deployment को लक्ष्य बनाता है।

बेंचमार्क स्कोर

Moonshot टीम ने 6 benchmark परिणाम प्रकाशित किए। उन्होंने K2.7-Code की तुलना K2.6, GPT-5.5 और Claude Opus 4.8 से की। K2.7-Code ने सभी श्रेणियों में K2.6 को पीछे छोड़ा। कोडिंग श्रेणी में सबसे बड़ा सुधार Kimi Code Bench v2 में देखा गया, जहाँ स्कोर 50.9% से बढ़कर 62.0% हो गया।

K2.7-Code ने MCP Mark Verified benchmark में 81.1% स्कोर किया, जो Opus 4.8 के 76.4% से अधिक है। MLS Bench Lite में भी इसने GPT-5.5 के करीब स्कोर दर्ज किया। K2.7-Code को Kimi Code CLI में चलाया गया, जबकि GPT-5.5 का परीक्षण Codex xhigh और Opus 4.8 का परीक्षण Claude Code xhigh environment में किया गया।

1 टिप्पणियां

 
cnaa97 1 시간 전

वाकई कमाल है