Cursor ने coding-विशेष AI मॉडल Composer 2 लॉन्च किया
(cursor.com)Cursor ने frontier-स्तर की performance और किफायती कीमत वाला coding-विशेष AI मॉडल Composer 2 पेश किया है.
प्रदर्शन
सभी प्रमुख benchmarks में इसने पिछले संस्करण की तुलना में बड़ा सुधार दर्ज किया है.
मॉडल का मूल्यांकन तीन tests से किया गया.
CursorBench — यह Cursor द्वारा बनाया गया वास्तविक coding tasks benchmark है. Composer 1 → 1.5 → 2 के साथ स्कोर 38.0 → 44.2 → 61.3 तक पहुँचा. 1 से 2 तक आते-आते performance में लगभग 61% सुधार हुआ, और खास तौर पर 1.5 → 2 चरण में लगभग 17 points की तेज छलांग दिखी, जो इस generation की सबसे बड़ी प्रगति थी.
Terminal-Bench 2.0 — यह Laude Institute द्वारा प्रबंधित terminal-आधारित agent evaluation है. यह terminal में वास्तविक commands चलाकर tasks पूरा करने की क्षमता को मापता है. स्कोर 40.0 → 47.9 → 61.7 रहा, जो CursorBench के लगभग समान वृद्धि पैटर्न को दिखाता है.
SWE-bench Multilingual — यह प्रसिद्ध software engineering benchmark का multilingual version है, जिसमें वास्तविक GitHub issues को code के जरिए हल किया जाता है. इसका स्कोर 56.9 → 65.9 → 73.7 तक बढ़ा. Composer 1 के समय से ही 56-point range के साथ यह बाकी दो benchmarks से ऊपर शुरू हुआ था, जिसका मतलब है कि code patch लिखने की क्षमता अपेक्षाकृत पहले से ही मजबूत थी.
मुख्य बिंदु
तीनों benchmarks में 1 → 1.5 की तुलना में 1.5 → 2 चरण की बढ़ोतरी कहीं अधिक बड़ी है, और यही इस घोषणा का मुख्य बिंदु है. continual pretraining + reinforcement learning का संयोजन यहीं सबसे असरदार साबित हुआ. SWE-bench Multilingual में 73.7 का स्कोर वर्तमान में सार्वजनिक मॉडलों में शीर्ष स्तर के स्कोरों में गिना जाता है.
मानक version: input $0.50 / output $2.50 (प्रति million tokens)
तेज़ version (fast): input $1.50 / output $7.50 (प्रति million tokens)
तेज़ version को default option के रूप में उपलब्ध कराया जाएगा, और समान श्रेणी के high-speed models की तुलना में इसकी कम कीमत इसकी बड़ी ताकत है. व्यक्तिगत plan users को अलग usage pool के रूप में पर्याप्त bundled quota भी मिलेगा.
टिप्पणी
यह प्रभावशाली है कि Cursor, Claude और GPT जैसे बाहरी models का उपयोग करने वाली layer से आगे बढ़कर अब अपने मॉडल को सीधे train करने की दिशा में गंभीरता से मुड़ा है. खासकर price-to-performance positioning काफी आक्रामक दिखती है, और इसे coding agent market में model layer तक vertical integration की रणनीति के रूप में पढ़ा जा सकता है. जो लोग अब तक Cursor में Claude Sonnet या GPT-4o का उपयोग कर रहे थे, वे Composer 2 पर switch करने पर विचार कर सकते हैं.
अभी कोई टिप्पणी नहीं है.