Cursor Composer 2.5, Cursor में सबसे ज़्यादा चुना जाने वाला मॉडल बना — 10x उपयोग बोनस
(x.com/mntruell)- Cursor के CEO Michael Truell ने X पर घोषणा की: “Composer 2.5, Cursor में सबसे ज़्यादा चुना जाने वाला मॉडल बन गया है। एक दिन के लिए सभी उपयोगकर्ताओं को 10 गुना उपयोग दिया जाएगा।”
- यह रिलीज़ के तुरंत बाद adoption rate के तेज़ी से बढ़ने का संकेत है, जहां Anthropic/OpenAI मॉडलों के मुकाबले Cursor का अपना मॉडल default रूप से चुना जा रहा है
Composer 2.5 मुख्य सारांश
• 18 मई को आधिकारिक रूप से लॉन्च किया गया Cursor का तीसरी पीढ़ी का self-developed agentic coding model
• Composer 2 की तरह ही Moonshot AI के open source Kimi K2.5 को base के रूप में इस्तेमाल करता है, और इस बार घोषणा के पहले पैराग्राफ में इसे स्पष्ट रूप से बताया गया है (मार्च में Kimi base को साफ़ तौर पर उजागर न करने पर आलोचना हुई थी, उसी को ध्यान में रखकर किया गया कदम)
• कुल compute का 85% Cursor की अपनी reinforcement learning pipeline और post-training में लगाया गया, और Composer 2 की तुलना में 25 गुना ज़्यादा synthetic coding tasks इस्तेमाल किए गए
• long-horizon कामों में reliability बढ़ाने के लिए “text feedback based targeted RL” पेश किया गया — लंबे rollout के अंत में केवल एक reward देने के बजाय, जहां गलत tool call हुआ उसी खास बिंदु पर सीधे hint inject करके credit assignment को अधिक सटीक बनाया गया
बेंचमार्क (Composer 2.5 vs Opus 4.7 vs GPT-5.5 vs Composer 2)
• Terminal-Bench 2.0: 69.3% vs 69.4% vs 82.7% vs 61.7% — Opus 4.7 के साथ लगभग बराबरी, GPT-5.5 से करीब 13 अंक पीछे
• SWE-Bench Multilingual: 79.8% vs 80.5% vs 77.8% vs 73.7% — Opus 4.7 से 0.7 अंक पीछे, GPT-5.5 से आगे
• CursorBench v3.1 (default setting): Composer 2.5 63.2%, Opus 4.7 xhigh default 61.6%, GPT-5.5 medium default 59.2% — असली डेवलपरों द्वारा इस्तेमाल किए जाने वाले default settings में दोनों frontier models को पीछे छोड़ा
कीमत — सबसे मज़बूत हथियार
• Standard tier: input $0.50/M, output $2.50/M. Fast tier (interactive default): input $3.00/M, output $15.00/M
• SWE-Bench Multilingual में Opus 4.7 के बराबर प्रदर्शन देते हुए Anthropic की कीमत का लगभग 1/10
• CursorBench के आधार पर 63% accuracy हासिल करते हुए औसत task cost $1 से कम — समान स्तर के प्रदर्शन वाले Opus/GPT की प्रति task लागत कई डॉलर ज़्यादा
साथ में सामने आई बड़ी तस्वीर
• Cursor ने यह भी घोषणा की कि Composer 2.5 से अलग, वह xAI infrastructure (SpaceXAI) के साथ Colossus 2 के लगभग 10 लाख H100-स्तर GPU का उपयोग करके 10 गुना बड़ा मॉडल शुरुआत से train कर रहा है (रिलीज़ तारीख तय नहीं)
• CEO Michael Truell के अनुसार, अभी Cursor के भीतर merge होने वाले PR में से 35% autonomous agent द्वारा बनाए जाते हैं
• Claude Code के ARR 2.5 अरब डॉलर और 3 लाख business customers पार करने के बाद Cursor पर दबाव बढ़ा था, और अब कंपनी अपने खुद के मॉडल से जवाबी हमला करती दिख रही है
उपयोग सीमाएँ / टिप्पणियाँ
• Composer 2.5 केवल Cursor IDE, Cursor CLI और Cursor web में उपलब्ध है — कोई बाहरी API, HuggingFace mirror, या third-party gateway नहीं
• Kimi K2.5 आधारित होने की वजह से regulated industries या federal से जुड़े कामों में यह अब भी एक विचारणीय तत्व है
• यह रिलीज़ दिखाती है कि “IDE wrapper” के रूप में शुरू हुआ Cursor अब गंभीरता से एक model lab में बदल रहा है। उसी base पर केवल post-training से +6pt से अधिक सुधार लाना, इस बात का अच्छा data point है कि “vertical RL raw scale को कितनी दूर तक हरा सकता है”
• स्रोत: X (@mntruell), Cursor: Introducing Composer 2.5, OfficeChai
1 टिप्पणियां
अभी नया आया है इसलिए इस्तेमाल करके देख रहा हूँ, और Composer 2.5 काफ़ी काम का लग रहा है।