Anthropic ने Claude Opus 4.7 लॉन्च किया - सेल्फ-वेरिफिकेशन, 3.3 गुना हाई-रेज़ोल्यूशन विज़न, कोडिंग में 13% सुधार
(anthropic.com)Anthropic ने अपना फ्लैगशिप मॉडल Claude Opus 4.7 लॉन्च किया है.
- SWE-bench Verified 87.6% (+6.8pp), SWE-bench Pro 64.3% के साथ GPT-5.4(57.7%) को पीछे छोड़कर पहले स्थान पर
- GPQA Diamond 94.2%, Terminal-Bench 2.0 69.4%, Finance Agent 64.4% हासिल
- कोडिंग बेंचमार्क में Opus 4.6 के मुकाबले 13% सुधार, production tasks के समाधान की दर 3 गुना बढ़ी
- नया सेल्फ-वेरिफिकेशन (Self-Verification) फीचर: काम पूरा होने से पहले खुद verification steps डिज़ाइन और execute करता है
- 3.3 गुना हाई-रेज़ोल्यूशन विज़न (अधिकतम 2,576px), नया tokenizer लागू
- xhigh effort level जोड़ा गया, agentic reasoning में 14% सुधार, tool errors एक-तिहाई तक घटे
- कीमत Opus 4.6 जैसी ही ($5/$25 per MTok)
- Anthropic ने खुद माना कि इसका प्रदर्शन private model Mythos से कम है
यह Amazon Bedrock, Google Cloud Vertex AI, और Microsoft Foundry पर भी उपलब्ध है.
1 टिप्पणियां
OPUS 4.7 > GPT 5.4 > OPUS 4.6