Anthropic ने अपना फ्लैगशिप मॉडल Claude Opus 4.7 लॉन्च किया है.

  • SWE-bench Verified 87.6% (+6.8pp), SWE-bench Pro 64.3% के साथ GPT-5.4(57.7%) को पीछे छोड़कर पहले स्थान पर
  • GPQA Diamond 94.2%, Terminal-Bench 2.0 69.4%, Finance Agent 64.4% हासिल
  • कोडिंग बेंचमार्क में Opus 4.6 के मुकाबले 13% सुधार, production tasks के समाधान की दर 3 गुना बढ़ी
  • नया सेल्फ-वेरिफिकेशन (Self-Verification) फीचर: काम पूरा होने से पहले खुद verification steps डिज़ाइन और execute करता है
  • 3.3 गुना हाई-रेज़ोल्यूशन विज़न (अधिकतम 2,576px), नया tokenizer लागू
  • xhigh effort level जोड़ा गया, agentic reasoning में 14% सुधार, tool errors एक-तिहाई तक घटे
  • कीमत Opus 4.6 जैसी ही ($5/$25 per MTok)
  • Anthropic ने खुद माना कि इसका प्रदर्शन private model Mythos से कम है

यह Amazon Bedrock, Google Cloud Vertex AI, और Microsoft Foundry पर भी उपलब्ध है.

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.