Claude 3.5 Sonnet लॉन्च: GPT4o से बेहतर प्रदर्शन

(anthropic.com)

15 पॉइंट द्वारा brainer 2024-06-21 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Anthropic ने आज Claude 3.5 Sonnet लॉन्च किया। यह जल्द आने वाले Claude 3.5 मॉडल परिवार का पहला संस्करण है और मौजूदा Claude 3 Opus तथा प्रतिस्पर्धी मॉडलों की तुलना में बेहतर प्रदर्शन देता है। Claude 3.5 Sonnet को मिड-टियर मॉडल Claude 3 Sonnet जैसी ही स्पीड और लागत पर उपलब्ध कराया गया है.

उपलब्धता

Claude 3.5 Sonnet को Claude.ai और Claude iOS ऐप में मुफ्त में इस्तेमाल किया जा सकता है, जबकि Claude Pro और Team प्लान सब्सक्राइबर इसे अधिक request limits के साथ एक्सेस कर सकते हैं। यह Anthropic API, Amazon Bedrock और Google Cloud के Vertex AI के जरिए भी उपलब्ध है। इसकी कीमत प्रति मिलियन input tokens $3 और प्रति मिलियन output tokens $15 है, और यह 200K tokens का context window प्रदान करता है।

प्रदर्शन में सुधार

Claude 3.5 Sonnet ने graduate-level reasoning (GPQA), undergraduate-level knowledge (MMLU) और coding ability (HumanEval) में नए मानक स्थापित किए हैं। humor और complex instructions को समझने की इसकी क्षमता में काफी सुधार हुआ है, और यह स्वाभाविक तथा सहानुभूतिपूर्ण टोन में उच्च-गुणवत्ता की सामग्री लिख सकता है।

आंतरिक मूल्यांकन परिणाम

आंतरिक coding evaluation में Claude 3.5 Sonnet ने 64% समस्याएँ हल कीं, जो Claude 3 Opus के 38% से बेहतर है। इस मूल्यांकन में प्राकृतिक भाषा विवरण के आधार पर open source codebase में bugs को ठीक करने या features जोड़ने की क्षमता का परीक्षण किया गया। Claude 3.5 Sonnet code translation को आसानी से संभालता है, इसलिए यह legacy applications को अपडेट करने और codebase migration में विशेष रूप से प्रभावी है।

विज़ुअल क्षमताएँ

Claude 3.5 Sonnet ने standard visual benchmarks में Claude 3 Opus को पीछे छोड़ा है और visual reasoning की आवश्यकता वाले कार्यों में खास प्रदर्शन दिखाया है। अधूरी छवियों से text को सटीक रूप से transcribe करने की इसकी क्षमता retail, logistics और financial services जैसे क्षेत्रों में बहुत उपयोगी है।

Artifacts फीचर की शुरुआत

आज Claude.ai में पेश किया गया Artifacts एक dynamic workspace प्रदान करता है, जिसमें उपयोगकर्ता generated code snippets, text documents, website designs जैसी सामग्री को real time में edit कर सकते हैं और उन्हें projects तथा workflows में integrate कर सकते हैं।

सुरक्षा और प्राइवेसी

Claude 3.5 Sonnet ने ASL-2 स्तर पर कड़े tests पूरे किए हैं और UK Artificial Intelligence Safety Institute (UK AISI) के सहयोग से pre-deployment safety evaluation भी पूरा किया है। उपयोगकर्ता डेटा को स्पष्ट अनुमति के बिना training में इस्तेमाल नहीं किया जाता।

आगे की योजना

Claude 3.5 मॉडल परिवार को पूरा करने के लिए इस साल के अंत में Claude 3.5 Haiku और Claude 3.5 Opus लॉन्च करने की योजना है। नई features और modalities विकसित की जा रही हैं ताकि enterprise application integration को समर्थन दिया जा सके, और उपयोगकर्ता की पसंद तथा interaction history को याद रखने वाले 'Memory' फीचर पर भी काम हो रहा है।

हम हमेशा Claude को बेहतर बनाने और उपयोगकर्ता feedback को शामिल करके बेहतर अनुभव देने का प्रयास करते हैं। Claude 3.5 Sonnet पर अपना feedback सीधे product के भीतर भेजा जा सकता है, ताकि उसे development roadmap में शामिल किया जा सके।

1 टिप्पणियां

wedding 2024-06-21

मैंने इसे टेस्ट किया, और स्पीड काफ़ी ज़्यादा तेज़ है.
यह भी अच्छा है कि gpt4o की तरह इसे भी एक तय संख्या तक मुफ़्त में इस्तेमाल किया जा सकता है.