Anthropic ने Claude 3.7 Sonnet लॉन्च किया

(anthropic.com)

18 पॉइंट द्वारा humblebee 2025-02-25 | 5 टिप्पणियां | WhatsApp पर शेयर करें

Anthropic ने अब तक का अपना सबसे बुद्धिमान मॉडल Claude 3.7 Sonnet लॉन्च किया है। यह बाज़ार का पहला hybrid reasoning model है, जो तुरंत जवाब देने के साथ-साथ यूज़र को दिखाई देने वाली step-by-step thinking process भी प्रदान कर सकता है.

मुख्य विशेषताएँ:

coding और frontend web development में बड़ा performance improvement
नया command-line tool 'Claude Code' पेश किया गया - डेवलपर terminal से सीधे engineering tasks Claude को सौंप सकते हैं
सभी Claude plans (Free, Pro, Team, Enterprise), Anthropic API, AWS Bedrock, और Google Cloud Vertex AI पर उपलब्ध
extended thinking mode free tier को छोड़कर सभी platforms पर उपलब्ध
कीमत पिछले मॉडल के समान: input tokens के प्रति million $3, output tokens के प्रति million $15 (thinking tokens सहित)

प्रदर्शन में सुधार:

SWE-bench Verified और TAU-bench में सर्वोच्च performance हासिल
Cursor, Cognition, Vercel, Replit, Canva आदि के शुरुआती tests में complex codebases को संभालने, advanced tools के उपयोग, code planning और changes, तथा full-stack updates में उत्कृष्ट क्षमता साबित
production-level code generation और error reduction में बेहतर प्रदर्शन
math, physics, और instruction following क्षमता में सुधार

Claude Code:

code search और reading, file editing, tests लिखना और चलाना, GitHub पर code commit और push करना, command-line tools का उपयोग संभव
test-driven development, complex problem debugging, और large-scale refactoring में विशेष रूप से उपयोगी
आम तौर पर 45 मिनट से अधिक समय लेने वाले काम एक बार में पूरे करके development time में बड़ी कमी
फिलहाल limited research preview के रूप में उपलब्ध

GitHub integration:

अब सभी Claude plans में GitHub integration उपलब्ध
personal, work, और open source projects की गहरी समझ के आधार पर काम
bug fixes, feature development, और documentation writing में मज़बूत partner की भूमिका
यूज़र के महत्वपूर्ण GitHub projects में व्यापक support प्रदान

सुरक्षा सुधारों में, पिछले मॉडल की तुलना में अनावश्यक refusal responses में 45% कमी आई है, और harmful requests तथा harmless requests के बीच अधिक सूक्ष्म अंतर करना संभव हुआ है।

5 टिप्पणियां

yeorinhieut 2025-02-25

Anthropic CEO Dario Amodei: DeepSeek मॉडल उतने चौंकाने वाले नहीं हैं

yeorinhieut 2025-02-25

लगता है Perplexity में भी जोड़ दिया गया है।
लेकिन अभी reasoning शायद इस्तेमाल नहीं हो रही है..

bearmett 2025-02-25

मैंने Claude Code इंस्टॉल करके इस्तेमाल किया, और वीडियो की तरह ही उससे दो प्रोजेक्ट्स का ओवरव्यू पूछा।

Total cost: $0.1151
Total cost: $0.0855

यानी लगभग 0.2 डॉलर खर्च हो जाते हैं..?

अगर वीडियो का उदाहरण 45 मिनट से ज़्यादा समय लेने वाला काम है, तो यह काफ़ी महँगा काम रहा होगा।

riskatcher 2025-02-25

बहुत महंगा है, value for money नहीं है। असली उपयोग में तो o3-mini ही बेहतर लगता है, लेकिन अगर coding के लिए इस्तेमाल करना हो तो reasoning चरण छोटा है और middle tokens की समस्या भी हल करनी होगी, इसलिए उस उपयोग के हिसाब से यह सबसे अच्छा लगता है। कीमत भी..

humblebee 2025-02-25

विस्तारित Thinking Mode (Thinking Mode - Extended)

यह फीचर मॉडल को जवाब देने से पहले self-reflection के ज़रिए अधिक गहराई से सोचने देता है
गणित, भौतिकी, निर्देशों का पालन, कोडिंग आदि विभिन्न कार्यों में प्रदर्शन बेहतर हुआ है
API उपयोगकर्ता मॉडल के सोचने के समय को अधिकतम 128K tokens तक नियंत्रित कर सकते हैं
speed (cost) और जवाब की quality के बीच संतुलन समायोजित करने की flexibility देता है
जैसे इंसान तेज़ प्रतिक्रिया और गहरी सोच को एक ही दिमाग से संभालते हैं, वैसे ही अलग मॉडल के बिना एक ही मॉडल में दो मोड देता है

लगता है कि इसने OpenAI के o1 या DeepSeek के R1 जैसे अलग reasoning model से अलग approach चुना है। ऐसा दिखता है कि एक ही मॉडल के भीतर दो मोड integrate किए गए हैं।

इसके अलावा, जब सीधे मॉडल से training data cutoff date पूछी गई, तो उसने जवाब दिया कि वह 2024 के अक्टूबर के अंत की है~!

Anthropic ने Claude 3.7 Sonnet लॉन्च किया

संबंधित पढ़ाई

5 टिप्पणियां