Anthropic ने Claude 3.7 Sonnet लॉन्च किया
(anthropic.com)Anthropic ने अब तक का अपना सबसे बुद्धिमान मॉडल Claude 3.7 Sonnet लॉन्च किया है। यह बाज़ार का पहला hybrid reasoning model है, जो तुरंत जवाब देने के साथ-साथ यूज़र को दिखाई देने वाली step-by-step thinking process भी प्रदान कर सकता है.
मुख्य विशेषताएँ:
- coding और frontend web development में बड़ा performance improvement
- नया command-line tool 'Claude Code' पेश किया गया - डेवलपर terminal से सीधे engineering tasks Claude को सौंप सकते हैं
- सभी Claude plans (Free, Pro, Team, Enterprise), Anthropic API, AWS Bedrock, और Google Cloud Vertex AI पर उपलब्ध
- extended thinking mode free tier को छोड़कर सभी platforms पर उपलब्ध
- कीमत पिछले मॉडल के समान: input tokens के प्रति million $3, output tokens के प्रति million $15 (thinking tokens सहित)
प्रदर्शन में सुधार:
- SWE-bench Verified और TAU-bench में सर्वोच्च performance हासिल
- Cursor, Cognition, Vercel, Replit, Canva आदि के शुरुआती tests में complex codebases को संभालने, advanced tools के उपयोग, code planning और changes, तथा full-stack updates में उत्कृष्ट क्षमता साबित
- production-level code generation और error reduction में बेहतर प्रदर्शन
- math, physics, और instruction following क्षमता में सुधार
Claude Code:
- code search और reading, file editing, tests लिखना और चलाना, GitHub पर code commit और push करना, command-line tools का उपयोग संभव
- test-driven development, complex problem debugging, और large-scale refactoring में विशेष रूप से उपयोगी
- आम तौर पर 45 मिनट से अधिक समय लेने वाले काम एक बार में पूरे करके development time में बड़ी कमी
- फिलहाल limited research preview के रूप में उपलब्ध
GitHub integration:
- अब सभी Claude plans में GitHub integration उपलब्ध
- personal, work, और open source projects की गहरी समझ के आधार पर काम
- bug fixes, feature development, और documentation writing में मज़बूत partner की भूमिका
- यूज़र के महत्वपूर्ण GitHub projects में व्यापक support प्रदान
सुरक्षा सुधारों में, पिछले मॉडल की तुलना में अनावश्यक refusal responses में 45% कमी आई है, और harmful requests तथा harmless requests के बीच अधिक सूक्ष्म अंतर करना संभव हुआ है।
5 टिप्पणियां
Anthropic CEO Dario Amodei: DeepSeek मॉडल उतने चौंकाने वाले नहीं हैं
लगता है Perplexity में भी जोड़ दिया गया है।
लेकिन अभी reasoning शायद इस्तेमाल नहीं हो रही है..
मैंने Claude Code इंस्टॉल करके इस्तेमाल किया, और वीडियो की तरह ही उससे दो प्रोजेक्ट्स का ओवरव्यू पूछा।
Total cost: $0.1151
Total cost: $0.0855
यानी लगभग 0.2 डॉलर खर्च हो जाते हैं..?
अगर वीडियो का उदाहरण 45 मिनट से ज़्यादा समय लेने वाला काम है, तो यह काफ़ी महँगा काम रहा होगा।
बहुत महंगा है, value for money नहीं है। असली उपयोग में तो o3-mini ही बेहतर लगता है, लेकिन अगर coding के लिए इस्तेमाल करना हो तो reasoning चरण छोटा है और middle tokens की समस्या भी हल करनी होगी, इसलिए उस उपयोग के हिसाब से यह सबसे अच्छा लगता है। कीमत भी..
विस्तारित Thinking Mode (Thinking Mode - Extended)
लगता है कि इसने OpenAI के o1 या DeepSeek के R1 जैसे अलग reasoning model से अलग approach चुना है। ऐसा दिखता है कि एक ही मॉडल के भीतर दो मोड integrate किए गए हैं।
इसके अलावा, जब सीधे मॉडल से training data cutoff date पूछी गई, तो उसने जवाब दिया कि वह 2024 के अक्टूबर के अंत की है~!