घोषणा
- Claude 3.7 Sonnet और Claude Code की घोषणा की गई। Claude 3.7 Sonnet बाज़ार का पहला hybrid reasoning model है, जो तेज़ प्रतिक्रिया और चरण-दर-चरण सोच प्रदान करता है। API उपयोगकर्ता मॉडल के सोचने के समय को बारीकी से नियंत्रित कर सकते हैं।
- Claude 3.7 Sonnet coding और frontend web development में विशेष रूप से मज़बूत प्रदर्शन दिखाता है। Claude Code एक command-line tool है, जो terminal से सीधे engineering कार्य सौंपने की सुविधा देता है, और इसे सीमित research preview के रूप में उपलब्ध कराया गया है।
- Claude 3.7 Sonnet सभी Claude plans, Anthropic API, Amazon Bedrock, और Google Cloud के Vertex AI पर उपलब्ध है। extended thinking mode मुफ्त Claude tier को छोड़कर सभी platforms पर उपलब्ध है।
Claude 3.7 Sonnet: व्यावहारिक अत्याधुनिक reasoning
- Claude 3.7 Sonnet को मौजूदा reasoning models से अलग दर्शन के साथ विकसित किया गया है। जैसे इंसान तेज़ प्रतिक्रिया और गहरे चिंतन के लिए एक ही मस्तिष्क का उपयोग करता है, वैसे ही reasoning को एकीकृत क्षमता होना चाहिए—ऐसा माना गया है।
- Claude 3.7 Sonnet सामान्य LLM और reasoning model को एक में जोड़ता है, जिससे उपयोगकर्ता सामान्य response और गहरी सोच के बीच चयन कर सकते हैं। extended thinking mode में गणित, भौतिकी, coding आदि में प्रदर्शन बेहतर होता है।
- API के माध्यम से Claude 3.7 Sonnet का उपयोग करते समय, उपयोगकर्ता सोचने के budget को नियंत्रित कर सकते हैं। इससे response की गति और गुणवत्ता को समायोजित किया जा सकता है।
- Claude 3.7 Sonnet गणित और computer science समस्याओं की तुलना में वास्तविक business use cases पर अधिक ध्यान देता है। शुरुआती tests में इसने coding क्षमता में उत्कृष्ट परिणाम दिखाए।
Claude Code
- Claude Code एक ऐसा tool है जो developers को code search, file editing, test चलाने, GitHub पर code commit और push करने जैसे काम करने में मदद करता है।
- Claude Code test-driven development, जटिल समस्याओं की debugging, और बड़े पैमाने के refactoring में विशेष रूप से उपयोगी है। शुरुआती tests में इसने development time को काफी कम किया।
- Claude Code का लक्ष्य यह समझना है कि developers Claude का उपयोग कैसे करते हैं, ताकि भविष्य में models को बेहतर बनाने में उसे शामिल किया जा सके।
Claude के साथ codebase पर काम करना
- Claude.ai में coding experience बेहतर किया गया है। GitHub integration अब सभी Claude plans में उपलब्ध है, जिससे developers अपने code repositories को सीधे Claude से जोड़ सकते हैं।
- Claude 3.7 Sonnet व्यक्तिगत, कार्यस्थल, और open source projects की गहरी समझ के आधार पर bug fixes, feature development, और documentation writing में एक मज़बूत partner बनता है।
ज़िम्मेदारी के साथ निर्माण
- Claude 3.7 Sonnet ने security, safety, और reliability सुनिश्चित करने के लिए बाहरी विशेषज्ञों के साथ मिलकर व्यापक testing और evaluation से गुज़रा है।
- नए safety results को कवर करने वाला system card उपलब्ध कराया गया है। इसमें responsible scaling policy evaluations शामिल हैं, जिन्हें अन्य AI labs और researchers भी लागू कर सकते हैं।
भविष्य की ओर
- Claude 3.7 Sonnet और Claude Code ऐसे AI systems की दिशा में एक महत्वपूर्ण कदम हैं, जो मानवीय क्षमताओं को बढ़ा सकते हैं। ये गहन reasoning, स्वायत्त कार्य, और प्रभावी collaboration के माध्यम से मानवीय उपलब्धियों का विस्तार करते हैं।
- नई क्षमताओं को explore करने और निर्माण करने की उम्मीद के साथ, निरंतर सुधार के लिए feedback का स्वागत है।
2 टिप्पणियां
Hacker News राय
Claude 3.7 Sonnet ने Aider मल्टीलैंग्वेज लीडरबोर्ड पर 60.4% स्कोर किया
Claude Code टीम के Boris प्रोडक्ट से जुड़े सवालों के जवाब देने वाले हैं
Kagi LLM बेंचमार्क को Sonnet 3.7 के general purpose और thinking mode के साथ अपडेट किया गया
HN प्रोफ़ाइल का विश्लेषण करने वाला एक मज़ेदार फीचर है
OpenAI इस बात पर फोकस कर रहा है कि असली बिज़नेस में LLM का उपयोग कैसे किया जाता है
Anthropic का code पर फोकस करना उचित लगता है
Cursor को latest version में अपडेट किया गया है और model list में "claude-3.7-sonnet" जोड़ा गया है
Claude 3.7 Sonnet के साथ पहली interaction में गहरा प्रभाव पड़ा
Claude ने 30 सेकंड में बैचलर थीसिस का आधा हिस्सा फिर से लिख दिया
o1 pro ने कुछ बार चौंकाने वाले नतीजे दिए
flash 2 से तुलना करने के लिए कीमत का अंतर बहुत ज़्यादा है.. यह ठीक o1pro और o3-mini के बीच के स्तर का है