1 पॉइंट द्वारा GN⁺ 2025-02-25 | 2 टिप्पणियां | WhatsApp पर शेयर करें

घोषणा

  • Claude 3.7 Sonnet और Claude Code की घोषणा की गई। Claude 3.7 Sonnet बाज़ार का पहला hybrid reasoning model है, जो तेज़ प्रतिक्रिया और चरण-दर-चरण सोच प्रदान करता है। API उपयोगकर्ता मॉडल के सोचने के समय को बारीकी से नियंत्रित कर सकते हैं।
  • Claude 3.7 Sonnet coding और frontend web development में विशेष रूप से मज़बूत प्रदर्शन दिखाता है। Claude Code एक command-line tool है, जो terminal से सीधे engineering कार्य सौंपने की सुविधा देता है, और इसे सीमित research preview के रूप में उपलब्ध कराया गया है।
  • Claude 3.7 Sonnet सभी Claude plans, Anthropic API, Amazon Bedrock, और Google Cloud के Vertex AI पर उपलब्ध है। extended thinking mode मुफ्त Claude tier को छोड़कर सभी platforms पर उपलब्ध है।

Claude 3.7 Sonnet: व्यावहारिक अत्याधुनिक reasoning

  • Claude 3.7 Sonnet को मौजूदा reasoning models से अलग दर्शन के साथ विकसित किया गया है। जैसे इंसान तेज़ प्रतिक्रिया और गहरे चिंतन के लिए एक ही मस्तिष्क का उपयोग करता है, वैसे ही reasoning को एकीकृत क्षमता होना चाहिए—ऐसा माना गया है।
  • Claude 3.7 Sonnet सामान्य LLM और reasoning model को एक में जोड़ता है, जिससे उपयोगकर्ता सामान्य response और गहरी सोच के बीच चयन कर सकते हैं। extended thinking mode में गणित, भौतिकी, coding आदि में प्रदर्शन बेहतर होता है।
  • API के माध्यम से Claude 3.7 Sonnet का उपयोग करते समय, उपयोगकर्ता सोचने के budget को नियंत्रित कर सकते हैं। इससे response की गति और गुणवत्ता को समायोजित किया जा सकता है।
  • Claude 3.7 Sonnet गणित और computer science समस्याओं की तुलना में वास्तविक business use cases पर अधिक ध्यान देता है। शुरुआती tests में इसने coding क्षमता में उत्कृष्ट परिणाम दिखाए।

Claude Code

  • Claude Code एक ऐसा tool है जो developers को code search, file editing, test चलाने, GitHub पर code commit और push करने जैसे काम करने में मदद करता है।
  • Claude Code test-driven development, जटिल समस्याओं की debugging, और बड़े पैमाने के refactoring में विशेष रूप से उपयोगी है। शुरुआती tests में इसने development time को काफी कम किया।
  • Claude Code का लक्ष्य यह समझना है कि developers Claude का उपयोग कैसे करते हैं, ताकि भविष्य में models को बेहतर बनाने में उसे शामिल किया जा सके।

Claude के साथ codebase पर काम करना

  • Claude.ai में coding experience बेहतर किया गया है। GitHub integration अब सभी Claude plans में उपलब्ध है, जिससे developers अपने code repositories को सीधे Claude से जोड़ सकते हैं।
  • Claude 3.7 Sonnet व्यक्तिगत, कार्यस्थल, और open source projects की गहरी समझ के आधार पर bug fixes, feature development, और documentation writing में एक मज़बूत partner बनता है।

ज़िम्मेदारी के साथ निर्माण

  • Claude 3.7 Sonnet ने security, safety, और reliability सुनिश्चित करने के लिए बाहरी विशेषज्ञों के साथ मिलकर व्यापक testing और evaluation से गुज़रा है।
  • नए safety results को कवर करने वाला system card उपलब्ध कराया गया है। इसमें responsible scaling policy evaluations शामिल हैं, जिन्हें अन्य AI labs और researchers भी लागू कर सकते हैं।

भविष्य की ओर

  • Claude 3.7 Sonnet और Claude Code ऐसे AI systems की दिशा में एक महत्वपूर्ण कदम हैं, जो मानवीय क्षमताओं को बढ़ा सकते हैं। ये गहन reasoning, स्वायत्त कार्य, और प्रभावी collaboration के माध्यम से मानवीय उपलब्धियों का विस्तार करते हैं।
  • नई क्षमताओं को explore करने और निर्माण करने की उम्मीद के साथ, निरंतर सुधार के लिए feedback का स्वागत है।

2 टिप्पणियां

 
GN⁺ 2025-02-25
Hacker News राय
  • Claude 3.7 Sonnet ने Aider मल्टीलैंग्वेज लीडरबोर्ड पर 60.4% स्कोर किया

    • बिना किसी अतिरिक्त सोच मोड के भी इसने ऊंचा स्कोर किया, और Sonnet 3.5 का रिकॉर्ड पार कर लिया
    • Aider 0.75.0, 3.7 Sonnet को सपोर्ट करता है
    • सोच मोड सपोर्ट और बेंचमार्क नतीजे जल्द आने वाले हैं
  • Claude Code टीम के Boris प्रोडक्ट से जुड़े सवालों के जवाब देने वाले हैं

  • Kagi LLM बेंचमार्क को Sonnet 3.7 के general purpose और thinking mode के साथ अपडेट किया गया

    • इसे Gemini 2.0 pro के बाद दूसरा सबसे शक्तिशाली general purpose LLM माना गया
    • thinking mode में यह o1-mini और o3-mini के समान स्तर पर है
    • कुल मिलाकर यह उसी कीमत पर उच्च गुणवत्ता और तेज़ी देता है
    • Kagi Assistant में यह 24 घंटे के भीतर सक्रिय होने वाला है
  • HN प्रोफ़ाइल का विश्लेषण करने वाला एक मज़ेदार फीचर है

    • इसका उपयोग नए मॉडल के humor को टेस्ट करने के लिए किया जा रहा है
  • OpenAI इस बात पर फोकस कर रहा है कि असली बिज़नेस में LLM का उपयोग कैसे किया जाता है

    • लक्ष्य "सबसे स्मार्ट मॉडल" बनाना है, लेकिन व्यवहार में इसका उपयोग मुख्य रूप से learning assistance, data transformation, और code writing में होता है
    • "intelligence" और "practicality" के बीच संतुलन महत्वपूर्ण है
  • Anthropic का code पर फोकस करना उचित लगता है

    • यह देखना दिलचस्प होगा कि Devin का competitor कैसा होगा
  • Cursor को latest version में अपडेट किया गया है और model list में "claude-3.7-sonnet" जोड़ा गया है

    • "claude-3.7-sonnet-thinking" भी काम करता है
    • जल्द ही thinking time control फीचर जोड़ा जाएगा
  • Claude 3.7 Sonnet के साथ पहली interaction में गहरा प्रभाव पड़ा

    • CloudFlare Pages function की एक समस्या हल करने में मदद मिली
    • Claude 3.7 ने समस्या को ठीक-ठीक पहचाना और समाधान सुझाया
  • Claude ने 30 सेकंड में बैचलर थीसिस का आधा हिस्सा फिर से लिख दिया

    • Gemini Flash 2 इसमें असफल रहा
  • o1 pro ने कुछ बार चौंकाने वाले नतीजे दिए

    • complex MCU code की समीक्षा करने में मदद मिली
    • o1 pro ने SPI इस्तेमाल करने वाले code को समझा और समस्या की ओर इशारा किया
    • Claude 3.7 का thinking mode खास उपयोगी नहीं था
    • o1 pro ने IPsec VPN समस्या हल करने में मदद की
    • ChatGPT और Claude का तुलना के साथ उपयोग किया जा रहा है
 
riskatcher 2025-02-25

flash 2 से तुलना करने के लिए कीमत का अंतर बहुत ज़्यादा है.. यह ठीक o1pro और o3-mini के बीच के स्तर का है