- Anthropic का Claude Sonnet 4 अब अधिकतम 10 लाख token context देता है, जिससे बड़े codebase या कई दस्तावेज़ों को एक साथ प्रोसेस किया जा सकता है
- बेहतर context support के साथ बड़े पैमाने पर code analysis, विशाल document sets की प्रोसेसिंग, और context बनाए रखने वाले agents के विकास जैसे कई उपयोग संभव हो गए हैं
- 2 लाख token से बड़े prompts के लिए API pricing बढ़ती है, लेकिन prompt caching और batch processing के ज़रिए लागत घटाई जा सकती है
- वास्तविक ग्राहक Bolt.new और iGent AI ने इस फीचर से productivity और AI capabilities में बड़ा सुधार हासिल किया है
- फिलहाल Sonnet 4 का long context support Anthropic API और Amazon Bedrock पर beta में उपलब्ध है, और जल्द ही Google Cloud पर भी आने वाला है
10 लाख token context support
- Claude Sonnet 4, जो Anthropic API पर उपलब्ध है, अब अधिकतम 10 लाख token context को सपोर्ट करता है
- इससे एक ही request में 75,000 से अधिक lines of code या कई research papers को एकीकृत रूप से प्रोसेस किया जा सकता है
- 10 लाख token context beta फीचर अभी Anthropic API और Amazon Bedrock पर उपलब्ध है, और Google Cloud के Vertex AI पर भी जल्द सपोर्ट मिलेगा
लंबा context, बढ़ते उपयोग के मामले
- बड़े पैमाने पर code analysis: पूरे codebase (source files, tests, documentation सहित) को एक साथ लाकर project structure को समझना, files के बीच संबंध पहचानना, और system design के आधार पर code improvements सुझाना संभव हो जाता है
- दस्तावेज़ों का एकीकृत सारांश: सैकड़ों legal contracts, research papers, और technical specifications का एक साथ analysis करके, दस्तावेज़ों के बीच के संबंध बनाए रखते हुए व्यापक insights निकाले जा सकते हैं
- context बनाए रखने वाले agents: सैकड़ों tool calls और multi-step workflows के दौरान पूरी API documentation, tool definitions, और interaction history को शामिल करते हुए consistent state बनाए रखने वाले conversational agents बनाए जा सकते हैं
API pricing policy
- 2 लाख token तक के prompts: input $3/मिलियन token, output $15/मिलियन token
- 2 लाख token से अधिक prompts: input $6/मिलियन token, output $22.5/मिलियन token
- prompt caching लागू करने पर latency और cost दोनों कम किए जा सकते हैं
- 10 लाख token context को batch processing के साथ जोड़ने पर अतिरिक्त 50% तक cost savings संभव हैं
ग्राहक उपयोग के उदाहरण
-
Bolt.new
- Bolt.new ने Claude को अपने web-based development platform के साथ integrate करके web development में नवाचार किया है
- "Sonnet 4 की 10 लाख context window की वजह से developers अब बड़े projects को अधिक accuracy के साथ संभाल सकते हैं"
-
iGent AI
- लंदन, UK स्थित iGent AI, Maestro नाम के AI partner के ज़रिए बातचीत की सामग्री को executable code में बदलता है
- "पहले असंभव रही autonomous software engineering क्षमता अब Sonnet 4 के 10 लाख token context से संभव हुई है, जिससे वास्तविक codebase पर कई दिनों तक sessions चलाना संभव हो गया है"
उपयोग का तरीका और आगे की योजना
- long context फीचर फिलहाल Anthropic API के Tier 4 और custom pricing plan customers के लिए beta में उपलब्ध है, और आने वाले कुछ हफ्तों में इसे अधिक उपयोगकर्ताओं तक बढ़ाया जाएगा
- Amazon Bedrock पर भी यह उपलब्ध है, और Google Cloud Vertex AI सपोर्ट भी जल्द आने वाला है
- अन्य Claude product family में भी long context लाने की योजना है
- अधिक जानकारी आधिकारिक documentation और pricing page में देखी जा सकती है
अभी कोई टिप्पणी नहीं है.