• Claude Opus 4.6 और Sonnet 4.6 अब 10 लाख token (1M) context window को standard pricing पर support करते हैं, और पूरे दायरे का उपयोग बिना किसी अलग premium के किया जा सकता है
  • कीमत वही unit rate पर लागू होगी: Opus 4.6 के लिए $5/$25, Sonnet 4.6 के लिए $3/$15 (input/output के आधार पर), और 9K हो या 900K request, billing उसी अनुपात में होगी
  • media input limit 6 गुना बढ़ाई गई है, जिससे एक बार में अधिकतम 600 images या PDF pages process किए जा सकते हैं, और यह Azure Foundry·Google Vertex AI आदि पर भी तुरंत उपलब्ध है
  • Claude Code के Max, Team, Enterprise users अब अपने-आप 1M context का उपयोग कर सकते हैं, जिससे session compaction कम होता है और बातचीत की निरंतरता बेहतर होती है
  • इसे बड़े codebase, contracts, operational logs जैसे जटिल और लंबे context को बनाए रखते हुए accuracy और efficiency बढ़ाने वाली क्षमता के रूप में देखा जा रहा है

1M context की सामान्य उपलब्धता का अवलोकन

  • Opus 4.6 और Sonnet 4.6 अब Claude Platform पर 1M context window को standard pricing के साथ उपलब्ध कराते हैं
    • Opus 4.6 की कीमत प्रति 10 लाख token $5 (input)/$25 (output), जबकि Sonnet 4.6 की $3/$15 है
    • request size के आधार पर कोई अलग pricing tier नहीं है
  • long-context premium हटा दिया गया है, और हर context length पर वही throughput बनाए रखा गया है
  • media input limit 6 गुना बढ़ी: अधिकतम 600 images या PDF pages support
  • beta header की जरूरत नहीं, और 200K token से बड़े requests भी अपने-आप handle किए जाएंगे

Claude Code एकीकरण

  • Claude Code के Max, Team, Enterprise plans में Opus 4.6 इस्तेमाल करने पर 1M context अपने-आप enable हो जाएगा
    • session के भीतर conversation compaction कम होगा
    • पहले इसके लिए अतिरिक्त usage की जरूरत थी, लेकिन अब यह base offering में शामिल है

मॉडल performance और accuracy

  • Opus 4.6 ने MRCR v2 पर 78.3% स्कोर किया है, जो इसी context length वाले मॉडलों में सबसे बेहतर प्रदर्शन है
  • 1M context पर भी accuracy बनी रहती है और long-context retrieval performance बेहतर होती है
  • बड़े codebase, contracts, long-term agent logs आदि को पूरा context जस का तस रखते हुए process किया जा सकता है
    • summary या context reset के बिना पूरी बातचीत बनाए रखी जा सकती है

वास्तविक उपयोग के उदाहरण

  • वैज्ञानिक शोध: सैकड़ों papers, mathematical frameworks और simulation code को एक साथ जोड़कर analyze किया जा सकता है (Alex Wissner-Gross)
  • कानूनी काम: 100-page contracts के कई versions की तुलना एक ही session में की जा सकती है (Bardia Pourvakil)
  • operations system analysis: incident response के दौरान सभी signals और hypotheses को एक साथ सामने रखा जा सकता है (Mayank Agarwal)
  • AI research और code review: बड़े diff files को एक बार में process करके quality सुधारी जा सकती है (Adhyyan Sekhsaria)
  • data analysis और debugging: Datadog, database और source code search के दौरान बिना details खोए context बनाए रखा जा सकता है (Anton Biryukov)
  • agent efficiency में सुधार: context compaction events में 15% कमी, और लंबे sessions में भी शुरुआती जानकारी बनी रहती है (Jon Bell)

उपलब्ध प्लेटफ़ॉर्म और शुरुआत कैसे करें

  • 1M context अभी Claude Platform, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry पर तुरंत उपलब्ध है
  • Opus 4.6 आधारित Claude Code Max, Team, Enterprise users को डिफ़ॉल्ट रूप से 1M context मिलेगा
  • अधिक जानकारी आधिकारिक documentation और pricing pages में देखी जा सकती है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.