Advisor रणनीति: Opus को सलाहकार बनाकर Sonnet की बुद्धिमत्ता बढ़ाना

(claude.com)

36 पॉइंट द्वारा GN⁺ 20 일 전 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

Claude Platform में Advisor रणनीति आधिकारिक रूप से पेश की गई — Opus को advisor और Sonnet या Haiku को executor के रूप में जोड़कर, लागत कम रखते हुए Opus-स्तर के करीब reasoning क्षमता को agent में लागू करने का पैटर्न
Sonnet के अकेले टास्क करने की तुलना में, Opus advisor के साथ जोड़ने पर SWE-bench Multilingual स्कोर 2.7%p बढ़ा और agent प्रति टास्क लागत 11.9% कम हुई
Haiku + Opus advisor संयोजन ने BrowseComp में 41.2% स्कोर के साथ Haiku अकेले (19.7%) से दोगुने से अधिक प्रदर्शन दर्ज किया, जबकि Sonnet अकेले की तुलना में लागत 85% कम रही
Messages API अनुरोध में advisor_20260301 टूल घोषित करने पर, एक ही /v1/messages अनुरोध के भीतर model handoff पूरा हो जाता है और अतिरिक्त round-trip अनुरोध या context management की जरूरत नहीं पड़ती
advisor tokens का बिल advisor model की दर पर और executor tokens का बिल executor model की दर पर अलग-अलग किया जाता है, जिससे लागत ट्रैकिंग और नियंत्रण संभव होता है

Advisor रणनीति का अवलोकन

Sonnet या Haiku executor के रूप में टास्क को शुरुआत से अंत तक पूरा करते हैं, और tool call, परिणाम पढ़ना तथा iterative कार्यों को संभालते हैं
जब executor ऐसे निर्णय पर पहुँचता है जिसे वह उचित रूप से हल नहीं कर सकता, तो वह Opus से guidance मांगता है, और Opus shared context का संदर्भ लेकर plan, revision, या halt signal में से एक लौटाता है
Advisor (Opus) सीधे tools call नहीं करता और न ही user-facing output बनाता है, वह केवल executor को guidance देता है
यह संरचना उस पारंपरिक sub-agent पैटर्न का उलटा रूप है जिसमें बड़ा orchestrator model काम को तोड़कर छोटे worker models को सौंपता है; यह अलग worker pool या orchestration logic के बिना काम करती है
Frontier-स्तर की reasoning केवल तब लागू होती है जब executor को उसकी जरूरत हो, और बाकी execution executor model की लागत पर ही चलता रहता है

प्रदर्शन मूल्यांकन के परिणाम

Sonnet + Opus advisor संयोजन ने SWE-bench Multilingual में Sonnet अकेले की तुलना में 2.7%p सुधार दिखाया, जबकि agent प्रति टास्क लागत 11.9% कम हुई
BrowseComp, Terminal-Bench 2.0 benchmarks में भी Sonnet अकेले की तुलना में स्कोर बेहतर रहे और प्रति टास्क लागत कम हुई
Haiku + Opus advisor: BrowseComp स्कोर 41.2% — Haiku अकेले (19.7%) से दोगुने से अधिक
- Sonnet अकेले की तुलना में स्कोर 29% कम है, लेकिन प्रति टास्क लागत 85% कम है
- advisor जोड़ने से Haiku अकेले की तुलना में लागत बढ़ती है, लेकिन संयुक्त लागत फिर भी Sonnet की तुलना में काफी कम रहती है

Advisor Tool का उपयोग

Messages API अनुरोध में advisor_20260301 घोषित करने पर, एक ही /v1/messages अनुरोध के भीतर model handoff पूरा हो जाता है — अतिरिक्त round-trip अनुरोध या context management की जरूरत नहीं
executor model खुद तय करता है कि advisor को कब बुलाना है, curated context advisor model को भेजा जाता है और plan वापस आता है
max_uses parameter से प्रति अनुरोध advisor call की अधिकतम संख्या तय की जा सकती है
advisor tokens usage block में अलग से रिपोर्ट किए जाते हैं, जिससे tier-wise खर्च ट्रैक किया जा सकता है
इसे मौजूदा tools (web search, code execution आदि) के साथ उसी loop में इस्तेमाल किया जा सकता है

response = client.messages.create(  
    model=&quot;claude-sonnet-4-6&quot;,  # executor  
    tools=[  
        {  
            &quot;type&quot;: &quot;advisor_20260301&quot;,  
            &quot;name&quot;: &quot;advisor&quot;,  
            &quot;model&quot;: &quot;claude-opus-4-6&quot;,  
            &quot;max_uses&quot;: 3,  
        },  
        # ... your other tools  
    ],  
    messages=[...]  
)

मूल्य संरचना

advisor tokens का बिल advisor model (Opus) की दर पर लिया जाता है, और executor tokens का बिल executor models (Sonnet/Haiku) की दर पर लिया जाता है
advisor केवल छोटे plan बनाता है (आमतौर पर 400~700 text tokens), और पूरा output executor कम दर पर संभालता है, इसलिए कुल लागत advisor model को अकेले चलाने की तुलना में काफी कम रहती है

उपयोगकर्ता प्रतिक्रिया

Eve Legal ML engineer: "Haiku 4.5 जटिलता के अनुसार Opus 4.6 को संदर्भित करके बुद्धिमत्ता को dynamic रूप से बढ़ाता है, और frontier-model स्तर की गुणवत्ता 5 गुना कम लागत पर हासिल करता है"
Bolt CEO: "जटिल टास्क में यह बेहतर architectural decisions लेता है, और सरल टास्क में कोई overhead नहीं होता — planning और execution trajectory का अंतर साफ दिखाई देता है"
Genspark CTO: "agent turns, tool calls और कुल स्कोर में स्पष्ट सुधार — हमारे खुद के planning tool से बेहतर परिणाम"

शुरुआत करें

अभी Claude Platform पर beta में उपलब्ध
शुरुआत की प्रक्रिया:
1. beta feature header जोड़ें: anthropic-beta: advisor-tool-2026-03-01
2. Messages API अनुरोध में advisor_20260301 जोड़ें
3. अपने use case के अनुसार system prompt संशोधित करें
Sonnet अकेले / Sonnet + Opus advisor / Opus अकेले — इन तीन configurations को अपने मौजूदा eval suite से तुलना करके चलाने की सिफारिश की गई है

Advisor रणनीति: Opus को सलाहकार बनाकर Sonnet की बुद्धिमत्ता बढ़ाना

Advisor रणनीति का अवलोकन

प्रदर्शन मूल्यांकन के परिणाम

Advisor Tool का उपयोग

मूल्य संरचना

उपयोगकर्ता प्रतिक्रिया

शुरुआत करें

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.