- उसी Opus 4.6 मॉडल का उपयोग करते हुए API कॉन्फ़िगरेशन बदलकर latency को न्यूनतम किया गया
- तेज iteration, live debugging आदि जैसे समय-संवेदनशील interactive कार्यों के लिए अनुकूलित
- CLI या VS Code extension में
/fast दर्ज करके on·off toggle करें, या user settings फ़ाइल में "fastMode": true के साथ हमेशा सक्रिय रखें
- सक्रिय होने पर अपने-आप Opus 4.6 पर स्विच हो जाता है, और status message व
↯ icon दिखता है
- Fast Mode में मानक Opus 4.6 की तुलना में token की प्रति-इकाई कीमत अधिक है
- 200K से कम context में input $30/MTok, output $150/MTok लागू (मानक में input $5, output $25)
- 200K से अधिक context में input $60/MTok, output $225/MTok लागू (मानक में input $10, output $37.5)
- 2/16 तक 50% छूट लागू
- Fast Mode के लिए अलग rate limit लागू होती है, और सीमा पार होने या credit खत्म होने पर अपने-आप मानक मोड में fallback हो जाता है
- Fast Mode को research preview के रूप में उपलब्ध कराया गया है, इसलिए फीचर और कीमत बदल सकती है
अभी कोई टिप्पणी नहीं है.