• उसी Opus 4.6 मॉडल का उपयोग करते हुए API कॉन्फ़िगरेशन बदलकर latency को न्यूनतम किया गया
  • तेज iteration, live debugging आदि जैसे समय-संवेदनशील interactive कार्यों के लिए अनुकूलित
  • CLI या VS Code extension में /fast दर्ज करके on·off toggle करें, या user settings फ़ाइल में "fastMode": true के साथ हमेशा सक्रिय रखें
  • सक्रिय होने पर अपने-आप Opus 4.6 पर स्विच हो जाता है, और status message व icon दिखता है
  • Fast Mode में मानक Opus 4.6 की तुलना में token की प्रति-इकाई कीमत अधिक है
    • 200K से कम context में input $30/MTok, output $150/MTok लागू (मानक में input $5, output $25)
    • 200K से अधिक context में input $60/MTok, output $225/MTok लागू (मानक में input $10, output $37.5)
    • 2/16 तक 50% छूट लागू
  • Fast Mode के लिए अलग rate limit लागू होती है, और सीमा पार होने या credit खत्म होने पर अपने-आप मानक मोड में fallback हो जाता है
  • Fast Mode को research preview के रूप में उपलब्ध कराया गया है, इसलिए फीचर और कीमत बदल सकती है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.