• Vertex AI के Priority PayGo को वास्तविक प्रोडक्शन AI chatbot पर लागू करके, लगभग 2 हफ्तों में संचित 27,000 डेटा पॉइंट्स का समय-आधारित विश्लेषण साझा किया गया
  • Median के आधार पर response time में ON_DEMAND(Standard) और ON_DEMAND_PRIORITY, दोनों अधिकांशतः 100~300ms के भीतर रहे, यानी प्रदर्शन लगभग समान था
  • वह समय स्लॉट जहाँ Priority उल्लेखनीय रूप से तेज़ था, लगभग केवल 16 बजे (-338ms) का था; बाकी 23 घंटों में प्रदर्शन समान रहा या उलटे Standard तेज़ था
  • 10 सेकंड से अधिक वाले अनुरोधों का अनुपात Standard में 3.4% और Priority में 5.9% रहा, यानी Priority उलटे 1.7 गुना अधिक अस्थिर निकला
  • खासकर रात 22~23 बजे के दौरान Priority का 10 सेकंड से अधिक response rate 12% से ऊपर गया, जो Standard की तुलना में 3 गुना से भी अधिक था
  • token unit price 1.8 गुना अधिक होने को देखते हुए, फिलहाल Priority PayGo में cost-performance का कोई लाभ नहीं माना गया
  • यह परिणाम gemini-3-flash-preview (preview model) + asia-northeast3 (Seoul region) वातावरण पर आधारित हैं, इसलिए GA रिलीज़ के बाद स्थिति बदल सकती है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.