- Google ने Gemini 2.5 Flash और 2.5 Flash-Lite के नए preview वर्ज़न पेश किए हैं, जिनका मुख्य फोकस quality improvement और efficiency enhancement है
- Flash-Lite को निर्देश समझने की क्षमता में बढ़ोतरी, अनावश्यक रूप से लंबे जवाबों में कमी, multimodal और translation क्षमताओं में सुधार के साथ high-speed और low-cost वातावरण के लिए अनुकूलित किया गया है
- Flash में tool उपयोग क्षमता को मजबूत किया गया है और token efficiency सुधारी गई है, जिससे जटिल agent-आधारित कामों में प्रदर्शन काफी बढ़ा है
- वास्तविक परीक्षणों में SWE-Bench Verified स्कोर 5% बढ़ा, और आंतरिक benchmark में दीर्घकालिक कार्य प्रदर्शन 15% बेहतर हुआ
- दोनों मॉडल
-latest alias को सपोर्ट करते हैं, जिससे बिना code बदले नवीनतम फीचर्स का उपयोग किया जा सकता है; जबकि स्थिरता चाहने वाले उपयोगकर्ता मौजूदा 2.5 मॉडलों का उपयोग जारी रख सकते हैं
Gemini 2.5 Flash और Flash-Lite का अवलोकन
- Gemini 2.5 Flash और Flash-Lite के नवीनतम वर्ज़न Google AI Studio और Vertex AI में जारी किए गए हैं। इस रिलीज़ का उद्देश्य लगातार बेहतर model quality और उच्च efficiency प्रदान करना है
- नया Flash-Lite और Flash, कुल मिलाकर quality, speed और cost के मामले में पुराने मॉडलों की तुलना में काफी बेहतर प्रदर्शन दिखाते हैं
- Flash-Lite में output tokens 50% कम हुए हैं, और Flash में 24% की कमी आई है, जिससे operating cost घटती है और processing speed बढ़ती है
Updated Gemini 2.5 Flash-Lite
- कमांड फॉलो करने की क्षमता बेहतर: जटिल निर्देशों या system prompt को समझने और उन पर अमल करने की क्षमता में बड़ा सुधार हुआ है
- अधिक संक्षिप्तता: छोटे और आसानी से समझ आने वाले जवाब उत्पन्न होते हैं, जिससे token cost घटती है और बड़े पैमाने के traffic वातावरण में latency कम होती है
- multimodal और translation quality में सुधार: audio transcription, image recognition और translation quality — तीनों में विश्वसनीयता बढ़ी है
- Flash-Lite preview वर्ज़न को
gemini-2.5-flash-lite-preview-09-2025 मॉडल नाम से तुरंत आज़माया जा सकता है
Updated Gemini 2.5 Flash
- tool उपयोग क्षमता मजबूत: जटिल multi-step परिस्थितियों में agent-आधारित उपयोगिता काफी बढ़ी है, जिससे SWE-Bench Verified पर पिछले वर्ज़न की तुलना में 5%p बेहतर प्रदर्शन (48.9% → 54%) हासिल हुआ
- cost efficiency में सुधार: कम tokens के उपयोग से बेहतर output quality मिलती है, और latency व infrastructure cost दोनों घटते हैं
- Primer उपयोगकर्ताओं का feedback भी सकारात्मक है
- Manus के सह-संस्थापक और Chief Scientist Yichao ‘Peak’ Ji ने कहा, “नया Gemini 2.5 Flash मॉडल अद्भुत speed और intelligence दोनों प्रदान करता है। long-horizon goal-based agent कार्यों में प्रदर्शन 15% बेहतर हुआ है, जिससे cost efficiency के आधार पर scale और बढ़ा है।”
- Gemini 2.5 Flash preview वर्ज़न
gemini-2.5-flash-preview-09-2025 मॉडल नाम से उपलब्ध है
Gemini के साथ build शुरू करें
- पिछले एक वर्ष में preview मॉडल जारी करके डेवलपर्स को नवीनतम फीचर्स जल्दी आज़माने और feedback देने में सक्षम बनाया गया है
- आज जारी किए गए preview वर्ज़न नए stable वर्ज़न में आधिकारिक रूप से परिवर्तित नहीं हो रहे हैं, बल्कि अगले आधिकारिक वर्ज़न की quality सुधारने के आधार के रूप में उपयोग किए जाएंगे
- लंबे मॉडल नामों की जगह
-latest alias जोड़ा गया है, जिससे हमेशा नवीनतम मॉडल को आसानी से इस्तेमाल किया जा सके। यह alias अपने-आप नवीनतम वर्ज़न से जुड़ता है, इसलिए code बदले बिना नए फीचर्स आज़माए जा सकते हैं
gemini-flash-latest
gemini-flash-lite-latest
- यदि किसी विशेष वर्ज़न को update या discontinue किया जाना हो, तो कम से कम 2 हफ्ते पहले ईमेल से सूचना दी जाएगी। alias सिर्फ एक reference है; pricing, features और limits हर रिलीज़ के अनुसार बदल सकते हैं
- यदि दीर्घकालिक स्थिरता चाहिए, तो मौजूदा
gemini-2.5-flash और gemini-2.5-flash-lite मॉडल नामों का उपयोग करने की सिफारिश की जाती है
महत्व
- यह रिलीज़ औपचारिक stable वर्ज़न में promotion नहीं, बल्कि एक preview update है, और भविष्य के stable मॉडल के लिए प्रयोग व उपयोगकर्ता feedback एकत्र करने की प्रक्रिया का हिस्सा है
- Google, Gemini के माध्यम से speed, intelligence और cost efficiency के संतुलन का लक्ष्य रखता है, और डेवलपर्स को बेहतर AI applications बनाने में मदद देने के लिए लगातार सुधार कर रहा है
1 टिप्पणियां
Hacker News टिप्पणियाँ
release notes के लिए यहाँ देखें। pelican से जुड़ी चर्चा के लिए यह पोस्ट देखें