Gemini 2.5 Deep Think, Gemini ऐप पर अब उपलब्ध
(blog.google)- Gemini 2.5 Deep Think फीचर Google AI Ultra सब्सक्राइबर के लिए Gemini ऐप में जोड़ा गया है
- नए पैरलल थिंकिंग (parallel thinking) और शोध परिणाम के साथ, IMO में गोल्ड मेडल हासिल करने वाले मॉडल पर आधारित होकर इसे वास्तविक उपयोग के लिए और बेहतर बनाया गया है
- रचनात्मक समस्या समाधान, गणित व वैज्ञानिक तर्क, एल्गोरिथ्म डेवलपमेंट जैसे जटिल कार्यों में बेहतर प्रदर्शन दिखाया
- बेहतर प्रदर्शन के लिए थिंकिंग टाइम (Thinking Time) बढ़ाया गया है ताकि कई आइडिया और समाधान एक साथ खोजे जा सकें, और इससे अधिक गहरी सोच व रचनात्मक आउटपुट बन सके
- सुरक्षित और जिम्मेदार AI विकास को मजबूत करने के लिए उन्नत मूल्यांकन और उपाय लागू किए गए हैं, तथा भविष्य में API और एंटरप्राइज़ उपयोग बढ़ाने की योजना है
Gemini 2.5 Deep Think का लॉन्च
- Gemini 2.5 Deep Think फीचर Google AI Ultra सब्सक्राइबरों को Gemini ऐप के जरिए उपलब्ध कराया गया है
- विश्वसनीय टेस्टर्स और शोधकर्ताओं की फीडबैक तथा नवीनतम शोध निष्कर्षों को इसमें शामिल किया गया है
- हाल ही में इंटरनेशनल मैथेमैटिक्स ओलंपियाड (IMO) में गोल्ड मेडल लेवल वाला मॉडल लेकर, वास्तविक उपयोग अनुभव के हिसाब से speed और practicality बेहतर की गई है
- इस रिलीज़ के साथ इसे एक रचनात्मक समस्या-समाधान टूल के रूप में और व्यापक बनाया जा रहा है, और गणितज्ञों/शोधकर्ताओं से मिलने वाले फीडबैक के आधार पर फीचर को और बेहतर करने की योजना है
Deep Think का काम करने का तरीका
- पैरलल थिंकिंग तकनीक अपनाकर, Gemini जटिल समस्याओं पर कई आइडिया और समाधानों को एक साथ खोजता, तुलना करता और मर्ज करता है
- मॉडल का थिंकिंग टाइम (Thinking Time) बढ़ाकर कई हाइपोथीसिस को गहराई से खोजा जाता है ताकि अधिक रचनात्मक समाधान मिल सकें
- रीइन्फोर्समेंट लर्निंग के जरिए Gemini को इन एक्सटेंडेड रीजनिंग पाथ का बेहतर उपयोग करने के लिए ट्रेन किया गया है, जिससे अधिक intuitive और गहरा समस्या समाधान कौशल मजबूत होता है
Deep Think के मुख्य प्रदर्शन और उपयोग क्षेत्र
- इटरेटिव डेवलपमेंट और डिजाइन: जटिल सिस्टम या डिजाइन को चरण-दर-चरण आगे बढ़ाने के काम में उच्च प्रदर्शन
- विज्ञान और गणितीय खोज: गणितीय reasoning या वैज्ञानिक शोध-पत्र की व्याख्या जैसे कठिन, रचनात्मक खोज कार्यों में मजबूत क्षमता दिखती है
- एल्गोरिद्म और कोड डेवलपमेंट: समस्या की संरचना, time complexity और trade-offs जैसे पहलुओं को ध्यान में रखना पड़ने वाली मुश्किल coding problems में सिटी-एज प्रदर्शन हासिल करना
- नवीनतम benchmarks (जैसे: LiveCodeBench V6, Humanity’s Last Exam) में पुराने मॉडल्स की तुलना में टॉप टियर कोड/नॉलेज/रीजनिंग प्रदर्शन दिखाया गया है
Gemini का जिम्मेदार विकास और सुरक्षा
- Gemini 2.5 Deep Think में सुरक्षा मूल्यांकन के दौरान पुराने Pro मॉडल से बेहतर content safety और अधिक objective tone दिखा
- जटिलता बढ़ने के साथ risk भी बढ़ता है, इसलिए Frontier Safety मूल्यांकन और आवश्यक responses को मजबूत बनाया गया है
- विस्तृत सुरक्षा परिणाम मॉडल कार्ड में देखे जा सकते हैं
Deep Think का उपयोग कैसे करें
- Google AI Ultra सब्सक्राइबर Google ऐप में मॉडल dropdown से 2.5 Pro चुनकर, prompt bar में Deep Think टॉगल से दिन में तय की गई संख्या में इसका उपयोग कर सकते हैं
- कोड रन, Google सर्च आदि tools के साथ auto integration होता है और काफी लंबा उत्तर जनरेट करना संभव है
- जल्द ही Gemini API और एंटरप्राइज़ के लिए अतिरिक्त परीक्षण भी किए जाने हैं
1 टिप्पणियां
Hacker News की राय
मैंने नया Deep Think agent टेस्ट किया, लेकिन सिर्फ़ पाँच prompts डालते ही daily usage limit पर पहुँच गया। महीने के $250 देने पर इस स्तर की service काफ़ी निराशाजनक लगती है। o3-pro या Grok 4 Heavy की तुलना में इसकी price competitiveness साफ़ तौर पर कमज़ोर है। AI community में इस feature को ही वह एकमात्र चीज़ माना जा रहा था जो शायद Google Ultra subscription की कीमत को justify कर सके। लेकिन Google एक तरफ़ AI Studio में top model मुफ़्त दे रहा है, और दूसरी तरफ़ असल में पैसे देने वाले Ultra subscribers पर ऐसी billing policy लगा रहा है, यह बिल्कुल समझ नहीं आता। performance के लिहाज़ से, मैंने business से जुड़ी high-difficulty problem situation दी तो इसने साफ़ और persuasive solution दिया, जो हमारी internal meeting के नतीजों से मेल खाता था। लेकिन आखिर में o3 ने भी काफ़ी कम दाम में लगभग वही निष्कर्ष दे दिया। बस o3 की report थोड़ी कम व्यवस्थित लगी। शायद थोड़ा और इस्तेमाल करने पर बेहतर समझ आए
दोस्तों, मैंने Gemini Deep Think को prompt दिया: “जरा साइकिल चलाते pelican की SVG image बनाओ”, और यह उसका result है https://www.svgviewer.dev/s/5R5iTexQ Simon Willison से पहले मैंने कर दिखाया!
अगर आप खुद चलाकर देखना चाहते हैं, तो simonw की LLM cli और llm-consortium plugin इस्तेमाल कर सकते हैंफायदा 1: कई models को मनचाहे ढंग से मिलाकर इस्तेमाल कर सकते हैं। किसी एक lab तक सीमित नहीं, अपनी पसंद का setup बना सकते हैंफायदा 2: llm-model-gateway plugin से एक बार local API के ज़रिए अपने app या coding collaboration tool से जोड़ सकते हैं https://x.com/karpathy/status/1870692546969735361
installation और example commands, और यहाँ तक कि consortium of consortium भी बनाया जा सकता है—ऐसे examples भी खुद लिखे गए हैं।
https://GitHub.com/irthomasthomas/llm-consortium
llm servecommand दिखाई नहीं दे रहीयह वही model नहीं है जिसने कुछ हफ़्ते पहले IMO (International Mathematical Olympiad) में gold medal जीता था, लेकिन उसका बहुत क़रीबी variant है https://x.com/OfficialLoganK/status/1951262261512659430यह अभी API के ज़रिए उपलब्ध नहीं है
यह approach Grok 4 Heavy जैसी है: कई ‘reasoning’ agents को parallel चलाया जाता है, फिर उनके जवाबों की तुलना करके सबसे अच्छा answer चुना जाता है, और इसमें लगभग 30 मिनट लगते हैं। result शानदार हैं, लेकिन benchmark comparison असल में Grok 4 (single-agent, faster model) की बजाय Grok 4 Heavy के मुकाबले होना ज़्यादा fair होगा
OpenAI ने $200, Anthropic ने $100·$200, Gemini ने $250, और Grok ने $300 तक pricing बढ़ा दी है। सिर्फ़ OpenAI ने “effectively unlimited” कहा था, और वास्तव में ChatGPT Pro plan में मैं कभी limit तक नहीं पहुँचा। Claude Max में, दूसरी तरफ़, कई बार limit hit हुई। लेकिन ये कंपनियाँ limits साफ़-साफ़ disclose क्यों नहीं करतीं, यह समझ नहीं आता
पिछले कुछ महीनों में Gemini इस्तेमाल करते हुए मुझे उल्टा लगा है कि यह धीरे-धीरे और खराब हो रहा है। hallucination बहुत ज़्यादा हो रही है, और गलती बताने पर भी AI अड़ जाता है। इस पर भरोसा करना मुश्किल हो गया है
Google AI Ultra subscribers को बताया गया है कि आज से वे Gemini app में Deep Think (fixed prompt count के साथ) feature इस्तेमाल कर सकते हैं। लेकिन “fixed set” का मतलब fixed संख्या है, या यह कि prompt types पहले से तय हैं—मैं इसे और स्पष्ट रूप से समझना चाहता हूँ
Gemini CLI से schedule बनवाते समय, मैं साफ़-साफ़ कई बार कहता हूँ कि कोई अचानक मनमानी हरकत न करे, बीच में दखल भी देता हूँ, फिर भी यह बार-बार अपने हिसाब से बदलाव करने की कोशिश करता है और पूरा plan बिगाड़ देता है