- Gemini 3.5 Flash frontier-स्तर की intelligence और execution क्षमता को जोड़ने वाला पहला Gemini 3.5 मॉडल है, जिसे agents और coding के long-running tasks के लिए बनाया गया है
- Flash series की speed बनाए रखते हुए यह Terminal-Bench 2.1 में 76.2%, GDPval-AA 1656 Elo जैसे benchmarks पर Gemini 3.1 Pro से आगे है
- output tokens के आधार पर इसकी throughput दूसरे frontier models की तुलना में 4 गुना तेज़ है, और कई मामलों में इसकी लागत आधे से भी कम है, इसलिए यह long-running agent tasks के लिए फायदेमंद है
- यह Antigravity और AI Studio में app development, legacy code को Next.js में बदलने, papers के आधार पर game implementation, और UX mockups बनाने जैसे multi-step tasks करता है
- इसे Gemini app और Search AI Mode के default model के रूप में दिया जा रहा है, साथ ही Gemini Spark और enterprise partner workflows में भी इस्तेमाल किया जा रहा है, और 3.5 Pro अगले महीने आने वाला है
Gemini 3.5 की घोषणा और उपलब्धता
- Gemini 3.5 frontier-स्तर की intelligence और execution क्षमता को जोड़ने वाला नया model family है, और इसे अधिक सक्षम agents बनाने वाले मॉडल के रूप में रखा गया है
- पहला जारी किया गया मॉडल 3.5 Flash है, जो agents और coding में frontier-स्तर की performance देता है और practical utility वाले complex long-running tasks पर केंद्रित है
- 3.5 Flash कई Google products और developer tools के माध्यम से उपलब्ध है
- आम users के लिए Gemini app और Google Search के AI Mode के जरिए उपलब्ध है
- developers इसे Google Antigravity, Google AI Studio के Gemini API, और Android Studio के जरिए उपयोग कर सकते हैं
- enterprises के लिए यह Gemini Enterprise Agent Platform और Gemini Enterprise के माध्यम से उपलब्ध है
- 3.5 Pro भी development में है, पहले से internally इस्तेमाल हो रहा है, और अगले महीने जारी होने वाला है
3.5 Flash की performance
- 3.5 Flash, Flash series की speed बनाए रखते हुए कई आयामों पर बड़े flagship models से टक्कर लेने वाली intelligence देता है
- यह Google का सबसे शक्तिशाली agentic coding model है, और कठिन coding व agent benchmarks में Gemini 3.1 Pro से आगे है
- Terminal-Bench 2.1: 76.2%
- GDPval-AA: 1656 Elo
- MCP Atlas: 83.6%
- CharXiv Reasoning multimodal understanding: 84.2%
- output tokens के आधार पर प्रति सेकंड processing speed दूसरे frontier models की तुलना में 4 गुना तेज़ है
- Artificial Analysis metrics में यह ऊपर-दाएँ quadrant में स्थित है, यानी यह quality और latency के बीच trade-off को कम करने वाला model है
बड़े पैमाने के agent tasks
- speed और performance के संतुलन की वजह से 3.5 Flash long-running agent tasks के लिए उपयुक्त है
- यह उन tasks को कम समय में पूरा करने में मदद करता है जिनमें developers को कई दिन और auditors को कई हफ्ते लगते थे, और यह अक्सर दूसरे frontier models की तुलना में आधे से भी कम लागत पर संभव होता है
- वास्तविक problem-solving process में यह तेज़ी से plan, build और iterate कर सकता है
- नए applications का development
- codebase maintenance
- financial documents तैयार करने में सहायता
- updated Antigravity harness के साथ मिलकर यह चुनौतीपूर्ण use cases में collaborative sub-agents deploy करके समस्याओं को बड़े पैमाने पर संभालने वाला execution engine बन जाता है
- यह supervision के तहत multi-step workflows और coding tasks को भरोसेमंद तरीके से चलाते हुए frontier-स्तर की performance बनाए रखता है
Antigravity और AI Studio के उपयोग के उदाहरण
- 3.5 Flash, Antigravity में dynamic criteria के आधार on unstructured assets का अपने-आप नाम बदलने और classification करने वाला multi-step workflow चलाता है
- Antigravity में दो agents का उपयोग करके यह AlphaZero paper को synthesize करता है और 6 घंटे के भीतर पूरी तरह playable game को code करता है
- Antigravity harness के साथ यह complex legacy codebase को Next.js में convert करता है
- Antigravity में sub-agents का उपयोग करके यह नया cityscape generate करता है, और builder व player नाम के दो agents की तेज़ self-improvement loop के साथ game develop करता है
- Gemini 3 की मजबूत multimodal foundation पर बना 3.5 Flash अधिक समृद्ध और interactive web UI व graphics generate करता है
- AI Studio में यह AI research paper के लिए interactive animation बनाता है
- AI Studio में यह plain text descriptions को interactive hardware में बदलता है
- AI Studio में यह school fundraising event के लिए पूरा branding concept बनाने हेतु कई concepts को parallel में चलाता है
- AI Studio में यह checkout flow के लिए अलग-अलग UX approaches को 60 सेकंड में generate करता है
enterprise और developer उपयोग
- 3.5 Flash की agent capabilities पहले से ही developers और enterprise workflows में इस्तेमाल हो रही हैं
- Gemini 3.5 model family के development के दौरान industry partners के साथ मिलकर repetitive work और complexity वाले बिंदुओं की पहचान की गई
- partners banking और fintech में कई हफ्तों के workflows को automate करने से लेकर complex data environments में data science teams को insights खोजने तक इसके प्रभाव देख रहे हैं
-
Shopify
- sub-agents को parallel में चलाकर यह लंबे समय तक complex data का analysis करता है और global scale पर अधिक सटीक merchant growth forecasting करता है
-
Macquarie Bank
- यह 100 पन्नों से अधिक के complex documents पर reasoning, relevant information retrieval, और low-latency पर भरोसेमंद recommendations बनाकर customer onboarding तेज़ करने के तरीके का pilot चला रहा है
-
Salesforce
- Agentforce में 3.5 Flash को integrate करके यह context बनाए रखने और complex multi-turn tool calls चलाने वाले कई sub-agents के साथ complex enterprise tasks को automate करता है
-
Ramp
- complex invoices की multimodal understanding और historical patterns पर reasoning को जोड़कर यह अधिक smart और भरोसेमंद OCR को support करता है
-
Xero
- vendor identification और 1099 tax forms के लिए information gathering जैसे कई हफ्तों तक चलने वाले complex workflows को agents के जरिए autonomous रूप से manage करवाकर यह छोटे व्यवसायों के repetitive admin tasks के automation को संभव बनाता है
-
Databricks
- agentic workflows का उपयोग करके यह real-time information monitor और retrieve करता है, बड़े datasets में reasoning करता है, समस्याओं का diagnosis करता है, और fixes व solutions सुझाता है
व्यक्तिगत AI agents और Search में उपयोग
- 3.5 Flash दुनिया भर में Gemini app और Search के AI Mode में default model बन रहा है
- Google I/O में 3.5 Flash की agent features को रोज़मर्रा की ज़िंदगी में लागू करने वाली नई capabilities दिखाई गईं
- Gemini Spark 3.5 Flash का उपयोग करने वाला personal AI agent है
- यह 24 घंटे चलता है
- user के निर्देशों के अनुसार digital life में navigate करता है और user की ओर से actions लेता है
- भरोसेमंद testers के लिए आज से rollout शुरू हो रहा है
- अमेरिका में Google AI Ultra subscribers के लिए अगले हफ्ते beta के रूप में उपलब्ध होगा
- 3.5 Flash की बेहतर agentic coding क्षमता Search में और अधिक intelligent experiences देती है
- users के लिए 24 घंटे काम करने वाले नए information agent को पेश किया गया है
- अधिक dynamic generative UI experiences को संभव बनाता है
- Search, 3.5 Flash का उपयोग करके Gyroid pattern को समझाने वाले interactive visuals बनाता है
सुरक्षा उपाय
- Gemini 3.5 को Frontier Safety Framework के तहत विकसित किया गया है
- cyber और CBRN safeguards को मजबूत किया गया है, जिससे harmful content generate करने की संभावना और safe queries के गलत तरीके से जवाब देने से इनकार करने की संभावना कम हुई है
- नए और अधिक उन्नत safety training व mitigation techniques लागू की गई हैं
- इसमें interpretability tools शामिल हैं, जो response देने से पहले AI की internal reasoning की जांच और समझने में मदद करते हैं
1 टिप्पणियां
Hacker News की राय
पेलिकन काफ़ी ठीक-ठाक लग रहा है: https://github.com/simonw/llm-gemini/issues/133#issuecomment...
लेकिन साइकिल के मामले में यह उतना अच्छा नहीं है। पैडल और पिछले पहिए के बीच की रॉड गायब है, और बाकी फ्रेम भी अजीब तरह से उलझा हुआ है
लागत भी महंगी है। वह एक पेलिकन ही 13 सेंट का पड़ा: https://www.llm-prices.com/#it=11&ot=14403&sel=gemini-3.5-fl...
यह उदाहरण भी साफ़ तौर पर बहुत बेहतर हुआ है और डिटेल बेहिसाब हैं, लेकिन बुनियादी फ्रेम का आकार अब भी गलत है। वेबपेज में भी यही पैटर्न दिखता है, जैसे बस और बटन वगैरह जोड़ देना
मैंने टूटा हुआ पेलिकन SVG image model में डालकर उससे खामियां ढूंढने को भी कहा, लेकिन वह टूटे हुए हिस्से फिर भी नहीं पहचान पाया
https://www.gianlucagimini.it/portfolio-item/velocipedia/
input/output प्रति मिलियन टोकन कीमत:
Gemini 2.5 Flash: $0.30/$2.50
Gemini 3.0 Flash Preview: $0.50/$3.00
Gemini 3.5 Flash: $1.50/$9.00
कीमत की दिशा दिलचस्प है। उसी आकार के अगले ही मॉडल में 3x कीमत बढ़ोतरी मैंने शायद पहले नहीं देखी, और यह भी मज़ेदार है कि 3 सिर्फ Preview में ही था
3.5 Flash की लागत लगभग Gemini 2.5 Pro जितनी है, जो $1.25/$10 था
Gemini 2.5 Flash(27 points): $172(1.0x)
Gemini 2.5 Pro(35 points): $649(3.8x)
Gemini 3.0 Flash(46 points): $278(1.6x)
Gemini 3.5 Flash(55 points): $1,552(9.0x, या 2.5 Pro के मुकाबले 2.4x)
यह बहुत बड़ी कीमत बढ़ोतरी है। Gemini 3.0 Flash से तुलना करें तो 5.6x है
इसलिए provider-neutral abstraction layer रखना सचमुच समझदारी है। अगर आप Kotlin इस्तेमाल करते हैं, तो Koog बढ़िया है
या फिर वे सोचते हों कि benchmark अच्छे हैं इसलिए कीमत बढ़ाई जा सकती है। लेकिन अभी इतना market share दिखता नहीं कि ऐसी बात को सही ठहराया जा सके
https://ai.google.dev/gemini-api/docs/models/gemini-3.5-flas...
इस बार Google ने मॉडल को Preview नहीं बल्कि Stable के रूप में मार्क किया है, यह ध्यान देने लायक है। हाल की रिलीज़ ट्रेंड से तुलना करें तो यह असामान्य है
इसके साथ 3x कीमत बढ़ोतरी जोड़ें, तो Flash pricing किसी बाद में वापस ली जाने वाली अस्थायी चाल से ज़्यादा Google की पसंदीदा long-term floor जैसी लगती है
हालांकि यह कहना अभी मुश्किल है कि सिर्फ Google ने माहौल भांप लिया है, या पूरी इंडस्ट्री चुपचाप low-cost inference की baseline फिर से तय कर रही है
https://gistpreview.github.io/?3496285c5dac5ba10ebbc0b201a1a...
Gemini 2.5 Pro - 5,325 tokens:
https://gistpreview.github.io/?cc5e0fefeaaffecd228c16c95e736...
Gemini 2.5 Flash - 7,556 tokens:
https://gistpreview.github.io/?263d6058fe526a62b8f270f0620ec...
Gemma 4 31B IT - AI Studio में 3,261 tokens:
https://gistpreview.github.io/?858a42b96af864859a3b89508619d...
Gemma 4 26B A4B IT - AI Studio में 4,034 tokens:
https://gistpreview.github.io/?4adb7703897e0c6b583f9de928e4a...
8112 tokens @ 52.97 TPS, 0.85s TTFT
https://gistpreview.github.io/?7bdefff99aca89d1bc12405323bd4...
पूरी session: https://gist.github.com/abtinf/7bdefff99aca89d1bc12405323bd4...
Macbook Pro M2 Max पर LM Studio के साथ जनरेट किया गया
https://huggingface.co/hesamation/Qwen3.6-35B-A3B-Claude-4.6...
https://gistpreview.github.io/?557f979c82701862bc26d24f10399...
https://claude.ai/public/artifacts/128ebe5a-add7-406a-9bce-6...
जब कोई "Flash" कहता है तो क्या मेरे दिमाग में तुरंत "instead consider HTML5" आना इस बात का संकेत है कि मैं सच में बूढ़ा हो गया हूँ?
Flash, ah, ah, saviour of the universe. Flash, ah, ah, he'll save every one of us!
न जाने कितने सालों से, जब भी "flash" शब्द सुनता हूँ, यही बात हमेशा दिमाग में आती है
knowledge cutoff: जनवरी 2025
latest update: मई 2026
इस देरी को लेकर बहुत बुरा एहसास होता है
इसलिए अगर बेहतर quality reasoning चाहिए, तो training को केंद्रित करना पड़ता है और डेटा बहुत high-quality, high-density होना चाहिए
अगर tool use मज़बूत है, तो model का पुराना डेटा इस्तेमाल करना शायद उतना मायने न रखे। क्योंकि वह नई जानकारी खोज सकता है। हालांकि अभी ज़्यादातर models ऐसा अपने-आप नहीं करते, जब तक थोड़ा धक्का न दिया जाए
मेरी समझ से Qwen 3 family सब एक ही base model से शुरू हुई और अलग-अलग metrics बेहतर करने के लिए सिर्फ fine-tuning/post-training किया गया। Gemini 3 family भी पूरी की पूरी वैसी ही हो सकती है, और शायद इसी वक्त Gemini 4 based models को नई जानकारी के साथ साथ-साथ train किया जा रहा हो
मैं google ai pro plan इस्तेमाल कर रहा हूँ और Antigravity में 3.5 Flash आज़माया, लेकिन दो prompts में ही quota खत्म हो गया। अगर यह bug नहीं है तो यह सच में बेकार स्तर का है
Gemini subreddit का माहौल देखें तो लगता है कि यह पहले से कहीं ज़्यादा कड़ा कट है। मैं भी शायद AI Pro cancel कर दूँगा
इस update ने app भी खराब कर दिया। message edit करते ही app हर बार crash हो जाता है। और यह Pixel पर भी हो रहा है
Gemini 3.5 Flash की 2000-token clock बुरी नहीं है। https://clocks.brianmoore.com/
लगभग वही मॉडल और 3x कीमत बढ़ोतरी। कहा गया था कि AI सस्ता होगा और हर जगह इस्तेमाल होगा
कीमत हास्यास्पद है
लगता है Gemini 3.5 Pro की कीमत भी साथ में बढ़ेगी। 12 x 5 = 60?
Google ऐसा लगता है जैसे चाहता हो कि हम Chinese models इस्तेमाल करें