Gemini 3.5 Flash

(blog.google)

6 पॉइंट द्वारा GN⁺ 2026-05-20 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Gemini 3.5 Flash frontier-स्तर की intelligence और execution क्षमता को जोड़ने वाला पहला Gemini 3.5 मॉडल है, जिसे agents और coding के long-running tasks के लिए बनाया गया है
Flash series की speed बनाए रखते हुए यह Terminal-Bench 2.1 में 76.2%, GDPval-AA 1656 Elo जैसे benchmarks पर Gemini 3.1 Pro से आगे है
output tokens के आधार पर इसकी throughput दूसरे frontier models की तुलना में 4 गुना तेज़ है, और कई मामलों में इसकी लागत आधे से भी कम है, इसलिए यह long-running agent tasks के लिए फायदेमंद है
यह Antigravity और AI Studio में app development, legacy code को Next.js में बदलने, papers के आधार पर game implementation, और UX mockups बनाने जैसे multi-step tasks करता है
इसे Gemini app और Search AI Mode के default model के रूप में दिया जा रहा है, साथ ही Gemini Spark और enterprise partner workflows में भी इस्तेमाल किया जा रहा है, और 3.5 Pro अगले महीने आने वाला है

Gemini 3.5 की घोषणा और उपलब्धता

Gemini 3.5 frontier-स्तर की intelligence और execution क्षमता को जोड़ने वाला नया model family है, और इसे अधिक सक्षम agents बनाने वाले मॉडल के रूप में रखा गया है
पहला जारी किया गया मॉडल 3.5 Flash है, जो agents और coding में frontier-स्तर की performance देता है और practical utility वाले complex long-running tasks पर केंद्रित है
3.5 Flash कई Google products और developer tools के माध्यम से उपलब्ध है
- आम users के लिए Gemini app और Google Search के AI Mode के जरिए उपलब्ध है
- developers इसे Google Antigravity, Google AI Studio के Gemini API, और Android Studio के जरिए उपयोग कर सकते हैं
- enterprises के लिए यह Gemini Enterprise Agent Platform और Gemini Enterprise के माध्यम से उपलब्ध है
3.5 Pro भी development में है, पहले से internally इस्तेमाल हो रहा है, और अगले महीने जारी होने वाला है

3.5 Flash की performance

3.5 Flash, Flash series की speed बनाए रखते हुए कई आयामों पर बड़े flagship models से टक्कर लेने वाली intelligence देता है
यह Google का सबसे शक्तिशाली agentic coding model है, और कठिन coding व agent benchmarks में Gemini 3.1 Pro से आगे है
- Terminal-Bench 2.1: 76.2%
- GDPval-AA: 1656 Elo
- MCP Atlas: 83.6%
- CharXiv Reasoning multimodal understanding: 84.2%
output tokens के आधार पर प्रति सेकंड processing speed दूसरे frontier models की तुलना में 4 गुना तेज़ है
Artificial Analysis metrics में यह ऊपर-दाएँ quadrant में स्थित है, यानी यह quality और latency के बीच trade-off को कम करने वाला model है

बड़े पैमाने के agent tasks

speed और performance के संतुलन की वजह से 3.5 Flash long-running agent tasks के लिए उपयुक्त है
यह उन tasks को कम समय में पूरा करने में मदद करता है जिनमें developers को कई दिन और auditors को कई हफ्ते लगते थे, और यह अक्सर दूसरे frontier models की तुलना में आधे से भी कम लागत पर संभव होता है
वास्तविक problem-solving process में यह तेज़ी से plan, build और iterate कर सकता है
- नए applications का development
- codebase maintenance
- financial documents तैयार करने में सहायता
updated Antigravity harness के साथ मिलकर यह चुनौतीपूर्ण use cases में collaborative sub-agents deploy करके समस्याओं को बड़े पैमाने पर संभालने वाला execution engine बन जाता है
यह supervision के तहत multi-step workflows और coding tasks को भरोसेमंद तरीके से चलाते हुए frontier-स्तर की performance बनाए रखता है

Antigravity और AI Studio के उपयोग के उदाहरण

3.5 Flash, Antigravity में dynamic criteria के आधार on unstructured assets का अपने-आप नाम बदलने और classification करने वाला multi-step workflow चलाता है
Antigravity में दो agents का उपयोग करके यह AlphaZero paper को synthesize करता है और 6 घंटे के भीतर पूरी तरह playable game को code करता है
Antigravity harness के साथ यह complex legacy codebase को Next.js में convert करता है
Antigravity में sub-agents का उपयोग करके यह नया cityscape generate करता है, और builder व player नाम के दो agents की तेज़ self-improvement loop के साथ game develop करता है
Gemini 3 की मजबूत multimodal foundation पर बना 3.5 Flash अधिक समृद्ध और interactive web UI व graphics generate करता है
- AI Studio में यह AI research paper के लिए interactive animation बनाता है
- AI Studio में यह plain text descriptions को interactive hardware में बदलता है
- AI Studio में यह school fundraising event के लिए पूरा branding concept बनाने हेतु कई concepts को parallel में चलाता है
- AI Studio में यह checkout flow के लिए अलग-अलग UX approaches को 60 सेकंड में generate करता है

enterprise और developer उपयोग

3.5 Flash की agent capabilities पहले से ही developers और enterprise workflows में इस्तेमाल हो रही हैं
Gemini 3.5 model family के development के दौरान industry partners के साथ मिलकर repetitive work और complexity वाले बिंदुओं की पहचान की गई
partners banking और fintech में कई हफ्तों के workflows को automate करने से लेकर complex data environments में data science teams को insights खोजने तक इसके प्रभाव देख रहे हैं
Shopify
- sub-agents को parallel में चलाकर यह लंबे समय तक complex data का analysis करता है और global scale पर अधिक सटीक merchant growth forecasting करता है
Macquarie Bank
- यह 100 पन्नों से अधिक के complex documents पर reasoning, relevant information retrieval, और low-latency पर भरोसेमंद recommendations बनाकर customer onboarding तेज़ करने के तरीके का pilot चला रहा है
Salesforce
- Agentforce में 3.5 Flash को integrate करके यह context बनाए रखने और complex multi-turn tool calls चलाने वाले कई sub-agents के साथ complex enterprise tasks को automate करता है
Ramp
- complex invoices की multimodal understanding और historical patterns पर reasoning को जोड़कर यह अधिक smart और भरोसेमंद OCR को support करता है
Xero
- vendor identification और 1099 tax forms के लिए information gathering जैसे कई हफ्तों तक चलने वाले complex workflows को agents के जरिए autonomous रूप से manage करवाकर यह छोटे व्यवसायों के repetitive admin tasks के automation को संभव बनाता है
Databricks
- agentic workflows का उपयोग करके यह real-time information monitor और retrieve करता है, बड़े datasets में reasoning करता है, समस्याओं का diagnosis करता है, और fixes व solutions सुझाता है

व्यक्तिगत AI agents और Search में उपयोग

3.5 Flash दुनिया भर में Gemini app और Search के AI Mode में default model बन रहा है
Google I/O में 3.5 Flash की agent features को रोज़मर्रा की ज़िंदगी में लागू करने वाली नई capabilities दिखाई गईं
Gemini Spark 3.5 Flash का उपयोग करने वाला personal AI agent है
- यह 24 घंटे चलता है
- user के निर्देशों के अनुसार digital life में navigate करता है और user की ओर से actions लेता है
- भरोसेमंद testers के लिए आज से rollout शुरू हो रहा है
- अमेरिका में Google AI Ultra subscribers के लिए अगले हफ्ते beta के रूप में उपलब्ध होगा
3.5 Flash की बेहतर agentic coding क्षमता Search में और अधिक intelligent experiences देती है
- users के लिए 24 घंटे काम करने वाले नए information agent को पेश किया गया है
- अधिक dynamic generative UI experiences को संभव बनाता है
- Search, 3.5 Flash का उपयोग करके Gyroid pattern को समझाने वाले interactive visuals बनाता है

सुरक्षा उपाय

Gemini 3.5 को Frontier Safety Framework के तहत विकसित किया गया है
cyber और CBRN safeguards को मजबूत किया गया है, जिससे harmful content generate करने की संभावना और safe queries के गलत तरीके से जवाब देने से इनकार करने की संभावना कम हुई है
नए और अधिक उन्नत safety training व mitigation techniques लागू की गई हैं
इसमें interpretability tools शामिल हैं, जो response देने से पहले AI की internal reasoning की जांच और समझने में मदद करते हैं

1 टिप्पणियां

GN⁺ 2026-05-20

Hacker News की राय

पेलिकन काफ़ी ठीक-ठाक लग रहा है: https://github.com/simonw/llm-gemini/issues/133#issuecomment...
लेकिन साइकिल के मामले में यह उतना अच्छा नहीं है। पैडल और पिछले पहिए के बीच की रॉड गायब है, और बाकी फ्रेम भी अजीब तरह से उलझा हुआ है
लागत भी महंगी है। वह एक पेलिकन ही 13 सेंट का पड़ा: https://www.llm-prices.com/#it=11&ot=14403&sel=gemini-3.5-fl...
- वह पेलिकन ऐसा लग रहा है जैसे crypto conference के लिए Miami आया हो
- यह बिल्कुल सही तरह से वह बात दिखाता है जो मैंने large language models की प्रगति में महसूस की है। जब इन्हें ऐसे SVG improvement करने को कहते हैं, तो ये गायब क्रॉसबार या अलग हुए हाथ-पैर ठीक नहीं करते, बस और ज़्यादा एलिमेंट जोड़ देते हैं
  यह उदाहरण भी साफ़ तौर पर बहुत बेहतर हुआ है और डिटेल बेहिसाब हैं, लेकिन बुनियादी फ्रेम का आकार अब भी गलत है। वेबपेज में भी यही पैटर्न दिखता है, जैसे बस और बटन वगैरह जोड़ देना
  मैंने टूटा हुआ पेलिकन SVG image model में डालकर उससे खामियां ढूंढने को भी कहा, लेकिन वह टूटे हुए हिस्से फिर भी नहीं पहचान पाया
- chainstay भूल जाना तब आम नतीजा होता है जब किसी भी इंसान से साइकिल बनाने को कहा जाए
  https://www.gianlucagimini.it/portfolio-item/velocipedia/
  
  most ended up drawing something that was pretty far off from a regular men’s bicycle
- इसमें Google वाली वही खास vibe अच्छी तरह कैद हुई लगती है, जो ज़्यादा कूल नहीं है लेकिन युवाओं के बीच लगातार relevant दिखने की कोशिश करती रहती है
- वह सूरज OS museum वाले दूसरे top HN post की बैकग्राउंड में दिखे सूरज से बहुत मिलता-जुलता है: https://news.ycombinator.com/item?id=48195009
input/output प्रति मिलियन टोकन कीमत:
Gemini 2.5 Flash: $0.30/$2.50
Gemini 3.0 Flash Preview: $0.50/$3.00
Gemini 3.5 Flash: $1.50/$9.00
कीमत की दिशा दिलचस्प है। उसी आकार के अगले ही मॉडल में 3x कीमत बढ़ोतरी मैंने शायद पहले नहीं देखी, और यह भी मज़ेदार है कि 3 सिर्फ Preview में ही था
3.5 Flash की लागत लगभग Gemini 2.5 Pro जितनी है, जो $1.25/$10 था
- यह लागत बढ़ोतरी को कम करके दिखाता है। 3.5 Flash टोकन भी ज़्यादा खर्च करता है। artificialanalysis.ai के हिसाब से पूरे eval चलाने की लागत का अंतर ज़्यादा वास्तविक कीमत जैसा लगता है:
  Gemini 2.5 Flash(27 points): $172(1.0x)
  Gemini 2.5 Pro(35 points): $649(3.8x)
  Gemini 3.0 Flash(46 points): $278(1.6x)
  Gemini 3.5 Flash(55 points): $1,552(9.0x, या 2.5 Pro के मुकाबले 2.4x)
  यह बहुत बड़ी कीमत बढ़ोतरी है। Gemini 3.0 Flash से तुलना करें तो 5.6x है
- संभव है कि शुरू से ही सस्ते मॉडल लगातार उपलब्ध कराते रहने का इरादा न रहा हो। API के ऊपर सर्विस बनाने वाले लोग आ जाने के बाद दबाव डालना एक स्वाभाविक तरीका है
  इसलिए provider-neutral abstraction layer रखना सचमुच समझदारी है। अगर आप Kotlin इस्तेमाल करते हैं, तो Koog बढ़िया है
- हमें फिर एक और DeepSeek moment चाहिए। नहीं तो आम लोगों के लिए AI इस्तेमाल करना मुश्किल हो जाएगा, और यह सिर्फ बड़ी कंपनियों की चीज़ बनकर रह जाएगा
- अगर Google TPU की वजह से सच में बाकी जगहों से सस्ता inference चला रहा है, तो यह खतरे का संकेत लगता है। शायद large language models को profit के साथ serve करना मुश्किल साबित हो रहा है
  या फिर वे सोचते हों कि benchmark अच्छे हैं इसलिए कीमत बढ़ाई जा सकती है। लेकिन अभी इतना market share दिखता नहीं कि ऐसी बात को सही ठहराया जा सके
- क्या 3.5 Flash को Preview नहीं बल्कि Stable के रूप में मार्क किया गया है? क्या मैं गलत पढ़ रहा हूँ?
  https://ai.google.dev/gemini-api/docs/models/gemini-3.5-flas...
इस बार Google ने मॉडल को Preview नहीं बल्कि Stable के रूप में मार्क किया है, यह ध्यान देने लायक है। हाल की रिलीज़ ट्रेंड से तुलना करें तो यह असामान्य है
इसके साथ 3x कीमत बढ़ोतरी जोड़ें, तो Flash pricing किसी बाद में वापस ली जाने वाली अस्थायी चाल से ज़्यादा Google की पसंदीदा long-term floor जैसी लगती है
हालांकि यह कहना अभी मुश्किल है कि सिर्फ Google ने माहौल भांप लिया है, या पूरी इंडस्ट्री चुपचाप low-cost inference की baseline फिर से तय कर रही है
Create animated SVG of a frog on a boat rowing through jungle river. Single page self contained HTML page with SVG
3.5 Flash: Thinking Medium - 7516 tokens
https://gistpreview.github.io/?5c9858fd2057e678b55d563d9bff0...
3.5 Flash: Thinking High - 7280 tokens
https://gistpreview.github.io/?1cab3d70064349d08cf5952cdc165...
3.1 Pro - 28,258 tokens
https://gistpreview.github.io/?6bf3da2f80487608b9525bce53018...
3.1 ने जनरेशन में 3 मिनट सोचा, लेकिन animation movement सही तरह से डालने वाला वही एकमात्र मॉडल था
- Gemini 3.1 Flash Lite Thinking High - 2,526 tokens:
  https://gistpreview.github.io/?3496285c5dac5ba10ebbc0b201a1a...
  Gemini 2.5 Pro - 5,325 tokens:
  https://gistpreview.github.io/?cc5e0fefeaaffecd228c16c95e736...
  Gemini 2.5 Flash - 7,556 tokens:
  https://gistpreview.github.io/?263d6058fe526a62b8f270f0620ec...
  Gemma 4 31B IT - AI Studio में 3,261 tokens:
  https://gistpreview.github.io/?858a42b96af864859a3b89508619d...
  Gemma 4 26B A4B IT - AI Studio में 4,034 tokens:
  https://gistpreview.github.io/?4adb7703897e0c6b583f9de928e4a...
- hesamation/Qwen3.6-35B-A3B-Claude-4.6-Opus-Reasoning-Distilled-GGUF @ Q6_K
  8112 tokens @ 52.97 TPS, 0.85s TTFT
  https://gistpreview.github.io/?7bdefff99aca89d1bc12405323bd4...
  पूरी session: https://gist.github.com/abtinf/7bdefff99aca89d1bc12405323bd4...
  Macbook Pro M2 Max पर LM Studio के साथ जनरेट किया गया
  https://huggingface.co/hesamation/Qwen3.6-35B-A3B-Claude-4.6...
- यह GPT 5.5 High thinking का नतीजा है। पहला नतीजा animated नहीं था, इसलिए दूसरा follow-up prompt "it's not animated though" जोड़ना पड़ा
  https://gistpreview.github.io/?557f979c82701862bc26d24f10399...
- Opus 4.7
  https://claude.ai/public/artifacts/128ebe5a-add7-406a-9bce-6...
- सब वाकई मज़ेदार हैं। सिर्फ 3.5 Flash Thinking High ही अजीब तरह से टेढ़ा-मेढ़ा है। 3.1 Pro की टोपी में आखिर हो क्या रहा है, समझ नहीं आता
जब कोई "Flash" कहता है तो क्या मेरे दिमाग में तुरंत "instead consider HTML5" आना इस बात का संकेत है कि मैं सच में बूढ़ा हो गया हूँ?
- Flash culture को इतना मज़ेदार बनाने वाली चीज़ों में से लगभग कुछ भी HTML5 में नहीं आया
- Flash designer वाकई शानदार था। वेब ने जिन चीज़ों में कुछ हद तक पीछे कदम लिया, उनमें 90s और 2000s के RAD tools भी थे
- ऐ नौजवानो!
  Flash, ah, ah, saviour of the universe. Flash, ah, ah, he'll save every one of us!
  न जाने कितने सालों से, जब भी "flash" शब्द सुनता हूँ, यही बात हमेशा दिमाग में आती है
knowledge cutoff: जनवरी 2025
latest update: मई 2026
इस देरी को लेकर बहुत बुरा एहसास होता है
- कम-से-कम कुछ मामलों में ऐसा लगता है कि वे ज़्यादा synthetic data और बहुत सख्ती से चुने गए डेटा के साथ training की ओर बढ़ रहे हैं। खासकर छोटे models के पास दुनिया की सारी जानकारी को दर्जनों या सैकड़ों GB model weights में समेटने की जगह नहीं होती, इसलिए वे ज्ञान की चौड़ाई को अनंत तक नहीं बढ़ा सकते
  इसलिए अगर बेहतर quality reasoning चाहिए, तो training को केंद्रित करना पड़ता है और डेटा बहुत high-quality, high-density होना चाहिए
  अगर tool use मज़बूत है, तो model का पुराना डेटा इस्तेमाल करना शायद उतना मायने न रखे। क्योंकि वह नई जानकारी खोज सकता है। हालांकि अभी ज़्यादातर models ऐसा अपने-आप नहीं करते, जब तक थोड़ा धक्का न दिया जाए
  मेरी समझ से Qwen 3 family सब एक ही base model से शुरू हुई और अलग-अलग metrics बेहतर करने के लिए सिर्फ fine-tuning/post-training किया गया। Gemini 3 family भी पूरी की पूरी वैसी ही हो सकती है, और शायद इसी वक्त Gemini 4 based models को नई जानकारी के साथ साथ-साथ train किया जा रहा हो
- तथ्यों को model weights से निकालना ही नहीं चाहिए। उन्हें real data sources से grounded होना चाहिए
- क्या कोई समझा सकता है कि इसका मतलब क्या है?
- मुझे लगा यह Google की पसंद थी
मैं google ai pro plan इस्तेमाल कर रहा हूँ और Antigravity में 3.5 Flash आज़माया, लेकिन दो prompts में ही quota खत्म हो गया। अगर यह bug नहीं है तो यह सच में बेकार स्तर का है
- कल या परसों Google ने AI Pro quota को सामान्य उपयोग के 33x से घटाकर 4x कर दिया
  Gemini subreddit का माहौल देखें तो लगता है कि यह पहले से कहीं ज़्यादा कड़ा कट है। मैं भी शायद AI Pro cancel कर दूँगा
  इस update ने app भी खराब कर दिया। message edit करते ही app हर बार crash हो जाता है। और यह Pixel पर भी हो रहा है
Gemini 3.5 Flash की 2000-token clock बुरी नहीं है। https://clocks.brianmoore.com/
लगभग वही मॉडल और 3x कीमत बढ़ोतरी। कहा गया था कि AI सस्ता होगा और हर जगह इस्तेमाल होगा
- शायद मतलब यह था कि crack epidemic की तरह हर जगह फैल जाएगा
- अगर benchmarks पर भरोसा करें, तो इसे 3.1 Pro की तीन-चौथाई कीमत भी माना जा सकता है
कीमत हास्यास्पद है
लगता है Gemini 3.5 Pro की कीमत भी साथ में बढ़ेगी। 12 x 5 = 60?
Google ऐसा लगता है जैसे चाहता हो कि हम Chinese models इस्तेमाल करें

Gemini 3.5 Flash

Gemini 3.5 की घोषणा और उपलब्धता

3.5 Flash की performance

बड़े पैमाने के agent tasks

Antigravity और AI Studio के उपयोग के उदाहरण

enterprise और developer उपयोग

Shopify

Macquarie Bank

Salesforce

Ramp

Xero

Databricks

व्यक्तिगत AI agents और Search में उपयोग

सुरक्षा उपाय

संबंधित पढ़ाई

1 टिप्पणियां

Hacker News की राय