2 पॉइंट द्वारा xguru 1 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • मुख्य फोकस Gemini 3.5 Flash, Gemini Omni Flash, Antigravity 2.0, Google AI Studio, Gemma 4, Android 17, Chrome/Web, Firebase, Google Play, AI युग में डेवलपर क्षमताएँ पर रहा
  • Google ने सिर्फ मॉडल घोषणाओं पर नहीं, बल्कि ऐसे डेवलपमेंट फ्लो पर ज़ोर दिया जिसमें agents वास्तविक प्रोडक्ट्स, browser, cloud, mobile apps, data, documents और test environments तक पहुँचते हैं
  • डेवलपमेंट टूल्स अब सिर्फ कोड लिखने तक सीमित नहीं रहे, बल्कि planning, execution, verification, debugging, deployment, evaluation और कई agents के coordination तक फैल गए हैं
  • Android, Flutter, Chrome, Firebase और Google Play सभी का विस्तार Gemini और agent tools को मौजूदा development flow के भीतर शामिल करने के तरीके से किया गया
  • कोड लिखने से ज़्यादा verification cost, context उपलब्ध कराना, tool access permissions, runtime observability, test infrastructure, और संगठन की documentation व system design बड़े bottleneck बनकर उभरे हैं

सत्र 1 - Google keynote

  • हर महीने 85 लाख से अधिक लोग Google models के साथ apps और experiences बना रहे हैं
  • Google के model APIs प्रति मिनट लगभग 19 अरब tokens प्रोसेस करते हैं
  • AI Search usage:
    • AI Overviews का उपयोग हर महीने 250 करोड़ से अधिक लोग करते हैं
    • AI Mode का उपयोग हर महीने 100 करोड़ से अधिक लोग करते हैं
  • Gemini app के monthly active users पिछले साल के I/O के 40 करोड़ से बढ़कर 90 करोड़ से अधिक हो गए हैं
  • Nano Banana model से 5000 करोड़ से अधिक images बनाई गई हैं
  • Gemini 3.5 Flash पूरे product और API stack में उपलब्ध है, और इसकी मुख्य विशेषताएँ तेज़ execution और cost efficiency हैं
  • Gemini Omni Flash Omni family का पहला model है, और इसका रुख multimodal input और output को अधिक व्यापक रूप से संभालने की ओर है
  • Antigravity 2.0 दुनिया भर में उपलब्ध एक standalone desktop app है, जो agent conversations, projects और task management को एक ही स्क्रीन पर संभालता है
  • Antigravity large-scale demo:
    • 93 sub-agents, 15,000 से अधिक model requests, और 2.6 अरब tokens के साथ एक खाली project से काम करने वाला operating system core बनाया गया
    • इसे Gemini 3.5 Flash की performance और cost efficiency का उपयोग करते हुए 1,000 डॉलर से कम API credits में चलाया गया

सत्र 2 - Developer keynote

  • Google ने डेवलपर्स के लिए models, agent tools, user platforms और infrastructure को साथ जोड़ने वाला एक flow पेश किया
  • Managed agents अब Gemini API में आ रहे हैं, जिससे Antigravity जैसे agent harness को API के रूप में इस्तेमाल किया जा सकता है
  • Google Antigravity 2.0 एक agent-centric desktop app है, जिसमें development tasks को कई agents मिलकर संभालते हैं
  • Antigravity SDK के साथ agent flows को सीधे customize और deploy किया जा सकता है
  • Google AI Studio में नए users बिना credit card के सीधे Cloud Run पर deploy कर सकते हैं
  • Google Workspace integration के साथ AI Studio अब app creation flow के भीतर Workspace data का उपयोग कर सकता है
  • Google AI Studio में ideas को सीधे Android app में बदलने वाला flow संभव हो गया है
  • Gemma 4:
    • Apache 2 license के तहत उपलब्ध है
    • पहले महीने में 10 करोड़ downloads हासिल किए
    • कुल Gemma downloads बढ़कर 50 करोड़ से अधिक हो गए
  • Chrome DevTools for Agents का उपयोग Antigravity और 20 से अधिक coding agents में किया जा सकता है
  • Gemma 4 को LoRA से fine-tune करके CI pipeline में सीधे इस्तेमाल होने वाले bash command responses बनाए गए और उन्हें local laptop पर deploy किया गया

सत्र 3 - Agent-first workflows from prompt to production

  • AI Studio में बनाए गए apps को Cloud Run और Firebase पर deploy करने के बाद, operations stage की debugging और analysis को भी agent flow से जोड़ा गया
  • 50 से अधिक managed MCP servers के ज़रिए agents, Google Cloud tools और data तक पहुँचते हैं
  • Developer Knowledge MCP Google documentation आधारित नवीनतम जानकारी को agent tools में लाता है, जिससे पुराने documents की समस्या कम होती है
  • latest documentation snapshots लगभग हर 8-12 घंटे में agent tools में पहुँचते हैं
  • Data Agent Kit और BigQuery MCP का उपयोग करके Firestore, BigQuery और log data का analysis किया जाता है और dashboards बनाए जाते हैं
  • Antigravity app errors की जाँच कर सकता है, संबंधित files ढूँढ़कर उन्हें ठीक कर सकता है, और GitHub commit तक आगे बढ़ सकता है
  • Cloud Run पर deploy किए गए remediation agent और CI agent, Eventarc, Pub/Sub और Gemini से जुड़कर errors की जाँच और fix करते हैं
  • कई agents A2A(agent-to-agent) तरीके से एक-दूसरे को tasks सौंपते हैं
  • agent development अब सिर्फ prototype generation तक सीमित नहीं है, बल्कि deployment, monitoring, data analysis और auto-remediation तक फैल चुका है

सत्र 4 - What’s new in Android

  • Android 17 में memory limits और संबंधित tools जोड़े गए हैं ताकि app का अत्यधिक memory उपयोग user experience को खराब न करे
  • Android 17, excessive memory, cold start, और excessive CPU जैसी स्थितियों को automatic analysis targets के रूप में लेता है
  • Android 17 target करने वाले apps को local network devices ढूँढ़ने और उनसे connect करने के लिए ACCESS_LOCAL_NETWORK permission चाहिए
  • Google ने Android UI को Jetpack Compose के साथ बनाने की दिशा को और मजबूत किया
  • Compose 1.10 और Compose 1.11 में performance, hybrid UI और नए API improvements शामिल हैं
  • AppFunctions और Gemini integration अभी private preview stage में हैं, और apps, Gemini orchestration के targets बन सकते हैं
  • ML Kit Prompt API developer preview के ज़रिए कुछ नई features को test किया जा सकता है
  • Android 17, Eclipsa Video, HE-AAC voice quality improvements, और CameraX व Media3 आधारित camera-media enhancements प्रदान करता है
  • बड़े स्क्रीन वाले apps, Navigation 3 और Compose Adaptive library का इस्तेमाल करके पारंपरिक mobile constraints से कम बंधे हुए दिशा में बढ़ रहे हैं
  • Wear OS के लिए Compose 1.6, Navigation 3 और power-saving state content management में मदद करने वाले mode manager को support करता है

सत्र 5 - What’s new in Chrome

  • Chrome का फोकस इस पर है कि websites उन users के लिए अच्छे से काम करें जो agents और agentic tools का उपयोग करते हैं
  • सिर्फ model के base knowledge पर निर्भर रहने के बजाय, Google latest Baseline और web features को development tools से जोड़ना चाहता है
  • पिछले साल के बाद से 55 features Baseline Widely Available status में पहुँचे हैं
  • घोषणा के समय तक 52 features Baseline Newly Available status में हैं
  • Chrome हर 4 हफ्ते में update होता है, इसलिए अगर coding agents को latest web features की जानकारी न हो तो वे पुराने implementations बना सकते हैं
  • Chrome का Prompt API Chrome 148 में उपलब्ध होगा
  • Navigation API, View Transitions, HTML-in-Canvas, और declarative partial updates को development flow में शामिल किया जा रहा है
  • Chrome extension developers अब installation, service worker, side panel और popup का automatic inspection और debugging कर सकेंगे
  • Chrome, web performance, identity, security जैसे high-level skills और 100 से अधिक common use case guides agents को देने की दिशा में विस्तार कर रहा है
  • agents को latest web features और browser support information देनी होगी, तभी पुराने compatibility patterns की पुनरावृत्ति कम की जा सकेगी

सत्र 6 - Google AI में नया क्या है

  • Gemini मॉडल परिवार एक multimodal मॉडल परिवार है, जो text, image, audio, video, code input और कई output formats को संभालता है
  • Gemini 3.5 Pro और Flash की भूमिकाएँ:
    • Gemini 3.5 Pro जटिल समस्याओं को हल करने पर केंद्रित है
    • Gemini 3.5 Flash performance, speed और cost के संतुलन की जिम्मेदारी संभालता है
  • AI Studio का Build फीचर डिफ़ॉल्ट मॉडल के रूप में 3.5 Flash का उपयोग करता है
  • Nano Banana 2 को AI Studio में सीधे आज़माया जा सकता है
  • Gemini Omni Flash ऐसा मॉडल है जो input से video सहित output बना सकता है
  • Gemini Live और Live API voice-based interaction को support करते हैं
  • Interactions API AI Studio के भीतर agents के साथ interaction के लिए एक फीचर है
  • Gemma 4 की उपलब्धता:
    • इसे AI Studio playground में टेस्ट किया जा सकता है
    • Gemini API में कुछ free calls भी संभव हैं
    • इसमें 256,000 token context window है और इसे Hugging Face पर पाया जा सकता है
  • Gemini Robotics 1.6, Genie 3, Antigravity 2.0, और open models व proprietary models को मिलाकर cost घटाने की रणनीति भी साथ में पेश की गई

सत्र 7 - Google AI Studio और Google Antigravity के साथ next-gen AI experiences बनाएं

  • Google AI Studio अब सिर्फ model playground से आगे बढ़कर, ideas को apps में बदलने और deploy करने की जगह बन गया है
  • models, agents, app generation, Workspace integration, और Cloud Run deployment अब एक ही flow में शामिल हैं
  • AI Studio का app section जल्द उपलब्ध होगा और app creation व deployment को अधिक सीधे तरीके से संभालेगा
  • AI Studio में बने code को एक बार में Antigravity में export करने का फीचर जोड़ा गया है
  • Antigravity 2.0 केवल code लिखने तक सीमित नहीं है, बल्कि कई tasks को agents के जरिए coordinate करने वाले mission control की भूमिका निभाता है
  • Antigravity 2.0 का मुख्य flow task list, implementation plan, और changed files review पर आधारित है
  • code review और changes review को सीधे Antigravity 2.0 के भीतर संभाला जा सकता है
  • browser testing, planning, multi-file feature writing, और end-to-end validation जैसे भारी काम agents को सौंपने की संरचना है
  • Google AI Studio से लगभग 20 मिनट में नया business app बनाया जा सकता है, और फिर उसे Antigravity से आगे विकसित किया जा सकता है
  • Google AI Studio “prompt to app” के लिए तेज़ शुरुआती बिंदु है, और Antigravity app को वास्तविक development work तक बढ़ाने का टूल है

सत्र 8 - अपने AI coding workflows में modern web capabilities अनलॉक करें

  • अगर coding agent को modern web capabilities की जानकारी नहीं हो, तो वह पुराने browser compatibility मानकों के आधार पर code बनाने लगता है
  • Chrome ने पिछले 1 साल में 50 नए features जारी किए हैं, लेकिन model knowledge cutoff की वजह से इन में से कई features model तक नहीं पहुँचते
  • Interest Invokers API के उदाहरण में agent द्वारा पुराने attribute name interesttarget का उपयोग करने की समस्या सामने आती है
  • Modern Web Guidance एक knowledge package है जो agents को latest web features और recommended implementations खोजने में मदद करता है
  • agent जवाब देने से पहले local package के भीतर semantic search करता है
  • guide का पैमाना और संरचना:
    • इस समय 100 से अधिक guides हैं
    • हर feature-specific skill को top-level tool के रूप में expose नहीं किया जाता, बल्कि ज़रूरत पड़ने पर खोजकर इस्तेमाल करने की संरचना है
  • guides ideal modern implementation और fallback recommendations दोनों प्रदान करते हैं
  • अगर browser support requirements न दी गई हों, तो agent डिफ़ॉल्ट रूप से Baseline Widely Available को मान लेता है
  • अगर AGENTS.md में “Chrome 144 या उससे ऊपर ही supported” जैसी शर्त लिखी जाए, तो agent अनावश्यक fallback से बच सकता है
  • Chrome team Gemini 3.1, Claude Opus 4.7, GPT 5.5 जैसे models पर रोज़ाना evaluation चलाती है

सत्र 9 - Firebase में नया क्या है

  • Firebase एक agent-native platform की ओर बढ़ रहा है, जहाँ लोग और agents दोनों apps बना और scale कर सकते हैं
  • Firebase Data Connect SQL-आधारित app development को support करने वाले Firebase SQL Connect में विकसित हो रहा है
  • Firebase SQL Connect के custom resolver के जरिए Cloud Functions और BigQuery जैसी Google Cloud services को जोड़ा जा सकता है
  • Firestore geo search, native full text search, और semantic match को support करता है
  • Firebase AI Logic latest models को support करता है, और Maps grounding के साथ location-aware AI features बनाए जा सकते हैं
  • Nano Banana image generation control फीचर भी Firebase AI Logic में इस्तेमाल किया जा सकता है
  • Firebase AI Logic iOS, Chrome, और Android में local·hybrid inference को support करता है, और local model न होने पर cloud-hosted model पर fallback करता है
  • Dart support for Cloud Functions in Firebase experimental preview के रूप में उपलब्ध है
  • AI Studio, Google Workspace से जुड़ा है, इसलिए Sheets, Docs, Gmail, और Calendar data को apps में इस्तेमाल किया जा सकता है
  • Firebase agent skills Android, iOS, web, और Flutter में इस्तेमाल किए जा सकते हैं, और Crashlytics support भी विस्तारित किया गया है

सत्र 10 - Google Play में नया क्या है

  • Play Billing 65 से अधिक markets में 300 से अधिक local payment methods को support करता है
  • Google Play पर 89 करोड़ से अधिक ऐसे users हैं जो खरीदारी के लिए तैयार हैं
  • Google Play Billing और alternative payments को साथ में देने के विकल्प बढ़ाए जा रहे हैं, और कम service fee की भी घोषणा की गई है
  • app discovery अब Gemini app, Android, और web तक फैल रही है, ताकि users Gemini के भीतर apps और games खोज सकें
  • Gemini स्थिर link list के बजाय app की वास्तविक capabilities और store listing information का उपयोग करके app सुझाता है
  • कुछ topics में Gemini और Play users 4.5 लाख से अधिक movies और TV content explore कर सकते हैं
  • Play Console में Eclipsa Video या Google Sheets जैसी structured files अपलोड करने पर Gemini listing को पहले से भर देता है
  • Gemini भविष्य में bulk price changes, import skills, और metadata configuration जैसे Play Console tasks में मदद करेगा
  • in-app subscription management API के जरिए users app के भीतर ही subscription plans आसानी से बदल सकते हैं
  • पिछले साल Google Play Billing ने 3.4 अरब डॉलर के attempted fraud और 13 करोड़ डॉलर के abusive refunds को रोका

सत्र 11 - agentic AI युग को परिभाषित करना

  • Gemini, Search, Gemini app, और Google DeepMind एक ही दिशा में agentic AI पर काम कर रहे हैं
  • Gemini 3.5 Flash को Search के भीतर भी इस्तेमाल किया जा सकता है
  • Search को तेज़ जवाबों और लंबे agentic task के बीच संतुलन ढूँढना होगा
  • Gemini Spark एक always-on agent की भूमिका निभाता है, जो यूज़र के सौंपे गए कामों को बैकग्राउंड में संभालता है
  • मॉडल को सिर्फ साधारण चैट जवाबों से आगे बढ़कर पूरे Google उत्पादों और बाहरी ecosystem के ऊपर काम करना होगा
  • Python से Go में अनुवाद किया गया internal tool:
    • जिन मौजूदा प्रोग्रामों में tests मौजूद हैं, उन्हें दूसरी भाषा में अनुवाद करना मॉडल के लिए अधिक स्पष्ट समस्या है
    • कुछ internal tools सिर्फ एक रात में 10-20 गुना तेज़ हो गए
  • नए agentic world के हिसाब से Google का internal software infrastructure भी और तेज़ी से बदल सकता है
  • hardware, model scale, product adoption, और feedback loop — इन सबका साथ में जुड़ना ज़रूरी है, तभी Gemini पूरे Google product stack में जा सकेगा
  • सवाल का फोकस “मॉडल क्या कर सकता है” से बदलकर “मॉडल को product और workflow में कैसे deploy किया जाए” पर जा रहा है

सत्र 12 - What’s new in Android development tools

  • Android development tools को सिर्फ human developers ही नहीं, बल्कि codebase में deploy होने वाले AI agent को ध्यान में रखकर भी डिज़ाइन किया गया है
  • Android Studio Otter Gemini Enterprise और Google One accounts को support करता है
  • Android Studio local models और remote models को import करके इस्तेमाल कर सकता है
  • Android Bench इस बात का benchmark है कि Android development task के लिए कौन-सा model इस्तेमाल किया जाए
  • Compose Preview में सीधे UI transformation की request की जा सकती है, ताकि agent बेहतर context के साथ काम कर सके
  • सिर्फ prompt के ज़रिए adaptive Android app बनाने वाला agent-based new project wizard इस्तेमाल किया जा सकता है
  • Android Studio में adaptive API integration, XML से Compose conversion जैसे कामों में मदद करने वाली लगभग 10 skills शामिल हैं
  • नया Android CLI LLM workflow को support करता है, और नया project बनाने में दूसरे Gradle LLM tools की तुलना में token usage को 70% से अधिक कम करता है
  • Antigravity CLI, Android CLI, और Android skills को जोड़कर Antigravity में भी Android app development शुरू किया जा सकता है
  • Android Studio Quail और Android 17 devices में network बदलने या laptop restart करने पर भी device connection बना रहता है

सत्र 13 - What’s new in Flutter

  • Flutter 3.44 और Dart 3.12 साथ में जारी किए गए
  • इस साल Flutter project में 1,700 से अधिक contributors ने हिस्सा लिया
  • हर महीने 15 लाख से अधिक developers Flutter से build करते हैं
  • Flutter 3.44 में Android API 34 या उससे ऊपर के Vulkan-supported devices पर नया rendering mode आज़माया जा सकता है
  • Toyota 2026 RAV4 के infotainment system में Flutter का उपयोग किया गया है
  • Dart-आधारित Cloud Functions for Firebase में AOT compilation की वजह से cold start 10ms तक कम होने के मामले देखे गए हैं
  • Firebase AI Logic में server prompt templates जोड़े गए हैं, इसलिए app के अंदर सीधे prompt डालने की ज़रूरत नहीं है
  • Firebase Agent Skills for Flutter agent को full-stack Flutter और Firebase app बनाने के लिए guidance देता है
  • LiteRT-LM support जल्द hi flutter_gemma package में आने वाला है
  • Flutter desktop में Canonical lead maintainer और strategic steward के रूप में शामिल है

सत्र 14 - What’s new in the Gemma open model family

  • Gemma 4 ने खुद को Gemma family के सबसे शक्तिशाली public model के रूप में स्थापित किया है
  • यह 2B से 31B तक कई sizes में उपलब्ध है, इसलिए इसे mobile, laptop, और cloud में इस्तेमाल किया जा सकता है
  • Gemma की शुरुआत 2024 में 1B से 27B तक फैली model family के रूप में हुई थी
  • Gemma 4 एक open weight model है और open source ecosystem के साथ compatible है
  • MTP और speculative decoding के ज़रिए decode speed को अधिकतम 3 गुना तक बढ़ाया जा सकता है
  • Android ecosystem के लिए Gemma 4 का day-zero implementation तैयार है
  • Android API के ज़रिए फ़ोन पर छोटे Gemma models सीधे चलाए जा सकते हैं, या Gemini API access मुश्किल होने वाले माहौल में local Gemma model से Android app कोड किया जा सकता है
  • Cloud Run पर ADK(agent development kit) और Gemma 31B का उपयोग करके ऐसा agent बनाया जाता है जो database को समझकर जवाब ढूँढ सके
  • Gemma 4 को Transformers.js, Ollama, और LM Studio के OpenAI-compatible interface के ज़रिए browser या local environment में चलाया जा सकता है
  • enterprise cloud, local machine, browser, और mobile — सभी Gemma के runtime environment बन जाते हैं

सत्र 15 - What’s new in Web UI

  • 2026 के Web UI updates में प्रमुख features को उनके Baseline status के साथ पेश किया गया
  • हर feature पर Baseline Widely Available, Newly Available, या Limited Available जैसी compatibility marking लगती है
  • contrast-color API से CSS में सही contrast वाला color चुनना आसान हो जाता है
  • Chrome 146 का meta name="text-scale" feature system text size setting के अनुसार काम करता है
  • Android और iOS — दोनों पर 30% से अधिक users default text size बदलते हैं
  • Chrome 134 से dialog element ने popover के declarative light dismiss जैसी features को अपनाया है
  • two-phase View Transitions को Chrome Canary में टेस्ट किया जा सकता है
  • scroll-driven animations 2023 में Chrome में आए थे, और Interop 2026 के ज़रिए interoperability बढ़ाई जा रही है
  • HTML-in-Canvas API Canvas के भीतर असली DOM content रखने की सुविधा देता है
  • Chrome 149 में gap decorations और shape outside के लिए नए usage patterns जोड़े गए हैं

सत्र 16 - Adaptive development for the expanding Android ecosystem

  • Android अब केवल फ़ोन तक सीमित ecosystem नहीं है, और 58 करोड़ से अधिक बड़ी-स्क्रीन active devices adaptive app निवेश का लाभ पा रहे हैं
  • foldable उपयोगकर्ताओं को adaptive app में अधिक मूल्य वाले user segment के रूप में वर्गीकृत किया जाता है
  • Android 17 में target SDK 37 को लक्ष्य करने पर orientation और resizability opt-out हटाने की दिशा में बदलाव हो रहा है
  • Android Studio Quail Canary का Desktop emulator डेस्कटॉप फ़ॉर्म वाले Android app testing को सपोर्ट करता है
  • Android 17 के Continue On API से उपयोगकर्ता एक डिवाइस पर कर रहे काम को दूसरे डिवाइस पर जारी रख सकते हैं
  • Google, Android app को Compose-first बनाने की दिशा को और मज़बूत कर रहा है
  • Compose 1.11 trackpad support को mouse और pointer स्तर तक बेहतर बनाता है, और non-touch input testing API जोड़ता है
  • Compose में state-based styling के लिए experimental API जोड़ी गई है
  • Connected Displays को Android Feature Drop के ज़रिए public availability में लाया गया है
  • Compose, Navigation 3, Compose Adaptive लाइब्रेरी foldable, desktop, car, TV, XR जैसी कई screens के लिए सपोर्ट देती हैं

सेशन 17 - Building the quantum-AI future with Hartmut Neven and James Manyika

  • quantum computing और AI का एक-दूसरे को accelerate करना मुख्य विषय है
  • Hartmut Neven ने 2012 में Google की Quantum AI team शुरू की थी
  • superposition और qubit, quantum computing की नींव हैं
  • 105 qubit chip पर संभव bit string की संख्या 2 की 105वीं घात है
  • ऐसे algorithm और problem, जिन्हें quantum computer उपयोगी ढंग से हल कर सकते हैं, उनकी संख्या अभी community में 70 से अधिक पहचानी जा चुकी है
  • आगे चलकर यह संख्या 10 गुना से भी अधिक बढ़ सकती है
  • quantum error correction superposition state को बनाए रखने के लिए ज़रूरी मुख्य तकनीक है
  • Google ने 2022 में quantum error correction के ज़रिए वास्तविक मशीन की errors घटाने में सफलता पाई थी
  • Quantum Echoes का संबंध NMR या MRI से आने वाले data को सीखने के तरीकों से है
  • Google का मानना है कि post-quantum cryptography transition को 2029 तक और अधिक मज़बूती से आगे बढ़ाना चाहिए

सेशन 18 - Scale AI with Google’s TPU software stack

  • TPU पर model को training, fine-tuning, inference कराने वाले open source software stack पर चर्चा है
  • model development flow को pre-training, post-training, serving/inference में बाँटा गया है
  • Kaggle और Colab के free TPU से post-training और inference आज़माया जा सकता है
  • vLLM on TPU demo में Gemma 4 31B model को TPU पर चलाकर खाने की image से nutrition information का सार निकाला गया
  • Gemma 4 एक multimodal model है, जो image लेकर उसकी सामग्री समझने और उसका सार देने के काम के लिए उपयुक्त है
  • vLLM TPU inference में MTP जोड़कर कई कार्यों में लगभग 3 गुना speedup मिला
  • Tunix post-training के लिए एक lightweight framework है
  • बड़े model के बजाय 4B model को fine-tune करके वही काम कराया गया, और उसे एक single Trillium chip पर चलाया गया
  • MaxText, Tunix, vLLM, JAX, PyTorch, TPU को model lifecycle के अलग-अलग चरणों के tools के रूप में रखा गया है

सेशन 19 - Supercharge your AI coding workflow with Chrome DevTools for agents

  • Chrome DevTools for agents ऐसा tool है जो coding agent को DevTools के ज़रिए browser runtime को सीधे observe करने देता है
  • जिस तरह मानव developer DevTools से सीखते और debugging करते हैं, उसी तरह coding agent के पास भी वही closed feedback loop होना चाहिए
  • agent वास्तविक Chrome instance खोल सकते हैं, page को navigate कर सकते हैं, form भर सकते हैं, और console log व network request इकट्ठा कर सकते हैं
  • source map access के ज़रिए runtime issue से संबंधित source file तक पहुँचा जा सकता है
  • यह tool NPM package के रूप में उपलब्ध है, और इसमें MCP serverCLI शामिल हैं
  • 6 उपलब्ध skills:
    • troubleshooting, Chrome DevTools, Chrome DevTools CLI skill सामान्य उपयोग और concepts में मदद करते हैं
    • accessibility debugging, memory leak debugging, optimized LCP skill agent को विशेषज्ञ-स्तर का domain knowledge देते हैं
  • implementation का आधार Puppeteer है, और agent Puppeteer को सीधे इस्तेमाल करने के बजाय tool wrapper का उपयोग करते हैं
  • डिफ़ॉल्ट रूप से यह अलग anonymous browser profile का उपयोग करता है, और Chrome password manager तक पहुँच नहीं देता
  • CyberAgent ने DevTools for agents के साथ 32 components की 236 Storybook story का audit 1 घंटे के भीतर किया

सेशन 20 - A new era of discovery: AI and the frontiers of science with Demis Hassabis

  • Demis Hassabis ने DeepMind का मूल लक्ष्य “solve intelligence” रखा था
  • AI किस तरह scientific discovery, products और research tools को बदल रहा है, यह मुख्य विषय है
  • AlphaFold को protein structure जैसी 50 साल पुरानी कठिन समस्या हल करने वाले उदाहरण के रूप में फिर से प्रस्तुत किया गया
  • Gemini for Science keynote में घोषित science-oriented model direction से जुड़ता है
  • Demis Hassabis ने वर्तमान समय को “singularity की foothills” पर खड़ा दौर बताया, और intelligence के हल होने का समय 2030 के आसपास 1 साल आगे-पीछे माना
  • Genie series model का उपयोग Waymo के लिए वास्तविक दुनिया में मुश्किल से दिखने वाली 1 in a billion स्थितियों का परीक्षण करने में होता है
  • Isomorphic Labs की drug discovery प्रगति को AI द्वारा science को accelerate करने के उदाहरण के रूप में पेश किया गया
  • Gemini app के पास हर महीने 90 करोड़ उपयोगकर्ता हैं, और AI Mode in Search भी एक महत्वपूर्ण product surface बन गया है
  • AI का उपयोग product feature से आगे बढ़कर science और research problems को हल करने के tool के रूप में हो रहा है

सेशन 21 - A fireside chat on the evolution of the developer craft

  • AI युग में developer का काम code लिखने से बढ़कर system design, documentation, orchestration की ओर जा रहा है
  • नए tools और model लगातार आ रहे हैं, लेकिन हर trend को तुरंत अपनाने की ज़रूरत नहीं; सोच-समझकर चुनना होगा कि क्या सीखना है
  • team में agent लाना कई junior engineer जोड़ने जैसा है, इसलिए internal docs और design decision records और अधिक महत्वपूर्ण हो जाते हैं
  • अच्छा agentic workflow बनाने के लिए तय करना होगा कि एक agent की ज़िम्मेदारी क्या होगी, कई agents आपस में कैसे बात करेंगे, और human supervision कहाँ होगी
  • कई coding tools का UX एक जैसा होता जा रहा है, इसलिए एक tool में सीखा गया pattern दूसरे tool में भी काम आ सकता है
  • agents के साथ काम करते समय process control का कुछ हिस्सा छोड़ना पड़ता है, और result व design intent के बीच तालमेल बिठाना होता है
  • technical debt, cognitive debt, intent debt AI की वजह से और तेज़ी से सुधर भी सकते हैं या और तेज़ी से बिगड़ भी सकते हैं
  • 20 agents को एक साथ चलाना मानव cognition capacity से बाहर जा सकता है, इसलिए इसे जानबूझकर manage करना होगा
  • अच्छे prompt की आदत search query के टुकड़ों से हटकर complete goal और context देने की दिशा में बदल रही है
  • “क्या आप सारा code खुद लिखते हैं” से अधिक महत्वपूर्ण यह हो गया है कि “क्या आपके पास ऐसा context और validation system है जिसमें agent काम कर सके”

सेशन 22 - Build core skills to thrive as an AI-era developer

  • AI के दौर में भी बुनियादी software engineering क्षमताएँ और ज़्यादा महत्वपूर्ण हो रही हैं
  • AI force multiplier बन सकता है, लेकिन उसके आउटपुट का मूल्यांकन, एकीकरण और रखरखाव करने के लिए गहरी विशेषज्ञता चाहिए
  • एजेंट जितना अधिक स्वायत्त रूप से काम करेंगे, उतना ही intent को और पहले स्पष्ट करने वाला shift-left ज़रूरी होगा
  • System Design की अवधारणा अब environment, people, agents, tools और culture तक फैल रही है
  • टीमों को एजेंट्स को out-of-box इस्तेमाल करने के बजाय agent role, profile, recipe, rule और skill खुद बनाकर बनाए रखना होगा
  • Specs, agent rules और skills सिस्टम के what और why को एजेंट्स तक पहुँचाने वाले source of truth बन जाते हैं
  • realistic eval बनाने के लिए AI, software engineering, users और business capabilities का साथ होना ज़रूरी है
  • agent trace का विश्लेषण करके tool usability, agent skill और system design सुधारने के लिए feedback loop बनानी चाहिए
  • मानव इंजीनियर अलग-अलग एजेंट के conductor से कई asynchronous agent teams के orchestrator की भूमिका में जा रहे हैं
  • malicious actors के नज़रिए से सिस्टम को देखने के लिए red team agent को स्पष्ट रूप से रखा जा सकता है

सेशन 23 - Software engineering at the tipping point

  • अगर AI कोड लिखने की गति बढ़ाता है, तो पूरा development ecosystem software ecology स्तर के दबाव में आता है
  • Google में Android और Chrome सहित सारा कोड एक shared monorepo में है, और वह trunk पर commit होने वाली संरचना में चलता है
  • Google लंबे समय से ऐसे internal tools इस्तेमाल करता रहा है जिनसे एक developer लाखों lines of code बदल सकता है
  • इस बात की संभावना बहुत ज़्यादा है कि मौजूदा development ecosystem 10x speed को संभाल न पाए
  • अगर एजेंट अधिक compile, test, commit और token usage पैदा करते हैं, तो infrastructure cost और bottlenecks बढ़ जाते हैं
  • एजेंट ऐसा कोड बना सकते हैं जिसे लिखना आसान हो, लेकिन ज़रूरी नहीं कि वह इंसानों के लिए maintain करना भी आसान हो
  • reuse और isolation को लागू कराने वाली component reuse और component isolation agentic skills की ज़रूरत है
  • API और data access को इस तरह मज़बूती से सुरक्षित करना चाहिए मानो वे एजेंट्स के लिए practically public हों
  • “agents will find things you probably didn't want them to” यह वाक्य permission design के जोखिम को उजागर करता है
  • 2030 के development ecosystem में आज का तरीका 2001 के CD-ROM दौर जितना पुराना लग सकता है

सेशन 24 - Vibe once, run anywhere with Google Antigravity and Flutter

  • Antigravity और Flutter को साथ इस्तेमाल करने पर एक बार बना आइडिया कई platforms तक बढ़ाया जा सकता है
  • Gemini 3 के रिलीज़ के समय से model capabilities में काफ़ी बढ़ोतरी हुई, और Antigravity ने शुरुआत से ही उन क्षमताओं को support किया
  • Antigravity का मुख्य आधार ऐसा feedback loop है जिसमें planning, execution और validation क़रीबी रूप से जुड़े रहते हैं
  • Antigravity task list और implementation plan बनाता है, execution के दौरान screenshot और video रिकॉर्ड करता है, और पूरा होने के बाद implementation व उसके कारणों सहित रिपोर्ट लिखता है
  • validation चरण में app चलाना, screenshot लेना, Chrome button क्लिक करना और tests चलाना क्रम से होता है
  • Flutter में Dart का strong typing और analysis server LLM को function signature, class shape जैसी objective error signals देता है
  • Flutter एक cross-platform UI toolkit है जो कई screens पर वही pixels और functionality देता है
  • Flutter का stateful hot reload ऐसा development experience देता है जिसमें चल रहे app को 1 सेकंड से कम में फिर से build किया जा सकता है
  • एजेंट जितना अधिक कोड बनाएँगे, इंसानों को उतना ही design goals और product direction तय करके agent outputs की समीक्षा करनी होगी
  • Antigravity agent execution loop देता है, और Flutter कई platforms पर consistent results देकर “vibe once, run anywhere” प्रवाह बनाता है

1 टिप्पणियां

 
hmmhmmhm 1 시간 전

Flash बहुत महंगा है, अब मैं हमेशा के लिए OpenRouter gemma hosting में ही रहने वाला हूँ