- Google का Gemini 3 अब सिर्फ़ एक conversational chatbot नहीं है, बल्कि code writing, web browsing, file manipulation जैसे वास्तविक काम करने वाला digital colleague-शैली AI बन चुका है
- इसके साथ पेश किया गया Antigravity उपयोगकर्ता के कंप्यूटर तक पहुँचकर स्वायत्त रूप से प्रोग्राम लिखता है, और Inbox system के ज़रिए approval या मदद माँगने वाला agent-based tool है
- Gemini 3 उपयोगकर्ता के निर्देशों के अनुसार website बनाना, data analysis करना, research paper लिखना तक कर सकता है, और PhD-स्तर की research capability दिखाता है
- गलतियाँ अभी भी मौजूद हैं, लेकिन वे अब भी ज़्यादातर judgment या understanding gap के स्तर की हैं, इसलिए यह इंसानों के साथ काम करने वाले ‘AI team member’ के ज़्यादा क़रीब है
- लेख इस बात पर ज़ोर देता है कि “chatbot के युग से digital colleague के युग में बदलाव” हो रहा है, और इंसान अब AI की गलतियाँ ठीक करने वाले नहीं बल्कि AI के काम को निर्देशित करने वाले manager बनते जा रहे हैं
Gemini 3 का आगमन और 3 साल का बदलाव
- ChatGPT के लॉन्च के लगभग 3 साल बाद आया Google Gemini 3 AI प्रगति की रफ़्तार का एक उदाहरण है
- 2022 के GPT-3.5 दौर में AI सिर्फ़ paragraph या poem generate करने के स्तर पर था
- 2025 का Gemini 3 अब interactive game को ख़ुद code और design करने के स्तर तक पहुँच गया है
- Gemini 3 उपयोगकर्ता के अनुरोध पर “Candy-Powered FTL Starship Simulator” नाम का वास्तव में खेला जा सकने वाला game बनाता है
- यह दिखाता है कि AI पहले जहाँ सिर्फ़ text समझाता था, अब वह code और interface को सीधे implement करने के चरण में पहुँच चुका है
Antigravity और agent-शैली AI
- Google ने Gemini 3 के साथ Antigravity नाम का एक developer tool भी पेश किया
- यह Claude Code या OpenAI Codex की तरह उपयोगकर्ता के कंप्यूटर तक पहुँचकर स्वायत्त रूप से code लिखने वाला system है
- Antigravity Inbox concept लाता है, जिसमें AI को काम के दौरान approval या मदद चाहिए होने पर वह उपयोगकर्ता को notification भेजता है
- उपयोगकर्ता अंग्रेज़ी में निर्देश देता है और AI उसे code के रूप में execute करता है
- उदाहरण के तौर पर, लेखक की newsletter files का analysis करके AI predictions को व्यवस्थित करने वाली website अपने-आप तैयार की गई
- AI web search, code execution, browser testing करता है और नतीजे को Netlify पर deploy किए जा सकने वाले रूप में package करता है
सहयोगी AI के रूप में Gemini 3
- Gemini 3 काम के दौरान user approval request के ज़रिए प्रगति को पारदर्शी ढंग से साझा करता है
- उपयोगकर्ता AI के सुझावों की समीक्षा और संशोधन करते हुए उसके साथ सहयोग करता है
- यह प्रक्रिया काफ़ी हद तक “AI management” जैसे अनुभव के क़रीब है
- AI परफ़ेक्ट नहीं है, लेकिन इसकी गलतियाँ ज़्यादातर judgment difference या intent interpretation में गलतफ़हमी के स्तर की हैं, और पारंपरिक hallucination समस्या लगभग नहीं के बराबर है
- Gemini 3 के साथ सहयोग का अनुभव “team member management” जैसा बताया गया है, जो सिर्फ़ prompt देने से कहीं आगे की interaction को दिखाता है
research capability और ‘PhD-स्तर’ का आकलन
- Gemini 3 ने research dataset analysis और paper writing जैसे कार्य किए
- पुराने crowdfunding data files को recover और organize किया गया, और उन पर नया analysis किया गया
- “startup·business strategy” विषय पर 14-पेज का paper लिखा गया
- AI ने स्वतंत्र hypothesis बनाई, statistical analysis किया, और अपना metric (idea originality measurement) भी तैयार किया
- नतीजा graduate student स्तर का लगा, हालाँकि कुछ statistical techniques और theoretical development कमज़ोर थे
- अतिरिक्त निर्देश देने पर गुणवत्ता में बड़ा सुधार हुआ
- लेखक का आकलन था कि “PhD-स्तर की intelligence अब दूर नहीं है”
digital colleague की ओर बदलाव
- Gemini 3 एक सोचने और execute करने वाला partner-style AI है, जिसे दुनिया भर के अरबों लोग access कर सकते हैं
- AI प्रगति में धीमापन आने के कोई संकेत नहीं हैं, और agent-based models के उभार के साथ AI management skill की अहमियत बढ़ रही है
- लेखक इसे “chatbot के युग से digital colleague के युग में संक्रमण” बताते हैं
- अब इंसान AI की गलतियाँ ठीक करने वाले नहीं, बल्कि AI के काम को निर्देशित करने वाले manager बनते जा रहे हैं
- अंत में Gemini 3 ने सिर्फ़ code के ज़रिए blog cover image बनाकर text से आगे की creative क्षमता भी दिखाई
- लेकिन AI को कंप्यूटर access देने पर security risk मौजूद रहता है, इसलिए सावधानी ज़रूरी है
1 टिप्पणियां
Hacker News राय
ऐसे लेखों को देखते समय मुझे हमेशा लगता है कि एक बात छूट जाती है — सवाल यह है: "क्या यह अच्छा है, क्या यह सही है"
edgeDetect(image)जैसा Sobel filter code लिखने को कहते, तो अलग-अलग models में सफलता अलग होती थीयह दिलचस्प है कि अब तक AI के साथ हमारा interaction ज़्यादातर text box-केंद्रित रहा है
Hallucination की समस्या अब भी बनी हुई है
"क्या यह PhD-level intelligence है?" इस सवाल पर, एक graduate student होने के नाते मुझे कुछ वैसा ही एहसास होता है
Google की प्रगति सिर्फ़ software ही नहीं, hardware में भी हो रही है
Gemini 3 प्रभावशाली है, लेकिन फिर भी लगता है कि यह मौजूदा literature की सीमाओं के भीतर ही रहता है
GPT-3 की release date जून 2020 थी, और ChatGPT वास्तव में version 3.5 था
यह बात काफ़ी समय से कही जा रही है कि Human in the loop अब AI की ग़लतियाँ सुधारने वाले इंसान से AI को निर्देशित करने वाले इंसान की तरफ़ विकसित हो रहा है
मुझे संदेह है कि Claude Code या Antigrav जैसे tools को सीधे local system पर चलाना कितना सुरक्षित है