- Google ने Gemini CLI नाम का एक नया open source AI agent पेश किया है
- यह टूल command-line environment में सीधे Gemini model की AI क्षमताओं का उपयोग करने में मदद करता है
- डेवलपर्स code generation, document summary, translation जैसे कई काम सीधे CLI में कर सकते हैं
- Gemini CLI की खासियत extensibility, customization, open source accessibility है
- मौजूदा AI agents की तुलना में यह सुविधा और productivity में सुधार जैसे फायदे देता है
Gemini CLI परिचय
- Google ने Gemini CLI जारी किया है ताकि डेवलपर्स command-line environment में AI features का आसानी से उपयोग कर सकें
- Gemini CLI, Google के Gemini model पर आधारित है और यह रोज़मर्रा के development tasks की automation, natural language processing, translation, code generation, document summary जैसी कई AI क्षमताएँ एकीकृत रूप में प्रदान करता है
- इसे open source के रूप में उपलब्ध कराया गया है, इसलिए इसे स्वतंत्र रूप से customize और extend किया जा सकता है, और इसमें developer community की ज़रूरतों के अनुसार विभिन्न plugins और extensions विकसित करने का वातावरण है
- मौजूदा LLM-आधारित command-line tools की तुलना में यह सरल integration और अधिक सुविधा प्रदान करता है, और इसके उपयोग उदाहरणों में code error fixing, development documentation automation, data analysis जैसे कई काम शामिल हैं
- Gemini CLI तेज़ AI access, real-time usability, और developer environment में स्वाभाविक रूप से integrate हो सकने वाली संरचना के जरिए productivity बढ़ाने में मदद करता है
1 टिप्पणियां
Hacker News राय
Google के Gemini प्रोडक्ट्स इतने ज़्यादा बिखरे हुए हैं कि काफ़ी भ्रम पैदा होता है। मैं Pro subscriber हूँ, फिर भी मुझे अभी जाकर पता चला कि
Gemini Code Assist StandardयाEnterpriseइस्तेमाल करने पर ज़्यादा usage मिलता है। ऐसे pricing tiers और feature differences से अनजान एक सामान्य Google user के रूप में, यह स्थिति काफ़ी बेतुकी लगी कि Google को Gemini subscription fee देने के बावजूदGemini CLIमें कोई खास फ़ायदा नहीं मिलताGoogle भी Microsoft की तरह लगभग हर क्षेत्र में प्रोडक्ट रखता है, लेकिन उसकी उलझाऊ messaging की वजह से हर प्रोडक्ट की अपनी ताकत धुंधली हो जाती है। मुझे भी Gemini 2.5 Pro पसंद है, लेकिन रोज़मर्रा के AI chat assistant की तलाश में मैंने कुछ समय तक दूसरे AI products भी आज़माए। Gemini Pro subscription, Google One में शामिल होने की वजह से Google Drive के साथ अच्छा लगता है, लेकिन मैं पहले से iCloud subscription और iOS ecosystem के data integration में हूँ, इसलिए बदलने की कोई वजह नहीं है। Gemini chat UI, OpenAI ChatGPT macOS client से काफ़ी पीछे है। NotebookLM दस्तावेज़ सारांश में मज़बूत है, लेकिन वह Gemini chat के साथ integrated नहीं है, इसलिए Google के अलग-अलग products के बीच बार-बार जाना पड़ता है। आख़िरकार मैं Raycast AI के लिए subscription दे रहा हूँ, क्योंकि वह workflow में अच्छी तरह integrated है और कई models आज़माने देता है। नए models तुरंत नहीं मिलते, लेकिन usage experience लगातार एक जैसा रहता है। Google के इतने products में बँटे होने की वजह से usability के मामले में वह OpenAI (सामान्य काम) और Anthropic (coding) से पीछे लगता है। पिछले कुछ महीनों में Google Stitch, GH Copilot/Cursor के लिए VSCode plugin, Claude Code आदि के ज़रिए पकड़ने की कोशिश दिखी, लेकिन सबमें ऐसा side project वाला एहसास आता है जो शायद जल्दी ग़ायब हो जाए
गुणवत्ता बहुत ऊँची है, लेकिन Google Cloud Dashboard इतना जटिल है कि ज़्यादातर startups या individual developers Google की जगह दूसरे solutions चुनते हैं। मैं Vertex पर models host करता हूँ, लेकिन यह Google Cloud से अलग कैसे है, यह साफ़ नहीं है। Project level पर तो दो APIs भी हैं। अगर आप AI provider हैं, तो size चाहे जो हो, बिना entry barrier के इस्तेमाल करने देना चाहिए, लेकिन संरचना ऐसी है कि Google AI Studio API से शुरू करो और project बड़ा होने पर मजबूरन Vertex API पर जाओ। यह scalable API solution जैसा नहीं लगता। OpenAI-compatible API भी अक्सर ठीक से काम नहीं करती, इसलिए उस पर बने कई tools सही तरह नहीं चलते। Google AI lineup में Jules और Gemini CLI का फ़र्क, Vertex API और AI Studio API का अंतर, और Vertex का Google Cloud पर निर्भर होना—जैसे app development में environment variables सेट करने जैसी जटिलताओं के कारण entry barrier मौजूद है Vertex environment variable official docs
Google की pricing policy समझना मुश्किल है। Gemini 2.5 Pro मुझे इस्तेमाल किए गए models में सबसे बेहतर लगता है, लेकिन Claude या Cursor की तरह ऐसा कोई simple subscription नहीं है जिसमें एक ही बार में सारे features मिल जाएँ। Enterprise users की तरफ़ OpenAI ने पूरी पकड़ बना ली है
हर महीने 300 डॉलर वाला AI ULTRA membership भी है। यहाँ तक कि Google One membership भी किस तरह के "extra features" देता है, यह हर समय बदलता हुआ सा लगता है, इसलिए साफ़ जानकारी मिलना मुश्किल है
Anthropic में भी यही समस्या है। Subscription लेने पर Claude इस्तेमाल कर सकते हैं, लेकिन Claude Code का billing अलग
API usageके रूप में होता है, यानी subscription से अलग pricing structure। लगता है किसी ने यह समझ लिया कि हम जैसे लोग CLI पसंद करते हैं, और अब उसके लिए अलग से charge किया जा रहा है। GUI से workaround संभव है, लेकिन terminal जैसा navigation intuitive नहीं लगता, इसलिए असुविधाजनक हैमैं इस project पर काम करने वालों में से एक हूँ। अभी adoption curve काफ़ी steep है, और आज जैसे दिन जब TPU ज़ोर-शोर से काम कर रहे हैं, हम सबकी feedback ध्यान से पढ़ रहे हैं। Bug reports और feature requests हमेशा welcome हैं
कल दोपहर मैं Ruby (जिस भाषा को मैं नहीं जानता) में लिखे एक algorithm को vanilla JavaScript में बदलने की कोशिश कर रहा था। GPT-4.1 से कोशिश की, लेकिन सिर्फ़ समय बर्बाद हुआ और काम नहीं बना। जिज्ञासा में Gemini CLI install किया, Ruby project pointed किया, और सिर्फ़ एक request में conversion हो गया। पूरा काम 5 मिनट में ख़त्म हो गया, यह देखकर हैरानी हुई
मैं Google Workspace with Gemini वाला paid org account इस्तेमाल करता हूँ, लेकिन
GOOGLE_CLOUD_PROJECT environment variable missingसंदेश दिखा। मैं GCP इस्तेमाल नहीं करता, इसलिए अतिरिक्त मार्गदर्शन के बिना environment variable की value कैसे मिले यह समझना आसान नहीं था। Paid users की accessibility सामान्य Google users से कम लगती है, इसलिए documentation बेहतर होनी चाहिएApple Container on M1 में Gemini CLI द्वारा generate किया गया code सफलतापूर्वक integrate किया। CodeRunner में Gemini CLI options लागू करने का तरीका
उम्मीद है कि ज़्यादा consumer-friendly subscription आएगा, जैसे Claude Max की तरह Gemini CLI और Gemini app को जोड़े, साथ में IP compliance और API access भी दे
Google Gemini, Gemini Ultra, AI Studio, Vertex AI, Notebook LLM, Jules जैसे समान काम वाले products बहुत ज़्यादा हैं, जिससे user guidance और licensing structure दोनों में भ्रम पैदा होता है
Claude Code (4 Opus) के साथ मैंने बड़े Rust codebase पर ठीक-ठाक नतीजे पाए, लेकिन complex tasks में कमी महसूस हुई। आज Gemini CLI भी आज़माया; install करना आसान था, लेकिन result बहुत खराब रहा। Rust code बदलने के बाद compile success rate में यह Claude से साफ़ तौर पर कमज़ोर था। हाँ, Gemini ने यह कहकर कि "मैंने code को बिगाड़ दिया है, इसलिए सभी changes revert करके फिर से शुरू करूँगा" आज की हँसी का एक अच्छा पल ज़रूर दे दिया
Gemini के fail होने का तरीका ही मज़ेदार है। जब code fix काम नहीं करता, तो वह "यह तो unexpected है" जैसे इंसानी dialogue देता है, और फिर "मुझे लगता है tests pass हो जाएँगे!" जैसी overconfident बात भी कर देता है। उसकी यह default overconfidence और exclamation marks का ज़रूरत से ज़्यादा इस्तेमाल काफ़ी ध्यान खींचता है। शायद training में उसने सीख लिया है कि दृढ़ता से बोलना बेहतर परिणाम देता है
एक परिकल्पना यह है कि Gemini को Google के बड़े internal codebase पर train किए जाने का फ़ायदा मिला है, लेकिन Google के अंदर Rust का इस्तेमाल बहुत कम है (शायद बेहतरीन C++ tooling की वजह से), इसलिए Rust में Gemini अपेक्षाकृत कमज़ोर है
मेरा भी ऐसा ही अनुभव रहा। मैं app के नए feature को test कर रहा था और चीज़ें पूरी तरह उलझ गईं। Undefined functions इस्तेमाल हुए, कई बार errors दोहराए गए, और आख़िरकार उसने हार मान ली। Claude ने काम पूरा तो कर दिया, लेकिन code quality कमज़ोर थी; Gemini के individual ideas नए थे, पर consistency की कमी के कारण अंत तक पूरा नहीं कर पाया
मैंने भी कोशिश की और 15 मिनट में वही "सब कुछ revert करो" वाली प्रतिक्रिया मिली
Claude भी जब स्थिति बहुत बिगड़ जाती है तो reset करने की कोशिश करता है। जब उसकी internal edits पूरी तरह उलझ जाती हैं, तब ऐसा देखा है
Gemini Code Assist इस्तेमाल करने पर मेरा पूरा code data Google को भेजा जाता है (notice link)। Prompt, संबंधित code, outputs, usage feedback, और feature usage info समेत सारी data Google services और machine learning सुधार में इस्तेमाल हो सकती है। Quality improvement के लिए लोग सीधे data देख सकते हैं, annotation जोड़ सकते हैं और process कर सकते हैं। Privacy protection के लिए इसे account info से अलग करके अधिकतम 18 महीने तक रखा जाता है। Sensitive information या ऐसा data जिसे आप बाहरी दुनिया में साझा नहीं करना चाहते, उसे input न करने की सलाह दी गई है
यह हिस्सा थोड़ा और जटिल है। Free Code Assist में collected data का उपयोग default रूप से होता है, लेकिन separate guidance के ज़रिए opt-out किया जा सकता है। Paid Code Assist में data model improvement के लिए इस्तेमाल नहीं होता। Pay-as-you-go account की Gemini API key से इस्तेमाल करने पर भी data collect नहीं किया जाता। यानी असल में sensitive data usage की सीमा, मूल पोस्ट में बताए गए से थोड़ी कम सख़्त है
यह बात सही है कि Gemini CLI में team किस तरह login करती है, उसके हिसाब से privacy policy को लेकर भ्रम पैदा होता है। इस विवाद को कम करने के लिए हर account type के terms of service और data policy को एक नज़र में समझाने वाला नया document और FAQ तैयार किया गया है (docs link)
Gemini ecosystem की सबसे निराशाजनक बात इसकी non-transparent privacy policy है। 2.5 Pro सबसे अच्छा model लगता है, इसलिए काम में इस्तेमाल करना चाहता हूँ, लेकिन privacy terms इतने confusing हैं कि व्यवहार में मानना पड़ता है कि कोई वास्तविक protection नहीं है। महँगे top-tier subscription के बावजूद यही स्थिति है
Mozilla और Google ने Gemmafile नाम का एक alternative जारी किया है। Gemma, Gemini का एक पूरी तरह offline (open-airgapped) version है जो local पर single file के रूप में चलता है और dependency-free standalone execution को support करता है। Download 2025 तक 32% organizations ने इसे वास्तविक deployment में इस्तेमाल किया है (report)
Gemini CLI के configuration.md docs के "What we don't collect" सेक्शन में साफ़ लिखा है कि personally identifiable information, prompt और response content, और file contents logs में store नहीं किए जाते
Gemini CLI का system prompt Gist link पर सार्वजनिक है। इससे जुड़ी निजी notes यहाँ
Gemini CLI open source है, इसलिए Github repository में system prompt का मूल text भी देखा जा सकता है
System prompt में absolute paths ही इस्तेमाल करने की बात कही गई है, लेकिन temporary file example में relative path इस्तेमाल हुआ है
कुछ दिन पहले Claude Code से streamlit Python आधारित एक साधारण stock tracking web app को code flow के हिसाब से लिख रहा था। Project एक निश्चित आकार तक बहुत अच्छा चला, लेकिन उसके बाद वह bugs जल्दी ठीक नहीं कर पाया। वही काम Gemini CLI से किया तो, जिस बिंदु पर Claude Code उलझने लगा था, वहाँ "codebase analyze करके सारे bugs ठीक करो" कहने पर app कम से कम सफलतापूर्वक run हो गया। सचमुच future जैसा लगा
क्या यह context window size का फ़र्क है? Gemini की window, Claude से 5 गुना बड़ी है। Claude इस्तेमाल करते समय debugging के दौरान एक बिंदु पर context की कमी से चीज़ें बिगड़ने लगती हैं। बाद में Gemini की बड़ी window में इसे test करने का इरादा है
अभी Claude Code का अच्छा usage pattern यह लगता है कि heavy lifting Gemini 2.5 Pro या o3/o3pro को दे दो, और MCP support की वजह से दोनों models को smoothly जोड़ सकते हो। अगर Gemini CLI भी open source है, तो उसमें भी अलग-अलग model plugins संभव लगते हैं। भविष्य में जब LLMs commodity बन जाएँगे, तब UI wrappers की तुलना में CLI agent-style tools मुख्यधारा बन सकते हैं। User count की race में OpenAI जीत सकता है, लेकिन actual work UI के रूप में ChatGPT कमज़ोर है
अगर हर module के लिए 100 lines से कम की summary markdown file बनाई जाए, जिसमें सिर्फ़ module overview और file locations हों, और AI उसी के ज़रिए explore करे, तो context समझने में मदद मिलती है। अगर चीज़ें इस format में भी समेटना मुश्किल है, तो human developers के लिए भी उसे manage करना मुश्किल होगा। AI को सही core context देना अहम है
लगता है कि specific और clear prompt engineering से productivity कहीं ज़्यादा बढ़ेगी। "सारे bugs ठीक करो" जैसे requests पूरी तरह वास्तविक scenario से मेल नहीं खाते
यह तरीका complexity बढ़ने पर टूट जाएगा, और code duplication बहुत होने से memory efficiency बहुत खराब हो सकती है। आख़िर में ख़ुद code लिखना ज़्यादा efficient हो सकता है। यह भी जिज्ञासा है कि अगर ढीला-ढाला code बहुत बढ़ता गया तो DRAM demand असामान्य रूप से बढ़ेगी या नहीं
मैंने Gemini CLI में खुद एक two-way voice interface जोड़ दिया।
~/.gemini/settings.jsonमें कुछ config values जोड़ने के लिए code example देखेंकाश यह Go या Rust जैसी किसी single binary में होता जिसे runtime की ज़रूरत न पड़ती। Node runtime की आवश्यकता थोड़ी निराशाजनक है
ऐसे projects में updates बार-बार आते हैं, इसलिए npm या pip management ज़्यादा व्यावहारिक है। यह कोई बहुत भारी computation या असाधारण storage मांगने वाला program नहीं है, इसलिए modern hardware पर यह खास समस्या नहीं है। मुझे भी लगता है कि Go इस काम के लिए बहुत उपयुक्त है, लेकिन practical viewpoint से library management अधिक आसान होता है
Gemini CLI से आप prompt में यह भी कह सकते हैं कि इसे अपनी पसंद की language में फिर से लिख दे
Product quality से ज़्यादा यह project ऐसा लगता है जैसे marketing के लिए बनाया गया हो—"हमारे पास भी CLI tool है"
वास्तव में OpenAI भी Typescript छोड़कर Codex CLI को Rust में rebuild कर रहा है, ऐसा एक लेख देखें। Node का मेरा अनुभव बहुत बड़ा नहीं है, लेकिन installation, packaging, और isolation का अनुभव काफ़ी परिपक्व लगता है
शायद Bun और Deno के ज़रिए standalone executable बनाया जा सकता है। Bun bundler docs Deno CLI compile docs. अगर standard Node code है, तो Bun में कम से कम ठीक चलना चाहिए। यह जानने की उत्सुकता है कि executable size, Go और Rust की तुलना में कैसा होगा
Failed to login. Ensure your Google account is not a Workspace account.क्या इसका मतलब है कि Workspace accounts इस्तेमाल ही नहीं किए जा सकते? GSuite के समय से मेरा Workspace account है, और अब लगातार ऐसा लगता है कि Google services में मुझे सीमाएँ झेलनी पड़ती हैं। शुरुआत में तो बस Gmail के लिए custom domain चाहिए था, लेकिन YouTube data, Fitbit data जैसी चीज़ें भी खोईं, और subscription services के विकल्प भी बेतरतीब तरीक़े से सीमित रहे। आख़िरकार यह महसूस होना कि Workspace account होने की वजह से मैं Gemini CLI से software development work नहीं कर सकता, लंबे समय से वफ़ादार ग्राहक के प्रति उपेक्षा जैसा लगता है, और यह निराशाजनक हैWorkspace account official guide मददगार हो सकती है
Issue workaround के अनुसार
GOOGLE_CLOUD_PROJECTजैसी environment variables की अतिरिक्त setting चाहिएइसी समस्या से जूझने वाले दूसरे users का अनुभव भी मौजूद है
मैंने इसे लगभग 1 महीने इस्तेमाल किया है, और 2.5 Pro की SOTA performance, 1M context window support आदि की वजह से यह ज़्यादातर tools से बेहतर लगता है। बड़े codebases डालने पर भी यह तेज़ और काफ़ी सटीक analysis तथा navigation कर लेता है
Cursor में इस्तेमाल करते समय बड़े Python files के imports टूटने की समस्या आई। Claude में ऐसा issue नहीं था। क्या Gemini में किसी और ने भी ऐसा अजीब issue देखा है?
Workflow जानने में दिलचस्पी है