5 पॉइंट द्वारा GN⁺ 2025-08-09 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Google ने Gemini CLI पर आधारित, GitHub repository में टीम collaboration को सपोर्ट करने वाली Gemini CLI GitHub Actions की घोषणा की
    • Gemini CLI एक ओपन सोर्स AI एजेंट है जो टर्मिनल से AI फीचर्स का उपयोग करने की सुविधा देता है
    • यह नया GitHub Actions संस्करण टीम-आधारित सहयोग के लिए डिज़ाइन किया गया है; इसे repository में मौजूद AI साथी की तरह समझा जा सकता है
  • यह टूल मुफ्त/ओपन सोर्स के रूप में उपलब्ध है और अभी beta version के तौर पर दुनिया भर में उपयोग के लिए खुला है
  • GitHub repository में होने वाले events (नए इश्यू, PR निर्माण आदि) के आधार पर यह स्वतः asynchronous तरीके से रन होता है और प्रोजेक्ट का पूरे संदर्भ को समझकर काम को स्वचालित रूप से संभालता है
  • 3 शक्तिशाली ओपन सोर्स workflows उपलब्ध हैं
    • इंटेलिजेंट इश्यू ट्राइएज (Intelligent issue triage)
      • नए इश्यू को analyze करके स्वतः label करता है और प्राथमिकता तय करता है
      • डेवलपर्स को महत्वपूर्ण काम पर ध्यान देने में मदद मिलती है
    • Accelerated pull request reviews (तेज PR reviews)
      • कोड बदलाव पर तुरंत और गहन feedback देता है
      • code quality, style और correctness की समीक्षा करके reviewer का बोझ कम करता है
    • On-demand collaboration (ऑन-डिमांड collaboration)
      • issue या PR में @gemini-cli का mention करके काम delegate किया जा सकता है
      • उदाहरण: "इस बग के लिए टेस्ट लिखना", "ऊपर दिए गए सुझाव को implement करना", "alternative solution brainstorming करना", "स्पष्ट परिभाषित bug fix"
  • इन workflows को launchpad की तरह देखें; ओपन सोर्स होने के कारण आप अपने कस्टम workflow बना सकते हैं
  • दोहराए जाने वाले और समय लेने वाले कामों को automate करके development productivity बढ़ाई जा सकती है और code review तथा issue management की efficiency बढ़ाकर टीम collaboration speed सुधार सकते हैं

1 टिप्पणियां

 
GN⁺ 2025-08-09
Hacker News टिप्पणियाँ
  • यह स्पष्ट नहीं हो पा रहा कि इसे CLI कहें, GitHub Action कहें या GitHub Application—यह स्थिति ही confusing हो गई है। Jules पहले 'कोडिंग एजेंट' कहलाता था, लेकिन अभी लगता है कोई दूसरा टूल उसकी जगह ले रहा है या यह Google का खुद को ही cannibalize करने वाला उदाहरण है। कंपनी को अब अधिक स्पष्ट विज़न वाला leadership चाहिए। मैंने 13 साल तक Android कोड लिखा, Google के साथ काम किया, Google डेवलपर कम्यूनिटी और conferences में लीडरशिप रोल निभाया, कई GDEs से जुड़ा, और Gemini API भी अपने products में use करता हूँ, फिर भी समझ नहीं पाया कि क्या हो रहा है। सामान्य ग्राहकों के लिए यह समझना लगभग असंभव लगेगा। Gemini API कनेक्शन के लिए दो SDK हैं, और डॉक्यूमेंटेशन बिखरा हुआ है; कोई काम करने के लिए Google search और code repo तक खोजनी पड़ती है। ज़्यादातर फीचर पर rate limit लग जाती है या केवल private beta tester को ही उपलब्ध होते हैं। कोडिंग एजेंट भी तीन हैं। Google account और phone access होने के बाद भी Gemini app शायद ही काम की लगे। Google Cloud में service account जोड़ने जैसी बेसिक चीज़ भी UX के कारण confusing है। बस AI Studio ही कुछ काम का लगा—यहाँ अलग-अलग मॉडल का प्रयोग संभव है और Gemini API key issue करने का DX बेहतर हुआ है। सच कहूँ तो इस रिलीज़ को उत्साह से celebrate करना कठिन है; यह बस 'mediocre/new-ish' स्तर का प्रोडक्ट लगता है।
  • मुझे लगता है research culture और software culture के बीच स्पष्ट सीमा होनी चाहिए। शोध वातावरण में कई टीमों का साथ-साथ अलग प्रयोग (experiments) चलना कई बार सकारात्मक हो सकता है, पर customer-facing software और product के लिए अलग दृष्टिकोण चाहिए।
  • Google ने कई 'incubation' स्थान बना रखे हैं, और उनमें से कुछ सफल हों तो पुराने products के साथ naturally blend नहीं हो पाते, जिससे users confuse हो जाते हैं। NotebookLLM का उदाहरण भी ऐसा ही है। फिर भी मुझे लगता है इतने अलग-अलग experiments बेहतर हैं। NotebookLLM टीम भी बहुत autonomous तरीके से काम करती दिखी।
  • Google account और phone-data access होने पर भी Gemini app का कुछ न कर पाना सबसे मज़ेदार बिंदु है। ऐप खोलते ही "Hello, Vasco" बोलता है, लेकिन जब पूछो "मेरे नाम क्या है?" तो "उपयोगकर्ता की जानकारी उपलब्ध नहीं" जैसे जवाब देता है। क्यों ऐसा होता है, पता है—लेकिन scene मज़ेदार ही रहता है।
  • Jules VM में asynchronous तरीके से, अलग code checkout पर चलता है। Gemini CLI local पर यूज़र के साथ synchronous तरीके से काम करता है (बस YOLO mode को छोड़कर)। ये दोनों बिल्कुल अलग तरीके हैं।
  • Google Workspace के साथ स्थिति अलग हो जाती है। पूरी organization में Gemini CLI enable करना mixed feelings वाला काम है। विस्तृत विवरण
  • Google को coding AI competition में उतरना चाहिए, यह समझ में आता है, लेकिन कई odd चीज़ें हैं।
    • Gemini अभी तो meeting scheduling जैसा basic काम भी नहीं कर पाता।
    • Google Docs में collaborative edit संभव नहीं, सिर्फ insert करना होता है।
    • Docs या Sheets के लिए centralized management point (MCP) भी नहीं है।
    • Sheets formula सहायता Google Search से भी खराब लगती है। इतने अलग-use-case ताकतवर हिस्से होने के बावजूद AI में अलग पहचान नहीं बना पाने पर निराशा होती है। पहले Gmail में मैंने exact string "remarkable" खोजी थी, पर results में "amazing" जैसे related शब्द भी आए। लगता है सभी products की search quality गिर रही है—समय थोड़ा frustrating है।
    • असल में मैंने Android फोन पर delivery booking email देखा और power button लंबा दबाया, तो Gemini popup हुआ। स्क्रीन context लेकर कहा, "इसे मेरे calendar में डाल दो," और event add हो गया। यह पूरी तरह perfect नहीं है (जैसे multi-day span या गलत location हो तो miss हो जाता है), लेकिन धीरे-धीरे बेहतर हो रहा है। यदि आप Google Workspace customer हैं तो Gemini web app, Calendar और Drive integration भी supported है। document summarization सहित कई काम संभव हैं। यानी 'schedule नहीं बन सकता' दावा ठीक नहीं है।
    • मैं मानता हूँ Google का Gemini को documents में अभी सभी जगह open न करना, Apple के iPhone में AI को पूरी तरह न खोलने जैसा ही कारण हो सकता है। reliability अभी ऐसी नहीं कि 99.99% public को दे दी जाए। यह सिस्टम केवल tech early adopter के लिए ठीक है; सामान्य users के लिए recommend नहीं करना चाहूँगा।
    • सच में अनेक छोटे-बड़े practical use-cases हैं, पर marketing weak है। उदाहरण के लिए, grocery list की photo लेकर Gemini से paste-friendly format में बदलने को कहा—वह सीधे Google Keep में डाल देता है, लेकिन category classification नहीं कर पाया। यदि team थोड़ा और priority दे कर polish करे, तो बहुत उपयोगी बन सकता है। OpenAI TikTok पर अलग-अलग फीचर market कर रहा है, जबकि 30 से नीचे के कई लोग Gemini के बारे में जानते ही नहीं। कई बार Gemini मुझे ChatGPT से अधिक practical लगा, लेकिन marketing लगभग न के बराबर है।
    • Google Docs support इतना सीमित है कि कोई उम्मीद बनती ही नहीं।
    • सिर्फ embedding-based search बदलने से ठीक काम नहीं करता—मेरी समझ यही है। वास्तविकता में embedding, text matching, quality vector का hybrid search चाहिए, और उसे scalable तरीके से fast बनाना आसान नहीं होता। यदि ऐसा कोई सिस्टम आपके पास हो तो बता देना।
  • इस सेवा का असली क्या है, समझने में बहुत ज्यादा समय लगता है। marketing copy, लंबी-by-लंबी व्याख्या, अतिरिक्त शब्द हटाने पर ही वास्तविकता दिखती है। मेरी समझ में यह GitHub Action ही है। इसे GitHub workflow YAML में डालकर Gemini CLI रन की जाती है, prompt, repo context, issue/PR diff जैसे event data भेजकर response या action कराया जाता है—यानी एक wrapper. token या app के जरिए GitHub API से repo data read/write (label add करना, comment, code suggestion आदि) संभव है। Gemini LLM HTTPS API endpoint के साथ standard calling pattern use होता है।
    • Boris Cherny और Catherine Wu की Latent Space पॉडकास्ट में AI-based CLI की semantic linting पर एक वीडियो है। संबंधित यूट्यूब इंटरव्यू मैंने अभी तक AI-based CLI को CI/CD में actively use नहीं किया है, लेकिन semantically pass/fail वाले workflows में बहुत रुचि है।
    • दस्तावेज़ में लिखा है "use this in chat interface"—यह chat interface क्या है, यही प्रश्न है।
  • Gemini प्लान (जैसे Google One, Workspace आदि) केवल web-based products पर लागू हैं, API-based (जैसे Gemini CLI) पर नहीं। अगर सिर्फ एक developer subscription से CLI, github action, Gemini chat, Jules सब इस्तेमाल हो जाएँ, तो यह सच में game changer होगा। मुझे Claude जैसे single max subscription model की बहुत जरूरत महसूस होती है।
    • शायद subscription structure समझने के लिए भी AI चाहिए।
    • Gemini का free tier सच में confusing है। अलग-अलग agents से टेस्ट करने पर सिर्फ 5-6 requests के बाद ही rate limit लग जाती है। जबकि web app लगभग unlimited जैसा लगता है। "generous free quota" की बात अलग, वास्तविकता में थोड़े समय में ही throttle हो जाता है। simple testing के लिए ठीक है, पर वास्तविक काम के लिए पर्याप्त नहीं।
  • promotion slide के image text में '@mini-cli' टैग से assign करने पर bug write से fix तक कई काम हो सकते हैं—यह लाइन बहुत funny लगती है।
    • अब तक वही लाइन बदल नहीं पाई, यह चौंकाने वाली बात है। शायद सच में बहुत honest statement हो।
  • क्या इसे वाकई 'gemini cli' कहना सही है? यदि अधिकतर GitHub route से use हो रहा हो तो शायद वह CLI नहीं रहता। बेहतर होता कि Claude Code जैसा naming होता—'gemini github action' या 'run gemini' ज्यादा intuitive।
    • शायद Gemini CLI टीम ने इसे इसलिए नाम दिया क्योंकि टीम को credit चाहिए था या फिर प्रोडक्ट को बहुत generic न दिखाने का internal pressure था।
    • वास्तव में github action VM में gemini-cli install होता है और issue/PR comments को prompt के रूप में gemini-cli को भेजा जाता है।
    • मैंने भी इसी नामकरण पर यही सवाल सोचा था। यही भाग सच में निराशाजनक लगा।
    • यह पूरी तरह local उपयोग वाली Gemini-CLI का एक add-on pattern है।
  • पिछले साल हमने सच में GitHub PR के लिए एक bounty platform बनाया था। incentive के कारण बहुत low-quality PR आए, और AI से draft आसानी से बनने लगा इसलिए यह concept practically लगभग बेकार लगता है। core open-source management चिंता अब 'reviewers/maintainers की सीमित resources' पर shift हो गई है। इसलिए हमने main agents से PR auto-generate कर, review और approval/edits flow को optimize करने वाला framework experiment करना शुरू किया है। संबंधित केस स्टडी यहाँ document की है
  • सेटअप की जरूरत बहुत ज्यादा है, इसलिए पहले से उपलब्ध GitHub Copilot Agent से तुलना करें तो convincing power काफी कम है। Gemini assistant को बाकी tools से स्पष्ट बेहतर होना होगा, तभी कोई meaningful user adoption संभव है।
    • बाकी assistants में जो सबसे बेहतर हो, शायद वही सवाल है कि क्या वह Claude है। यदि Gemini लगभग उसी स्तर पर आ जाए और subscription स्पष्ट तथा reasonable हो, तो पर्याप्त होगा।
  • यह सच में free है—इस पर ही संदेह होता है। शायद data-sharing training के कारण hidden लागत हो; opt-out option भी नहीं, इसलिए private या internal repos में सावधानी से इस्तेमाल करना चाहिए।
  • Copilot Agent से अच्छे results अभी काफी मिल रहे हैं। कभी-कभी PR बंद करके issue groom करना या local में cursor से काम करना पड़ता है, लेकिन काम शुरू करने की गति बहुत बढ़ गई है, इसलिए कुल मिलाकर satisfaction high है।