3 पॉइंट द्वारा GN⁺ 2025-12-11 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Google Gemini 3 Pro API key जारी करने की प्रक्रिया इतनी जटिल है कि व्यक्तिगत डेवलपर के लिए इसे एक्सेस करना कठिन हो जाता है
  • Gemini नाम का कई उत्पाद समूहों में दोहराव के कारण यह साफ समझना मुश्किल है कि कौन-सी सेवा कौन-सा फीचर दे रही है
  • Google AI Studio में API key बनाना आसान है, लेकिन पेमेंट सेटअप Google Cloud Console पर ट्रांसफर हो जाता है, जहाँ जटिल सत्यापन चरण और दस्तावेज़ अपलोड की मांग की जाती है
  • पेमेंट अकाउंट सत्यापन के बाद भी 403 Forbidden error बार-बार आती रही, इसलिए वास्तविक उपयोग के लिए तैयार होने में कई घंटे लग गए
  • पूरा अनुभव दिखाता है कि Google का तरीका बड़े उद्यम-केंद्रित और कम प्रभावी है, जबकि OpenAI या Anthropic की प्रक्रिया अधिक सीधी है

Gemini उत्पाद लाइन की उलझन

  • “Gemini” नाम का उपयोग chatbot, मोबाइल ऐप, voice assistant, Workspace के भीतर AI फीचर, CLI टूल, IDE extension, LLM मॉडल आदि अलग-अलग उत्पादों में होता है
    • उदाहरण: gemini.google.com पर chatbot, Android/iPhone ऐप, Gemini CLI, Gemini Code Assist, Vertex AI Platform आदि
  • एक ही नाम कई सेवाओं पर होने से डेवलपर के लिए सही API access path खोज पाना कठिन हो जाता है
  • Anthropic और OpenAI दोनों में consumer web service और developer console के सिर्फ दो access रास्ते हैं, जिससे पूरा स्ट्रक्चर काफी सरल रहता है

API key निर्माण प्रक्रिया

  • Google AI Studio में API key निर्माण सरल है, और कुछ ही सेकंड में नया key जारी हो जाता है
  • जारी किया गया key Gemini CLI में सही से पहचाना गया, लेकिन paid API credit के लिए billing setup जरूरी था
  • जब “Set up billing” पर क्लिक किया, तो Google Cloud Console पर रीडायरेक्ट हुआ और उसके बाद लंबी प्रक्रिया शुरू हो गई

पेमेंट अकाउंट सेटअप की जटिलता

  • सीधे पेमेंट संभव नहीं; Billing Account निर्माण → प्रोजेक्ट लिंक करना → पेमेंट मेथड जोड़ना → पेमेंट मेथड का सत्यापन चरणों से गुजरना पड़ता है
  • भारत क्षेत्र के क्रेडिट कार्ड के लिए 2-चरणीय OTP सत्यापन के बाद अतिरिक्त रूप से सरकारी पहचान पत्र और कार्ड फोटो जमा करने को कहा गया
    • कार्ड नंबर को किसी image editor में स्वयं छिपाना पड़ता है, और अपलोड के लिए सिर्फ PNG format स्वीकार होता है
  • अपलोड त्रुटियाँ बार-बार हुईं और verification complete होने में कई दिन लग सकते हैं जैसी मेल सूचना मिली

403 error और account recovery

  • सत्यापन पूरा होने के बाद भी Gemini CLI और API कॉल में 403 Forbidden error लगातार आती रही
    • Google दस्तावेज़ के JavaScript sample code से टेस्ट करने पर भी वही error मिला
    • AI Studio Playground में भी “Failed to generate content” संदेश दिखा
  • बाद में Google से “Your account is in good standing” वाला संदेश मिलने के बाद ही स्थिति सामान्य हुई
    • उसके बाद Playground, API और CLI तीनों में Gemini 3 Pro उपलब्ध हो गया

प्रक्रिया पर मूल्यांकन

  • पूरी प्रक्रिया 3 घंटे से अधिक समय लेने वाला एक अक्षम अनुभव था, और व्यक्तिगत डेवलपर के लिए अनावश्यक रूप से जटिल रही
  • Google की सिस्टम बड़े संगठनों की compliance-केन्द्रित डिजाइन जैसी लगती है, जो व्यक्तिगत उपयोगकर्ता की प्रोडक्टिविटी को कम कर देती है
  • जबकि OpenAI और Anthropic सरल भुगतान और API access flow देकर अधिक developer-friendly महसूस होते हैं
  • Gemini 3 Pro की performance जाँचने के लिए लेखक एक महीने का ट्रायल चलाने की योजना रखते हैं, लेकिन इसे एक customer-centricता की कमी वाले प्लेटफॉर्म की तरह देखा गया

1 टिप्पणियां

 
GN⁺ 2025-12-11
Hacker News की राय
  • Microsoft Azure में इससे भी ज़्यादा भयानक अनुभव हुआ
    प्रक्रिया के दौरान एक थर्ड-पार्टी सेल्स टीम ने संपर्क किया, जिसने खुद को ‘official certified Microsoft support’ बताया, लेकिन बाद में समझ आया कि वे असल में ज़रूरत से ज़्यादा महंगे billing options बेचने की कोशिश कर रहे थे

  • बच्चे के साथ गेम बनाते हुए text-to-speech (TTS) फीचर का प्रयोग किया
    ब्राउज़र में Google Gemini मॉडल टेस्ट किया, और वह अच्छी तरह काम कर रहा था। लेकिन API के साथ integrate करने की कोशिश में कई दिक्कतें आईं

    1. Gemini API prototyping के लिए थी, इसलिए error rate लगभग 30% था, जबकि Vertex API stable थी लेकिन features कम थे। TTS API में वही मॉडल होने के बावजूद performance बहुत खराब थी
    2. हर API अलग-अलग parameters support करती थी, इसलिए मनचाहा combination बनाना संभव नहीं था
    3. दस्तावेज़ खुद पढ़ने पड़ते थे, या Claude Code से docs का सार निकलवाकर प्रयोग करना पड़ता था। लेकिन उसमें hallucination मिलने का जोखिम था
    • API call करने पर और Gemini UI में इस्तेमाल करने पर मॉडल की performance अलग निकलती है
      Gemini API में लगभग 1% संभावना से random failure होता है, इसलिए retry logic ज़रूरी है
      इसके अलावा API response time भी Google की internal स्थिति के अनुसार 30 सेकंड से 4 मिनट तक बहुत बदलता रहता है
  • Google AdWords के शुरुआती दिनों में सिर्फ credit card होने से कोई भी विज्ञापन चला सकता था
    इसी तुरंत पहुंच की वजह से भरोसा बना, और आम यूज़र को भी लगता था कि उसके साथ बड़े enterprise जैसा व्यवहार हो रहा है
    लेकिन 2008 में DoubleClick acquisition के बाद, Google का फोकस users से हटकर enterprise-centric हो गया, ऐसा लगता है

    • मैंने हमेशा product और sales टीमों को तुरंत signup (Self-signup) की अहमियत समझाई है
      बिना किसी इंसान से बात किए या इंतज़ार किए, सीधे pay करके इस्तेमाल शुरू करना चाहता हूँ
      लेकिन sales टीमें price discrimination या persuasion के मौके चाहती हैं, इसलिए यह ढांचा बना रहता है
    • आज का Google AdWords सबसे unfriendly onboarding experience देने वाली services में से एक है
      signup आसान है, लेकिन पहली ad set करते ही account suspend हो जाता है, और appeal का भी कोई फायदा नहीं
      इसे ठीक से इस्तेमाल करने के लिए expert hire करना पड़ता है
  • मुझे हमेशा हैरानी होती है कि AWS या GCP का Cloud Console UI इस हालत में release कैसे हो सकता है
    ऐसा product जारी करके भी संतुष्ट रहना या promotion पाना समझ से बाहर है

    • क्या Google leadership ने demo के अलावा कभी GCP interface को खुद इस्तेमाल किया है, इस पर संदेह है
    • लगता है Google में leadership नहीं, सिर्फ shareholders हैं
    • AWS console की जटिल संरचना Conway’s Law का एकदम सही उदाहरण है
      संबंधित जानकारी: Conway’s Law wiki और Molly Rocket का वीडियो “The Only Unbreakable Rule”
  • gemini API key खोजते ही official docs तुरंत मिल जाते हैं
    docs के शुरू में ही link है, और marketing-style design की जगह साफ-सुथरा layout है, जो अच्छा लगता है
    शायद असली समस्या billing से जुड़ी हो सकती है

    • key बनाना आसान है, लेकिन payment और billing की प्रक्रिया ही समस्या है
    • कई बार कोशिश की, लेकिन Gemini API billing अब भी काम नहीं करती। Logan से पूछने पर भी खास समाधान नहीं मिला
    • ज़्यादातर शिकायतें शायद gemini-cli के खराब अनुभव को पूरी Gemini accessibility के साथ गड़बड़ कर रही हैं
    • असली production environment AI Studio नहीं, बल्कि Vertex AI है
      पहले service account setup जटिल था, और docs भी CLI auth पर केंद्रित थीं
      हाल में Express Mode से API Key इस्तेमाल करना संभव हुआ है, लेकिन शिकायतें होना स्वाभाविक था
      पहले Vertex और AI Studio के बीच feature gap भी काफ़ी बड़ा था
      संबंधित चर्चा: Google AI Studio फ़ोरम
    • हर हिस्सा दिन में कई बार आंशिक रूप से टूट जाता है
      मैं personal Workspace account से AI Studio इस्तेमाल करता हूँ, लेकिन एक दिन से Gemini CLI ने API key reject करनी शुरू कर दी
      न कोई वजह, न कोई explanation। payment करने के बाद भी access block हो गया
      company account में switch करने की कोशिश की, लेकिन docs इतनी मिलती-जुलती थीं कि मैंने गलत service के लिए signup कर लिया
      आखिर में Gemini Pro से पूछा, तो उसने 27-step process बताया। उनमें से किसी एक step पर अटक जाओ तो फिर शुरुआत से शुरू करो
      Azure भी ऐसा ही है, या उससे बदतर। GPT-5 access तक नहीं है
  • “Set up billing” link दबाते ही Google AI Studio से Cloud Console में redirect कर दिया गया
    उसी पल निराशा छा गई। AWS या GCP console में जाते ही पुरानी docs और उलझे हुए dashboard में समय बर्बाद होता है

    • यहाँ तक मज़ाक किया जाता है, “वह पुरानी AWS documentation क्या अभी इसी कमरे में मौजूद है?”
  • Gemini इस्तेमाल करते-करते मैंने भी बिल्कुल उसी वजह से छोड़ दिया
    Google की जटिल प्रक्रिया पर समय बर्बाद करने की गुंजाइश नहीं है

  • “nano banana pro” देखकर API key लेने की कोशिश की, लेकिन 5 मिनट में हार मान ली
    लगा था शायद सिर्फ मैं ही अटका हूँ, लेकिन समझदार लोग भी सब वहीं फँस रहे हैं
    McDonald’s kiosk पर तो पढ़ना-लिखना न जानने वाला भी burger order कर सकता है, फिर Google इतना basic UX क्यों नहीं बना पाता, समझ नहीं आता

    • IBM का AI cloud भी ऐसा ही था। docs पुरानी थीं, और कई तरह की API keys में से असली सिर्फ एक थी
      जैसे किसी Mario castle level में सही sequence follow करने पर ही बाहर निकल सकते हो
      IBM के लिए यह समझ आता है, लेकिन लगता है Google भी उसी स्तर पर पहुँच गया है
    • मुझे लगता है Google की internal culture एक user-unfriendly bubble में फँसी हुई है, इसलिए ऐसा नतीजा निकलता है
  • अगर Gemini API team यह पढ़ रही है, तो Structured Outputs इस्तेमाल करते समय आने वाली
    'The specified schema produces a constraint that has too many states for serving' error के बारे में
    थोड़ा और पारदर्शी explanation मिलना चाहिए
    शायद समस्या constraint grammar या token mask के बहुत बड़ा हो जाने की है
    OpenAI स्पष्ट docs और उदार limits देता है
    संबंधित issue भी GitHub पर बिना वजह बंद कर दिया गया
    फिर भी Gemini model की speed प्रभावशाली है, और पिछले साल की तुलना में API quality बहुत बेहतर हुई है

  • पहले HN पर शिकायत पोस्ट की थी, तो Logan ने खुद feedback माँगा था
    वह X account पर भी काफ़ी सक्रिय है, और अगले महीने AI Studio के UX/UI improvements का संकेत दिया है
    इतने बड़े संगठन में भी product पर ध्यान दिखना उम्मीद जगाता है

    • लेकिन Bluesky पर “vibe coding update” का संकेत देना बहुत जल्दीबाज़ी लगता है
      टीम की दिशा स्पष्ट नहीं दिखती, और लगता है कि Google PMs में पहले जैसी ground sense नहीं रही
    • Google developer relations team अक्सर feedback लेती है, लेकिन असली action बहुत कम देखने को मिलता है
      शायद वे तब तक इंतज़ार करते हैं जब तक चीज़ें रणनीतिक रूप से महत्वपूर्ण न हो जाएँ
      समझ नहीं आता कि “payment process को आसान बनाना” रणनीतिक रूप से महत्वपूर्ण क्यों नहीं है