2 पॉइंट द्वारा GN⁺ 2025-12-22 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Claude in Chrome एक AI extension है जो ब्राउज़र के भीतर बटन क्लिक, फ़ॉर्म भरने और पेज नेविगेशन जैसे काम कर सकता है
  • यह ब्राउज़र के भीतर Claude Code और Claude Desktop के साथ इंटीग्रेट होकर development और work automation को सपोर्ट करता है
  • Google Drive, Calendar, CRM, email, analytics dashboard जैसी विभिन्न web services में दोहराए जाने वाले काम अपने-आप पूरे कर सकता है
  • यह सिर्फ़ paid subscribers के लिए उपलब्ध feature है और फिलहाल beta version में है
  • prompt injection attack जैसे security risks को ध्यान में रखते हुए यह ज़ोर दिया गया है कि उपयोगकर्ता permissions और actions को खुद review और approve करें

Claude in Chrome का परिचय

  • Claude अब सीधे ब्राउज़र के भीतर काम कर सकता है और बटन क्लिक, फ़ॉर्म इनपुट और पेज नेविगेशन जैसे काम करता है
    • यह Claude Code और Claude Desktop के साथ इंटीग्रेट होकर development और testing workflow को सपोर्ट करता है
    • फिलहाल यह सभी paid subscribers को beta version के रूप में उपलब्ध है
  • इसे Chrome Web Store के ज़रिए install किया जा सकता है, और demo video व usage guide भी उपलब्ध हैं

प्रमुख फीचर

  • ब्राउज़र के भीतर automation support
    • Claude Chrome में बटन क्लिक, फ़ॉर्म भरना और पेज बदलने जैसे काम कर सकता है
    • उपयोगकर्ता ब्राउज़र छोड़े बिना Claude के माध्यम से apps और workflows को control कर सकते हैं
  • background और scheduled tasks चलाना
    • जब उपयोगकर्ता दूसरे काम कर रहे हों, तब Claude background में task पूरा कर सकता है
    • report generation, schedule update जैसे दैनिक और साप्ताहिक automated execution को सपोर्ट करता है
  • Claude Code के साथ integration
    • developers Chrome के भीतर ही सीधे code testing और repetitive tasks कर सकते हैं

उपयोग के उदाहरण

  • analytics dashboard data extraction: Claude analytics page में नेविगेट करके ज़रूरी आंकड़ों का सार बना सकता है
  • Google Drive व्यवस्थित करना: folder structure बनाना, files को move करना और duplicate files को mark करना जैसी automated organization
  • Calendar-आधारित meeting preparation: email thread से meeting context पढ़कर तैयारी वाली meetings को mark करना
  • product comparison automation: कई sites से product specifications पढ़कर Google Sheets में comparison table बनाना
  • CRM log लिखना: Calendar attendees की जानकारी को Salesforce से match करके activity log का draft तैयार करना
  • promotional emails साफ़ करना: marketing mails और newsletters की पहचान कर review के बाद bulk delete करना

सुरक्षा और safe-use guidelines

  • चूँकि AI सीधे ब्राउज़र के भीतर काम करता है, इसलिए malicious actors से जुड़े security risks मौजूद हैं
    • prompt injection attacks जैसी चीज़ों से अनचाहा behavior हो सकता है
    • यह भी बताया गया है कि Claude hallucination कर सकता है, जिससे वह उपयोगकर्ता की मंशा से अलग काम कर सकता है
  • सुरक्षित उपयोग के निर्देश
    • permissions केवल trusted sites पर ही दें
    • financial या personal data से जुड़े कामों से बचें, और किसी भी महत्वपूर्ण action से पहले ज़रूर verify करें
    • अगर Claude कोई unexpected behavior दिखाए, तो उसे तुरंत रोककर review करें
    • समस्या होने पर feedback feature के ज़रिए report करें

FAQ के मुख्य बिंदु

  • Claude Code का Chrome extension integration: developers Claude Code का उपयोग करके Chrome में सीधे build और test कर सकते हैं। इससे browser-based projects में repetitive tasks की speed बढ़ सकती है
  • Claude Desktop integration: desktop app में शुरू किया गया काम ब्राउज़र में आगे जारी रखा जा सकता है
  • अनुशंसित नहीं की जाने वाली गतिविधियाँ: financial transactions, password management और sensitive personal data processing जैसे काम प्रतिबंधित हैं
  • permission control: उपयोग से पहले Claude की access permissions को pre-approve किया जाता है, और purchase जैसी irreversible actions से पहले फिर से confirmation माँगा जाता है
  • security risks: attacker Claude को धोखा देकर bank information leak करवाने या files delete करवाने की कोशिश कर सकते हैं। protections मौजूद हैं, लेकिन वे पूरी तरह perfect नहीं हैं

उपयोगकर्ता भागीदारी और सुधार

  • उपयोगकर्ता feedback देते हैं तो उसका सीधा असर Claude की capabilities को बेहतर बनाने में पड़ता है
  • Chrome extension Google API policy का पालन करता है और user data के limited-use requirements का अनुसरण करता है

1 टिप्पणियां

 
GN⁺ 2025-12-22
Hacker News टिप्पणियाँ
  • कई सालों तक V8 security vulnerabilities को रोकने, browser को process unit के हिसाब से अलग करने, और sandboxing बेहतर करने के बाद अब debugging-enabled LLM को Chrome में प्लग कर देने का विचार वाकई विडंबनापूर्ण है
    पहले भी जब ऐसी “अच्छी आइडिया” आई थी, नतीजा lead mixed gasoline था

    • आखिरकार लगता है कि अंतिम लक्ष्य AI को सीधे Chrome में embed करना है
      शायद 20 साल बाद Gemini इतना सुविधाजनक bundle हो जाएगा कि antitrust lawsuit फूट पड़े
      संबंधित दस्तावेज़: Chrome Built-in AI APIs
    • यह विचार उस दौर की याद दिलाता है जब इंसानों पर ‘Full Autopilot’ beta test किया जा रहा था
      मज़ाक अपनी जगह, लेकिन Anthropic CEO के principle-centered approach पर टिके रहने की बात सम्मानजनक है। खासकर terminal-based code agent बनाना प्रभावशाली है
    • इससे xkcd 2044 वाला “चक्र कभी नहीं टूटता” मीम याद आता है
    • क्या इसका मतलब है कि Claude Code जैसे टूल को isolated VM के बिना सीधे personal या company account पर चलाया जाए?
      यह मज़ाक नहीं, सच में चौंकाने वाली बात है
    • अल्पकालिक innovation speed लंबी अवधि की security चिंताओं को दबा सकती है
      अभी तो यह alpha स्तर का लगता है, इसलिए warning text लगा है, और security model शायद बाद में पूरा होगा
  • लगता है Claude के पास Chrome debugger के ज़रिए webpage पर JS चलाने की tool access permission है
    लेकिन चिंता मत करो, secret leakage रोकने के लिए regex filter है, ऐसा कहते हैं
    const r = [/password/i, /token/i, /secret/i, ...]

    • अगर आप कहें “पासवर्ड या token expose न हो, इसमें मदद करो”, तो शायद जवाब होगा “बिलकुल! ये रहा regex”
    • यह पहले से curl command बना सकता था, तो क्या यह उससे भी ज़्यादा ख़तरनाक है?
    • “comprehensive” सुनकर तो बस हँसी आती है
  • security concerns वाजिब हैं, लेकिन व्यवहारिक रूप से Claude Code या Playwright MCP जैसे टूल के साथ हम Rubicon पार कर चुके हैं
    मैं कई महीनों से Claude Code को full system access के साथ इस्तेमाल कर रहा हूँ
    यह files पढ़ सकता है, bash चला सकता है, git push तक कर सकता है। browser automation तो उल्टा कम जोखिमभरा है
    असली सवाल “क्या AI को access दें?” नहीं, बल्कि “क्या हम इसे ऐसे design करें कि इंसान अहम फैसलों को सीधे approve करे?” है
    मैं credentials या payments वाले काम manual approval पर रखता हूँ, और QA testing या बार-बार form भरने जैसे कामों में इसका उपयोग करता हूँ

    • मैं भी 2003 से सारे development tools को VM में isolate करके चला रहा हूँ
    • व्यक्तिगत रूप से मुझे container-first approach ज़्यादा सुरक्षित लगती है
      जैसे QubesOS window में LLM को जोड़ना, ताकि non-deterministic behavior का असर सिर्फ सीमित क्षेत्र में रहे
      अगर backup·rollback·recovery व्यवस्था पक्की न हो तो यह जोखिमभरा है
      ZFS snapshots को rsync.net पर push करना आदर्श होगा, लेकिन सोचता हूँ क्या Time Machine जैसी आसान solution अब भी मौजूद है
    • “हम Rubicon पार कर चुके हैं”, लेकिन ‘हम’ सब लोग नहीं हैं
      अभी भी बहुत से लोग AI tools बिल्कुल इस्तेमाल नहीं करते, और अगर यह Chrome में default bundle हो गया तो इससे बचना मुश्किल होगा
    • मुख्य रूप से आप इसका इस्तेमाल किन कामों के लिए करते हैं?
  • कल मैंने Claude से Zillow की 70 saved listings का analysis करवाया, लेकिन यह price drop summary ठीक से नहीं कर पाया
    ऐसा लगा जैसे उसने सारे pages देख लिए हों, लेकिन वास्तव में शायद नहीं देखे
    DOM को सीधे पढ़ने की जगह यह screenshot-based analysis कर रहा था, जो token बचाने के लिए किया गया समझौता लगता है
    मैं AI skeptic था, फिर भी संभावनाएँ देखता हूँ, लेकिन यह Anthropic के दूसरे products की तुलना में काफ़ी पीछे है

    • prompt में सीधे tool name specify कर दें, जैसे “WebFetch से fetch करो”, तो यह बेहतर काम करता है
    • screenshot खिलाने वाली strategy अक्षम है
      HTML को XML की तरह handle करके XPath queries से सिर्फ ज़रूरी data निकलवाना कहीं बेहतर था
    • Playwright MCP के ज़रिए existing browser remote control API से कोशिश करना दिलचस्प हो सकता है
    • अगर यह “प्रकाश-वर्ष पीछे” है, तो AI मानकों से देखें तो 3 महीने में पकड़ भी सकता है
    • LLM में समय की समझ कमज़ोर होती है, इसलिए synchronization की ज़रूरत वाले कामों में यह कमज़ोर पड़ता है
      इसी वजह से text/CLI-based UX बेहतर है, और std in/out तरीका आदर्श लगता है
  • जब Claude Code को CLI या public API में काम नहीं मिला, तो उसने Chrome integration feature से app खोल लिया
    cookies से access token extract करके private API तक सीधे पहुँच गया
    सचमुच हैरान कर देने वाला समय है

    • security risk तो है, लेकिन इसकी problem-solving ability कमाल की है
      इसने बकवास नहीं की, न हार मानी, बल्कि मौजूद tools का creative इस्तेमाल किया
    • यह सच में शानदार नतीजा है
  • safety पर ज़ोर देते हुए भी यह Debugger permission इस्तेमाल करता है, जिससे device धीमा होता है, vulnerabilities expose होती हैं, और CAPTCHA समस्याएँ आती हैं
    मैं competitor extension rtrvr.ai बना रहा हूँ, और मैंने इसे sensitive permissions से बचने वाली design के साथ बनाया है
    अगर Claude भी consumer product के रूप में आ रहा है, तो उसे भी ऐसा approach चाहिए

    • मैंने ऐसे task दिए जिनमें spreadsheet access की ज़रूरत ही नहीं थी, फिर भी यह लगातार Google Drive access permission माँगता रहा
    • इसमें self-promotion की गंध है, लेकिन 2004-स्टाइल बिना vowels वाला company name मज़ेदार है
  • Google यह feature 125 डॉलर प्रति माह वाले experimental subscribers only के लिए दे रहा है
    देखें: Google Labs Mariner
    Gemini CLI से भी browser automation हो सकता है, लेकिन interactivity कम है और main profile access सीमित है

    • इसे free में भी लगभग वैसा किया जा सकता है
      एक empty workspace बनाइए और कहिए “browser में X कर दो”, फिर यह Chrome खोलकर click·scroll वगैरह कर देता है
    • मैं Chrome DevTools MCP को web development और testing के लिए अच्छे से इस्तेमाल कर रहा हूँ
      Claude Code user की तरह व्यवहार कर सकता है और console output भी पढ़ सकता है
      यह दूसरी websites के साथ interaction के लिए नहीं है, लेकिन development use के लिए शानदार है
  • Claude को सीधे browser में डालना सुविधाजनक है, लेकिन extension programs बहुत sensitive layer में मौजूद होते हैं
    एक बार AI extension के रूप में चलने लगे, तो “usefulness” से ज़्यादा अहम सवाल यह हो जाता है कि “यह किस data तक पहुँच रहा है
    यह किन page contents को पढ़ सकता है, prompts·responses कैसे process होते हैं, और क्या session के बाद भी store रहते हैं—यह सब साफ़ होना चाहिए
    browser में transparency और least-privilege principle सबसे अहम हैं

  • यह मूल रूप से Chrome DevTools MCP का विकल्प लगता है, लेकिन Chrome Web Store reviews अच्छे नहीं हैं

  • हम इंसानों को भी इस स्तर का browser access permission नहीं देंगे, तो AI को क्यों देना चाहते हैं?

    • शायद हम LLM को इंसानों की तरह anthropomorphize कर रहे हैं, जबकि असल में यह highly advanced calculator भी हो सकता है
      यह मानव चेतना से काफ़ी दूर है, लेकिन calculator के अगले चरण की तरह देखा जा सकता है
      इसलिए जो access इंसानों के लिए खतरनाक हो, वह LLM को दिया जा सकता है
      Golem की अवधारणा की तरह—ऐसा अस्तित्व जिसकी कल्पना बहुत पहले से थी, लेकिन जिसे वास्तव में बनाया नहीं जा सका था
      देखें: Golem wiki article