2 पॉइंट द्वारा GN⁺ 2025-04-08 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • AI ऐप्स को MCP के जरिए ब्राउज़र से जोड़कर वेबसाइटों पर काम को ऑटोमेट करने वाला टूल
    • उदाहरण के लिए, वेबसाइट पर बार-बार फ़ॉर्म भरने जैसे काम को ऑटोमेट किया जा सकता है
  • वर्कफ़्लो ऑटोमेशन: काम की रफ़्तार बढ़ाकर और ऑटोमेशन के जरिए दक्षता में सुधार
  • ऑटोमेटेड टेस्टिंग: AI एडिटर का उपयोग करके कोड के end-to-end tests अपने आप चलाना। यूज़र फ़्लो को टेस्ट करना, UI elements को वेरिफ़ाई करना, और यह जांचना कि अलग-अलग scenarios में application अपेक्षित रूप से काम कर रही है या नहीं
  • टास्क ऑटोमेशन: data collection, फ़ॉर्म भरना, workflow automation जैसी दोहराई जाने वाली web-based tasks को आसानी से ऑटोमेट करके समय बचाना और त्रुटियाँ कम करना

Browser MCP के फ़ायदे

  • स्पीड: ऑटोमेशन लोकल पर होता है, इसलिए network latency के बिना performance बेहतर होती है।
  • प्राइवेसी: ऑटोमेशन लोकल पर होने के कारण ब्राउज़र गतिविधि डिवाइस पर ही रहती है और remote servers पर भेजी नहीं जाती।
  • लॉगिन बनाए रखना: मौजूदा browser profile का उपयोग करके सभी सेवाओं में लॉगिन स्थिति बनाए रखता है।
  • गोपनीयता/स्टेल्थ: असली browser fingerprint का उपयोग करके bot detection और CAPTCHA से बचता है।

उपयोग का तरीका

  1. Browser MCP extension इंस्टॉल करें: अपने ब्राउज़र में Browser MCP extension जोड़ें।
  2. MCP server सेट करें: अपने AI application में Browser MCP server जोड़कर उसे browser extension से कनेक्ट करें।
  3. ऑटोमेशन शुरू करें: automated workflows बनाएं और AI assistant को ब्राउज़र में दोहराए जाने वाले काम संभालने दें।

ब्राउज़र ऑटोमेशन फ़ीचर टूल्स

  • नेविगेट: URL पर जाएँ
  • पीछे जाएँ: पिछले पेज पर जाएँ
  • आगे जाएँ: अगले पेज पर जाएँ
  • प्रतीक्षा: तय समय (सेकंड) तक इंतज़ार करें
  • कुंजी दबाना: कीबोर्ड पर key press करें
  • स्नैपशॉट: मौजूदा पेज का accessibility snapshot कैप्चर करें
  • क्लिक: वेब पेज पर क्लिक करें
  • ड्रैग एंड ड्रॉप: दो elements के बीच drag and drop करें
  • होवर: पेज के किसी element पर mouse over करें
  • टेक्स्ट इनपुट: editable element में टेक्स्ट दर्ज करें
  • ऑप्शन चुनें: dropdown से विकल्प चुनें
  • कंसोल लॉग लाएँ: ब्राउज़र के console logs प्राप्त करें

संगत MCP AI applications

  • Cursor
  • Claude
  • Windsurf
  • VSCode

1 टिप्पणियां

 
GN⁺ 2025-04-08
Hacker News की राय
  • वेबसाइट का दावा है कि यह "वास्तविक browser fingerprint का उपयोग करके bot detection और CAPTCHA से बचता है"

    • मैंने मिलती-जुलती system का इस्तेमाल किया है, लेकिन AI द्वारा browser को नियंत्रित करते समय CAPTCHA आ गया और कई वेबसाइटों पर block भी हो गया
    • browser session का उपयोग बंद करने पर block हट गया, लेकिन यह तरीका कोई सर्वसमर्थ समाधान नहीं है
  • यह system Microsoft के Playwright-MCP की पुरानी नकल जैसा लगता है

  • अगर कोई browser shopping वेबसाइटों पर खास शर्तों के मुताबिक products को filter कर सके, तो वह उपयोगी होगा

  • मुझे नहीं पता MCP क्या है, और अब तो पूछने में भी डर लगता है

  • वेब से जानकारी खोजकर Google Sheets में results डालने का काम शुरुआत में लगभग पूरी तरह सही चला, लेकिन बाद की कोशिशों में असफल रहा

    • सोच रहा हूँ कि क्या browser और MCP app के बीच latency की समस्या है
    • पहली कोशिश में मैंने जल्दी से "इस chat की अनुमति दें" permission पर click किया था, लेकिन बाद की कोशिशों में LLM ने click समस्या की रिपोर्ट की
    • Google स्प्रेडशीट के title पर click करके नाम दर्ज करने का काम पहली बार सफल हुआ, लेकिन बाद की कोशिशों में विफल रहा
    • cell A1, B1 आदि को पहचानकर row में insert करने का काम भी पहली बार सफल हुआ, लेकिन बाद में विफल रहा
    • पहली कोशिश में यह लगभग परफेक्ट था, लेकिन बाद की कोशिशों में 100% reproducible नहीं था
    • अनुभव smooth है और setup व execution शानदार हैं
  • Claude Desktop में test करने पर यह smooth चला और Playwright की तुलना में कम झंझटभरा लगा

    • अगर page पर CAPTCHA detect होने पर automation pause करके user को notify करने की सुविधा हो, तो अच्छा होगा
    • Playwright CAPTCHA को लगातार try करता रहता है
  • अगर Chrome developer tools के accessibility tree का उपयोग करके page navigate किया जा सके, तो अच्छा होगा

  • manual कामों, खासकर refund request जैसे कामों के लिए उम्मीद बनती है

    • हर महीने service provider में login करना, statement download करना, Google document बनाना, email लिखना और file upload करना झंझटभरा है
    • automation पहले से संभव है, और वास्तविक expense tracking app इस काम का आधा हिस्सा कम कर सकता है
    • AI tools में बारीक specifications की ज़रूरत खत्म करने की क्षमता है
    • ऐसे workflows अक्सर छोटे बदलावों से प्रभावित हो जाते हैं
  • सोच रहा हूँ कि क्या MCP नया RPA (robotic process automation) है

  • मैं hardware synths को control करके, physical knobs को छुए बिना sound design के लिए ऐसा ही काम करता हूँ