• 21 साल पहले Selenium विकसित करने वाले Jason Huggins ने AI एजेंट्स को ध्यान में रखकर फिर से बनाया यह ब्राउज़र ऑटोमेशन ओपन सोर्स प्रोजेक्ट
  • Vibium AI एजेंट्स के लिए ब्राउज़र ऑटोमेशन इन्फ्रास्ट्रक्चर है, जो एक सिंगल बाइनरी में ब्राउज़र lifecycle और WebDriver BiDi प्रोटोकॉल को मैनेज करता है और MCP सर्वर एक्सपोज़ करता है
  • 10MB का सिंगल Go बाइनरी Clicker Chrome को अपने-आप detect और launch करता है, और BiDi proxy व MCP सर्वर के जरिए AI models या JS clients को ब्राउज़र कंट्रोल करने देता है
  • JS/TS client sync और async API दोनों को सपोर्ट करता है, और npm install vibium के बाद तुरंत इस्तेमाल किया जा सकता है
  • Claude Code जैसे LLM एजेंट claude mcp add vibium एक ही कमांड से ब्राउज़र कंट्रोल क्षमता जोड़ सकते हैं
  • यह AI ऑटोमेशन और टेस्ट ऑटोमेशन दोनों के लिए उपयुक्त है, और बिना configuration वाला ब्राउज़र कंट्रोल environment देता है

Vibium अवलोकन

  • Vibium AI एजेंट्स और इंसानी यूज़र्स के लिए ब्राउज़र ऑटोमेशन इन्फ्रास्ट्रक्चर है
    • एक सिंगल Go बाइनरी में ब्राउज़र मैनेजमेंट, WebDriver BiDi proxy और MCP सर्वर फ़ंक्शन एकीकृत हैं
    • Claude Code, Codex, Gemini जैसे विभिन्न LLM models के साथ compatible
  • बिना इंस्टॉलेशन प्रक्रिया के तुरंत काम करने वाली संरचना, जिसे AI एजेंट्स या टेस्ट ऑटोमेशन environment में इस्तेमाल किया जा सकता है

घटक

  • Clicker: लगभग 10MB का Go बाइनरी, जो ये फ़ीचर्स देता है
    • Chrome का ऑटो-डिटेक्शन और BiDi mode में launch
    • WebSocket-आधारित BiDi proxy server के रूप में कमांड फ़ॉरवर्डिंग
    • MCP server के जरिए LLM एजेंट्स से संचार
    • Auto-Wait फ़ीचर के साथ elements का इंतज़ार करके interaction
    • screenshot capture फ़ीचर
  • JS/TS client: npm पैकेज के रूप में उपलब्ध, और sync(browserSync) व async(browser) API दोनों को सपोर्ट करता है
    • vibe.go(), vibe.find(), vibe.click(), vibe.quit() जैसे आसान कमांड्स से ब्राउज़र कंट्रोल
    • screenshot save, element खोज, click जैसी बेसिक ऑटोमेशन क्षमताएँ शामिल

AI एजेंट इंटीग्रेशन

  • Claude Code में ब्राउज़र कंट्रोल जोड़ने की कमांड:
    claude mcp add vibium -- npx -y vibium  
    
    • Chrome अपने-आप डाउनलोड हो जाता है, इसलिए अलग configuration की ज़रूरत नहीं
  • उपलब्ध कमांड्स की सूची
    • browser_launch: ब्राउज़र लॉन्च
    • browser_navigate: URL पर जाएँ
    • browser_find: CSS selector से element खोजें
    • browser_click: element पर क्लिक
    • browser_type: टेक्स्ट इनपुट
    • browser_screenshot: viewport capture
    • browser_quit: ब्राउज़र बंद

इंसानी यूज़र्स के लिए इंस्टॉलेशन

  • npm install vibium कमांड से ऑटो-इंस्टॉल
    • प्लेटफ़ॉर्म के अनुसार Clicker बाइनरी, Chrome for Testing और chromedriver को cache में डाउनलोड करता है
    • Linux: ~/.cache/vibium/, macOS: ~/Library/Caches/vibium/, Windows: %LOCALAPPDATA%\\vibium\\
  • environment variable VIBIUM_SKIP_BROWSER_DOWNLOAD=1 से ब्राउज़र डाउनलोड स्किप किया जा सकता है

प्लेटफ़ॉर्म सपोर्ट

  • Linux x64, macOS(Intel/Apple Silicon), Windows x64 सभी सपोर्टेड

क्विक स्टार्ट

  • लाइब्रेरी उपयोग उदाहरण
    import { browser } from "vibium";  
    const vibe = await browser.launch();  
    await vibe.go("https://example.com");  
    const el = await vibe.find("a");  
    await el.click();  
    await vibe.quit();  
    
  • Claude Code इंटीग्रेशन उदाहरण
    • इंस्टॉल करने के बाद “Go to example.com and click the first link” जैसी कमांड से ब्राउज़र ऑपरेट किया जा सकता है

रोडमैप

  • V1: MCP और JS client के जरिए ब्राउज़र कंट्रोल पर फोकस
  • V2 योजना
    • Python और Java clients
    • Cortex(memory·navigation layer)
    • Retina(recording extension feature)
    • video recording, AI-आधारित element खोज फ़ीचर

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.