• सिर्फ <script src="page-agent.js"></script> की एक लाइन जोड़ते ही वेबसाइट AI-native app में बदल जाती है
    • browser extension, Python, headless browser के बिना भी काम करता है
  • natural language में निर्देश दें, बाकी AI संभाल लेता है. text-based DOM manipulation फीचर की वजह से screenshot, OCR, multimodal LLM की ज़रूरत नहीं
  • सारा प्रोसेसिंग वेबपेज के भीतर होने वाले in-page execution model में होता है, इसलिए अलग permission मांगे बिना DOM elements को सीधे नियंत्रित करता है
  • OpenAI, Claude, DeepSeek, Qwen जैसे कई models इस्तेमाल किए जा सकते हैं, और Ollama के साथ पूरी तरह offline भी चलाया जा सकता है (API key-आधारित integration)
  • interactive UI और human-in-the-loop interface प्रदान करता है
  • bookmarklet का उपयोग करके किसी भी वेबपेज पर टेस्ट किया जा सकता है
  • Chrome extension इंस्टॉल करने पर multi-page tasks भी सपोर्ट करता है, साथ ही browser-level control और external integrations भी
  • मुख्य उपयोग के मामले
    • SaaS AI Copilot: backend में बदलाव किए बिना product के भीतर AI Copilot लागू करें
    • smart form automation: multi-step click process को एक वाक्य में छोटा करके ERP/CRM/admin tools को बेहतर बनाएं
    • accessibility enhancement: voice commands और screen reader के जरिए web accessibility में सुधार
  • MIT license : Repo है alibaba/page-agent

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.