- सिर्फ
<script src="page-agent.js"></script> की एक लाइन जोड़ते ही वेबसाइट AI-native app में बदल जाती है
- browser extension, Python, headless browser के बिना भी काम करता है
- natural language में निर्देश दें, बाकी AI संभाल लेता है. text-based DOM manipulation फीचर की वजह से screenshot, OCR, multimodal LLM की ज़रूरत नहीं
- सारा प्रोसेसिंग वेबपेज के भीतर होने वाले in-page execution model में होता है, इसलिए अलग permission मांगे बिना DOM elements को सीधे नियंत्रित करता है
- OpenAI, Claude, DeepSeek, Qwen जैसे कई models इस्तेमाल किए जा सकते हैं, और Ollama के साथ पूरी तरह offline भी चलाया जा सकता है (API key-आधारित integration)
- interactive UI और human-in-the-loop interface प्रदान करता है
- bookmarklet का उपयोग करके किसी भी वेबपेज पर टेस्ट किया जा सकता है
- Chrome extension इंस्टॉल करने पर multi-page tasks भी सपोर्ट करता है, साथ ही browser-level control और external integrations भी
- मुख्य उपयोग के मामले
- SaaS AI Copilot: backend में बदलाव किए बिना product के भीतर AI Copilot लागू करें
- smart form automation: multi-step click process को एक वाक्य में छोटा करके ERP/CRM/admin tools को बेहतर बनाएं
- accessibility enhancement: voice commands और screen reader के जरिए web accessibility में सुधार
- MIT license : Repo है alibaba/page-agent
अभी कोई टिप्पणी नहीं है.