page-agent - कोड की सिर्फ 1 लाइन से वेबपेज में AI एजेंट जोड़ें
(alibaba.github.io)- सिर्फ
<script src="page-agent.js"></script>की एक लाइन जोड़ते ही वेबसाइट AI-native app में बदल जाती है- browser extension, Python, headless browser के बिना भी काम करता है
- natural language में निर्देश दें, बाकी AI संभाल लेता है. text-based DOM manipulation फीचर की वजह से screenshot, OCR, multimodal LLM की ज़रूरत नहीं
- सारा प्रोसेसिंग वेबपेज के भीतर होने वाले in-page execution model में होता है, इसलिए अलग permission मांगे बिना DOM elements को सीधे नियंत्रित करता है
- OpenAI, Claude, DeepSeek, Qwen जैसे कई models इस्तेमाल किए जा सकते हैं, और Ollama के साथ पूरी तरह offline भी चलाया जा सकता है (API key-आधारित integration)
- interactive UI और human-in-the-loop interface प्रदान करता है
- bookmarklet का उपयोग करके किसी भी वेबपेज पर टेस्ट किया जा सकता है
- Chrome extension इंस्टॉल करने पर multi-page tasks भी सपोर्ट करता है, साथ ही browser-level control और external integrations भी
- मुख्य उपयोग के मामले
- SaaS AI Copilot: backend में बदलाव किए बिना product के भीतर AI Copilot लागू करें
- smart form automation: multi-step click process को एक वाक्य में छोटा करके ERP/CRM/admin tools को बेहतर बनाएं
- accessibility enhancement: voice commands और screen reader के जरिए web accessibility में सुधार
- MIT license : Repo है alibaba/page-agent
11 टिप्पणियां
वाह, कमाल है..!!
वाह, यह काफ़ी दिलचस्प है।
ऐसा लगता है कि bookmarklet के ज़रिए पेज पर LLM आसानी से जोड़ने के लिए यह अच्छा है। जिन लोगों को default bookmarklet का Alibaba (चीन) पर जाना थोड़ा असहज लगता है, वे
baseURLऔरapiKeyदेकर इसे अपने इस्तेमाल वाले LLM endpoint पर सेट कर सकते हैं। (local LLMया OpenAI आदि)javascript:(function(){import('https://cdn.jsdelivr.net/npm/page-agent@1.5.5/+esm').then(module=>{window.agent=new module.PageAgent({model:'gpt-5.4',baseURL:'<your-api-url>',apiKey:'<your-api-key>'});if(window.agent.panel)window.agent.panel.show();}).catch(e=>console.error(e));})();
पहले लगा यह क्या है, इसे कैसे इस्तेमाल करते हैं, लेकिन अब समझ आ गया है.
extension इंस्टॉल करके Toss Securities में मैंने कहा कि मुझे SOXL का 30 दिन पहले का शेयर प्राइस जानना है, तो यह खुद ऑपरेट करके अंदर गया, कीमत देखी और बता दी.
playwright और AI को जोड़ने की तुलना में यह काफी तेज़ भी है.
यह SNS पर काफ़ी चर्चा में है.. लगता है इसे एक बार ट्राय करना पड़ेगा
कमाल है, इसे तुरंत काम में लाने के लिए सच में बहुत तरह-तरह के उपयोग दिख रहे हैं।
लगता है कि बस security के पहलू को थोड़ा बेहतर करके इस्तेमाल किया जा सकता है।
वाह, सच में मज़ेदार है
और साइट पर ऐसा कुछ है, और सच में drag करते ही यह bookmark के रूप में add हो जाता है।
मैंने यह पहली बार देखा, बहुत दिलचस्प है। bookmarklet शेयर करते समय यह अच्छा तरीका है।
अरे.. GeekNews bookmarklet भी open की शुरुआती अवधि से ही मौजूद था.
https://news.hada.io/bookmarklet
अरे, GeekNews में भी ऐसा बढ़िया bookmarklet था, यह अब पता चला हाहा
लगता है आम लोगों के लिए भी इस्तेमाल करना आसान होगा, सच में बहुत अच्छा लग रहा है
दिलचस्प है। लगता है Alibaba ने फिर कुछ अनोखा निकाला है
शायद इसे सर्विस के अंदरूनी admin tools में डालकर देखना ठीक रहेगा?
लगभग सिर्फ CRUD बनाकर, फिर इसे और उसे क्रम से करने को कहें, तो लगता है workflow बन जाता है।
डेमो का काम करना काफ़ी दिलचस्प है
इसे सीधे कोड में डाले बिना, bookmarklet का इस्तेमाल करके
किसी भी वेबसाइट पर लागू किया जा सकता है।