Comet - Perplexity का Web Agent और ब्राउज़र
(perplexity.ai)Comet: Perplexity द्वारा बनाया गया नया ब्राउज़र
लॉन्च हुए थोड़ा समय हो चुका है, लेकिन वेटलिस्ट पार करने के बाद इसे इस्तेमाल करके यह लिखा है।
मुख्य सार
Comet Perplexity द्वारा विकसित एक AI ब्राउज़र है, जो यूज़र की फोकस और workflow को अधिकतम करने और जिज्ञासा को execution में बदलने में मदद करता है।
प्रमुख फीचर्स और विशेषताएँ
-
AI-इंटीग्रेटेड सर्च, तुरंत context, साइट automation
- ब्राउज़र के भीतर ही summary, shopping, scheduling, research संभव
-
Comet Assistant
- click, input, submit, autofill जैसी दोहराई जाने वाली tasks का automatic handling
-
जटिल कामों का भी automation
- product comparison से लेकर payment तक पूरी shopping process को support
-
इंटीग्रेटेड मैनेजमेंट
- email और calendar (Gmail, Google Calendar) integration
- schedule briefing, mail/schedule booking तक सब कुछ ब्राउज़र के भीतर
-
पर्सनलाइज़्ड अनुभव
- usage pattern सीखकर tabs और insights को automatically organize करना
-
अपनी गतिविधियों से सीधे जवाब ढूँढना
- history, videos, documents जैसे personal data में search support
-
smart actions और tab-आधारित focus फीचर
@tabफीचर से खुले tab के अनुसार real-time answers
उपयोग के उदाहरण
Perplexity ने Linkedin पर उपयोग के उदाहरणों पर अतिरिक्त पोस्ट भी किए हैं।
https://www.linkedin.com/company/perplexity-ai/posts/?feedView=all
सेवा इस्तेमाल करने के बाद व्यक्तिगत राय
तकनीक
- Chromium ब्राउज़र + Perplexity + Web Agent का रूप
- natural language query -> Intent/slot extraction -> Symantic DOM mapping -> action conversion -> event execution(web Tool) -> result parsing और preprocessing -> ReAct जैसी संरचना का अनुमान
- Comet screenshot लेकर मौजूदा काम की स्थिति समझने देता है, लेकिन क्या यह analysis के लिए vision model का उपयोग करता है, इसकी अतिरिक्त पुष्टि ज़रूरी है।
टेस्ट केस
(1) ईमेल लिखना
- Google email वेबसाइट का ठीक तरह से उपयोग करके ईमेल लिखा
- Agent ने वास्तविक send नहीं किया, बल्कि draft save करने का विकल्प चुना
(2) Naver Map में route ढूँढना + आसपास के रेस्तराँ की सिफारिश
- Naver Map वेबपेज पर जाने के बाद Seoul Station से Jamsil तक route खोजने को कहा, और इसने Naver Map service का सही ढंग से (मानो इंसान की तरह) उपयोग करके route निकाला
- आसपास के रेस्तराँ खोजने के लिए Naver Map का उपयोग नहीं किया गया, बल्कि Perplexity के मौजूदा Search Tool का इस्तेमाल किया गया
(3) Open AI Platform Pricing crawling
- मेरी जानकारी के अनुसार Open AI Platform Remix का उपयोग करता है, और कुछ API कीमतें toggle form में छिपी हुई थीं
- Comet को स्पष्ट रूप से toggle खोलकर सभी API की कीमतें जाँचने और Markdown में परिणाम देने को कहा गया, और इसने ठीक तरह से प्रदान किया
- हालाँकि, जानकारी को सटीक रूप से निकालने के लिए prompt engineering की ज़रूरत है
- Anthropic के API पेज की भी जाँच करवाई, लेकिन वेबपेज का layout (divider) अस्पष्ट होने के कारण जटिल API policy को सटीक रूप से parse नहीं कर सका। बुनियादी API कीमतें सही निकालीं।
व्यक्तिगत राय
- browsing agent विकसित करते समय context, rendering आदि जैसी कई बातों पर विचार करना पड़ा होगा; यह सब कैसे हल किया गया होगा, यह जानने की जिज्ञासा है।
- तकनीकी रूप से इसमें wow factor दिखता है, लेकिन product के नज़रिए से यह अभी भी कुछ हद तक अस्पष्ट लगता है।
- यह व्यक्ति पर निर्भर हो सकता है, लेकिन मुझे अभी भी यह स्पष्ट नहीं है कि मुझे यह product क्यों इस्तेमाल करना चाहिए, Comet के लिए पैसे क्यों देने चाहिए, और यह मेरे (customer) कौन-से problem को हल करेगा। यानी, value proposition मेरे लिए स्पष्ट नहीं है। अभी मेरी प्रतिक्रिया बस इतनी है: 'ओह! यह दिलचस्प है, यह भी हो जाता है; याद आया तो कुछ बार और इस्तेमाल करूँगा।'
- Perplexity भले ही उपयोग के उदाहरण दिखा रहा हो, लेकिन फिर भी यह सवाल आता है: 'क्या यह सचमुच ऐसा problem है जिसे Agent से ही हल करना चाहिए? (मैं खुद करूँ तो शायद जल्दी हो)' और 'क्या इसने वास्तव में पूरा problem हल किया है?'
- शायद ब्राउज़र infrastructure के अधिक क़रीब होने की वजह से ऐसा महसूस होता है, ऐसा मेरा सावधानी से लगाया गया अनुमान है।
- किसी मायने में AI Agent-आधारित ब्राउज़र एक नया format है, इसलिए अगर यह ग्राहकों को अच्छे से दिखा सके कि 'आपकी कौन-सी problem है और Comet उसे सच में पूरी तरह हल कर सकता है', तो यह प्रभावी हो सकता है।
- इसे ध्यान से देखते हुए थोड़ा और इस्तेमाल करना होगा। product से जुड़ी समस्याओं को कैसे हल किया जा सकता है, यह सोचने वाली बात है।
UI
यह मेरे द्वारा किया गया व्यक्तिगत analysis है। (मैं इसे reverse planning के रूप में बनाकर देखने पर काम कर रहा हूँ...,)
https://www.figma.com/deck/Gky9ZDEqZKdJfG4RWoNYdf
4 टिप्पणियां
जब आप इसे इस्तेमाल करके देख रहे थे, तो क्या उस comet agent query के उपयोग पर कोई सीमा थी? या फिर दूसरे tools की तरह यह test period में था, इसलिए query की कोई परवाह नहीं थी? मुझे याद है कि कुछ pro-max जैसा भी था, इसलिए जिज्ञासा से पूछ रहा हूँ।
मैं फिलहाल pro subscription पर हूँ। हो सकता है मैंने अपेक्षाकृत कम इस्तेमाल किया हो, लेकिन Comet समेत Perplexity में अभी तक कभी Limit से नहीं टकराया हूँ। लगता है उम्मीद से ज़्यादा ढील है।
subscription plan में rate limit दी नहीं गई है, इसलिए पक्का कहना मुश्किल है।
फिलहाल ऐसा लगता है कि beta release pro-max से अलग दी गई है.
https://perplexity.ai/help-center/en/…
यह मेरा व्यक्तिगत अनुभव है, लेकिन जैसा आपने कहा, शायद test period होने की वजह से query का खास असर नहीं दिख रहा। मैंने एक साथ 12 virtual browser parallel में चलाकर काम होते हुए भी देखा है। यह वाकई चौंकाने वाला है।
अच्छा लगा, पढ़कर जा रहा हूँ.
उम्मीद के मुताबिक ही लगा, इसलिए थोड़ा अफसोस है..
इस बात से सहमत हूँ.
उदाहरण:) जब इसे Naver news page पढ़कर tariff negotiation पर अलग-अलग अख़बारों का रुख़ संक्षेप में बताने को कहा, तो यह जिन अख़बारों को पढ़ा ही नहीं था, उनके बारे में भी 'हर मीडिया हाउस के झुकाव पर पहले से सीखे गए पूर्वाग्रह' के आधार पर, न पढ़े गए अख़बारों का रुख़ गढ़कर जवाब देता है.