Nxtscape - ओपन सोर्स एजेंट ब्राउज़र

(github.com/nxtscape)

6 पॉइंट द्वारा GN⁺ 2025-06-21 | 1 टिप्पणियां | WhatsApp पर शेयर करें

AI-आधारित एजेंट फीचर्स वाला एक ओपन सोर्स ब्राउज़र
यह उपयोगकर्ता की privacy को प्राथमिकता देता है और AI मॉडल को लोकल पर चलाकर डेटा सुरक्षा की मज़बूती प्रदान करता है
इसके प्रमुख फ़ायदों में Chrome extension compatibility और पारदर्शी ओपन सोर्स नीति पर ज़ोर दिया गया है
Arc, Dia, Perplexity Comet जैसे मौजूदा ब्राउज़र विकल्पों की तुलना में लोकल प्रोसेसिंग और यूज़र डेटा पर नियंत्रण इसकी अलग पहचान है
इसका लक्ष्य लगातार फीचर विस्तार और community-driven development है, और यह योगदान के कई तरीकों का समर्थन करता है

Nxtscape क्या है

Nxtscape एक ओपन सोर्स एजेंट ब्राउज़र है, जो AI फीचर्स को लोकल environment में चलाता है
यह Arc, Dia, Perplexity Comet जैसे ब्राउज़रों का एक विकल्प है, खासकर उन उपयोगकर्ताओं के लिए जो privacy और डेटा नियंत्रण चाहते हैं
उपयोगकर्ता अपनी API key का इस्तेमाल कर सकते हैं या Ollama जैसे लोकल मॉडल को जोड़ सकते हैं, जिससे web usage history जैसी जानकारी बाहर लीक नहीं होती

मुख्य विशेषताएँ

Chrome extensions के साथ पूर्ण compatibility, जिससे परिचित environment बना रहता है
AI agent cloud से गुज़रे बिना सीधे ब्राउज़र के भीतर काम करता है
उपयोगकर्ता खुद API key दर्ज कर सकते हैं या लोकल मॉडल इंटीग्रेशन चुन सकते हैं, जिससे डेटा सुरक्षा का उच्च स्तर सुनिश्चित होता है
ओपन सोर्स और community-led development मॉडल के कारण कोड transparency बनी रहती है
आगे MCP Store, AI-आधारित ad blocking जैसी कई सुविधाएँ जोड़ने की योजना है

डेमो और उपयोग उदाहरण

AI agent का उपयोग करने वाले automation scenarios उपलब्ध हैं
लोकल AI chat फीचर इंटीग्रेट किया गया है, जिससे conversational मदद मिल सकती है
productivity tools के साथ जोड़कर विभिन्न workflow automation संभावनाएँ दिखाई गई हैं

विकास की पृष्ठभूमि

यह विचार इस समस्या-बोध से आया कि ब्राउज़र तकनीक लंबे समय से ठहरी हुई है
लक्ष्य एक AI agent-आधारित environment बनाना है जो developer productivity को बहुत बढ़ा सके
साधारण दोहराए जाने वाले काम, जैसे "Amazon order history से Tide Pods ऑर्डर करना", को automate करके उपयोगकर्ता को ब्राउज़र से 'प्रतिस्पर्धा' करने के बजाय उसकी मदद मिलनी चाहिए
यह एक स्पष्ट सिद्धांत रखता है कि AI agent को लोकल environment में सुरक्षित रूप से काम करना चाहिए

प्रमुख ब्राउज़रों से तुलना

Chrome: ओपन सोर्स Chromium पर आधारित होने के बावजूद पिछले 10 वर्षों में AI, automation, MCP(Multi Capability Plug-in) जैसे इनोवेटिव फीचर्स अपनाने में सीमित रहा है
Brave: इसने cryptocurrency, search, VPN आदि तक अपनी दिशा बढ़ाई, जबकि Nxtscape का फ़ोकस AI-केंद्रित है
Arc/Dia: ये लोकप्रिय रहे, लेकिन closed source होने और सेवा बंद होने पर विकल्प न रहने की समस्या है। Nxtscape पूरी तरह ओपन सोर्स है
Perplexity Comet: एक search/advertising कंपनी होने के कारण ब्राउज़र history जैसे डेटा कंपनी के नियंत्रण में जा सकते हैं। Nxtscape उपयोगकर्ता के सभी रिकॉर्ड को सिर्फ लोकल तक सीमित रखता है

कम्युनिटी भागीदारी और योगदान

bug reports, फीचर सुझाव, Discord में भागीदारी, Twitter फॉलो जैसे कई तरीकों से योगदान किया जा सकता है

लाइसेंस और तकनीकी संदर्भ

सोर्स कोड AGPL-3.0 लाइसेंस के तहत उपलब्ध है
यह Chromium, browser-use, Stagehand, Nanobrowser जैसे ओपन सोर्स प्रोजेक्ट्स से प्रेरित होकर बनाया गया है

1 टिप्पणियां

GN⁺ 2025-06-21

Hacker News राय

मुझे लगता है कि अब तक की टिप्पणियाँ बड़े चित्र के बजाय सिर्फ़ बारीक हिस्सों पर ज़्यादा ध्यान दे रही हैं। व्यक्तिगत रूप से, मैं ऐसे ब्राउज़र में बहुत बड़ी वैल्यू देखता हूँ जो local LLM से जुड़ा हो, ब्राउज़र जो कुछ भी देखता है उसे timestamp के साथ local DB में सेव करे, जिन चीज़ों के साथ मैं interact करता हूँ उन्हें अपने-आप parse/summary करे, Puppeteer की तरह script किया जा सके, और code prompt-आधारित automation को support करे। एक निजी digital सहायक के रूप में, यह भूली हुई जानकारी या ज़रूरी चीज़ें आसानी से ढूँढने में मदद कर सकता है, search·ads·spam·अनचाही जानकारी को सक्रिय रूप से फ़िल्टर कर सकता है, और यहाँ तक कि मनचाहे internet tasks भी अपने-आप कर सकता है। 25 साल से जमा bookmarks के बाद अब सिर्फ़ bookmark काफ़ी नहीं हैं। किसी फूले हुए, अनावश्यक वेबसाइट में एक जानकारी खोजते-खोजते भटक जाने की स्थिति को bodyguard bot शोर और बेकार जानकारी फ़िल्टर करके बेहतर बना सकता है। अगर यह सच में बहुत अच्छी तरह काम करे, तो यह digital space में personal assistant, tour manager, doorman, housekeeper, mechanic जैसी कई भूमिकाएँ एक साथ निभा सकता है, और 2025 में जब ब्राउज़र इस अराजक internet का मुख्य portal बन चुका है, तो यह दिशा बुरी नहीं लगती। आख़िरकार execution capability ही असली सवाल है, लेकिन मैं बहुत उत्सुक हूँ कि ऐसा प्रोजेक्ट कैसे आगे बढ़ता है
- ईमानदार feedback के लिए बहुत धन्यवाद। यही वह vision है जो हमने सोचा था। हम अपने दिन का 90% से ज़्यादा समय ब्राउज़र में बिताते हैं, फिर भी यह अब तक सिर्फ़ एक ‘बेवकूफ़ खिड़की’ भर है। अगर यह browsing history याद रखे, महत्वपूर्ण articles clip करे और Evernote web clipper की तरह highlights सेव करे, और सब कुछ semantic search से खोजा जा सके, तो ज़िंदगी बदल सकती है। सारा data local PostgresDB में स्टोर हो, और "पिछले महीने price comparison क्या था?", "browser automation highlight ढूँढो" जैसे सवालों का तुरंत जवाब दे सके। जब focus चाहिए हो, तब distracting sites को block करने की सुविधा भी हो। search और memory से आगे बढ़कर अब वह समय है जब ब्राउज़र सच में मेरा काम करने में मदद करे। उदाहरण के लिए tabs को topic के हिसाब से auto-group करना, हर site पर hard drive prices compare करना, Discord server के नए posts का सारांश बनाना — यह सब local में हो। ब्राउज़र को internet के chaos में हमारी मदद करनी चाहिए, उसे और जटिल बनाने की ज़रूरत नहीं। खासकर अगर कोई workflow आपकी रोज़मर्रा की ज़िंदगी में सबसे ज़्यादा तकलीफ़देह है, तो हम आपके use cases ज़रूर सुनना चाहेंगे
- असल में यह लगभग वही चीज़ है जो Microsoft Recall के साथ करना चाहता था। Recall फीचर AI लहर में अकेली ऐसी चीज़ लगी थी जो सच में जीवन बेहतर बना सकती है, लेकिन गहराई से सोचूँ तो मुझे वास्तव में AI नहीं चाहिए, बल्कि यह चाहिए कि मेरा computer local में detailed records रखे और advanced search दे। मैं चाहता हूँ कि मेरा computer जो कुछ भी मैंने किया है, वह सब बिना चूके याद रखे। कौन-सी site देखी, हर page पर कितना scroll किया, जो बातें type करके मिटा दीं वे भी — सब कुछ सेव करने वाला ‘total recall’ फीचर चाहिए। वजह यह है कि मेरे दिमाग़ की याददाश्त हमेशा त्रुटिपूर्ण रहती है, इसलिए मैं computer से अधिक परिपूर्ण memory की उम्मीद करता हूँ। और मैं चाहता हूँ कि search हमेशा consistent और deterministic तरीके से काम करे। exact timestamp, Boolean operators होने चाहिए, और NLP तो Lucene ने 20 साल पहले ही काफ़ी अच्छी तरह दे दिया था। मुझे बाहरी corpus से auto-generated summary नहीं चाहिए; मुझे सिर्फ़ यह चाहिए कि मेरा computer वही ठीक से याद रखे जो मैंने उस पर किया। मुझे नहीं लगता कि LLM personal search में बहुत अतिरिक्त value जोड़ता है। LLM की प्रकृति के कारण वास्तविक data को सटीक रूप में वापस लाना मुश्किल है, और अंततः accurate search के लिए indexing पारंपरिक तरीक़े से ही करनी पड़ती है। मुझे लगता है कि अभी LLM का बोलबाला इसलिए है क्योंकि ‘सब कुछ’ efficiently index करने के तरीके अभी कमज़ोर हैं, जबकि personalized search के लिए ‘सब कुछ’ नहीं, बल्कि मेरी screen पर दिखा text और metadata (time, cursor position, clipboard, URL आदि) जानना ही काफ़ी है। LLM-based indexing की ज़रूरत केवल तब पड़ती है जब असली text snapshots को traditional index में स्टोर करना capacity के लिहाज़ से बहुत भारी हो; वरना धुँधली conversational search मेरे लक्ष्य का हिस्सा नहीं है। असली लक्ष्य total recall है
- यह सच में शानदार vision है। जब मेरा ध्यान भटक जाए, तो अच्छा होगा अगर ब्राउज़र मुझे याद दिलाए और यह भी विश्लेषण करे कि मैं क्या कर रहा था। self-reflection यहाँ बहुत शक्तिशाली हथियार बन सकता है
- लंबे समय से मैं एक ऐसी browser extension बनाना चाहता था जो उन pages का पूरा text अपने-आप सेव और index करे जिन पर मैं 30 सेकंड से ज़्यादा रुका हूँ, और फिर उन्हें searchable बनाए। यह प्रोजेक्ट उससे कहीं आगे जाता है
- मेरी नज़र में यह ‘LLM-based native ad blocker’ है… यह जंगल इतना बड़ा है कि सिर्फ़ यह सोचकर ही सिर दर्द होने लगता है (मज़ाक कर रहा हूँ)
nanobrowser की तरह, नया ब्राउज़र बनाने के बजाय क्या एक robust extension काफ़ी नहीं होगा? nanobrowser webdriver exposure के बिना अच्छी तरह बना है, और js execution/LLM integration में भी इसकी कोई कमी नहीं दिखती। यह पूरी agentic functionality तक देता है, इसलिए मैं जानना चाहता हूँ कि नया ब्राउज़र बनाना क्यों ज़रूरी है
शायद यह मूर्खतापूर्ण सवाल हो, लेकिन क्या कोई समझा सकता है कि ‘agentic browser’ आख़िर है क्या? ऐसा लगता है जैसे सब लोग पहले से जानते हों, लेकिन मुझे समझ नहीं आ रहा कि यह कोई आम शब्द है या सिर्फ़ ‘AI features वाला web browser’ कहना है
- पूछने के लिए धन्यवाद। यह बिलकुल भी मूर्खतापूर्ण सवाल नहीं है। ‘agentic browser’ से मतलब ऐसे ब्राउज़र से है जहाँ AI agent आपकी जगह web navigation करता है। यानी ऐसा ब्राउज़र जिसमें agent Amazon पर reorder करने या forms भरने जैसे काम भी सीधे खुद कर सके
- agent वह संरचना है जिसमें LLM tools (जैसे: calculate(expression)) के साथ काम करता है। मनचाहा परिणाम पाने के लिए ज़रूरत पड़ने पर वह tool अपने-आप चलाता है। जटिल workflows में, LLM को मिला input कई tools के संयोजन में बदल सकता है, जैसे user agent को किसी खास string पर set करना। उदाहरण के लिए set_user_agent(…) जैसा command चलाना, page पर click करना, page खुलते समय custom JS inject करना आदि
- ‘agentic’ शब्द मैंने पहली बार एक महीने पहले सुना था। उसके बाद 2~3 दिनों तक इसे office town hall में भी कई बार दोहराया गया। संक्षेप में, agent ऐसा AI है जो खुद निर्णय लेकर अपने-आप कार्रवाई करता है
agentic browser की अवधारणा बहुत शानदार लगती है। client-side agent के रूप में automation करने की क्षमता सच में बहुत शक्तिशाली है। लेकिन साथ ही security के नज़रिये से यह ‘कभी भी पूरी तरह सुरक्षित नहीं’ हो सकता। ब्राउज़र लगभग सभी sensitive accounts में logged in होता है, और स्वाभाविक रूप से internet से आने वाले untrusted input के सामने खुला रहता है। एक prompt injection और कुछ ही सेकंड में ज़िंदगी उलझ सकती है। concept बहुत अच्छा है, लेकिन जब तक पूरी supply chain PCI/SOC2/ISO 27001 जैसी certifications से न गुज़री हो, और third-party security analysts उसका ख़ून-पसीने से सत्यापन न कर चुके हों, तब तक मैं इसे हाथ भी नहीं लगाऊँगा
- यह मुद्दा उठाने के लिए बहुत धन्यवाद। यह चिंता पूरी तरह सही है। इसलिए हम local-first और open source पर ज़ोर देते हैं। cloud agents (जैसे Manus.im) में credentials एक ऐसे black box को देने पड़ते हैं जिसे verify नहीं किया जा सकता, जबकि local agent में control user के पास रहता है। agent केवल तभी चलता है जब user उसे explicitly trigger करे, user real-time progress देख सकता है और कभी भी रोक सकता है, इसे अलग Chrome user profile में isolate करके चलाया जा सकता है, और सबसे महत्वपूर्ण बात यह कि यह open source है, इसलिए code को सीधे inspect और verify किया जा सकता है
मेरा use case पानी से जुड़े websites से CSV/data files निकालना है। उदाहरण के लिए South Australia के reservoir level data को निकालना मेरे लिए बहुत मुश्किल था (खासकर क्योंकि मेरा frontend experience कम है)। अगर ऐसे काम agent से automate किए जा सकें, तो मैं इसे ज़रूर आज़माऊँगा
मुझे यह सच में शानदार प्रोजेक्ट लगता है! और HN पर launch करना भी बहुत बड़ी बात है। शुरुआती अनुभव से मेरी ईमानदार राय: जब मैंने ब्राउज़र में ‘सभी tabs को विषय के अनुसार group करो’ prompt चलाया, तो यह बहुत अच्छा चला। उसके बाद मैंने कहा कि सभी tab groups हटाकर reset कर दो, तो जवाब मिला: "यह browser automation task है, इसे ‘Agent Mode’ में चलाएँ।" Agent Mode में वही request दी, तो उत्तर मिला: "यह productivity task है, इसे Chat Mode में चलाएँ।" फिर बस आगे-पीछे की बातचीत चलती रही; अंत में यह सभी tabs को एक नए group में डाल तो पाया, लेकिन group को पूरी तरह हटाने में असफल रहा। शायद वह API ही मौजूद नहीं है। कुल मिलाकर, अच्छा होगा अगर हर browser-level action के लिए एक ‘undo’ button हो। अगर वह कठिन है, तो कम-से-कम यह अपने बनाए tab group को कुछ सेकंड के भीतर खुद हटा सके। मैं इसे आगे भी इस्तेमाल करता रहूँगा। edit1: chrome internal pages (जैसे chrome://extensions) पर chat interface इस्तेमाल करते समय कभी-कभी यह google.com पर jump कर जाता है। edit2: मैंने पुष्टि की कि productivity mode में group ungroup करने का tool नहीं है, सिर्फ़ group create करने का है
- feedback के लिए बहुत धन्यवाद! हुई असुविधा के लिए माफ़ी। यह अभी शुरुआती beta stage में है। agent mode और chat mode को अलग tools के रूप में design किया गया है। मौजूदा prompts अभी कमज़ोर हैं, इसलिए उन्हें बेहतर बनाने की ज़रूरत महसूस हो रही है। group हटाने के मामले में लगता है कि Chrome API में अभी इसका सीधा support नहीं है, इसलिए शायद हमें इसे खुद implement करना होगा। कई लोग ‘undo’ feature माँग रहे हैं, इसलिए हम cursor के 'restore checkpoint' स्टाइल जैसा कुछ लाने पर विचार कर रहे हैं। अगर आपके पास कोई ठोस उदाहरण हों कि productivity features आपकी रोज़मर्रा की ज़िंदगी में कितने महत्वपूर्ण हैं, तो हम ज़रूर सुनना चाहेंगे :)
‘nxtscape’ नाम पुराने SCSI की nostalgia देता है। ‘GPT’ की तरह छोटा और एक साँस में बोलने लायक naming बेहतर हो सकती है। product सच में शानदार है
- आज के feedback से लगा कि हमें नाम और branding पर ज़्यादा समय देना चाहिए। इस पर सोचेंगे :)
यह बाज़ार पूरी तरह winner-take-all है। कोशिश काबिल-ए-तारीफ़ है, लेकिन दो-तीन लोगों की team के लिए browser बनाना बहुत बड़ा काम है। ऊपर से Google ने I/O में पहले ही भविष्य की दिशा की झलक दे दी है, और ऐसा लगता है कि इस क्षेत्र में Google इसे जल्द ही Chrome में लागू कर सकता है और तेज़ी से market share ले सकता है। deeptech founders सालों से Chrome को चुनौती देने की कोशिश करते आए हैं, लेकिन एक बार भी सच में सफल नहीं हुए। व्यावहारिक रूप से, मेरा मानना है कि किसी साफ़-साफ़ परिभाषित ICP वाले छोटे pain point से शुरुआत करनी चाहिए। इतनी passion और energy बर्बाद होते देखना अफ़सोस की बात होगी
- ईमानदार feedback के लिए धन्यवाद! competition कड़ा है, यह सच है। लेकिन हमें लगता है कि open source, community-driven, privacy-first AI browser (Brave की तरह) के लिए बाज़ार में स्पष्ट खाली जगह मौजूद है
मुझे लगता है कि user-facing features वाले ऐसे ब्राउज़र में निश्चित रूप से बहुत value है, खासकर जो user के प्रति hostile web content को अपने-आप process और reshape कर सके। कुछ ठोस use cases: 1) sofa खरीदते समय marketing hype के बजाय सिर्फ़ कुछ विशेष शर्तों के आधार पर options फ़िल्टर करना, 2) सिर्फ़ तब notify करना जब दोस्त Facebook पर पोस्ट करें और बाकी सब फ़िल्टर कर देना, 3) अगर local community Facebook या nextdoor पर चलती है, तो बार-बार वही व्यक्ति जो repetitive posts करता है, सिर्फ़ उसे छिपा देना, 4) government public hearing page को बेवजह 700 pages तक फुला दिया गया हो, तो उसका auto-summary बनाकर सिर्फ़ असली महत्वपूर्ण बातें निकाल देना — ऐसे कई domains में इसका उपयोग हो सकता है
- sofa खरीदने वाले उदाहरण की तरह, specific conditions के आधार पर items फ़िल्टर करने की सुविधा बड़े sites (Amazon सहित) में भी मूल रूप से कमज़ोर है। पहले मैंने scraping और data science को मिलाकर diskprices.com जैसी site खुद बनाई थी, और अगर LLM इस तरह के use case में सच में उपयोगी साबित होता है, तो आगे भी लोग browser में prompt लिखने के बजाय ऐसे domain-specific sites ज़्यादा बनाएँगे। repetitive posts को block करने के मामले में nextdoor में user block feature मौजूद है, जो देखने लायक हो सकता है (nextdoor block guide)
- यह सच में बहुत बढ़िया उदाहरण है!
क्या यह robots.txt का पालन करता है?
- अभी नहीं करता। लेकिन सच कहूँ तो अगर agent सिर्फ़ ‘मानव’ के लिए उपयोग हो रहा है, तो मुझे यक़ीन नहीं कि इसे scraping मानना चाहिए या नहीं, इसलिए यह कितना महत्वपूर्ण है, पता नहीं
- यह स्पष्ट रूप से users के लिए बना agent है। अगर robots.txt तक को सख़्ती से मानना पड़े, तो ईमानदारी से कहूँ तो यह बहुत घुटनभरा होगा। robots.txt मूल रूप से web crawlers के शिष्टाचार के लिए बनाया गया था, न कि उन tools को रोकने के लिए जो individual users की requests का प्रतिनिधित्व करते हैं। चाहे terminal हो, सामान्य browser हो या AI browser — किसी भी तरीके से मेरी site तक पहुँचने वाले tools को site operators द्वारा सीमित करना web की ताकत को कम करता है। AI tools के प्रति नफ़रत के कारण web की विविधता की बलि देना, भविष्य के लिहाज़ से भी ख़तरनाक है। संदर्भ: robots.txt FAQ

Nxtscape - ओपन सोर्स एजेंट ब्राउज़र

Nxtscape क्या है

मुख्य विशेषताएँ

डेमो और उपयोग उदाहरण

विकास की पृष्ठभूमि

प्रमुख ब्राउज़रों से तुलना

कम्युनिटी भागीदारी और योगदान

लाइसेंस और तकनीकी संदर्भ

संबंधित पढ़ाई

1 टिप्पणियां

Hacker News राय