- वेब स्क्रैपिंग और AI एजेंट ऑटोमेशन के लिए विशेष रूप से तैयार हेडलेस ब्राउज़र इंजन
- बिल्ट-इन V8 इंजन के साथ वास्तविक JavaScript चलाता है, और Chrome DevTools Protocol(CDP) इम्प्लीमेंटेशन के कारण Puppeteer·Playwright कोड को जैसा है वैसा पुनः उपयोग किया जा सकता है
- हेडलेस Chrome की तुलना में मेमोरी 30MB(vs 200MB+), बाइनरी 70MB(vs 300MB+), पेज लोड 85ms(vs ~500ms) तक काफी हल्का
- पेज लोड 85ms के स्तर पर होने से बड़े पैमाने की क्रॉलिंग में Chrome की तुलना में प्रतीक्षा समय 5~10 गुना कम
- सिंगल बाइनरी डिप्लॉयमेंट के साथ Chrome, Node.js जैसी बाहरी dependencies शून्य
--stealth stealth mode बिल्ट-इन:
navigator.webdriver छिपाना, native function disguise जैसी anti-bot bypass settings अपने-आप लागू
- प्रति-सेशन fingerprint randomization (GPU, canvas, audio आदि)
- 3,520 डोमेन के ads·analytics·telemetry trackers का ऑटो ब्लॉक करके page rendering speed भी बेहतर
- CLI में
obscura fetch से single page rendering, obscura serve से CDP WebSocket server शुरू
obscura scrape url1 url2 ... --concurrency 25 से आसान parallel scraping
--eval "document.title" की तरह CLI में JS expression तुरंत चलाकर सिर्फ परिणाम निकाला जा सकता है, इसलिए सरल data extraction के लिए उपयोगी
- CDP API के जरिए Target, Page, Runtime, DOM, Network, Fetch, Input जैसे प्रमुख domains का समर्थन, और DOM→Markdown conversion(LP.getMarkdown) भी शामिल
- फॉर्म submission·login के समय POST processing, 302 redirect, cookie persistence को अपने-आप संभालता है, इसलिए authentication flow को अलग से implement करने की जरूरत नहीं
- Apache 2.0 लाइसेंस
5 टिप्पणियां
यह इन दिनों काफी लोकप्रिय हो रहा headless browser है.
हल्का होना तो इसकी अच्छी बात है, लेकिन stealth mode के ठीक से काम करने की वजह से भी यह लोकप्रिय है.
GitHub पर अकाउंट एक महीने पहले बनाया गया था
फिलहाल, जब मैंने बस सामान्य Google search किया, तो खास कोई reaction या review नहीं मिला।
Hacker News, Reddit वगैरह पर भी ठीक से कुछ दिखा नहीं..
शायद मैं ही नहीं ढूँढ़ पा रहा हूँ..
लेकिन stars 6,000 से ज़्यादा हैं।
जो चीज़ें अभी तेज़ी से लोकप्रिय हो रही हैं, उन्हें कहाँ देख सकते हैं?
यह काफ़ी ख़तरनाक software लग रहा है..
मैंने इसे ज़्यादातर Twitter पर ही बहुत देखा है। कहते हैं कि automation करना आसान है.
असल में, मैं stealth mode को टेस्ट नहीं कर पाया, इसलिए इसका ठीक से आकलन नहीं कर सकता।
यह शायद बहुत आम नहीं है। (हालाँकि आजकल ऐसे प्रोजेक्ट बहुत हैं, इसलिए शायद इसे आम मानना चाहिए..)
यह ऐसा प्रोग्राम है जिसमें संवेदनशील जानकारी डालकर इस्तेमाल किए जाने की संभावना भी काफी है, इसलिए लगता है कि इसे थोड़ा समय लेकर इस्तेमाल करना चाहिए।
लगता है यह u/Total_Nectarine_3623 द्वारा बनाया गया टूल है.
https://www.reddit.com/r/ClaudeAI/s/9VO1vzO2zp
दूसरी पोस्ट्स को देखें तो ONIST या CTF में रुचि दिखती है, इसलिए लगता है कि इनकी information security में दिलचस्पी है, और इन्होंने एक बहुत बड़े single commit के साथ पहला release किया. इसे देखकर लगता है कि original repository में पहले काफी vibe coding की गई, फिर उसे कई commits में बाँटकर वैसे का वैसा public करना ठीक नहीं लगा होगा, इसलिए शायद सबको एक में मिला दिया गया. GitHub handle भी h4ckfOr0day है, और आम तौर पर ONIST या थोड़े less conventional तरीकों से जुड़े tools को अक्सर burner account से अपलोड करने जैसी एक परंपरा-सी भी होती है.
open source पर भरोसा समय के साथ बनता है, लेकिन फिलहाल कोई खास बुरा इरादा नहीं लगता.