Obscura - ओपन सोर्स हेडलेस ब्राउज़र
(github.com/h4ckf0r0day)- वेब स्क्रैपिंग और AI एजेंट ऑटोमेशन के लिए विशेष रूप से बनाया गया हेडलेस ब्राउज़र इंजन
- बिल्ट-इन V8 इंजन के साथ वास्तविक JavaScript चलाता है, और Chrome DevTools Protocol(CDP) इम्प्लीमेंटेशन की वजह से Puppeteer·Playwright कोड जैसा का तैसा पुन: उपयोग किया जा सकता है
- हेडलेस Chrome की तुलना में मेमोरी 30MB(vs 200MB+), बाइनरी 70MB(vs 300MB+), पेज लोड 85ms(vs ~500ms) के साथ काफी अधिक हल्का
- पेज लोड 85ms स्तर का होने से बड़े पैमाने की क्रॉलिंग में Chrome के मुकाबले प्रतीक्षा समय 5~10 गुना कम
- सिंगल बाइनरी डिस्ट्रीब्यूशन के साथ Chrome, Node.js जैसी बाहरी डिपेंडेंसी शून्य
--stealthस्टेल्थ मोड बिल्ट-इन:navigator.webdriverछिपाना, native function disguise जैसी एंटी-बॉट बायपास सेटिंग्स अपने आप लागू- सेशन-आधारित fingerprint रैंडमाइज़ेशन(GPU, कैनवास, ऑडियो आदि)
- 3,520 डोमेन्स के विज्ञापन·एनालिटिक्स·टेलीमेट्री ट्रैकर्स को अपने आप ब्लॉक करके पेज रेंडरिंग स्पीड भी बेहतर करता है
- CLI में
obscura fetchसे सिंगल पेज रेंडरिंग,obscura serveसे CDP WebSocket सर्वर शुरू किया जा सकता है obscura scrape url1 url2 ... --concurrency 25से आसानी से समानांतर स्क्रैपिंग--eval "document.title"की तरह CLI में JS expressions सीधे चलाकर सिर्फ परिणाम निकाला जा सकता है, इसलिए सरल डेटा एक्सट्रैक्शन में उपयोगी- CDP API के जरिए Target, Page, Runtime, DOM, Network, Fetch, Input आदि प्रमुख डोमेन्स का सपोर्ट, और DOM→Markdown रूपांतरण(LP.getMarkdown) भी शामिल
- फॉर्म सबमिशन·लॉगिन के समय POST प्रोसेसिंग, 302 रीडायरेक्ट, कुकी बनाए रखना अपने आप संभालता है, इसलिए authentication flow अलग से लागू करने की जरूरत नहीं
- Apache 2.0 लाइसेंस
5 टिप्पणियां
यह इन दिनों काफी लोकप्रिय हो रहा headless browser है.
हल्का होना तो इसकी अच्छी बात है, लेकिन stealth mode के ठीक से काम करने की वजह से भी यह लोकप्रिय है.
GitHub पर अकाउंट एक महीने पहले बनाया गया था
फिलहाल, जब मैंने बस सामान्य Google search किया, तो खास कोई reaction या review नहीं मिला।
Hacker News, Reddit वगैरह पर भी ठीक से कुछ दिखा नहीं..
शायद मैं ही नहीं ढूँढ़ पा रहा हूँ..
लेकिन stars 6,000 से ज़्यादा हैं।
जो चीज़ें अभी तेज़ी से लोकप्रिय हो रही हैं, उन्हें कहाँ देख सकते हैं?
यह काफ़ी ख़तरनाक software लग रहा है..
मैंने इसे ज़्यादातर Twitter पर ही बहुत देखा है। कहते हैं कि automation करना आसान है.
असल में, मैं stealth mode को टेस्ट नहीं कर पाया, इसलिए इसका ठीक से आकलन नहीं कर सकता।
यह शायद बहुत आम नहीं है। (हालाँकि आजकल ऐसे प्रोजेक्ट बहुत हैं, इसलिए शायद इसे आम मानना चाहिए..)
यह ऐसा प्रोग्राम है जिसमें संवेदनशील जानकारी डालकर इस्तेमाल किए जाने की संभावना भी काफी है, इसलिए लगता है कि इसे थोड़ा समय लेकर इस्तेमाल करना चाहिए।
लगता है यह u/Total_Nectarine_3623 द्वारा बनाया गया टूल है.
https://www.reddit.com/r/ClaudeAI/s/9VO1vzO2zp
दूसरी पोस्ट्स को देखें तो ONIST या CTF में रुचि दिखती है, इसलिए लगता है कि इनकी information security में दिलचस्पी है, और इन्होंने एक बहुत बड़े single commit के साथ पहला release किया. इसे देखकर लगता है कि original repository में पहले काफी vibe coding की गई, फिर उसे कई commits में बाँटकर वैसे का वैसा public करना ठीक नहीं लगा होगा, इसलिए शायद सबको एक में मिला दिया गया. GitHub handle भी h4ckfOr0day है, और आम तौर पर ONIST या थोड़े less conventional तरीकों से जुड़े tools को अक्सर burner account से अपलोड करने जैसी एक परंपरा-सी भी होती है.
open source पर भरोसा समय के साथ बनता है, लेकिन फिलहाल कोई खास बुरा इरादा नहीं लगता.