warc-parquet - WARC को Parquet में बदलने वाला CLI (github.com/maxcountryman) 8 पॉइंट द्वारा xguru 2022-06-30 | 1 टिप्पणियां | WhatsApp पर शेयर करें Web ARChive (.warc) फ़ाइलों को column-based Apache Parquet format में बदलता है DuckDB में Parquet लोड करके आसानी से query किया जा सकता है Rust open source संबंधित पढ़ाई WarcDB - SQLite DB के रूप में Web crawl data 14 पॉइंट · 0 टिप्पणियां · 2022-06-22 Carquet - Parquet फ़ाइलों को पढ़ने और लिखने के लिए उच्च-प्रदर्शन शुद्ध C लाइब्रेरी 9 पॉइंट · 0 टिप्पणियां · 2026-01-17 dir2md v1.0.4 — ओपन सोर्स codebase को LLM-Friendly Markdown में बदलने वाला CLI, बड़ा अपडेट 8 पॉइंट · 0 टिप्पणियां · 2025-10-10 Broot - जटिल directory tree को navigate करने के लिए एक नया CLI टूल 7 पॉइंट · 3 टिप्पणियां · 2020-01-10 DuckLake - एकीकृत डेटा लेक और कैटलॉग फ़ॉर्मेट 13 पॉइंट · 1 टिप्पणियां · 2025-05-29 1 टिप्पणियां xguru 2022-06-30 DuckDB - Embedded OLAP DB ओपनसोर्स यह कुछ समय पहले पोस्ट किए गए WarcDB - Web crawl data as SQLite DB जैसा लगता है। लेकिन जहाँ पहले से Parquet इस्तेमाल करने वाला इंफ्रास्ट्रक्चर मौजूद है, वहाँ इसे इस्तेमाल करना शायद और आसान होगा
1 टिप्पणियां
DuckDB - Embedded OLAP DB ओपनसोर्स
यह कुछ समय पहले पोस्ट किए गए WarcDB - Web crawl data as SQLite DB जैसा लगता है।
लेकिन जहाँ पहले से Parquet इस्तेमाल करने वाला इंफ्रास्ट्रक्चर मौजूद है, वहाँ इसे इस्तेमाल करना शायद और आसान होगा