- नवीनतम हार्डवेयर (SIMD·GPU) को ध्यान में रखकर डिज़ाइन किया गया ओपन सोर्स column-oriented file format
- analytics·AI workloads में high-throughput·low-latency data access को लक्ष्य बनाता है
- Parquet की तुलना में लगभग 40% अधिक compression ratio, अधिकतम 40 गुना तेज decoding speed हासिल
- data dependencies को न्यूनतम करने वाला Lane-आधारित layout पेश करता है, जिससे हर unit को स्वतंत्र रूप से decode किया जा सकता है
- SIMD·multi-core CPU·GPU पर अत्यधिक data parallelism सुनिश्चित
- स्पष्ट SIMD code के बिना भी automatic vectorization अच्छी तरह काम करे, इस तरह डिज़ाइन किया गया
- CPU·GPU cache विशेषताओं को ध्यान में रखकर छोटे batch-unit access approach अपनाया गया
- compression को पूरी तरह खोले बिना processing करने वाले partial decompression समर्थन के साथ data engine compressed state में ही query execution कर सकता है
- multi-column compression (Multi-Column Compression, MCC) के ज़रिये columns के बीच correlation का उपयोग
- मौजूदा column storage formats की single-column सीमा को पूरक करने वाला expression-based encoding mechanism प्रदान करता है
- बाहरी libraries पर निर्भर न रहने वाली zero-dependency structure से build सरल होता है
- C++, Python, Rust आदि प्रमुख language bindings उपलब्ध
- CSV ↔ FastLanes conversion API built-in
read_csv() / to_fls() से आसान conversion
read_fls() / to_csv() से reverse conversion समर्थित
- GPU decoding, Apache Arrow·DuckDB integration जैसे अगली पीढ़ी के data stack के साथ integration को लक्ष्य बनाकर विकास जारी
अभी कोई टिप्पणी नहीं है.