• नवीनतम हार्डवेयर (SIMD·GPU) को ध्यान में रखकर डिज़ाइन किया गया ओपन सोर्स column-oriented file format
  • analytics·AI workloads में high-throughput·low-latency data access को लक्ष्य बनाता है
  • Parquet की तुलना में लगभग 40% अधिक compression ratio, अधिकतम 40 गुना तेज decoding speed हासिल
  • data dependencies को न्यूनतम करने वाला Lane-आधारित layout पेश करता है, जिससे हर unit को स्वतंत्र रूप से decode किया जा सकता है
    • SIMD·multi-core CPU·GPU पर अत्यधिक data parallelism सुनिश्चित
  • स्पष्ट SIMD code के बिना भी automatic vectorization अच्छी तरह काम करे, इस तरह डिज़ाइन किया गया
    • CPU·GPU cache विशेषताओं को ध्यान में रखकर छोटे batch-unit access approach अपनाया गया
  • compression को पूरी तरह खोले बिना processing करने वाले partial decompression समर्थन के साथ data engine compressed state में ही query execution कर सकता है
  • multi-column compression (Multi-Column Compression, MCC) के ज़रिये columns के बीच correlation का उपयोग
    • मौजूदा column storage formats की single-column सीमा को पूरक करने वाला expression-based encoding mechanism प्रदान करता है
  • बाहरी libraries पर निर्भर न रहने वाली zero-dependency structure से build सरल होता है
    • C++, Python, Rust आदि प्रमुख language bindings उपलब्ध
  • CSV ↔ FastLanes conversion API built-in
    • read_csv() / to_fls() से आसान conversion
    • read_fls() / to_csv() से reverse conversion समर्थित
  • GPU decoding, Apache Arrow·DuckDB integration जैसे अगली पीढ़ी के data stack के साथ integration को लक्ष्य बनाकर विकास जारी

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.