Hyperspace - Apache Spark के लिए MS द्वारा जारी किया गया indexing subsystem open source

(microsoft.github.io)

8 पॉइंट द्वारा xguru 2020-07-20 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Apache Spark में index-आधारित query acceleration संभव बनाने वाला subsystem

→ CSV, JSON, Parquet डेटा के लिए index बनाना और मैनेज करना

→ इन index का अपने-आप उपयोग करके, code में बदलाव किए बिना query/workload को तेज़ करना

→ कुल मिलाकर सामान्य hardware पर लगभग 2x query performance acceleration

Microsoft Azure cloud के Azure Synapse Analytics में उपयोग किया जा रहा है

( enterprise data warehousing और big data analytics को जोड़ने वाली unlimited analytics service )

1 टिप्पणियां

xguru 2020-07-20

परिचय लेख: Apache Spark™ के लिए indexing subsystem, Hyperspace, अब open source है