-
बड़े पैमाने के डेटा को offline या real-time में synchronize और transform करने के लिए प्लेटफ़ॉर्म
-
Apache Incubator प्रोजेक्ट (पहला नाम Waterdrop)
-
उपयोग में आसान, लचीला configuration, low-code development
-
real-time streaming सपोर्ट
-
offline multi-source डेटा analysis
-
उच्च-प्रदर्शन डेटा processing
-
SQL से डेटा aggregation और processing संभव
-
Spark Structured Streaming सपोर्ट
-
Spark 2.x सपोर्ट
-
समर्थित plugins
→ Input : Fake, File, Hdfs, Kafka, S3, Socket,..
→ Filter : Add, Checksum, Convert, Date, Drop, Grok, Json, Kv, Lowercase, Remove, Rename, Repartition, Replace, Sample, Split, Sql, Table, Truncate, Uppercase, Uuid,..
→ Output : ElasticSearch, File, Hdfs, Jdbc, Kafka, Mysql, S3, Stdout,..
अभी कोई टिप्पणी नहीं है.