• बड़े पैमाने के डेटा को offline या real-time में synchronize और transform करने के लिए प्लेटफ़ॉर्म

  • Apache Incubator प्रोजेक्ट (पहला नाम Waterdrop)

  • उपयोग में आसान, लचीला configuration, low-code development

  • real-time streaming सपोर्ट

  • offline multi-source डेटा analysis

  • उच्च-प्रदर्शन डेटा processing

  • SQL से डेटा aggregation और processing संभव

  • Spark Structured Streaming सपोर्ट

  • Spark 2.x सपोर्ट

  • समर्थित plugins

 → Input : Fake, File, Hdfs, Kafka, S3, Socket,..

 → Filter : Add, Checksum, Convert, Date, Drop, Grok, Json, Kv, Lowercase, Remove, Rename, Repartition, Replace, Sample, Split, Sql, Table, Truncate, Uppercase, Uuid,..

 → Output : ElasticSearch, File, Hdfs, Jdbc, Kafka, Mysql, S3, Stdout,..

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.