xsv - CLI के लिए CSV फ़ाइल प्रोसेसिंग टूल
(github.com)CSV फ़ाइलों को DB की तरह इस्तेमाल करने वाला CLI टूल। Rust open source
फ़ाइल मर्ज करना, लाइन गिनना, fixed-width बनाना, reformat करना (delimiter बदलना आदि),
join(inner,outer,cross), column value partitioning, sampling, reverse order, खास column निकालना, column reorder करना,
sort, split (N फ़ाइलों में), stats (हर column का average, variance, median, range आदि), table फ़ॉर्म में देखना
2 टिप्पणियां
local पर spark?!
डेटा विश्लेषण के दौरान CSV डेटा को साफ़ करने में यह काम आ सकता है
SQL स्टाइल में join करने का उदाहरण - https://www.johndcook.com/blog/2019/12/31/sql-join-csv-files/