Miller - CSV/JSON डेटा प्रोसेसिंग के लिए CLI टूल
(github.com)- CSV, TSV, Tabular JSON आदि named-index डेटा को प्रोसेस करना
→ key-value डेटा के लिए awk, sed, cut, join, sort जैसी सुविधाएँ प्रदान करता है
- डेटा को साफ़ करने और संक्षिप्त करने, सांख्यिकी बनाने, DevOps, सिस्टम प्रबंधन, लॉग फ़ाइल प्रोसेसिंग, फ़ाइल फ़ॉर्मैट रूपांतरण, DB query post-processing आदि में उपयोगी
→ R, Pandas, SQL Output आदि को प्रोसेस करने में मददगार
-
streaming का समर्थन और Unix Pipe के साथ अच्छा integration
-
अंदरूनी रूप से Insertion-Ordered Hash Map के साथ डेटा प्रोसेसिंग
-
open source : शुरुआत में C में लिखा गया था, और 6.0 से Go में बदला गया
2 टिप्पणियां
इसे बार-बार इस्तेमाल करने की नौबत तो नहीं आती, लेकिन मैनुअल को बगल में खोलकर बीच-बीच में भी इस्तेमाल करूँ, तब भी यह अब तक इस्तेमाल किए गए किसी भी टूल से बेहतर लगता है!
अच्छा है। बड़े csv को ad hoc तरीके से प्रोसेस करने के लिए अब तक कोई खास उपयुक्त टूल नहीं था, और यह इस्तेमाल करने में भी आसान लगता है.