12 पॉइंट द्वारा GN⁺ 2024-10-07 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • डेटा जांच, query, join, import और export के लिए एक open source टूल, जो डेटाबेस और दस्तावेज़ों को संभालने में उपयोगी है
  • यह SLQ नाम की query language का उपयोग करता है और कई तरह के data source और format को support करता है

मुख्य फीचर

  • डेटाबेस टेबल की तुलना: diff कमांड का उपयोग करके source metadata या row values की तुलना की जा सकती है।
  • Excel से Postgres में डेटा import: Excel XLSX worksheet की सामग्री को नई Postgres table में insert किया जा सकता है।
  • डेटाबेस metadata देखना: --json flag का उपयोग करके schema और अन्य metadata को JSON format में output किया जा सकता है।
  • MySQL table के सभी column नाम लाना: किसी खास table के column names को आसानी से निकाला जा सकता है।
  • SQL Server query चलाना और नतीजे SQLite में insert करना: SQL Server पर query चलाकर उसके results को SQLite में insert किया जा सकता है।
  • सभी डेटाबेस टेबल को CSV में export करना: JSON metadata का उपयोग करके table names निकाले जा सकते हैं, और हर table को CSV file के रूप में output किया जा सकता है।

source कमांड

  • source जोड़ना और manage करना: source को add, activate, move, list, group, ping या remove करने के लिए कमांड उपलब्ध हैं।
  • डेटाबेस टेबल कमांड: table copy, cut और delete जैसे सुविधाजनक कमांड उपलब्ध हैं।

JSONL query

  • JSONL format support: JSON Lines format की log files पर query चलाई जा सकती है।

SQL source और output format

  • supported डेटाबेस: Postgres, SQLite, MySQL, MariaDB, SQL Server, Azure SQL Edge आदि supported हैं।
  • अन्य source: Excel XLSX, CSV, TSV, JSON, JSONA, JSONL आदि formats से डेटा import किया जा सकता है।
  • output format: SQL डेटाबेस में insert करने के अलावा Excel XLSX, CSV, TSV, JSON, JSONL, JSONA, XML, HTML, Markdown, Raw आदि कई formats में output किया जा सकता है।

GN⁺ का सार

  • sq डेटाबेस और दस्तावेज़ डेटा को संभालने के लिए एक शक्तिशाली टूल है, जो कई तरह के data source और format को support करके data processing में flexibility देता है।
  • डेटाबेसों के बीच डेटा ले जाना, metadata manage करना, और डेटा को कई formats में बदलना जैसे फीचर्स के जरिए data work को सरल बनाया जा सकता है।
  • यह डेटाबेस management और data processing में रुचि रखने वाले developers के लिए उपयोगी है, खासकर उन projects में जहाँ कई तरह के data source के साथ काम करना पड़ता है।
  • समान फीचर देने वाले टूल में jq, pandas, Apache Drill आदि शामिल हैं।

2 टिप्पणियां

 
xguru 2024-10-08

SQ - swiss-army knife for data

इसे साढ़े तीन साल पहले परिचित कराया गया था, और इस दौरान इसमें काफ़ी फीचर्स बढ़ गए हैं।

 
GN⁺ 2024-10-07
Hacker News टिप्पणी
  • मुझे नहीं लगता कि JQ की query language खास तौर पर आकर्षक है। डेटाबेस से सवाल पूछते समय JQ जैसी XPATH-समान भाषा चुनने की वजह समझ में नहीं आती
  • सोच रहा हूँ कि क्या ऐसा कोई टूल है जो JSON input लेकर SQL syntax में query कर सके। यह पुराने उपयोगकर्ताओं के लिए अधिक आकर्षक होगा
  • यह सुझाव दिया गया कि Python को एक single executable file के रूप में package किया जाए, और Unix शैली में application और module को symbolic link किया जाए
    • कई developers टूल चुनते समय सौंदर्य संबंधी पहलुओं को सबसे कम महत्व देते हैं। packaging या aesthetic consistency से ज़्यादा दूसरे factors अहम होते हैं
  • डेमो बहुत ज़्यादा state-dependent लगा। jq की असली ताकत उसकी reliability और उसके behavior को समझ पाने की क्षमता है, जबकि state-dependent tools में यह कमी होती है
  • ऐसा कुछ नहीं दिखता जो standard SQL और CLI tools से न किया जा सके। standard SQL सीखने से ज़्यादा reusable knowledge मिलेगी
  • नए tools हमेशा अच्छे होते हैं। भले ही वे mainstream न बनें, डेटाबेस को संभालने के नए तरीकों को खोजना हमेशा अच्छा है
  • sq पसंद है। DB में छोटे काम जल्दी करने और CSV या JSON में output देने के लिए उपयोगी है। बस अच्छा होता अगर sq query language (SLQ) में SQL के ... LIKE "SOME_STRING%" जैसे substring matching का समर्थन होता। SQL को manually call किया जा सकता है
  • पढ़ा था कि Postgres में JSON output feature जोड़ा जाएगा। .wrangle | .data iPhone 13 mini पर काम करता है
  • SQL डेटाबेस इस्तेमाल करते समय काश यह टूल होता
  • अच्छा होगा अगर Zeek logs के लिए TSV support हो