18 पॉइंट द्वारा GN⁺ 2024-02-07 | 1 टिप्पणियां | WhatsApp पर शेयर करें

SQL for the Weary

  • लक्षित पाठक: सेल बायोलॉजी में मास्टर डिग्री रखने वाली Rachel एक research hospital में cell analysis का काम करती हैं और डेटा साइंटिस्ट बनना चाहती हैं.
  • आवश्यक पूर्व ज्ञान: बुनियादी Unix commands और tabular data analysis की क्षमता.
  • सीखने के परिणाम: database और database administrator के बीच अंतर समझाना, SQL लिखना, table define करना और data manipulation, joins के प्रकार समझाना, adjacent rows पर काम करने के लिए window functions का उपयोग, transactions और triggers की समझ, SQL का उपयोग करके JSON data manipulation, Python के माध्यम से database interaction.

सेटअप

  • नवीनतम release डाउनलोड: SQLite database examples, SQL queries, Python scripts आदि शामिल फ़ाइलों को एक temporary directory में extract करें.

पृष्ठभूमि अवधारणाएँ

  • Database: data का ऐसा संग्रह जिसे खोजा और पुनर्प्राप्त किया जा सके.
  • Database Management System (DBMS): किसी विशेष प्रकार के database को manage करने वाला program.
  • SQLite: database को एक single file में store करता है, जबकि PostgreSQL अधिक performance के लिए information को कई files में distribute करता है.
  • Relational Database Management System (RDBMS): data को tables में store करता है और query के लिए SQL का उपयोग करता है.
  • NoSQL database: MongoDB जैसे ऐसे databases भी मौजूद हैं जो tables का उपयोग नहीं करते.

डेटाबेस से कनेक्शन

  • Database connection: यह वास्तविक query नहीं है, लेकिन अन्य काम करने से पहले आवश्यक चरण है.

प्रशासनिक commands

  • SQLite administrative commands: ये standard SQL का हिस्सा नहीं हैं, और PostgreSQL के special commands \\ से शुरू होते हैं.
  • Output format: .headers on और .mode markdown का उपयोग करके results को पढ़ने योग्य रूप में output करें.

टेबल manipulation

  • Table creation: create table command से table और columns define करें.
  • Data insertion: insert into command से table में data जोड़ें.
  • Row update: update command से विशेष conditions को संतुष्ट करने वाली rows का data बदलें.
  • Row deletion: delete from command से विशेष conditions को संतुष्ट करने वाली rows हटाएँ.

joins

  • Join: दो tables की जानकारी को combine करने की प्रक्रिया.
  • Inner join: inner join का उपयोग करके केवल दोनों tables की matching rows को combine करें.
  • Left join: left join का उपयोग करके बाएँ table की सभी rows रखें और दाएँ table के missing values को null से भरें.

aggregate functions

  • Aggregation: कई values को एक में combine करने की प्रक्रिया.
  • सामान्य aggregate functions: sum, max, min, avg आदि का उपयोग करके data aggregate करें.
  • Grouping: group by का उपयोग करके किसी विशेष column के unique combinations के आधार पर rows को group करें और हर group पर aggregation करें.

GN⁺ की राय

  • यह लेख databases और SQL की बुनियादी समझ विकसित करने के लिए एक उपयोगी सामग्री है, खासकर शुरुआती software engineers या data science में रुचि रखने वालों के लिए.
  • वास्तविक examples के साथ SQL की विभिन्न विशेषताओं को समझाकर यह database management और manipulation का व्यावहारिक ज्ञान देता है.
  • खास तौर पर database joins, aggregate functions, और table manipulation जैसे विषय data analysis से जुड़े कामों में बहुत महत्वपूर्ण हैं, और यह लेख इन अवधारणाओं को स्पष्ट रूप से समझने में मदद करता है.

1 टिप्पणियां

 
GN⁺ 2024-02-07
Hacker News की राय
  • ChatGPT का उपयोग करके data scientist की तरह जटिल queries लिखी जा सकती हैं। इससे conversion rate, message click-through rate जैसे उपयोगी metrics हासिल किए जा सकते हैं.
  • "data scientist" शब्द का अर्थ उस दौर से बदल गया है जब इसे "सबसे sexy job" कहा जाता था। लेख में biology में master's degree रखने वाली Rachel research hospital में cell analysis कर रही हैं और data scientist बनना चाहती हैं। पहले data scientist वे लोग माने जाते थे जिनके पास quantitative background और software engineering background दोनों होते थे, लेकिन अब कभी-कभी उन्हें "overrated data analyst" भी माना जाता है.
  • इस गाइड को DuckDB का उपयोग करके फिर से लिखना बेहतर हो सकता है। आजकल data scientist SQLite की तुलना में DuckDB का अधिक उपयोग करते हैं.
  • यह बहुत संक्षिप्त SQL guide है और examples के माध्यम से शानदार शिक्षण सामग्री देती है। अमेरिकी universities में यही सामग्री एक semester में पढ़ाई जाती है, लेकिन database optimization को छोड़कर यह guide अधिकांश industry software engineering roles के लिए पर्याप्त है.
  • TextQuery नाम का Mac app SQL practice के लिए इस्तेमाल किया जा सकता है। इसमें CSV datasets को जल्दी import करके SQL queries चलाई जा सकती हैं, और अभी beta version मुफ्त में उपलब्ध है.
  • अस्थिर Wi‑Fi वाली उड़ान के दौरान लंबे single-page tutorial को डाउनलोड कर लेना अच्छा रहेगा। जिज्ञासा है कि क्या SQL के अलावा दूसरी languages या technologies के लिए भी ऐसे tutorials हैं.
  • कई queries सिर्फ SQLite में ही वैध हैं, और इनमें कुछ ऐसे features शामिल हैं जो कुछ DBMS में supported नहीं हैं। उदाहरण के लिए, aggregate filtering को MySQL, MS SQL, Oracle आदि support नहीं करते.
  • data scientist के लिए tutorial कम और सामान्य SQL का अच्छा summary ज़्यादा लगता है.
  • "left outer join" की व्याख्या केवल equality conditions पर लागू होती है, इसलिए यह left join के बारे में गलत समझ बना सकती है। ऐसी व्याख्या बहुत आम है, लेकिन भ्रामक हो सकती है.