2 पॉइंट द्वारा GN⁺ 2024-03-25 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Linux संकट उपकरण

  • Linux सर्वर पर डिफ़ॉल्ट रूप से इंस्टॉल किए जाने वाले "संकट उपकरणों" की सूची और उन उपकरणों को शामिल करने वाले (Ubuntu) पैकेज नाम दिए गए हैं।
  • बुनियादी statistics, system log, device information, device statistics, network tools, NUMA statistics, network sniffer, profiler और PMU statistics आदि के लिए उपकरण शामिल हैं।
  • bpfcc-tools (bcc) और bpftrace eBPF उपकरण प्रदान करते हैं; bcc में अधिक सुविधाएँ हैं और bpftrace को रियल-टाइम में संपादित किया जा सकता है।
  • सर्वर के अनुसार कुछ विशेष accelerator analysis tools या debugging tools को भी पहले से इंस्टॉल करने की सिफारिश की गई है।
  • ये आवश्यक analysis tools अक्सर नहीं बदलते, इसलिए इन्हें कुछ वर्षों में एक बार ही अपडेट करने की आवश्यकता होती है।

संकट के समय उपकरण इंस्टॉल करने का महत्व

  • production environment में संकट की स्थिति के दौरान software install करते समय उत्पन्न हो सकने वाली समस्याओं को उदाहरणों के साथ समझाया गया है।
  • सिस्टम धीमा हो जाने पर आवश्यक उपकरण इंस्टॉल करने में बहुत समय लग सकता है, और कई configuration समस्याओं या security policies के कारण install करना कठिन हो सकता है।
  • संकट की स्थिति में समस्या का तेज़ी से निदान और समाधान करने के लिए संकट उपकरणों को पहले से इंस्टॉल करना बेहतर है।

GN⁺ की राय

  • यह लेख system administrator या SRE (site reliability engineer) के लिए बहुत उपयोगी जानकारी देता है। यह वास्तविक संकट की स्थिति में आवश्यक उपकरणों का तुरंत उपयोग कर पाने के लिए पूर्व तैयारी के महत्व पर ज़ोर देता है।
  • संकट उपकरणों की पूर्व-स्थापना सिस्टम की availability और resilience बढ़ाने में योगदान देती है, और संभावित system downtime को कम करने में मदद करती है।
  • हालाँकि, security और performance के बीच संतुलन खोजना महत्वपूर्ण है। उदाहरण के लिए, यदि सिस्टम पर अनावश्यक उपकरण इंस्टॉल हों, तो हमलावर उनका दुरुपयोग कर सकते हैं।
  • यह विचार किया जा सकता है कि Linux distributions enterprise environment के अनुरूप संकट उपकरणों को डिफ़ॉल्ट रूप से शामिल करें, लेकिन यह प्रत्येक संगठन की security policy और आवश्यकताओं पर निर्भर कर सकता है।
  • open source community में पहले से ही विभिन्न monitoring और performance analysis tools उपलब्ध हैं, और उदाहरण के लिए Prometheus, Grafana जैसे उपकरण system performance monitoring में व्यापक रूप से उपयोग किए जाते हैं। इन उपकरणों के साथ संकट उपकरणों को एकीकृत करके उपयोग करने पर system management अधिक प्रभावी हो सकता है।

1 टिप्पणियां

 
GN⁺ 2024-03-25
Hacker News टिप्पणियाँ
  • 4:07pm पैकेज इंस्टॉल विफल, repository resolve नहीं हो रही। /etc/apt कॉन्फ़िगरेशन में समस्या है…

    • cloud environment के कुछ नुकसान हैं, लेकिन ऐसी स्थिति में यह उपयोगी होता है। जटिल मरम्मत करने के बजाय, समस्या वाली मशीन को बंद करके या pool से हटाकर और नई मशीन का उपयोग करके समस्या हल की जा सकती है।
  • containerized servers बहुत हैं, लेकिन अब भी चुनौतियाँ मौजूद हैं।

    • Docker image के अंदर मौजूद कई tools को security scanning tools द्वारा risk factor के रूप में चिह्नित किया जाता है। gdb जैसे tools चिंता का विषय हो सकते हैं, लेकिन कई tools ऐसे नहीं होते।
    • इससे बचने के लिए tools को किसी अलग volume में static binary के रूप में रखा जाता है, या mount path को install prefix की तरह इस्तेमाल करके compile और install किया जाता है। जब debugging की ज़रूरत होती है, तो ops team volume को अस्थायी रूप से read-only mode में mount करती है।
  • अगर ऐसे debug tools हों जिनके लिए कुछ kernel features सक्षम करने पड़ें, तो उसी host पर चल रहे दूसरे containers पर उसके प्रभाव को लेकर चिंता रहती है।

  • FreeBSD systems में /rescue/ directory होती है, जो लगभग 150 महत्वपूर्ण tools को मिलाकर एक single statically linked लगभग 17MB binary file उपलब्ध कराती है।

  • जब मैं Netflix में काम करता था, Brendan और उनकी team ने हर जगह bpftrace, bcc, और काम करने वाला perf जैसे debugging tools इंस्टॉल कर रखे थे, और इसने कई बार जान बचाने जैसा काम किया।

  • यह देखकर हैरानी हुई कि सूची में strace नहीं है। जब कोई program बेकार या गलत error message लौटाता है, तब यह खास तौर पर बहुत उपयोगी tool है।

  • SRE तरह की positions के interview लेते समय मैं हमेशा इन tools को कवर करता हूँ। उम्मीदवार को कौन-सा specific command याद है, इससे ज़्यादा महत्वपूर्ण यह है कि क्या संभव है, कौन-कौन से tools उपलब्ध हैं, और उनका उपयोग कैसे करना है।

  • ऐसी crisis situation में जहाँ tool install करना संभव न हो, Docker के ज़रिए कई utilities चलाई जा सकती हैं। उदाहरण के लिए, host network से जुड़े हुए tcpdump को चलाने वाला Docker container build और run करने का तरीका बताया गया है।

  • yum install को प्राथमिकता दी जाती है, लेकिन अगर Docker उपलब्ध है, तो अतिरिक्त mapping की ज़रूरत होने पर भी यह एक व्यावहारिक विकल्प है। यह rootless/podman setup में काम न करे।

  • nmap, netstat, nc का ज़िक्र नहीं किया गया। इन tools ने कई बार समस्याएँ सुलझाने में मदद की है।

  • क्या root access मिल सकता है? किसी भी काम को करने के लिए system administrator को ticket उठानी पड़ती है।

  • मैं nmap जोड़ना चाहूँगा। network connectivity की समस्याएँ कुछ apps में साफ़ तौर पर दिखाई नहीं देतीं।