Linux संकट उपकरण
- Linux सर्वर पर डिफ़ॉल्ट रूप से इंस्टॉल किए जाने वाले "संकट उपकरणों" की सूची और उन उपकरणों को शामिल करने वाले (Ubuntu) पैकेज नाम दिए गए हैं।
- बुनियादी statistics, system log, device information, device statistics, network tools, NUMA statistics, network sniffer, profiler और PMU statistics आदि के लिए उपकरण शामिल हैं।
bpfcc-tools (bcc) और bpftrace eBPF उपकरण प्रदान करते हैं; bcc में अधिक सुविधाएँ हैं और bpftrace को रियल-टाइम में संपादित किया जा सकता है।
- सर्वर के अनुसार कुछ विशेष accelerator analysis tools या debugging tools को भी पहले से इंस्टॉल करने की सिफारिश की गई है।
- ये आवश्यक analysis tools अक्सर नहीं बदलते, इसलिए इन्हें कुछ वर्षों में एक बार ही अपडेट करने की आवश्यकता होती है।
संकट के समय उपकरण इंस्टॉल करने का महत्व
- production environment में संकट की स्थिति के दौरान software install करते समय उत्पन्न हो सकने वाली समस्याओं को उदाहरणों के साथ समझाया गया है।
- सिस्टम धीमा हो जाने पर आवश्यक उपकरण इंस्टॉल करने में बहुत समय लग सकता है, और कई configuration समस्याओं या security policies के कारण install करना कठिन हो सकता है।
- संकट की स्थिति में समस्या का तेज़ी से निदान और समाधान करने के लिए संकट उपकरणों को पहले से इंस्टॉल करना बेहतर है।
GN⁺ की राय
- यह लेख system administrator या SRE (site reliability engineer) के लिए बहुत उपयोगी जानकारी देता है। यह वास्तविक संकट की स्थिति में आवश्यक उपकरणों का तुरंत उपयोग कर पाने के लिए पूर्व तैयारी के महत्व पर ज़ोर देता है।
- संकट उपकरणों की पूर्व-स्थापना सिस्टम की availability और resilience बढ़ाने में योगदान देती है, और संभावित system downtime को कम करने में मदद करती है।
- हालाँकि, security और performance के बीच संतुलन खोजना महत्वपूर्ण है। उदाहरण के लिए, यदि सिस्टम पर अनावश्यक उपकरण इंस्टॉल हों, तो हमलावर उनका दुरुपयोग कर सकते हैं।
- यह विचार किया जा सकता है कि Linux distributions enterprise environment के अनुरूप संकट उपकरणों को डिफ़ॉल्ट रूप से शामिल करें, लेकिन यह प्रत्येक संगठन की security policy और आवश्यकताओं पर निर्भर कर सकता है।
- open source community में पहले से ही विभिन्न monitoring और performance analysis tools उपलब्ध हैं, और उदाहरण के लिए Prometheus, Grafana जैसे उपकरण system performance monitoring में व्यापक रूप से उपयोग किए जाते हैं। इन उपकरणों के साथ संकट उपकरणों को एकीकृत करके उपयोग करने पर system management अधिक प्रभावी हो सकता है।
1 टिप्पणियां
Hacker News टिप्पणियाँ
containerized servers बहुत हैं, लेकिन अब भी चुनौतियाँ मौजूद हैं।
gdbजैसे tools चिंता का विषय हो सकते हैं, लेकिन कई tools ऐसे नहीं होते।अगर ऐसे debug tools हों जिनके लिए कुछ kernel features सक्षम करने पड़ें, तो उसी host पर चल रहे दूसरे containers पर उसके प्रभाव को लेकर चिंता रहती है।
FreeBSD systems में
/rescue/directory होती है, जो लगभग 150 महत्वपूर्ण tools को मिलाकर एक single statically linked लगभग 17MB binary file उपलब्ध कराती है।जब मैं Netflix में काम करता था, Brendan और उनकी team ने हर जगह
bpftrace,bcc, और काम करने वालाperfजैसे debugging tools इंस्टॉल कर रखे थे, और इसने कई बार जान बचाने जैसा काम किया।यह देखकर हैरानी हुई कि सूची में
straceनहीं है। जब कोई program बेकार या गलत error message लौटाता है, तब यह खास तौर पर बहुत उपयोगी tool है।SRE तरह की positions के interview लेते समय मैं हमेशा इन tools को कवर करता हूँ। उम्मीदवार को कौन-सा specific command याद है, इससे ज़्यादा महत्वपूर्ण यह है कि क्या संभव है, कौन-कौन से tools उपलब्ध हैं, और उनका उपयोग कैसे करना है।
ऐसी crisis situation में जहाँ tool install करना संभव न हो, Docker के ज़रिए कई utilities चलाई जा सकती हैं। उदाहरण के लिए, host network से जुड़े हुए
tcpdumpको चलाने वाला Docker container build और run करने का तरीका बताया गया है।yum installको प्राथमिकता दी जाती है, लेकिन अगर Docker उपलब्ध है, तो अतिरिक्त mapping की ज़रूरत होने पर भी यह एक व्यावहारिक विकल्प है। यह rootless/podmansetup में काम न करे।nmap,netstat,ncका ज़िक्र नहीं किया गया। इन tools ने कई बार समस्याएँ सुलझाने में मदद की है।क्या root access मिल सकता है? किसी भी काम को करने के लिए system administrator को ticket उठानी पड़ती है।
मैं
nmapजोड़ना चाहूँगा। network connectivity की समस्याएँ कुछ apps में साफ़ तौर पर दिखाई नहीं देतीं।