- threshold को production risk, जांच/समाधान समय, और complexity को ध्यान में रखकर सेट करें
- इसे risk होने से पहले सेट करना चाहिए, ताकि तेजी से कार्रवाई की जा सके
- threshold को समस्या के बहुत करीब न रखें, ताकि operator के पास काम करने का समय रहे
- threshold को समस्या से बहुत दूर भी नहीं रखना चाहिए
- कुछ Alert के कई root cause होते हैं, इसलिए उन्हें समझना और जांचना जटिल हो सकता है
- तेज़ समस्या-समाधान में मदद के लिए Alert को root cause की संख्या के अनुसार विभाजित करें
- सही threshold ढूंढना आसान नहीं है, और इसके लिए कई बार छोटे feedback loop से गुजरना पड़ता है
अभी कोई टिप्पणी नहीं है.