2 पॉइंट द्वारा GN⁺ 2024-07-29 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • LLM का उपयोग करके alerts को actionable और noise में वर्गीकृत करता है
    • alert history और Slack conversations का विश्लेषण करके तय करता है कि alert actionable है या नहीं
    • कार्रवाई के लिए context-specific जानकारी (insights और अतिरिक्त resources) देकर alert fatigue को कम करता है
  • Slack के साथ इंटीग्रेट होकर काम करता है, alert patterns का विश्लेषण करता है, और channel alerts पर साप्ताहिक रिपोर्ट देता है

मॉड्यूलर आर्किटेक्चर

  1. अलर्ट संग्रह: Datadog webhook के जरिए alerts को FastAPI server पर भेजता है
  2. FastAPI server: सिस्टम का core, जो आने वाले alerts को प्रोसेस करता है, Slack के साथ interact करता है, और data flow को manage करता है
  3. Slack इंटीग्रेशन: alert management और interaction के लिए user interface प्रदान करता है
  4. डेटाबेस: alert data और embeddings को स्टोर करने के लिए Postgres और pgvector का उपयोग करता है

इंटीग्रेशन

लचीले data model का उपयोग करके कई integrations को support किया जा सकता है। फिलहाल Opslane Datadog को support करता है

GN⁺ की संक्षिप्त टिप्पणी

  • Opslane एक ऐसा टूल है जो alert fatigue को कम करता है और actionable alerts को वर्गीकृत करके on-call अनुभव को कम तनावपूर्ण बनाता है
  • Slack इंटीग्रेशन के जरिए यह alert management और debugging में मदद करता है, और साप्ताहिक रिपोर्ट के माध्यम से alert quality का विश्लेषण करता है
  • यह open source के रूप में उपलब्ध है, community contributions का स्वागत करता है, और Datadog इंटीग्रेशन को support करता है
  • समान फीचर्स वाले टूल्स में PagerDuty और VictorOps शामिल हैं।

1 टिप्पणियां

 
GN⁺ 2024-07-29
Hacker News राय
  • पहली राय: अलर्ट थकान कम करने वाले उन प्रोडक्ट्स पर चर्चा, जो अलर्ट को कार्रवाई योग्य और शोर में वर्गीकृत करने तथा उन्हें संभालने के लिए संदर्भ जानकारी देते हैं

    • यह समस्या उन कंपनियों की दिक्कत को और बेहतर दिखाती है जो उपयोगी observability बना नहीं पातीं
    • प्रोडक्ट स्वागतयोग्य है, लेकिन उम्मीद है कि खराब सांस्कृतिक प्रथाओं को संभव बनाने वाले पहलू को मुख्य selling point के रूप में ज़ोर न दिया जाए
    • telecom industry ने 15 साल पहले Fault Management automation के ज़रिए इस समस्या को हल कर लिया था
    • जब अलर्ट Slack में चले गए, तो डेटा unstructured text बन गया और जटिल filtering solutions की ज़रूरत पड़ने लगी
  • दूसरी राय: महत्वपूर्ण कामों के लिए अविश्वसनीय LLM का उपयोग करने पर चिंता जताई गई

    • उम्मीद है कि मूल समस्या को हल किया जाए और उसमें LLM न जोड़ा जाए
  • तीसरी राय: उल्लेख है कि All Quiet के संस्थापक ऐसा टूल बना रहे हैं जो LLM का उपयोग नहीं करता

    • यूज़र नहीं चाहते कि महत्वपूर्ण अलर्ट किसी opaque LLM पर निर्भर हों
    • AI लक्षणों में मदद कर सकता है, लेकिन observability और process जैसी मूल वजहों को हल नहीं कर सकता
  • चौथी राय: LLM के ज़रिए नोटिफिकेशन की अहमियत फ़िल्टर करने पर चिंता जताई गई

  • पाँचवीं राय: टूल को Slack से बहुत कसकर जोड़ने से उपलब्ध platform सीमित हो जाते हैं

    • दूसरे instant messaging platform भी मौजूद हैं
    • IM के उपयोग से जुड़ा व्यापक मुद्दा दूसरे comment thread में चर्चा में है
  • छठी राय: कहा गया कि इस दिशा के बड़े प्रशंसक हैं

    • शुरुआती bootstrapping और लगातार baselining को लेकर जिज्ञासा जताई गई
    • Louie.AI टीम SE और प्रमुख पदों के लिए hiring कर रही है
  • सातवीं राय: बताया गया कि मौजूदा नौकरी में अलर्ट सिस्टम की समस्या पता है, लेकिन उसे हल क्यों नहीं किया जा सकता

    • अलर्ट बंद नहीं किए जा सकते, और मूल कारण की पहचान या समाधान नहीं हो पाता
    • on-call को अच्छी तरह चलाना एक सांस्कृतिक समस्या है
    • तकनीकी टूल सांस्कृतिक समस्याएँ हल नहीं कर सकते
    • सांस्कृतिक समस्या हल करने के लिए या तो दूसरी नौकरी ढूँढनी होगी या समस्या को स्वीकार करना होगा
  • आठवीं राय: प्रोडक्ट बनाने पर बधाई दी गई और बताया गया कि पहले पैराग्राफ में एक शब्द छूटा हुआ है

  • नौवीं राय: business alerts के लिए इसी तरह के UI की तलाश है

    • Snowflake/BigQuery जैसे data sources इस्तेमाल करने वाला टूल चाहिए
    • बताया गया कि जो टूल इस्तेमाल किए, वे आख़िरकार spammy Slack channel बनकर रह गए