1 पॉइंट द्वारा GN⁺ 2024-07-30 | 1 टिप्पणियां | WhatsApp पर शेयर करें

CrowdStrike का विमानन उद्योग पर प्रभाव

  • 19 जुलाई 2024 को CrowdStrike ने Windows सिस्टम के लिए sensor configuration update जारी किया
  • इस update के कारण लगभग 85 लाख कंप्यूटरों पर blue screen की समस्या आई, जिससे अस्पतालों, बैंकों, 911 सिस्टम सहित कई संस्थान प्रभावित हुए
  • Linux, Mac और मोबाइल फ़ोन प्रभावित नहीं हुए

अमेरिकी विमानन उद्योग पर प्रभाव

  • 19 जुलाई को अमेरिका में उड़ान भरने वाले विमानों की संख्या की घंटेवार तुलना करने वाला चार्ट दिया गया है
  • 12 जुलाई की तुलना में 0600 से 1300 तक हल्की कमी, उसके बाद हल्की बढ़ोतरी
  • 0400 से शुरू होने वाले संचयी आँकड़ों में पिछले हफ़्ते के शुक्रवार की तुलना में 2.6% वृद्धि

एयरलाइन आँकड़े

  • अमेरिका की 4 प्रमुख एयरलाइनों (Delta, United, American, Southwest) के आँकड़े दिए गए हैं
  • Delta: -1087 उड़ानें (-46%)
  • United: -596 उड़ानें (-36%)
  • American: -376 उड़ानें (-16%)
  • Southwest: +101 उड़ानें (+3%)

एयरलाइन सारांश

  • Delta को सबसे बड़ा झटका लगा, उसके बाद United और American रहे
  • Southwest प्रभावित नहीं हुई
  • Delta को बहाली में लंबा समय लगा, जबकि अन्य एयरलाइंस अपेक्षाकृत जल्दी सामान्य हो गईं

डेटा और विश्लेषण

  • ADS-B Exchange के raw data का उपयोग कर विमानों के takeoff का पता लगाने वाले code से प्रोसेस किया गया
  • takeoff को एक flight मानकर आँकड़े तैयार किए गए

GN⁺ की संक्षिप्त टिप्पणी

  • यह लेख CrowdStrike के update से हुई बड़े पैमाने की IT outage का विमानन उद्योग पर पड़े प्रभाव का विश्लेषण करता है
  • Delta एयरलाइन को अन्य एयरलाइनों की तुलना में बहाली में अधिक समय क्यों लगा, इस पर विभिन्न राय दी गई हैं
  • यह लेख IT systems की स्थिरता और emergency planning के महत्व को रेखांकित करता है
  • समान कार्यक्षमता वाले अन्य प्रोजेक्ट्स के रूप में Splunk जैसे log management और analysis tools की सिफारिश की गई है

1 टिप्पणियां

 
GN⁺ 2024-07-30
Hacker News की राय
  • Delta का crew tracking software बुरी तरह प्रभावित हुआ, जिससे recovery में समय लगा

  • इससे यह संकेत मिलता है कि बहुत से computers को internet से connected नहीं होना चाहिए

  • लगता है Delta पहले से ही मुकदमे की तैयारी कर रही है

  • एक लेख कि Southwest Airlines ने Windows 3.1 का उपयोग करके CrowdStrike और Microsoft outage से बचाव किया

  • यह जिज्ञासा कि Minneapolis-St Paul airport ने दूसरे अमेरिकी airports से पहले cancellations क्यों देखीं

  • यह जिज्ञासा कि क्या एक आधुनिक, अच्छी तरह अभ्यास की गई disaster recovery plan ने काम किया, या IT ने backup और recovery की लागत नहीं चुकाई

  • यह जिज्ञासा कि क्या कोई global analysis उपलब्ध है

  • इस outage की दिलचस्प बात यह थी कि "PROD" systems, जो मुख्यतः Linux और पुराने proprietary software पर चलते थे, ठीक रहे, लेकिन "CORP" systems, जो मुख्यतः Windows पर चलते थे, बुरी तरह प्रभावित हुए

    • banking systems को पैसे transfer करने में समस्या नहीं हुई, लेकिन लोगों के साथ interact करने वाले systems में दिक्कत हुई
  • Delta द्वारा core business capabilities को outsource करना और contracts को न्यूनतम रखकर बचत करना, समस्या को और बदतर बना गया

    • उम्मीद है कि ग्राहकों को मुआवजा देने की लागत, बचाई गई लागत से अधिक पड़े
    • स्रोत: Reddit टिप्पणी
  • Delta के पास उचित disaster recovery plan और IT business continuity plan नहीं था

    • UA, AA, F9 ने तैयार plans को तुरंत लागू किया और जल्दी recovery कर ली
    • UA और AA ने server farms, cloud solutions, और airports के end-user stations तक हर जगह plans तैनात किए थे
    • Delta ने काफी IT outsource कर रखा था
    • UA और AA कर्मचारियों के overtime की लागत चुकाने में नहीं हिचके
    • UA और AA भी Delta जितने ही Windows पर निर्भर थे
    • AA शुक्रवार के अंत तक recover हो गया और शनिवार को सामान्य operations फिर शुरू कर दिए
    • UA लगभग 12 घंटे बाद recover हुआ और शनिवार दोपहर सामान्य schedule फिर शुरू कर दिया
    • समस्या की जिम्मेदारी 100% Delta के IT decisions पर है
    • निचले स्तर के IT कर्मचारी संभवतः अधिकांश दोष और परिणाम झेलेंगे
  • यह पसंद आया कि अब "CrowdStrike" "global outage" का पर्याय बन गया है

    • "heartbleed" जैसे प्यारे नाम के बजाय, यह उसी कंपनी का नाम है जिसने समस्या पैदा की