1 पॉइंट द्वारा GN⁺ 2025-10-30 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Microsoft की cloud service Azure में outage (सेवा बाधा) होने की रिपोर्ट की गई
  • Hacker News पोस्ट को उपयोगकर्ता ने सीधे बाधा की सूचना देने वाली घोषणा के रूप में लिखा है
  • बाधा के कारण, प्रभाव के दायरे, रिकवरी की स्थिति आदि का मुख्य पाठ में ठोस रूप से उल्लेख नहीं है
  • पोस्ट का उद्देश्य Azure service उपयोगकर्ताओं को सतर्क करना है
  • यह मामला cloud infrastructure पर अधिक निर्भर कंपनियों और developers के लिए operational risk को समझने के महत्व की याद दिलाता है

Azure सेवा बाधा की रिपोर्ट

  • Hacker News की “Tell HN: Azure outage” पोस्ट Azure platform में बाधा आने की बात बताती है
  • मुख्य पाठ उपलब्ध न होने के कारण विस्तृत कारण, प्रभावित क्षेत्र, सेवा के प्रकार आदि की पुष्टि नहीं हो सकती
  • पोस्ट के प्रारूप से लगता है कि किसी उपयोगकर्ता ने बाधा को स्वयं देखकर community के साथ साझा किया

अतिरिक्त जानकारी

  • Microsoft Azure दुनिया भर में इस्तेमाल की जाने वाली cloud computing service है
  • मुख्य पाठ में रिकवरी की प्रगति या आधिकारिक घोषणा शामिल नहीं है
  • मूल पाठ में अतिरिक्त जानकारी नहीं है

1 टिप्पणियां

 
GN⁺ 2025-10-30
Hacker News टिप्पणियाँ
  • यह अब भी हैरान करता है कि ज़रूरी सेवाएँ, खासकर सार्वजनिक परिवहन, पूरी तरह cloud पर निर्भर हैं और उनके पास कोई backup नहीं है
    नीदरलैंड्स में आज आम चुनाव का मतदान दिवस था, और Azure outage की वजह से ट्रेनें कई घंटों तक लेट रहीं या रद्द हो गईं, इसलिए कुछ लोग वोट नहीं दे सके

    • सोच रहा हूँ कि क्या मतदान सिर्फ एक ही दिन होता है। अगर सिर्फ एक दिन होता है, तो ऐसी समस्या कभी भी आ सकती है। लगता है कई दिनों में कराने का कोई स्पष्ट कारण होगा
    • 2025 में भी अब तक लोगों को खुद polling station जाना पड़ता है, यह यक़ीन करना मुश्किल है। मैं 20 साल से ज़्यादा समय से postal voting कर रहा हूँ, और 1 महीने पहले ballot paper मिल जाता है जिसे डाक से भेज देता हूँ। उम्मीद है कभी online voting आएगी और कागज़ की बर्बादी खत्म होगी
    • मेरा मानना है कि मतदान दिवस को राष्ट्रीय अवकाश घोषित किया जाना चाहिए
    • लेकिन अगर आप दो cloud पर deploy करें तो लोग इसे टैक्स का दुरुपयोग कहकर आलोचना करते हैं। आखिरकार reliability और cost saving में से एक चुनना पड़ता है
    • न्यूज़ीलैंड भी इस outage से बच नहीं पाया। सरकार की RealME सेवा (tax filing, passport application आदि) बंद हो गई, जिससे बड़ा भ्रम पैदा हुआ
  • Azure status page की सूचना के मुताबिक Azure Status पर 16:00 UTC के आसपास Front Door समस्या की वजह से कुछ सेवाएँ बंद हो गईं
    जिन ग्राहकों को portal access नहीं मिल रहा था, उन्हें PowerShell या CLI इस्तेमाल करने को कहा गया, और बताया गया कि portal को AFD से अलग करके restore किया जा रहा है

    • 17:17 UTC अपडेट में कहा गया कि वजह संभवतः गलत configuration change थी। सभी changes रोक दिए गए हैं और पिछली सामान्य स्थिति पर rollback किया जा रहा है
    • यूरोप region में AFD अक्सर regional स्तर पर डाउन होता है। आधे से ज़्यादा मामलों की आधिकारिक रिपोर्ट भी नहीं होती
    • DNS का ज़िक्र देखकर सोच रहा हूँ कि क्या यह पुराने AWS outage जैसा ही मामला है
    • status message में AFD समस्या मानी गई, लेकिन सिर्फ portal को AFD dependency के बिना चलाने की कार्रवाई का ज़िक्र था। हम जो AFD इस्तेमाल करते हैं, उनके लिए यह लंबी लड़ाई हो सकती है
    • सिर्फ portal ही नहीं, microsoft.com भी डाउन था
  • Starbucks mobile ordering काम नहीं कर रहा था, तो मैंने Grubhub से ऑर्डर करने की कोशिश की, लेकिन वह भी डाउन था। आखिरकार वजह जानने HN पर आना पड़ा

    • लगता है HN कुछ basement servers पर चल रहा है, इसलिए cloud से ज़्यादा stable है
    • sysadmin subreddit ने HN से एक घंटे से भी पहले outage पकड़ लिया। on-call engineers ने तुरंत नोटिस कर लिया
    • पुराने AWS outage के समय भी Starbucks app बंद हो गया था
    • drive-thru की लाइन आगे नहीं बढ़ रही थी, तो अजीब लगा, लेकिन वजह यही थी
    • मेरा Netatmo air quality sensor भी alerts भेजना बंद कर चुका था। यह घर के अंदर का डेटा है, फिर इसे cloud से होकर जाने की क्या ज़रूरत है
  • Azure outage, AWS outage जितना चौंकाने वाला नहीं लगता।
    शुरू में Microsoft ecosystem का vertical integration आकर्षक लगा था, लेकिन इस्तेमाल करने पर resource allocation बहुत असुविधाजनक लगा, इसलिए मैं वापस AWS पर चला गया
    अब तक मैंने GCP कभी इस्तेमाल नहीं किया, लेकिन अब लगता है शायद वह बेहतर होता

    • जब मैंने पहली बार Azure इस्तेमाल किया था, तो menu इतने जटिल थे कि पूरी स्क्रीन ढक लेते थे। वही पहली बार था जब cloud में रास्ता भटकने जैसा महसूस हुआ
    • सच कहूँ तो GCP काफ़ी अच्छा है। काश ज़्यादा लोग इसे आज़माते
    • लेकिन heavily regulated industries में सिर्फ Microsoft की अनुमति होती है। AWS या GCP पर विचार ही नहीं किया जाता
    • Microsoft public sector compliance अच्छी तरह संभालता है, इसलिए उसके पास बहुत से सरकारी ग्राहक हैं। इसी वजह से Azure outage का असर public services पर ज़्यादा पड़ता है
    • सच तो यह है कि अगर MS डाउन हो जाए और Github चलता रहे, तो शायद ध्यान ही न जाए
  • इस समय payment system बंद है, और मैं आधा बंद पड़े supermarket के अंदर खड़ा हूँ

    • जिस grocery store में मैं पहले काम करता था, उसमें offline mode था, इसलिए payment authorization fail होने पर ग्राहक मुफ़्त में सामान ले जाते थे
    • हमारे इलाके का Family Dollar internet समस्या की वजह से महीने में दो दिन तो हमेशा रुक जाता है। अगर मैं backup link दूँ और बदले में revenue का आधा हिस्सा लूँ, तो दोनों का फ़ायदा होगा
    • इस supermarket में पूरी तरह outage नहीं था, लेकिन payment step पर timeout होता लग रहा था, इसलिए सब बहुत धीमा था
    • 90s का वह दौर याद आ गया जब mechanical cash registers को electronic से बदला जा रहा था। आजकल card terminals boot loop में फँस जाते हैं, इसलिए मैंने फूलों के पैसे cash में दिए। मेरे partner ने मज़ाक किया कि clerk शायद tax के बिना cash रखना चाहता है
    • मेरा मानना है कि किसी भी retail store में कम-से-कम offline payment capability तो होनी ही चाहिए
  • अब सोच रहा हूँ कि Google Cloud Run या Cloudflare Workers पर migrate कर जाऊँ
    व्यक्तिगत रूप से मुझे Hetzner price-to-performance के हिसाब से भरोसेमंद लगता है
    एक comparison video भी था, और अच्छा होता अगर vpspricetracker.com जैसी साइटों पर Geekbench scores भी साथ दिखते

    • Hetzner अच्छा है, लेकिन शायद Google-level reliability नहीं दे पाएगा
    • कभी-कभी लगता है कि शायद multi-provider setup बेहतर होगा
    • वैसे, 4 महीने पहले हुआ Cloudflare outage भी Google Cloud की समस्या से शुरू हुआ था
  • पिछले 2 साल में मैं धीरे-धीरे सेवाओं को Azure से बाहर ले जा रहा हूँ।
    अब सिर्फ static assets bucket और Matomo analytics के लिए VM बची है, लेकिन Front Door का अनुभव इतना भयानक था कि आज की घटना के बाद मैंने पूरी तरह Cloudflare पर जाने का फैसला कर लिया

    • सच कहें तो इस साल सभी cloud providers ने बड़े outages देखे हैं। अब कोई भी पूर्ण reliability की गारंटी नहीं दे सकता
    • फिर भी ऐसे संकट को अवसर में बदलना ज़रूरी है
  • login.microsoftonline.com डाउन है, इसलिए पूरे संगठन में SSO रुक गया है। microsoft.com भी साथ में ठप है

    • US tenant में login flow रुक रहा है, लेकिन यूरोप (खासकर germany-west) में सब ठीक चल रहा है
    • हमारी कंपनी में SSO और 365 ठीक हैं, लेकिन सिर्फ admin portal inaccessible है
    • अब लोग मज़ाक में इसे NASSO(Not A Single Sign On) कह रहे हैं
    • आजकल Office 365 outages लगभग हर हफ्ते हो रहे हैं, फिर भी लोग इसे अपनाते हैं, यह हैरानी की बात है
  • VSCode download fail हो रहा है
    download link काम नहीं कर रहा

    • आज winget भी बीच-बीच में fail हो रहा था। मैं UniGetUI इस्तेमाल करता हूँ, और सिर्फ Microsoft-संबंधित packages की list refresh नहीं हो रही
    • Azure DevOps repositories भी inaccessible हैं, इसलिए काम रुक गया है
    • कुछ लोग तो VSCodium इस्तेमाल करने की सलाह भी दे रहे हैं
  • हमारी टीम 100% Azure पर आधारित है, लेकिन इस outage का हम पर असर नहीं पड़ा
    1 साल पहले Front Door छोड़ने के बाद से सब stable है। पहले हर नई deployment पर समस्या आती थी, और एक बार तो homepage पर Microsoft banner तक दिख गया था

    • Front Door OriginTimeout issue को एक साल से ज़्यादा झेलने के बाद आखिरकार migrate किया। लेकिन API server अब भी AFD के पीछे है, इसलिए इस बार फिर असर हुआ
    • outage से भी ज़्यादा गंभीर समस्या content contamination है। जिस Microsoft banner के लिए subscribe भी नहीं किया, उसका दिखना काफ़ी गंभीर मामला है