1 पॉइंट द्वारा GN⁺ 2026-02-10 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • कुछ GitHub सेवाओं में प्रदर्शन में गिरावट की रिपोर्ट की गई, और नोटिफिकेशन की डिलीवरी में देरी हुई
  • औसत देरी शुरू में लगभग 50 मिनट से बढ़कर अधिकतम 1 घंटा 20 मिनट तक पहुंची
  • इसके बाद धीरे-धीरे रिकवरी हुई, और देरी 1 घंटा → 30 मिनट → 15 मिनट स्तर तक घट गई
  • UTC के अनुसार 9 फ़रवरी 2026, 19:29 पर समस्या का समाधान और घटना समाप्त होने की रिपोर्ट दी गई
  • GitHub ने कहा है कि वह Root Cause Analysis (RCA) बाद में प्रकाशित करेगा

GitHub नोटिफिकेशन देरी घटना का सारांश

  • GitHub ने बताया कि उसकी कुछ सेवाओं में प्रदर्शन में गिरावट आई थी
    • शुरुआती चरण में नोटिफिकेशन की डिलीवरी सामान्य रूप से नहीं हो रही थी
    • समस्या के कारण की जांच जारी थी

नोटिफिकेशन देरी की प्रगति

  • पहले अपडेट में औसतन 50 मिनट की देरी होने की बात कही गई
    • GitHub ने बताया कि वह mitigation उपायों पर काम कर रहा है
  • बाद के अपडेट में देरी 1 घंटा 20 मिनट तक बढ़ गई, लेकिन रिकवरी के संकेत दिखाई दिए
  • धीरे-धीरे रिकवरी होने पर देरी का समय 1 घंटा → 30 मिनट → 15 मिनट तक कम हुआ
    • बताया गया कि backlog (जमा हुए नोटिफिकेशन) को प्रोसेस किया जा रहा था
  • अंततः नोटिफिकेशन देरी की समस्या का समाधान हो गया और सामान्य डिलीवरी फिर शुरू हो गई

घटना का समापन और आगे की कार्रवाई

  • UTC के अनुसार 9 फ़रवरी 2026, 19:29 पर घटना पूरी तरह हल हो गई
  • GitHub ने उपयोगकर्ताओं के धैर्य और समझ के लिए आभार व्यक्त किया
  • Root Cause Analysis के नतीजे तैयार होते ही प्रकाशित किए जाएंगे

उपयोगकर्ता अलर्ट और subscription फीचर

  • उपयोगकर्ता ईमेल, SMS, Slack, Webhook आदि के जरिए घटना अपडेट subscribe कर सकते हैं
  • subscribe करते समय GitHub और Atlassian की privacy policy और service terms से सहमत होना होगा
  • साइट Google reCAPTCHA से सुरक्षित है

सारांश

  • यह घटना GitHub की नोटिफिकेशन सिस्टम देरी समस्या से जुड़ी थी, जिसमें लगभग 4 घंटे तक चरणबद्ध रिकवरी हुई
  • सेवा अब सामान्य स्थिति में लौट आई है, और अतिरिक्त विश्लेषण रिपोर्ट बाद में जारी की जाएगी

2 टिप्पणियां

 
joyfui 2026-02-10

आज तड़के GitHub पर जो errors आ रहे थे, वो सिर्फ मेरे साथ ही नहीं हो रहा था।

 
GN⁺ 2026-02-10
Hacker News की राय
  • GitHub अब service uptime statistics प्रकाशित नहीं करता, इसलिए मैंने खुद डेटा parse किया।
    अभी पूरी service के हिसाब से यह ‘single 9’ स्तर का लगता है।
    इसे GitHub Statuses page पर देखा जा सकता है।

    • इससे पुराना GitHub status page याद आ गया। उस समय वह असली uptime को पारदर्शी तरीके से दिखाता था, और जैसे ही उसने सच दिखाया, उसका आज वाले page में बदल जाना हैरान करने वाला नहीं है।
      archive.org link description भी अच्छी लगी।
    • पूरी service के आधार पर इसे ‘single 9’ कहना uptime calculation method के हिसाब से मायने नहीं रखता।
      हर domain के अलग-अलग आँकड़े ठीक हैं, लेकिन सभी services को एक metric में जोड़ना बेकार है।
      ज़्यादातर 99.5% से ऊपर हैं, सिर्फ Copilot अपवाद लगता है।
    • Copilot का कुल आँकड़ा सबसे कम होना दिलचस्प है।
      मैं इसे रोज़ इस्तेमाल करता हूँ लेकिन शायद ही कभी कोई समस्या महसूस हुई। शायद incident registration timing देर से reflect होता है।
    • आज के downtime को ‘minor’ के रूप में classify किया गया, यह समझ नहीं आता।
      web UI लगभग काम ही नहीं कर रहा था, इसलिए सोचता हूँ क्या GitHub incident severity को कम करके दिखा रहा है।
    • शानदार project है। इसे साझा करने के लिए धन्यवाद।
  • कुछ साल पहले तक मुझे नहीं लगा था कि GitHub की dominance पर कभी खतरा आएगा।
    लेकिन अगर operations ऐसे ही अस्थिर रहे, तो यह industry का एक बड़ा self-inflicted wound बनकर दर्ज होगा।

    • पिछले साल Azure की ‘existential’ migration के बाद से uptime एक-दो स्तर गिरा हुआ लगता है।
    • अभी मैं GitLab docs का “Migrate from GitHub” page देख रहा हूँ।
      अगर issues और projects भी migrate किए जा सकते हैं, तो मैं गंभीरता से shift होने का सोच रहा हूँ।
    • यह सिर्फ operations की समस्या नहीं, बल्कि architecture और code quality की समस्या भी लगती है।
      GitHub Enterprise self-hosted product को देखकर उसकी complexity समझी जा सकती है।
    • कोई ठोस आधार नहीं है, लेकिन अंदाज़ा है कि हाल की बार-बार की outages शायद AI-centric strategy का side effect भी हो सकती हैं।
    • मुझे लगता है Microsoft ने इसे Azure पर force migrate किया और AI workloads को प्राथमिकता दी।
      GitHub दुनिया भर के developer data की golden goose है, लेकिन अगर यह ऐसे ही अस्थिर रहा तो पूरा franchise ही खतरे में पड़ सकता है।
      Windows 11 भी अच्छा नहीं है, और GitHub शायद modern development की बुनियाद वाली भूमिका खो सकता है।
  • मैं Caddy के security bug को संभाल रहा था, तभी GitHub down हो गया और report खोलने पर सिर्फ unicorn page दिख रहा था।
    बच्चे के बिना मिले 2 घंटों में ध्यान लगाकर काम करना चाहता था, लेकिन इस outage की वजह से feedback loop कल तक टल जाने की चिंता है।
    फिर भी GitHub Sponsors की वजह से आजीविका चल रही है, इसलिए आभारी हूँ।

    • जानना चाहता हूँ कि वह security bug क्या है।
    • क्या आपने कभी alternative platform पर विचार किया है? मैं personal server चलाता हूँ, इसलिए security मेरे लिए महत्वपूर्ण है।
  • GitHub को धीरे-धीरे टुकड़ों में बिखरते और फटते हुए real time में देखा जा सकता है।
    GitHub Status History page लगभग comedy जैसा लगता है।

    • आज 9 फ़रवरी है, और पहले ही 14 incidents हो चुके हैं।
      AI industry के ‘messiah’ चरण को फिर इस तरह गुजरते देखना विडंबनापूर्ण है।
      संबंधित लेख: The Verge link
    • मज़ाक में कहा गया कि इस trend को पलटना है तो और vibe coding करनी होगी।
    • फिर भी यह अच्छी बात है कि GitHub इसे पारदर्शी रूप से सार्वजनिक करता है।
      downtime छिपाया नहीं जा रहा, इसलिए प्रतिक्रिया देना संभव है, और शायद जल्द ही postmortem भी आएगा।
    • Azure migration पूरी होने तक ऐसा चलता रहेगा, ऐसा लगता है।
    • अच्छा होता अगर GitHub profile के contribution graph की तरह इसका yearly visualization भी होता।
  • इस साल GitHub पर incidents इतने ज़्यादा रहे हैं कि वह लगभग हर दिन status page अपडेट कर रहा है।
    status history देखें तो, इतनी बड़ी service के लिए भी यह सामान्य नहीं है।
    यहाँ तक मज़ाक है कि हर दिन शाम 4 बजे के आसपास GitHub Actions रुक जाता है।
    अच्छा होगा अगर वे अंदरूनी तौर पर कारण और उपाय साझा करें।

    • coding agents आने के बाद operational traffic 100 गुना बढ़ गया हो, इसकी पूरी संभावना है।
      GitHub मूल रूप से किसी और scale को ध्यान में रखकर design किया गया था, और अचानक उस पर बिल्कुल नए स्तर का load आ गया।
  • status page पर शुरुआत में सिर्फ notification delay दिखाया गया था, लेकिन असल में PR access करते समय unicorn page बार-बार आ रहा था।
    बाद में PR के लिए अलग status page बना, और आखिरकार मामला पूरी service की समस्या तक फैल गया।
    related incident link

    • “कुछ services के performance degradation की जाँच चल रही है” वाला item जोड़ा गया।
      UTC 16:10 पर यह नहीं था, लेकिन कुछ मिनट बाद दिखने लगा।
    • PR approve करते समय JSON API ने HTML error page लौटाया। अंदर सब कुछ पूरी तरह उलझा हुआ लगता है।
    • मैं भी 500 errors बार-बार देख रहा हूँ। latency भी बहुत बढ़ गई है।
      monitoring link
    • commit details खोलने पर भी सिर्फ unicorn page दिखता है।
    • git command खुद भी काम नहीं कर रही।
  • पिछले कुछ हफ़्तों में मैंने Forgejo पर migration पूरा कर लिया।
    हमारी company बड़े cloud पर निर्भरता कम करना चाहती थी, इसलिए GitHub/Azure outage की वजह से core infrastructure रुक जाना स्वीकार्य नहीं था।
    transition काफ़ी smooth रहा, और हम कुछ custom development भी कर रहे हैं।

    1. हमने Firecracker-आधारित runner बनाया ताकि Forgejo Actions में VM environment पर CI चल सके
    2. environment variable group feature जोड़ने का proposal तैयार कर रहे हैं
      community बहुत स्वागतपूर्ण है, इसलिए उम्मीद है कि Forgejo और बढ़े।
      company link, proposal discussion link
    • अगर आप London में हैं, तो .eu domain क्यों इस्तेमाल करते हैं, server location क्या है, और hosting provider कौन है, यह जानना चाहूँगा।
  • GitHub की instability अब बर्दाश्त के बाहर है।
    अगर आगे चलकर code repository चुनने पर मेरा प्रभाव हुआ, तो मैं GitHub से बचने की सलाह दूँगा।

    • features दूसरी forges में भी काफ़ी हद तक replace की जा सकती हैं।
      लेकिन GitHub की discoverability और social signals (stars, forks) अब भी आकर्षक हैं।
      internal forge (GitLab, Gitea आदि) इस्तेमाल करके GitHub पर mirror करना एक व्यावहारिक तरीका है।
      विडंबना यह है कि अगर GitHub बेहतर होता, तो मैं paid plan लेता; अभी मैं सिर्फ free plan इस्तेमाल करता हूँ और पैसे कहीं और खर्च करता हूँ।
  • पिछले 3 महीनों में 3 बड़े outages हो चुके हैं।
    status history में यह साफ़ लिखा है।

    • जानना चाहता हूँ कि हाल में team से कौन गया है। क्या कोई key knowledge holder चला गया, या operations किसी दूसरे region में shift किए गए?
    • 2 हफ्ते बाद MVP launch है, और फिर outage! यह बहुत निराशाजनक है। reliability बहुत गिर गई है।
    • साथ में मज़ाक भी किया गया कि कहीं यह भी vibe coding की वजह से तो नहीं।
  • अभी की स्थिति देखकर लगता है जैसे AI ने engineers को replace कर दिया हो।

    • जवाब में मज़ाक आया: “हाँ, माफ़ करना। मैंने तुम्हारा database delete कर दिया।”
    • असल में मेरी जानकारी के अनुसार GitHub अभी Microsoft Azure पर migrate हो रहा है, इसलिए ऐसा downtime हो रहा है।
    • यह मानो Tay.ai और Zoe.ai अंदर ही अंदर लड़ रहे हों और service संभाल ही न पा रहे हों, ऐसा व्यंग्य है।