- कुछ GitHub सेवाओं में प्रदर्शन में गिरावट की रिपोर्ट की गई, और नोटिफिकेशन की डिलीवरी में देरी हुई
- औसत देरी शुरू में लगभग 50 मिनट से बढ़कर अधिकतम 1 घंटा 20 मिनट तक पहुंची
- इसके बाद धीरे-धीरे रिकवरी हुई, और देरी 1 घंटा → 30 मिनट → 15 मिनट स्तर तक घट गई
- UTC के अनुसार 9 फ़रवरी 2026, 19:29 पर समस्या का समाधान और घटना समाप्त होने की रिपोर्ट दी गई
- GitHub ने कहा है कि वह Root Cause Analysis (RCA) बाद में प्रकाशित करेगा
GitHub नोटिफिकेशन देरी घटना का सारांश
- GitHub ने बताया कि उसकी कुछ सेवाओं में प्रदर्शन में गिरावट आई थी
- शुरुआती चरण में नोटिफिकेशन की डिलीवरी सामान्य रूप से नहीं हो रही थी
- समस्या के कारण की जांच जारी थी
नोटिफिकेशन देरी की प्रगति
- पहले अपडेट में औसतन 50 मिनट की देरी होने की बात कही गई
- GitHub ने बताया कि वह mitigation उपायों पर काम कर रहा है
- बाद के अपडेट में देरी 1 घंटा 20 मिनट तक बढ़ गई, लेकिन रिकवरी के संकेत दिखाई दिए
- धीरे-धीरे रिकवरी होने पर देरी का समय 1 घंटा → 30 मिनट → 15 मिनट तक कम हुआ
- बताया गया कि backlog (जमा हुए नोटिफिकेशन) को प्रोसेस किया जा रहा था
- अंततः नोटिफिकेशन देरी की समस्या का समाधान हो गया और सामान्य डिलीवरी फिर शुरू हो गई
घटना का समापन और आगे की कार्रवाई
- UTC के अनुसार 9 फ़रवरी 2026, 19:29 पर घटना पूरी तरह हल हो गई
- GitHub ने उपयोगकर्ताओं के धैर्य और समझ के लिए आभार व्यक्त किया
- Root Cause Analysis के नतीजे तैयार होते ही प्रकाशित किए जाएंगे
उपयोगकर्ता अलर्ट और subscription फीचर
- उपयोगकर्ता ईमेल, SMS, Slack, Webhook आदि के जरिए घटना अपडेट subscribe कर सकते हैं
- subscribe करते समय GitHub और Atlassian की privacy policy और service terms से सहमत होना होगा
- साइट Google reCAPTCHA से सुरक्षित है
सारांश
- यह घटना GitHub की नोटिफिकेशन सिस्टम देरी समस्या से जुड़ी थी, जिसमें लगभग 4 घंटे तक चरणबद्ध रिकवरी हुई
- सेवा अब सामान्य स्थिति में लौट आई है, और अतिरिक्त विश्लेषण रिपोर्ट बाद में जारी की जाएगी
2 टिप्पणियां
आज तड़के GitHub पर जो errors आ रहे थे, वो सिर्फ मेरे साथ ही नहीं हो रहा था।
Hacker News की राय
GitHub अब service uptime statistics प्रकाशित नहीं करता, इसलिए मैंने खुद डेटा parse किया।
अभी पूरी service के हिसाब से यह ‘single 9’ स्तर का लगता है।
इसे GitHub Statuses page पर देखा जा सकता है।
archive.org link description भी अच्छी लगी।
हर domain के अलग-अलग आँकड़े ठीक हैं, लेकिन सभी services को एक metric में जोड़ना बेकार है।
ज़्यादातर 99.5% से ऊपर हैं, सिर्फ Copilot अपवाद लगता है।
मैं इसे रोज़ इस्तेमाल करता हूँ लेकिन शायद ही कभी कोई समस्या महसूस हुई। शायद incident registration timing देर से reflect होता है।
web UI लगभग काम ही नहीं कर रहा था, इसलिए सोचता हूँ क्या GitHub incident severity को कम करके दिखा रहा है।
कुछ साल पहले तक मुझे नहीं लगा था कि GitHub की dominance पर कभी खतरा आएगा।
लेकिन अगर operations ऐसे ही अस्थिर रहे, तो यह industry का एक बड़ा self-inflicted wound बनकर दर्ज होगा।
अगर issues और projects भी migrate किए जा सकते हैं, तो मैं गंभीरता से shift होने का सोच रहा हूँ।
GitHub Enterprise self-hosted product को देखकर उसकी complexity समझी जा सकती है।
GitHub दुनिया भर के developer data की golden goose है, लेकिन अगर यह ऐसे ही अस्थिर रहा तो पूरा franchise ही खतरे में पड़ सकता है।
Windows 11 भी अच्छा नहीं है, और GitHub शायद modern development की बुनियाद वाली भूमिका खो सकता है।
मैं Caddy के security bug को संभाल रहा था, तभी GitHub down हो गया और report खोलने पर सिर्फ unicorn page दिख रहा था।
बच्चे के बिना मिले 2 घंटों में ध्यान लगाकर काम करना चाहता था, लेकिन इस outage की वजह से feedback loop कल तक टल जाने की चिंता है।
फिर भी GitHub Sponsors की वजह से आजीविका चल रही है, इसलिए आभारी हूँ।
GitHub को धीरे-धीरे टुकड़ों में बिखरते और फटते हुए real time में देखा जा सकता है।
GitHub Status History page लगभग comedy जैसा लगता है।
AI industry के ‘messiah’ चरण को फिर इस तरह गुजरते देखना विडंबनापूर्ण है।
संबंधित लेख: The Verge link
downtime छिपाया नहीं जा रहा, इसलिए प्रतिक्रिया देना संभव है, और शायद जल्द ही postmortem भी आएगा।
इस साल GitHub पर incidents इतने ज़्यादा रहे हैं कि वह लगभग हर दिन status page अपडेट कर रहा है।
status history देखें तो, इतनी बड़ी service के लिए भी यह सामान्य नहीं है।
यहाँ तक मज़ाक है कि हर दिन शाम 4 बजे के आसपास GitHub Actions रुक जाता है।
अच्छा होगा अगर वे अंदरूनी तौर पर कारण और उपाय साझा करें।
GitHub मूल रूप से किसी और scale को ध्यान में रखकर design किया गया था, और अचानक उस पर बिल्कुल नए स्तर का load आ गया।
status page पर शुरुआत में सिर्फ notification delay दिखाया गया था, लेकिन असल में PR access करते समय unicorn page बार-बार आ रहा था।
बाद में PR के लिए अलग status page बना, और आखिरकार मामला पूरी service की समस्या तक फैल गया।
related incident link
UTC 16:10 पर यह नहीं था, लेकिन कुछ मिनट बाद दिखने लगा।
monitoring link
gitcommand खुद भी काम नहीं कर रही।पिछले कुछ हफ़्तों में मैंने Forgejo पर migration पूरा कर लिया।
हमारी company बड़े cloud पर निर्भरता कम करना चाहती थी, इसलिए GitHub/Azure outage की वजह से core infrastructure रुक जाना स्वीकार्य नहीं था।
transition काफ़ी smooth रहा, और हम कुछ custom development भी कर रहे हैं।
community बहुत स्वागतपूर्ण है, इसलिए उम्मीद है कि Forgejo और बढ़े।
company link, proposal discussion link
GitHub की instability अब बर्दाश्त के बाहर है।
अगर आगे चलकर code repository चुनने पर मेरा प्रभाव हुआ, तो मैं GitHub से बचने की सलाह दूँगा।
लेकिन GitHub की discoverability और social signals (stars, forks) अब भी आकर्षक हैं।
internal forge (GitLab, Gitea आदि) इस्तेमाल करके GitHub पर mirror करना एक व्यावहारिक तरीका है।
विडंबना यह है कि अगर GitHub बेहतर होता, तो मैं paid plan लेता; अभी मैं सिर्फ free plan इस्तेमाल करता हूँ और पैसे कहीं और खर्च करता हूँ।
पिछले 3 महीनों में 3 बड़े outages हो चुके हैं।
status history में यह साफ़ लिखा है।
अभी की स्थिति देखकर लगता है जैसे AI ने engineers को replace कर दिया हो।