- GitHub status page फिलहाल All Systems Operational दिखा रहा है, और 27 मई 2026 के लिए कोई reported incident नहीं है
- पिछले 90 दिनों के आधार पर सभी प्रमुख components Operational हैं, और Actions uptime 99.66% तथा Pull Requests 99.55% है
- 26 मई को Actions और Pages में authentication issue के कारण execution start और action download failures हुए, जिससे अधिकांश Actions runs प्रभावित हुए
- 20 मई को Actions delay का कारण गलत तरीके से configured health check था, जिससे कुल runs के 4.5% और scale set jobs के 30% में देरी हुई
- 15 मई को Actions degradation planned failover के दौरान routing issue की वजह से हुआ, और peak समय पर 42% runs fail हुए
वर्तमान सेवा स्थिति
- GitHub status page फिलहाल All Systems Operational के रूप में दिखाया गया है
- 27 मई 2026 के लिए कोई reported incident नहीं दिखाया गया है
- पिछले 90 दिनों के आधार पर सभी प्रमुख components Operational स्थिति में हैं
- Git Operations: 99.83% uptime
- Webhooks: 99.73% uptime
- API Requests: 99.98% uptime
- Issues: 99.86% uptime
- Pull Requests: 99.55% uptime
- Actions: 99.66% uptime
- Packages: 99.98% uptime
- Pages: 99.96% uptime
- Copilot: 99.91% uptime
- Codespaces: 99.77% uptime
- Copilot AI Model Providers: 100.0% uptime
- GitHub Enterprise Cloud के region-wise status pages भी अलग से दिए गए हैं
26 मई 2026 का Actions और Pages incident
-
- 10:57 UTC पर Actions और Pages performance degradation की जांच शुरू हुई
- 11:19 UTC पर Actions की availability degradation की पुष्टि हुई
- 11:53 UTC पर Actions execution start failures और action download failures पैदा करने वाले authentication issue की जांच चल रही थी, और उस समय अधिकांश Actions runs प्रभावित थे
- 12:37 UTC पर GitHub Actions को प्रभावित करने वाले authentication issue का कारण पहचान लिया गया और mitigation का काम शुरू हुआ
- 13:00 UTC पर Actions और Pages degradation को कम कर दिया गया और stability verification के लिए monitoring मोड में ले जाया गया
- 13:18 UTC पर incident resolve हो गया, और विस्तृत root cause analysis तैयार होने पर साझा किया जाएगा
20 मई 2026 का Actions incident
-
- 16:00 से 17:45 UTC के बीच GitHub Actions ग्राहकों को 5 मिनट से अधिक execution start delay का सामना करना पड़ा
- प्रभाव की अवधि में कुल runs का लगभग 4.5% delayed था, और scale set jobs पर इससे अधिक असर पड़ा
- scale set jobs का 30% delayed था और 4% बिल्कुल शुरू ही नहीं हो पाया
- कारण runners को jobs assign करने वाली internal service में गलत तरीके से configured health check था
- upper dependency में थोड़े समय की latency spike ने कई pods में health check failures ट्रिगर किए, जिससे वे pods service से हट गए और बची हुई capacity पर load केंद्रित हो गया
- अतिरिक्त load से memory pressure पैदा हुआ, और एक regional cluster में cascading failure बढ़ता गया जिससे self-recovery संभव नहीं रही
- response के तहत healthy regional cluster की capacity बढ़ाई गई और impaired regional cluster से traffic हटाया गया, जिसके बाद execution start delay recover हो गया
- recurrence रोकने के लिए health check configuration को cascading failure scenarios से बचने लायक मजबूत किया जा रहा है, और regional degradation के समय traffic redistribute करने वाले automatic mitigations का मूल्यांकन किया जा रहा है
- 20:14 UTC पर incident resolve हो गया
15 मई 2026 की Actions availability degradation
-
- 07:43 से 08:48 UTC के बीच GitHub Actions में कुछ ग्राहकों के workflow execution failures या start delays हुए
- incident की शुरुआत GitHub Actions द्वारा उपयोग की जाने वाली supporting infrastructure के planned failover के दौरान हुई
- failover के दौरान automatic service discovery update सही ढंग से propagate नहीं हुआ, जिससे traffic गलत तरीके से route हुआ और workflow orchestration की एक critical dependency में request timeouts बढ़ गए
- अधिकतम प्रभाव के समय Actions runs का 42% fail हुआ
- Actions workflow execution पर निर्भर downstream services भी प्रभावित हुईं, जिनमें GitHub Pages और Copilot cloud services शामिल थे
- 08:12 UTC पर responders ने service discovery routing issue को manually ठीक किया
- timeouts और failure rate जल्द ही recover हो गए, और सभी प्रभावित services के stabilize होने तक monitoring जारी रही
- recurrence रोकने के लिए failover पूरा होने से पहले service discovery state को validate करने वाले failover guardrails, stronger pre- और post-validation, और infrastructure events के दौरान timeout cascades कम करने के लिए dependency resilience improvements पर काम चल रहा है
- 08:48 UTC पर incident resolve हो गया
1 टिप्पणियां
Hacker News की राय