- हाल में GitHub की बार-बार होने वाली सेवा बाधाएँ जारी रहने से, इंडस्ट्री मानक ‘5 nines(99.999%)’ तो दूर, ‘3 nines(99.9%)’ हासिल करना भी मुश्किल लग रहा है
- 9 फ़रवरी को Actions, Pull Request, सूचनाएँ, Copilot जैसे प्रमुख फ़ीचर्स में एक साथ गड़बड़ी हुई, और कुछ सेवाओं में कई घंटों से अधिक की देरी हुई
- Copilot policy propagation issue के कारण कुछ उपयोगकर्ताओं ने 10 फ़रवरी की सुबह तक मॉडल दिखने में त्रुटि का अनुभव किया
- GitHub ने status page की संरचना बदल दी, जिससे पिछले 90 दिनों की availability को ट्रैक करना मुश्किल हो गया, और अनौपचारिक डेटा में availability के 90% से नीचे जाने के समय भी दिखे
- Enterprise Cloud SLA में 99.9% uptime का उल्लेख है, लेकिन यह वास्तव में सभी उपयोगकर्ताओं को गारंटी नहीं देता, इसलिए downtime को ध्यान में रखकर ऑपरेशन रणनीति की ज़रूरत बढ़ गई है
GitHub की घटती उपलब्धता और बार-बार सेवा बाधाएँ
- cloud services में बार-बार होने वाली outages आम होती जा रही हैं, और GitHub भी स्थिरता की समस्याओं से जूझ रहा है
- “ऐसा दिन कम ही होता है जब outage न हो” जैसी अभिव्यक्ति सामने आई, और ‘5 nines(99.999%)’ तो दूर, ‘1 nine(90%)’ भी मुश्किल बताया गया
- 9 फ़रवरी (UTC के अनुसार) GitHub के प्रमुख फ़ीचर Actions, Pull Request, सूचनाएँ, Copilot सभी प्रभावित हुए
- GitHub ने लगभग 15:54 बजे घोषणा की कि “कुछ सेवाओं में समस्या है”, और बताया कि सूचनाओं में लगभग 50 मिनट की देरी है
- 17:57 बजे देरी घटकर लगभग 30 मिनट रह गई, और 19:29 बजे सामान्य होने की सूचना दी गई
- Copilot से जुड़ी गड़बड़ी अधिक समय तक चली
- 9 फ़रवरी 16:29 बजे से 10 फ़रवरी 9:57 बजे तक कुछ उपयोगकर्ताओं के लिए Copilot policy propagation issue हुआ
- इसके कारण नए सक्रिय किए गए मॉडल उपयोगकर्ताओं को दिखाई नहीं दे रहे थे
- GitHub ने status page की संरचना बदल दी, जिससे पिछले 90 दिनों की availability को ट्रैक करना मुश्किल हो गया
- विस्तृत जानकारी दी जाती है, लेकिन यह ऐसे रूप में बदल गया है जिसमें समग्र uptime trend को दृश्य रूप से समझना कठिन है
- अनौपचारिक restoration page(mrshu.github.io/github-statuses/) के डेटा में 2025 में एक समय availability के 90% से नीचे गिरने का बिंदु दिखता है
- GitHub के Enterprise Cloud SLA में 99.9% uptime का उल्लेख है, लेकिन यह सभी उपयोगकर्ताओं को गारंटी नहीं देता
- इंडस्ट्री में ‘5 nines’ को आदर्श मानक माना जाता है, लेकिन कुछ कंपनियों के लिए 90% बनाए रखना भी मुश्किल माना जा रहा है
- यह स्थिति संकेत देती है कि ग्राहकों को downtime को आधार मानकर ऑपरेशन प्लान तैयार करना चाहिए
संबंधित संदर्भ और उदाहरण
- GitHub हाल में AI फ़ीचर्स और policy changes को लेकर कई विवादों से गुज़रा है
- Pull Request के लिए AI code blocking ‘kill switch’ पर विचार
-
self-hosted runner pricing plan वापस लेना
- ऐसा मामला भी है जहाँ Zig भाषा परियोजना ने Microsoft की AI-केंद्रित नीति के कारण GitHub छोड़ दिया
- इन घटनाओं के साथ सेवा स्थिरता में गिरावट भी डेवलपर समुदाय की नाराज़गी बढ़ाने वाला कारक बन रही है
निष्कर्ष
- GitHub की हालिया गड़बड़ियाँ ‘तीन 9 (99.9%)’ तक हासिल करना भी कठिन होने वाली availability समस्या को उजागर करती हैं
- Copilot जैसे मुख्य फ़ीचर्स की अस्थिरता जारी रहने से, cloud-based development platforms की reliability सुनिश्चित करना एक महत्वपूर्ण चुनौती बनकर उभरा है
- downtime के लिए रणनीति तैयार करने की ज़रूरत पर फिर ज़ोर दिया गया है
5 टिप्पणियां
GitHub एक मुफ्त सेवा है, ऐसे में उससे high availability की उम्मीद करना ही...
अगर KakaoTalk में आउटेज हो जाए तब भी क्या आप यही बात कहेंगे...
git reset --hardकर दें तो शायद हो जाएगाबस GitHub आउटेज न हो, तो अभी जैसा है वैसा ही अच्छा है
Hacker News की राय
GitHub की uptime समस्या निश्चित रूप से गंभीर है, लेकिन सिर्फ इसलिए कि सभी फीचर एक साथ रुक गए, यह कहना कि “पूरा GitHub डाउन हो गया” मुझे कुछ ज़्यादा लगता है
मैं Copilot का लगभग इस्तेमाल नहीं करता, इसलिए वह सेवा बार-बार बंद भी हो जाए तो मुझे खास फर्क नहीं पड़ता
असल में महत्वपूर्ण बात Git, वेबसाइट, API, Actions जैसे core फीचर्स की स्थिरता है
GitHub के Enterprise SLA के अनुसार हर सेवा के लिए कम-से-कम 99.9% की गारंटी होनी चाहिए, और वास्तविक आँकड़े यहाँ देखे जा सकते हैं
Copilot लगभग एक 9 के स्तर पर है, और core services Git और Actions भी कुछ ऐसे ही हैं
इतने संसाधनों वाली कंपनी का ग्राहकों को यूँ छोड़ देना किसी भी तरह से सही नहीं ठहराया जा सकता
असल में error responses को भी “सामान्य संचालन” में गिन लिया जाता है
network industry की तरह सचमुच 99.999% हासिल करना बहुत दुर्लभ है, और ज्यादातर जगह data slicing tricks से status page को हरा बनाए रखा जाता है
2025 में जब GitHub CTO ने कहा था कि “पूरी तरह Azure पर migration” करके reliability बढ़ाई जाएगी, तभी से बेचैनी थी
पहले community चिल्लाती थी कि “नए फीचर जल्दी जोड़ो”, लेकिन अब stability और reliability कहीं ज़्यादा जरूरी हैं
GitHub इस समय Azure migration, AI-आधारित infrastructure changes, और AI traffic explosion की तिहरी मार झेल रहा है
लोकप्रिय projects में issue दर्ज होने के कुछ ही मिनटों में AI द्वारा बनाए गए दर्जनों PR आने लगते हैं
ऐसा load संभालना कठिन है, और AI से पहले वाले “N 9s” और बाद वाले “N 9s” की कठिनाई बिल्कुल अलग है
GitHub के status page को देखें तो यह वास्तव में 90.21% है, यानी सिर्फ एक 9 के स्तर पर
पुराने 2019 archive में जहाँ महीने में 1~4 outages होते थे, अब हालत यह है कि लगभग रोज़ एक बार कुछ न कुछ गड़बड़ होती है
जब GitHub AI features पर अटका हुआ है, उसी दौरान platform की security बिखर रही है
हाल ही में Aqua Security पर हमला हुआ और कई repos संक्रमित हुए, यह GitHub Actions की mutable reference vulnerability का फायदा उठाने का मामला था
GitHub इस समस्या को जानता था, फिर भी उसने इसे ठीक नहीं किया
उदाहरण:
uses: actions/checkout@11bd7190...automation tool के लिए mheap/pin-github-action देखें
पहले deployments Jenkins से हो जाते थे, और साधारण tests script से चल जाते थे, लेकिन अब यह बिखरा हुआ YAML hell बन गया है
90% uptime का आँकड़ा सभी services को मिलाकर है, इसलिए वास्तविक अनुभव अलग हो सकता है
लेकिन Copilot का 96.47% भी सिर्फ एक 9 के बराबर है
GitHub कहता है कि “सभी फीचर्स साथ में इस्तेमाल करो”, लेकिन ऐसा करते ही reliability तेजी से गिरती है
उदाहरण के लिए, साधारण PR diff खोलने में भी 30 सेकंड से अधिक लग जाते हैं
ऐसे मामले भी रहे हैं जहाँ CI/CD, git, और PR फीचर सब बंद हो गए थे
जिसने GitHub Enterprise Server को खुद चलाया है, उसके नज़रिए से ये समस्याएँ चौंकाने वाली नहीं हैं
Active-active support नहीं, downtime के बिना upgrade नहीं, rollback नहीं — यानी basic high availability requirements तक पूरी नहीं होतीं
अगर bug आ जाए तो backup restore के अलावा कोई उपाय नहीं होता, और उस प्रक्रिया में data loss भी हो जाता है
ऐसे product को महंगे enterprise ग्राहकों को बेचना availability के प्रति उदासीनता का सबूत है
Microsoft में अच्छे products को खराब कर देने की प्रतिभा है
Skype इसका सबसे बड़ा उदाहरण है, और Windows, Notepad, Explorer भी अलग नहीं हैं
Office → Office 365 → Microsoft 365 → Copilot 365 तक का branding confusion भी बहुत गंभीर है
हमारी कंपनी हर PR पर GitHub Actions से security scan चलाती है
GitHub रुक जाए तो security gate भी रुक जाता है, और developers बिना verification के merge कर देते हैं
ऐसी स्थिति में vulnerable code अंदर आ जाता है, फिर भी GitHub अपनी engineering capacity Copilot पर ही लगा रहा है
IPv6 की अनदेखी GitHub की तकनीकी लापरवाही का प्रतीक है
इससे भी बड़ा सवाल यह है कि ऐसी स्थिति में भी यह security audits कैसे पास कर लेता है
GitHub के security documents देखें तो वे बस औपचारिकता जैसे लगते हैं