4 पॉइंट द्वारा GN⁺ 2026-03-24 | 5 टिप्पणियां | WhatsApp पर शेयर करें
  • हाल में GitHub की बार-बार होने वाली सेवा बाधाएँ जारी रहने से, इंडस्ट्री मानक ‘5 nines(99.999%)’ तो दूर, ‘3 nines(99.9%)’ हासिल करना भी मुश्किल लग रहा है
  • 9 फ़रवरी को Actions, Pull Request, सूचनाएँ, Copilot जैसे प्रमुख फ़ीचर्स में एक साथ गड़बड़ी हुई, और कुछ सेवाओं में कई घंटों से अधिक की देरी हुई
  • Copilot policy propagation issue के कारण कुछ उपयोगकर्ताओं ने 10 फ़रवरी की सुबह तक मॉडल दिखने में त्रुटि का अनुभव किया
  • GitHub ने status page की संरचना बदल दी, जिससे पिछले 90 दिनों की availability को ट्रैक करना मुश्किल हो गया, और अनौपचारिक डेटा में availability के 90% से नीचे जाने के समय भी दिखे
  • Enterprise Cloud SLA में 99.9% uptime का उल्लेख है, लेकिन यह वास्तव में सभी उपयोगकर्ताओं को गारंटी नहीं देता, इसलिए downtime को ध्यान में रखकर ऑपरेशन रणनीति की ज़रूरत बढ़ गई है

GitHub की घटती उपलब्धता और बार-बार सेवा बाधाएँ

  • cloud services में बार-बार होने वाली outages आम होती जा रही हैं, और GitHub भी स्थिरता की समस्याओं से जूझ रहा है
    • “ऐसा दिन कम ही होता है जब outage न हो” जैसी अभिव्यक्ति सामने आई, और ‘5 nines(99.999%)’ तो दूर, ‘1 nine(90%)’ भी मुश्किल बताया गया
  • 9 फ़रवरी (UTC के अनुसार) GitHub के प्रमुख फ़ीचर Actions, Pull Request, सूचनाएँ, Copilot सभी प्रभावित हुए
    • GitHub ने लगभग 15:54 बजे घोषणा की कि “कुछ सेवाओं में समस्या है”, और बताया कि सूचनाओं में लगभग 50 मिनट की देरी है
    • 17:57 बजे देरी घटकर लगभग 30 मिनट रह गई, और 19:29 बजे सामान्य होने की सूचना दी गई
  • Copilot से जुड़ी गड़बड़ी अधिक समय तक चली
    • 9 फ़रवरी 16:29 बजे से 10 फ़रवरी 9:57 बजे तक कुछ उपयोगकर्ताओं के लिए Copilot policy propagation issue हुआ
    • इसके कारण नए सक्रिय किए गए मॉडल उपयोगकर्ताओं को दिखाई नहीं दे रहे थे
  • GitHub ने status page की संरचना बदल दी, जिससे पिछले 90 दिनों की availability को ट्रैक करना मुश्किल हो गया
    • विस्तृत जानकारी दी जाती है, लेकिन यह ऐसे रूप में बदल गया है जिसमें समग्र uptime trend को दृश्य रूप से समझना कठिन है
    • अनौपचारिक restoration page(mrshu.github.io/github-statuses/) के डेटा में 2025 में एक समय availability के 90% से नीचे गिरने का बिंदु दिखता है
  • GitHub के Enterprise Cloud SLA में 99.9% uptime का उल्लेख है, लेकिन यह सभी उपयोगकर्ताओं को गारंटी नहीं देता
    • इंडस्ट्री में ‘5 nines’ को आदर्श मानक माना जाता है, लेकिन कुछ कंपनियों के लिए 90% बनाए रखना भी मुश्किल माना जा रहा है
    • यह स्थिति संकेत देती है कि ग्राहकों को downtime को आधार मानकर ऑपरेशन प्लान तैयार करना चाहिए

संबंधित संदर्भ और उदाहरण

  • GitHub हाल में AI फ़ीचर्स और policy changes को लेकर कई विवादों से गुज़रा है
    • Pull Request के लिए AI code blocking ‘kill switch’ पर विचार
    • self-hosted runner pricing plan वापस लेना

      • ऐसा मामला भी है जहाँ Zig भाषा परियोजना ने Microsoft की AI-केंद्रित नीति के कारण GitHub छोड़ दिया
      • इन घटनाओं के साथ सेवा स्थिरता में गिरावट भी डेवलपर समुदाय की नाराज़गी बढ़ाने वाला कारक बन रही है

निष्कर्ष

  • GitHub की हालिया गड़बड़ियाँ ‘तीन 9 (99.9%)’ तक हासिल करना भी कठिन होने वाली availability समस्या को उजागर करती हैं
  • Copilot जैसे मुख्य फ़ीचर्स की अस्थिरता जारी रहने से, cloud-based development platforms की reliability सुनिश्चित करना एक महत्वपूर्ण चुनौती बनकर उभरा है
  • downtime के लिए रणनीति तैयार करने की ज़रूरत पर फिर ज़ोर दिया गया है

5 टिप्पणियां

 
elbanic 2026-03-26

GitHub एक मुफ्त सेवा है, ऐसे में उससे high availability की उम्मीद करना ही...

 
cosine20 2026-03-27

अगर KakaoTalk में आउटेज हो जाए तब भी क्या आप यही बात कहेंगे...

 
malkeu 2026-03-26

git reset --hard कर दें तो शायद हो जाएगा

 
master6559 2026-03-25

बस GitHub आउटेज न हो, तो अभी जैसा है वैसा ही अच्छा है

 
GN⁺ 2026-03-24
Hacker News की राय
  • GitHub की uptime समस्या निश्चित रूप से गंभीर है, लेकिन सिर्फ इसलिए कि सभी फीचर एक साथ रुक गए, यह कहना कि “पूरा GitHub डाउन हो गया” मुझे कुछ ज़्यादा लगता है
    मैं Copilot का लगभग इस्तेमाल नहीं करता, इसलिए वह सेवा बार-बार बंद भी हो जाए तो मुझे खास फर्क नहीं पड़ता
    असल में महत्वपूर्ण बात Git, वेबसाइट, API, Actions जैसे core फीचर्स की स्थिरता है

    • सहमत हूँ। लेकिन पिछले 90 दिनों में कोई भी individual service 3x9(99.9%) uptime हासिल नहीं कर पाई
      GitHub के Enterprise SLA के अनुसार हर सेवा के लिए कम-से-कम 99.9% की गारंटी होनी चाहिए, और वास्तविक आँकड़े यहाँ देखे जा सकते हैं
    • “GitHub डाउन हो गया” कहना बढ़ा-चढ़ाकर कहना है, यह सही है, लेकिन हकीकत में API भी सिर्फ 99.69% पर है, यानी सिर्फ दो 9
      Copilot लगभग एक 9 के स्तर पर है, और core services Git और Actions भी कुछ ऐसे ही हैं
    • यह कंपनी 1 ट्रिलियन डॉलर की global company के पोर्टफोलियो का हिस्सा है
      इतने संसाधनों वाली कंपनी का ग्राहकों को यूँ छोड़ देना किसी भी तरह से सही नहीं ठहराया जा सकता
    • आजकल बड़ी कंपनियाँ जो “5 nines” कहती हैं, वह लगभग भ्रम है
      असल में error responses को भी “सामान्य संचालन” में गिन लिया जाता है
      network industry की तरह सचमुच 99.999% हासिल करना बहुत दुर्लभ है, और ज्यादातर जगह data slicing tricks से status page को हरा बनाए रखा जाता है
  • 2025 में जब GitHub CTO ने कहा था कि “पूरी तरह Azure पर migration” करके reliability बढ़ाई जाएगी, तभी से बेचैनी थी
    पहले community चिल्लाती थी कि “नए फीचर जल्दी जोड़ो”, लेकिन अब stability और reliability कहीं ज़्यादा जरूरी हैं

    • फिर भी GitHub की नए फीचर जोड़ने की रफ्तार अब भी धीमी है
    • अगर आप सिर्फ बड़े platform ही नहीं इस्तेमाल करते, तो छोटे और उबाऊ हद तक stable विकल्प भी मौजूद हैं
    • मैं उसी दौर में जुड़ा था, और सिर्फ अपने repo को सार्वजनिक रूप से शेयर कर पाना ही मुझे बहुत रोमांचक लगा था
    • कुल मिलाकर industry की overall stability बेहतर हुई है, लेकिन अब बहुत सारी dependencies आपस में उलझी हुई हैं, इसलिए एक जगह दिक्कत हो तो पूरा तंत्र हिल जाता है
    • पूरी तरह Azure पर जाने के दौरान वे IPv6 access भूल जाएँ, ऐसी उम्मीद है
  • GitHub इस समय Azure migration, AI-आधारित infrastructure changes, और AI traffic explosion की तिहरी मार झेल रहा है
    लोकप्रिय projects में issue दर्ज होने के कुछ ही मिनटों में AI द्वारा बनाए गए दर्जनों PR आने लगते हैं
    ऐसा load संभालना कठिन है, और AI से पहले वाले “N 9s” और बाद वाले “N 9s” की कठिनाई बिल्कुल अलग है

    • सही बात। GitHub को मूल रूप से ऐसे AI agent stampede environment को ध्यान में रखकर डिज़ाइन नहीं किया गया था
  • GitHub के status page को देखें तो यह वास्तव में 90.21% है, यानी सिर्फ एक 9 के स्तर पर
    पुराने 2019 archive में जहाँ महीने में 1~4 outages होते थे, अब हालत यह है कि लगभग रोज़ एक बार कुछ न कुछ गड़बड़ होती है

    • यह आँकड़ा खराब इसलिए भी है क्योंकि इसमें सिर्फ downtime ही नहीं बल्कि degraded performance भी शामिल है
    • फिर भी मज़ाक में कहा गया कि यह Claude के status.claude.com से बेहतर है
  • जब GitHub AI features पर अटका हुआ है, उसी दौरान platform की security बिखर रही है
    हाल ही में Aqua Security पर हमला हुआ और कई repos संक्रमित हुए, यह GitHub Actions की mutable reference vulnerability का फायदा उठाने का मामला था
    GitHub इस समस्या को जानता था, फिर भी उसने इसे ठीक नहीं किया

    • अस्थायी उपाय के तौर पर Actions version को hash से pin करना बेहतर है
      उदाहरण: uses: actions/checkout@11bd7190...
      automation tool के लिए mheap/pin-github-action देखें
    • मुझे लगता है कि CI/CD, YAML-आधारित complexity की वजह से जरूरत से ज्यादा उलझ चुका है
      पहले deployments Jenkins से हो जाते थे, और साधारण tests script से चल जाते थे, लेकिन अब यह बिखरा हुआ YAML hell बन गया है
    • GHA की security इतनी गंभीर हालत में है कि लोग कहते हैं, “Swiss cheese से भी ज़्यादा छेद हैं”
    • इस समस्या को वर्षों से यूँ ही छोड़ देने पर community discussion भी है
  • 90% uptime का आँकड़ा सभी services को मिलाकर है, इसलिए वास्तविक अनुभव अलग हो सकता है
    लेकिन Copilot का 96.47% भी सिर्फ एक 9 के बराबर है
    GitHub कहता है कि “सभी फीचर्स साथ में इस्तेमाल करो”, लेकिन ऐसा करते ही reliability तेजी से गिरती है

    • ऊपर से “धीमा है लेकिन चल रहा है” जैसी स्थितियाँ आँकड़ों में शामिल नहीं होतीं
      उदाहरण के लिए, साधारण PR diff खोलने में भी 30 सेकंड से अधिक लग जाते हैं
    • कुछ incidents को आधिकारिक तौर पर देरी से report भी किया जाता है
      ऐसे मामले भी रहे हैं जहाँ CI/CD, git, और PR फीचर सब बंद हो गए थे
    • 2019 data से तुलना करें तो अब स्थिति 10 गुना से भी ज्यादा खराब है
    • 96% सच में बहुत भयानक आँकड़ा है
  • जिसने GitHub Enterprise Server को खुद चलाया है, उसके नज़रिए से ये समस्याएँ चौंकाने वाली नहीं हैं
    Active-active support नहीं, downtime के बिना upgrade नहीं, rollback नहीं — यानी basic high availability requirements तक पूरी नहीं होतीं
    अगर bug आ जाए तो backup restore के अलावा कोई उपाय नहीं होता, और उस प्रक्रिया में data loss भी हो जाता है
    ऐसे product को महंगे enterprise ग्राहकों को बेचना availability के प्रति उदासीनता का सबूत है

    • हमारी कंपनी ने भी आखिरकार GHES छोड़कर GHEC में migration कर लिया
  • Microsoft में अच्छे products को खराब कर देने की प्रतिभा है
    Skype इसका सबसे बड़ा उदाहरण है, और Windows, Notepad, Explorer भी अलग नहीं हैं
    Office → Office 365 → Microsoft 365 → Copilot 365 तक का branding confusion भी बहुत गंभीर है

    • लगता है “GitHub for Business” आने में भी अब ज़्यादा वक्त नहीं है
  • हमारी कंपनी हर PR पर GitHub Actions से security scan चलाती है
    GitHub रुक जाए तो security gate भी रुक जाता है, और developers बिना verification के merge कर देते हैं
    ऐसी स्थिति में vulnerable code अंदर आ जाता है, फिर भी GitHub अपनी engineering capacity Copilot पर ही लगा रहा है

    • कुछ लोग पूछ रहे थे कि क्या इसका कोई public example मौजूद है
  • IPv6 की अनदेखी GitHub की तकनीकी लापरवाही का प्रतीक है
    इससे भी बड़ा सवाल यह है कि ऐसी स्थिति में भी यह security audits कैसे पास कर लेता है
    GitHub के security documents देखें तो वे बस औपचारिकता जैसे लगते हैं

    • audit की quality भी architecture level जितनी ही खराब है