Claude Code आउटेज पर Boris Cherny का पोस्टमॉर्टम: “यह किसी व्यक्ति की गलती नहीं, बल्कि process की समस्या है”
Claude Code के निर्माता Boris Cherny(@bcherny) ने 31 मार्च को हुई Claude service outage पर एक छोटा लेकिन प्रभावशाली कमेंट साझा किया।
“गलतियाँ होती हैं। टीम के रूप में महत्वपूर्ण बात यह पहचानना है कि यह किसी खास व्यक्ति की गलती नहीं है — यह process, culture, या infrastructure की समस्या है। इस मामले में एक manual deployment step था जिसे automated होना चाहिए था। टीम ने automation में कुछ सुधार लागू किए हैं, और कुछ पर अभी काम चल रहा है।”
क्या हुआ था?
31 मार्च 17:45 UTC से 1 अप्रैल 05:52 UTC तक Claude Opus 4.6 और Sonnet 4.6 में timeout की घटनाएँ तेज़ी से बढ़ीं।  Downdetector के अनुसार सुबह 8:30 बजे (PT) तक 2,400 से अधिक users ने समस्या रिपोर्ट की थी, और अधिकतर issues Claude Chat से जुड़े थे. 
Cherny ने खुद बताया कि इसकी वजह deployment automation की कमी वाला एक manual deployment step था।
आउटेज से भी अधिक ध्यान खींचने वाली बात: प्रतिक्रिया का तरीका
Cherny की टिप्पणी engineering culture में प्रचलित blameless postmortem दर्शन को साफ़ तौर पर दिखाती है। Google और Netflix जैसी SRE (site reliability engineering) culture में लंबे समय से ज़ोर दिया गया सिद्धांत — “व्यक्ति को दंडित करने से समस्या छिप जाती है, system को ठीक करना चाहिए” — यह दर्शाता है कि Claude Code टीम इसी सोच को व्यवहार में ला रही है।
तेज़ी से बढ़ रही AI services में एक manual deployment step भी बड़े पैमाने की outage का कारण बन सकता है, और उसे सार्वजनिक रूप से स्वीकार कर automation से जवाब देना — यह बात छोटी टीमों से लेकर बड़े services तक सभी के लिए याद रखने लायक है।
संदर्भ
∙ Claude के official status page (status.claude.com) के अनुसार outage पूरी तरह सुलझ चुका है।
∙ मूल ट्वीट: https://x.com/bcherny/status/2039210700657307889
अभी कोई टिप्पणी नहीं है.