Anthropic की सेवाओं में Opus 4.5 और Sonnet 4/4.5 मॉडल्स में बाधा
(status.claude.com)- Claude प्लेटफ़ॉर्म पर कई मॉडल्स की error rate बढ़ी हुई बताई गई है
- उपयोगकर्ता ईमेल या SMS के जरिए आउटेज और समाधान अलर्ट की सदस्यता ले सकते हैं
- SMS अलर्ट के लिए दुनिया भर के country code list के माध्यम से अलग-अलग देशों के नंबर रजिस्टर किए जा सकते हैं
- सदस्य OTP (one-time password) सत्यापन के बाद SMS अपडेट प्राप्त कर सकते हैं
- यह Anthropic द्वारा संचालित Claude सेवा के आउटेज मॉनिटरिंग सिस्टम को दिखाने वाला एक उदाहरण है
Claude सेवा आउटेज सूचना
- Claude status page पर कई मॉडल्स में error rate बढ़ी हुई स्थिति की सूचना दी गई है
- “Elevated errors across many models” वाक्य के रूप में दिखाया गया
- सटीक कारण या प्रभाव के दायरे के बारे में कोई विवरण नहीं है
अलर्ट सदस्यता का तरीका
- उपयोगकर्ता ईमेल या टेक्स्ट मैसेज (SMS) के जरिए आउटेज अपडेट अलर्ट प्राप्त कर सकते हैं
- ईमेल में हर बार घटना अपडेट होने पर सूचना भेजी जाती है
- SMS तब भेजा जाता है जब Claude घटना बनाता है या उसे resolve करता है
SMS अलर्ट पंजीकरण प्रक्रिया
- SMS अलर्ट पाने के लिए country code चुनना → मोबाइल नंबर दर्ज करना → OTP सत्यापन प्रक्रिया जरूरी है
- नंबर सत्यापित करने के लिए OTP (one-time password) दर्ज करना होता है
- सत्यापन के बाद SMS अपडेट प्राप्त किए जा सकते हैं
समर्थित देशों की सूची
- पेज में दुनिया के अधिकांश देशों के country code list शामिल हैं
- उदाहरण: अमेरिका(+1), दक्षिण कोरिया(+82), जापान(+81), यूनाइटेड किंगडम(+44), जर्मनी(+49) आदि
- अलग-अलग देशों के उपयोगकर्ता एक ही प्रक्रिया से SMS अलर्ट प्राप्त कर सकते हैं
सेवा स्थिति मॉनिटरिंग का महत्व
- Claude status page, Anthropic सेवाओं की real-time आउटेज स्थिति सार्वजनिक करने का माध्यम है
- उपयोगकर्ताओं को पारदर्शी आउटेज अलर्ट और रिकवरी प्रगति साझा करने की सुविधा देता है
- डेवलपर्स और एंटरप्राइज़ ग्राहकों के लिए service availability तुरंत समझने की व्यवस्था है
1 टिप्पणियां
Hacker News की राय
समस्या होते ही status page को अपडेट किया गया, यह काफ़ी प्रभावशाली लगा
Claude Code इस्तेमाल करते समय API error आया, तो status page देखा और वहाँ सचमुच outage दिख रहा था
मुझे लगता है ऐसी पारदर्शी प्रतिक्रिया हर service की default practice होनी चाहिए
संयोग से मैं खुद Claude इस्तेमाल कर रहा था, इसलिए outage की गंभीरता तुरंत समझ आ गई
लगता है Claude users रविवार शाम को भी काफ़ी मेहनत से काम कर रहे हैं
मैं इस incident response engineer टीम का एक सदस्य हूँ
14:43 PT / 22:43 UTC तक हमने समस्या को mitigate कर दिया था. असुविधा के लिए खेद है
duplicate route advertisement की वजह से कुछ inference backends की traffic blackhole में चली गई
detection में लगभग 75 मिनट लगे, और कुछ mitigation paths उम्मीद के मुताबिक काम नहीं कर पाए
गलत routes हटा दिए गए हैं और service recover हो गई है
आगे हम synthetic monitoring और infrastructure change visibility को मज़बूत करेंगे ताकि इसे और जल्दी पकड़ सकें
उनकी transparency की वजह से मैं Cloudflare पर और ज़्यादा भरोसा करने लगा हूँ
50 साल बाद की एक steampunk dystopia की कल्पना की
“LLM hosting रुकते ही दुनिया भर का production ठप हो गया और market collapse हो गया. Sam, क्या तुम सुन रहे हो?”
यह सोचकर ही हँसी आती है
संबंधित वीडियो: YouTube Shorts
Claude.ai chat में मुझे यह संदेश मिला
या तो timing कमाल की थी, या फिर monetization team को bonus मिलना चाहिए
backend या तो 429/402 error throw नहीं कर रहा था, या gateway ने उसे गलत तरह से handle करके गलत message return किया
अगर Opus 4.5 को band कर दिया गया, तो शायद मैं रो पड़ूँगा
outage से ठीक पहले Opus ने अजीब तरह से बहुत लंबे जवाब देने शुरू कर दिए थे
साधारण सवालों पर भी वह पूरा codebase उगल देने जैसा जवाब दे रहा था, और database schema से जुड़े एक आसान सवाल में भी दो बार compression हुआ
canivibe.ai — हो सकता है किस service का इस्तेमाल हो रहा है, उसके हिसाब से vibe मिल सके
क्या यह कहीं AWS outage तो नहीं था, यह सोच रहा हूँ
status page के हिसाब से अब recover हो चुका लगता है
मैंने agent को उसी error loop में फँसा देखा था, लेकिन इस बार उसने सही result दिया
लगता है शायद इस तरह के outages को अपने-आप detect करने वाला कोई rule जोड़ा गया है, और यह काफ़ी प्रेरणादायक प्रतिक्रिया लगी