Claude API अपटाइम 99% के बावजूद 9 incidents — मार्च AI service reliability report जारी
(reports.ai-watch.dev)AIWatch एक open source project है जो Claude, OpenAI, Gemini जैसी प्रमुख AI services के outage, uptime और recovery time को
real time में monitor करता है।
डैशबोर्ड: https://ai-watch.dev
लैंडिंग पेज: https://ai-watch.dev/intro
GitHub: https://github.com/bentleypark/aiwatch
जब outage होता है, तो AI कारण का analysis करता है, recovery time का अनुमान लगाता है, और
Discord/Slack पर तुरंत alert भेजता है।
आज हम 20–31 मार्च (12 दिन) के दौरान collected data के आधार पर 27 services (मार्च के अनुसार) की
reliability report जारी कर रहे हैं। यह पहला report है, इसलिए अवधि छोटी है, और अप्रैल से इसे पूरे महीने के data के साथ प्रकाशित किया जाएगा।
3 मुख्य निष्कर्ष
1. uptime % metric अधूरा है
Claude API ने 99% uptime दर्ज किया, लेकिन 12 दिनों में 9 incidents हुए।
Cohere ने 100% uptime और zero incidents दर्ज किए।
सिर्फ numbers देखने पर दोनों समान लग सकते हैं, लेकिन वास्तविक reliability बिल्कुल अलग है।
2. छोटे incidents जमा होकर बड़ा problem बनते हैं
Together AI में 12 दिनों के दौरान 20 incidents हुए, जो सबसे ज़्यादा थे,
लेकिन average recovery time 25 मिनट था, इसलिए कुल downtime 8 घंटे 37 मिनट रहा।
दूसरी ओर ChatGPT में 4 incidents थे, लेकिन उनमें से एक 19 घंटे 46 मिनट लंबा था।
3. upstream dependency का risk
Deepgram का 74 घंटे का Voice Agent outage, OpenAI outage से शुरू हुआ था।
दूसरे AI के ऊपर बने services, ऊपरी service के outage को ज्यों का त्यों inherit कर लेते हैं।
AIWatch Score के शीर्ष 5 (मार्च के अनुसार)
| सेवा | Score | ग्रेड | incidents |
|---|---|---|---|
| Cohere API | 100 | Excellent | 0 |
| Hugging Face | 100 | Excellent | 0 |
| OpenRouter | 99 | Excellent | 0 |
| Groq Cloud | 93 | Excellent | 1 |
| DeepSeek API | 92 | Excellent | 1 |
| OpenAI API | 88 | Excellent | 1 (2h 56m) |
| Together AI | 84 | Good | 20 (avg 25m) |
| ChatGPT | 73 | Good | 4 (सबसे लंबा 19h 46m) |
| Claude API | 59 | Fair | 9 (मॉडल-वार aggregation) |
| ElevenLabs | 47 | Degrading | 2 (सबसे लंबा 4h 47m) |
Score formula (मार्च report के अनुसार): Uptime(50) + incident impact days(30) + recovery time(20) = कुल 100 points
यह incident count नहीं, बल्कि impact days(affected_days) पर आधारित है, इसलिए reporting method चाहे जो हो, निष्पक्ष comparison संभव है।
पूरी calculation method public है: https://ai-watch.dev/#about-score
ElevenLabs ने 97.55% uptime के साथ 27 services में अकेले Degrading grade प्राप्त किया।
अगर आप voice/audio services को production में इस्तेमाल कर रहे हैं, तो सावधानी ज़रूरी है।
ध्यान देने योग्य बातें
- monitoring period 20–31 मार्च (12 दिन) का है, और यह पहला report है, इसलिए data आंशिक है।
अप्रैल से इसे पूरे महीने के data के साथ प्रकाशित किया जाएगा।
उपयोग के अनुसार सिफारिशें (मार्च report के अनुसार)
- production critical: Cohere(100 points, 0 incidents), OpenAI API(88 points, 1 incident / कुल downtime 2h 56m)
- low latency / stability: Groq Cloud(93 points, 100% uptime), DeepSeek API(92 points)
- coding workflow: Cursor, Windsurf (उच्च uptime)
- voice/audio: AssemblyAI recommended + fallback अनिवार्य (ElevenLabs·Deepgram में multiple outages)
अभी कोई टिप्पणी नहीं है.