AIWatch एक open source project है जो Claude, OpenAI, Gemini जैसी प्रमुख AI services के outage, uptime और recovery time को
real time में monitor करता है।

डैशबोर्ड: https://ai-watch.dev
लैंडिंग पेज: https://ai-watch.dev/intro
GitHub: https://github.com/bentleypark/aiwatch

जब outage होता है, तो AI कारण का analysis करता है, recovery time का अनुमान लगाता है, और
Discord/Slack पर तुरंत alert भेजता है।

आज हम 20–31 मार्च (12 दिन) के दौरान collected data के आधार पर 27 services (मार्च के अनुसार) की
reliability report जारी कर रहे हैं। यह पहला report है, इसलिए अवधि छोटी है, और अप्रैल से इसे पूरे महीने के data के साथ प्रकाशित किया जाएगा।

3 मुख्य निष्कर्ष

1. uptime % metric अधूरा है
Claude API ने 99% uptime दर्ज किया, लेकिन 12 दिनों में 9 incidents हुए।
Cohere ने 100% uptime और zero incidents दर्ज किए।
सिर्फ numbers देखने पर दोनों समान लग सकते हैं, लेकिन वास्तविक reliability बिल्कुल अलग है।

2. छोटे incidents जमा होकर बड़ा problem बनते हैं
Together AI में 12 दिनों के दौरान 20 incidents हुए, जो सबसे ज़्यादा थे,
लेकिन average recovery time 25 मिनट था, इसलिए कुल downtime 8 घंटे 37 मिनट रहा।
दूसरी ओर ChatGPT में 4 incidents थे, लेकिन उनमें से एक 19 घंटे 46 मिनट लंबा था।

3. upstream dependency का risk
Deepgram का 74 घंटे का Voice Agent outage, OpenAI outage से शुरू हुआ था।
दूसरे AI के ऊपर बने services, ऊपरी service के outage को ज्यों का त्यों inherit कर लेते हैं।


AIWatch Score के शीर्ष 5 (मार्च के अनुसार)

सेवा Score ग्रेड incidents
Cohere API 100 Excellent 0
Hugging Face 100 Excellent 0
OpenRouter 99 Excellent 0
Groq Cloud 93 Excellent 1
DeepSeek API 92 Excellent 1
OpenAI API 88 Excellent 1 (2h 56m)
Together AI 84 Good 20 (avg 25m)
ChatGPT 73 Good 4 (सबसे लंबा 19h 46m)
Claude API 59 Fair 9 (मॉडल-वार aggregation)
ElevenLabs 47 Degrading 2 (सबसे लंबा 4h 47m)

Score formula (मार्च report के अनुसार): Uptime(50) + incident impact days(30) + recovery time(20) = कुल 100 points
यह incident count नहीं, बल्कि impact days(affected_days) पर आधारित है, इसलिए reporting method चाहे जो हो, निष्पक्ष comparison संभव है।
पूरी calculation method public है: https://ai-watch.dev/#about-score

ElevenLabs ने 97.55% uptime के साथ 27 services में अकेले Degrading grade प्राप्त किया।
अगर आप voice/audio services को production में इस्तेमाल कर रहे हैं, तो सावधानी ज़रूरी है।


ध्यान देने योग्य बातें

  • monitoring period 20–31 मार्च (12 दिन) का है, और यह पहला report है, इसलिए data आंशिक है।
    अप्रैल से इसे पूरे महीने के data के साथ प्रकाशित किया जाएगा।

उपयोग के अनुसार सिफारिशें (मार्च report के अनुसार)

  • production critical: Cohere(100 points, 0 incidents), OpenAI API(88 points, 1 incident / कुल downtime 2h 56m)
  • low latency / stability: Groq Cloud(93 points, 100% uptime), DeepSeek API(92 points)
  • coding workflow: Cursor, Windsurf (उच्च uptime)
  • voice/audio: AssemblyAI recommended + fallback अनिवार्य (ElevenLabs·Deepgram में multiple outages)

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.