• हाल में AI coding tools के उपयोग से जुड़ी service outages लगातार सामने आने के बाद, Amazon ने सभी AI-सहायित code changes के लिए senior engineer की पूर्व-स्वीकृति प्रक्रिया शुरू की है
  • आंतरिक नोट्स के अनुसार, आउटेज के कारण के रूप में "best practices और safeguards अभी पूरी तरह स्थापित न होने के बीच नए GenAI उपयोग" को चिन्हित किया गया
  • इस महीने Amazon website और shopping app लगभग 6 घंटे तक down रहे, जिससे ग्राहक transaction पूरा नहीं कर सके, account information नहीं देख सके और price lookup नहीं कर सके; कारण गलत software code deployment था
  • AWS में भी AI coding assistant Kiro द्वारा environment delete और recreate कर दिए जाने से 13 घंटे का outage हुआ; इस तरह AI-संबंधित कम-से-कम दो incidents रिपोर्ट हुए
  • AI coding tools को production में लागू करने से जुड़े operational risk अब वास्तविक रूप ले रहे हैं, जिसके चलते junior और mid-level engineers के AI-सहायित बदलावों पर senior engineer sign-off अनिवार्य करने का तत्काल कदम उठाया गया

Amazon की आंतरिक बैठकें और जवाबी कदम

  • Amazon के e-commerce division ने हाल में हुई लगातार service disruptions का विश्लेषण करने के लिए बड़े पैमाने पर engineers की बैठक बुलाई
    • बैठक के agenda में AI coding tools के उपयोग से जुड़े incidents शामिल थे
    • आंतरिक briefing notes में कहा गया कि पिछले कुछ महीनों में “high-risk (high blast radius)” incidents बढ़े हैं, और “Gen-AI-assisted changes” को प्रमुख कारणों में गिना गया
  • दस्तावेज़ में “ऐसे नए GenAI use cases जो अभी पूरी तरह स्थापित नहीं हैं” को योगदान देने वाले कारक के रूप में दर्ज किया गया
  • senior vice president Dave Treadwell ने email में कहा कि “हाल के समय में site और infrastructure की availability अच्छी नहीं रही”

AI-संबंधित आउटेज के मामले

  • Amazon website और shopping app इस महीने की शुरुआत में लगभग 6 घंटे तक बंद रहे, और इसका कारण “गलत software code deployment” पाया गया
    • इसके चलते ग्राहक transaction पूरा करना, account information देखना और product price check करना नहीं कर सके
  • AWS में भी AI coding assistant Kiro के उपयोग के दौरान समस्या हुई
    • दिसंबर के मध्य में, Kiro ने environment को “delete करके फिर recreate” करने का फैसला किया, जिससे 13 घंटे तक cost calculator service बंद रही
    • Amazon ने इस घटना को “मुख्यभूमि चीन के कुछ क्षेत्रों में एक single service तक सीमित बहुत ही सीमित incident” बताया
    • Amazon ने यह भी जोड़ा कि दूसरे incident का “customer-facing AWS services पर कोई असर नहीं पड़ा

नई approval प्रक्रिया और operational improvements

  • Treadwell साप्ताहिक बैठक ‘This Week in Stores Tech (TWiST)’ के ज़रिए समस्या के कारणों और अल्पकालिक सुधार कदमों पर चर्चा करेंगे
    • पहले वैकल्पिक उपस्थिति वाली इस बैठक को अब सभी कर्मचारियों के लिए उपस्थिति-प्रोत्साहित प्रारूप में बदला गया है
  • आगे से junior और mid-level engineers द्वारा किए गए AI-सहायित code changes पर senior engineer की sign-off approval आवश्यक होगी
  • Amazon ने इस समीक्षा को “सामान्य business process का हिस्सा” बताया और continuous improvement को लक्ष्य कहा

कर्मचारियों में कटौती और बढ़ते आउटेज पर विवाद

  • Financial Times ने रिपोर्ट किया कि कुछ engineers ने कहा कि कर्मचारी कटौती के बाद ‘Sev2’ स्तर के incidents (ऐसे मध्यम स्तर के outages जिनमें तेज़ प्रतिक्रिया चाहिए) बढ़े हैं
  • Amazon ने हाल के वर्षों में कई बार restructuring की है, और जनवरी 2026 में ही 16,000 corporate jobs कम कीं
  • हालांकि, कंपनी इस दावे से सहमत नहीं है कि workforce cuts ही outages बढ़ने का कारण हैं

आगे की दिशा

  • Amazon website availability review और operational performance checks को नियमित बना रहा है
  • कंपनी AI coding tools के सुरक्षित उपयोग और outage prevention systems को मज़बूत करने पर साथ-साथ काम कर रही है
  • यह कदम AI adoption के विस्तार के बीच human verification process के महत्व को फिर से रेखांकित करने वाले उदाहरण के रूप में देखा जा रहा है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.