OpenAI frontier models और Codex अब AWS पर उपलब्ध
(openai.com)- OpenAI frontier models और Codex अब AWS पर औपचारिक रूप से उपलब्ध हैं, और लाखों AWS ग्राहक उस प्लेटफ़ॉर्म पर OpenAI के साथ बना सकते हैं जहाँ वे पहले से अपना business चला रहे हैं
- एंटरप्राइज़ अपनी मौजूदा security, compliance, procurement, billing, governance workflows के ज़रिए frontier AI को production में ला सकते हैं, जिससे evaluation से वास्तविक deployment तक की friction कम होती है
- OpenAI models on Amazon Bedrock AWS-native security और governance controls का उपयोग करके AI applications बनाने में मदद करता है
- Codex on Amazon Bedrock OpenAI के software engineering agent को AWS environment में लाता है, जिसे हर हफ्ते 50 लाख से अधिक लोग इस्तेमाल करते हैं, ताकि code writing, review, debugging और modernization में मदद मिल सके
- भविष्य में Daybreak को AWS ग्राहकों के लिए उपलब्ध कराया जाएगा, ताकि secure code review, threat modeling, patch verification, dependency risk analysis, detection और remediation guidance को रोज़मर्रा के development loop में शामिल किया जा सके
AWS पर OpenAI को production में लाना
- OpenAI frontier models और Codex अब AWS पर general availability में हैं
- AWS ग्राहक उस AWS प्लेटफ़ॉर्म के माध्यम से OpenAI capabilities का उपयोग कर सकते हैं जहाँ वे पहले से अपना business चला रहे हैं
- एंटरप्राइज़ की प्रमुख बाधाएँ जैसे security, compliance, procurement, billing और governance processes मौजूदा workflows के भीतर ही संभाली जा सकती हैं
- संगठन operational barriers को कम करके evaluation चरण से वास्तविक deployment तक तेज़ी से पहुँच सकते हैं
उपलब्धता का तरीका और विस्तार की योजना
- OpenAI models on Amazon Bedrock AWS-native security और governance controls का उपयोग करके AI applications बनाने की सुविधा देता है
- Codex on Amazon Bedrock एक software engineering agent के रूप में उपलब्ध है, जो teams को उसी AWS environment में code writing, review, debugging और modernization में मदद करता है जहाँ वे पहले से build और deploy करते हैं
- ये दोनों offerings AWS Commercial और GovCloud regions में उपलब्ध हैं
- OpenAI और AWS, AWS के माध्यम से उपलब्ध OpenAI capabilities का विस्तार जारी रखने की योजना बना रहे हैं, ताकि teams कम friction और अधिक confidence के साथ evaluation से production तक जा सकें
- भविष्य में उपलब्ध कराया जाने वाला Daybreak cyber models और Codex Security को शामिल करेगा, और इसे इस तरह डिज़ाइन किया गया है कि cyber defenders जोखिमों को पहले देख सकें, तेज़ी से प्रतिक्रिया दे सकें और software को अधिक resilient बना सकें
1 टिप्पणियां
Hacker News की राय
जब भी मैं लोगों को यह पूछते देखता हूँ कि AWS, Azure, GCP जैसी जगहों पर कोई भरोसा क्यों करता है, या इनके लिए प्रीमियम क्यों देता है, तो लगता है कि उन्होंने कभी एंटरप्राइज़ माहौल में काम नहीं किया
जिस बड़ी कंपनी में मैं काम करता हूँ, वहाँ ग्राहक अनुबंधों में सख्त डेटा गवर्नेंस शामिल है, और हमारी अपनी गवर्नेंस आवश्यकताएँ भी हैं। ऐसे vendor का इस्तेमाल करना, जो सिर्फ infosec approval पा चुका हो इतना ही नहीं, बल्कि ग्राहक अनुबंध में data processor के रूप में भी दर्ज हो, नौकरी से निकाले जाने और मुकदमे से बचने का रास्ता है
घर पर अपने code और data के साथ खेलते समय आप जो चाहें कर सकते हैं, लेकिन कंपनी और ग्राहक के data के साथ ऐसा बिल्कुल नहीं कर सकते। यही वजह है कि कोई भी ट्रेंडी नया frontier model बस यूँ ही नहीं इस्तेमाल किया जाता। side project और startup की बंदिशें और विचार पूरी तरह अलग होते हैं
छोटा अक्षर पढ़ेंगे तो काफ़ी दिलचस्प चीज़ें मिलेंगी। data loss की ज़िम्मेदारी ज़्यादातर ग्राहक पर होती है, SLA claim के लिए ठोस सबूत देना पड़ता है, और जो remedy मिलती है वह आमतौर पर उसी product के future usage credit के रूप में होती है जिसमें data खोया था
AWS की terms, GCP जैसी जगहों की तुलना में, उलटे काफ़ी reasonable लगती हैं। GCP का SLA ज़्यादातर enterprise procurement team को यह कहने में मदद करता दिखता है कि “SLA है, इसलिए due diligence भी हो गई, और इसे चुनने पर शायद नौकरी नहीं जाएगी।” दूसरी ओर GCP कह सकता है, “जब आपने contract sign किया था तभी proposed remedy मान ली थी, इसलिए अगर मुकदमा करेंगे तो हम वही clause दिखाएँगे। भरोसा करने के लिए धन्यवाद।” [0]
[0] https://docs.cloud.google.com/storage/docs/storage-classes
Standard multi-region या dual-region storage के लिए availability SLA 99.95% है, regional standard के लिए 99.9%, और regional Nearline, Coldline, Archive के लिए यह 99.0% तक गिर सकता है। credit प्रभावित service tier की monthly billing का 10%, 25%, 50% होता है, monthly aggregate cap 50% है, और यह future usage पर लागू होता है। Google यह भी कहता है कि अगर ग्राहक 30 दिनों के भीतर credit claim नहीं करता, तो उसे waived माना जाएगा
AWS भी hack हो सकता है, लेकिन उसने इस संभावना को थोड़ा कम करने और यह ट्रैक करना आसान बनाने पर मेहनत की है कि कौन-से ग्राहक प्रभावित हुए। उदाहरण के लिए, अगर आप AWS logging में गहराई तक जाएँ, तो सिर्फ इसे enabled छोड़ देने भर से इतना रिकॉर्ड बचता है कि बाद में देखा जा सकता है कि किसने permissions या environment में क्या किया। AWS कर्मचारियों की access भी काफ़ी अच्छी तरह log होती होगी। पहले मेरे account पर AWS कर्मचारी को attach करने के लिए कई प्रक्रियाओं से गुजरना पड़ता था
यह जानकर झटका लगा कि Azure में सिर्फ एक GitHub Copilot license इस्तेमाल करना कितना मुश्किल है। दोनों Microsoft product हैं, फिर भी IT को GitHub Enterprise सेट करना पड़ा, उसे Azure subscription से जोड़ना पड़ा, और न जाने कितनी चीज़ें समझनी पड़ीं
अगर आपने बड़ी कंपनी के माहौल में AI coding model इस्तेमाल किए हैं, तो आप जानते होंगे कि कई बड़े enterprise deployment में व्यवहारिक रूप से AWS Bedrock इस्तेमाल करना अनिवार्य हो जाता है। वजह सीधी है
हम अमेरिका में काम नहीं करते, और यह सख्त requirement है कि data हमारे देश के भीतर ही रहे; Bedrock यह control देता है
अगर रुझान यही रहा तो आगे AI कैसे बढ़ता रहेगा, यह सोचने वाली बात है। अगर मान लें कि ज़्यादातर मूल्यवान data ऐसी firewalls के पीछे है, तो public data शायद पहले ही harvest किया जा चुका है, और संभव है कि training अवैध रूप से हासिल data पर भी हुई हो। यह हिस्सा धुंधला क्षेत्र है
क्या आखिरकार यह बाहरी input के बिना एक closed ecosystem बन जाएगा?
अगर आप सोच रहे हैं कि ये API सीधे इस्तेमाल करने के बजाय AWS के ज़रिए ज़्यादा पैसे देकर क्यों ली जाएँ, तो वजह यह है कि कुछ कंपनियों में नए vendor approval लेना लगभग असंभव होता है। अगर कंपनी के पास AWS contract है, तो AWS जो उपलब्ध कराता है वही इस्तेमाल करना पड़ता है
ग्राहक अनुबंध के हिसाब से हो सकता है आपको नया vendor ग्राहकों को बताना पड़े, और इससे नया security review trigger हो जाए। लेकिन अगर बस Bedrock में एक model और जोड़ना है? तो यह कहीं आसान है
OpenAI के लिए यह बहुत बड़ी खबर है। सिर्फ इसलिए कि AWS पर इस्तेमाल किया जा सकता था, Claude को अपनाने वाले enterprise मेरी कल्पना से कहीं ज़्यादा थे, और अब असली प्रतिस्पर्धा शुरू होगी
यह OpenAI के लिए अच्छा कदम है और Anthropic के लिए चिंताजनक बात। AWS lock-in और security requirements की वजह से कुछ समय तक Bedrock ही मेरे लिए base model इस्तेमाल करने का एकमात्र रास्ता था
first-mover advantage खत्म होना उन्हें शायद पसंद नहीं आएगा, लेकिन इसकी उम्मीद उन्होंने बहुत पहले से की होगी
प्रतिस्पर्धा के लिए यह अच्छी खबर है
Claude Code, Amazon Bedrock के ज़रिए इस्तेमाल करने वालों के लिए नए features लगातार बाहर रख रहा है। जैसे auto mode, Ultra plan, Claude for Chrome वगैरह। अगर competition थोड़ा और बढ़े, तो शायद उन्हें अपनी strategy पर फिर से सोचना पड़े
मैं कुछ समय से api.anthropic.com emulator बनाकर requests को “चुपके से” Amazon Bedrock तक forward कर रहा था। यह अच्छा काम करता है, और अब first-party-only features भी तुरंत इस्तेमाल किए जा सकते हैं
लगता है Anthropic को जल्दी IPO कर लेना चाहिए। उनकी भारी revenue growth लगभग पूरी तरह Gemini launch की नाकामी और OpenAI के Azure में बँधे होने की वजह से आई थी
Anthropic model सचमुच AWS पर उपलब्ध एकमात्र व्यावहारिक serverless API थे, यानी Bedrock models। हाल की Qwen 3.5/3.6 series तो लॉन्च भी नहीं की गई। token efficiency और ROI-केंद्रित रुझान भी साथ जुड़ रहे हैं, इसलिए मैं सच में देखना चाहता हूँ कि Anthropic Q3 कैसे बंद करता है
frontier labs hyperscaler को frozen model builds देती हैं, जिनमें data collection के बिना सिर्फ serving होती है। उन ज़्यादातर कंपनियों के लिए, जो संवेदनशील data रखते हुए frontier LLM इस्तेमाल करना चाहती हैं, यह एक बुनियादी शर्त है
यह Azure के लिए बुरी बात है। वह चुना हुआ मंच था, लेकिन demand के साथ कदम नहीं मिला पाया
जब OpenAI exclusive contract से इसलिए निकला कि Azure पर्याप्त stable नहीं था, तभी समझ आ गया था कि अगला ठिकाना AWS होगा