2 पॉइंट द्वारा GN⁺ 11 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • OpenAI frontier models और Codex अब AWS पर औपचारिक रूप से उपलब्ध हैं, और लाखों AWS ग्राहक उस प्लेटफ़ॉर्म पर OpenAI के साथ बना सकते हैं जहाँ वे पहले से अपना business चला रहे हैं
  • एंटरप्राइज़ अपनी मौजूदा security, compliance, procurement, billing, governance workflows के ज़रिए frontier AI को production में ला सकते हैं, जिससे evaluation से वास्तविक deployment तक की friction कम होती है
  • OpenAI models on Amazon Bedrock AWS-native security और governance controls का उपयोग करके AI applications बनाने में मदद करता है
  • Codex on Amazon Bedrock OpenAI के software engineering agent को AWS environment में लाता है, जिसे हर हफ्ते 50 लाख से अधिक लोग इस्तेमाल करते हैं, ताकि code writing, review, debugging और modernization में मदद मिल सके
  • भविष्य में Daybreak को AWS ग्राहकों के लिए उपलब्ध कराया जाएगा, ताकि secure code review, threat modeling, patch verification, dependency risk analysis, detection और remediation guidance को रोज़मर्रा के development loop में शामिल किया जा सके

AWS पर OpenAI को production में लाना

  • OpenAI frontier models और Codex अब AWS पर general availability में हैं
  • AWS ग्राहक उस AWS प्लेटफ़ॉर्म के माध्यम से OpenAI capabilities का उपयोग कर सकते हैं जहाँ वे पहले से अपना business चला रहे हैं
  • एंटरप्राइज़ की प्रमुख बाधाएँ जैसे security, compliance, procurement, billing और governance processes मौजूदा workflows के भीतर ही संभाली जा सकती हैं
  • संगठन operational barriers को कम करके evaluation चरण से वास्तविक deployment तक तेज़ी से पहुँच सकते हैं

उपलब्धता का तरीका और विस्तार की योजना

  • OpenAI models on Amazon Bedrock AWS-native security और governance controls का उपयोग करके AI applications बनाने की सुविधा देता है
  • Codex on Amazon Bedrock एक software engineering agent के रूप में उपलब्ध है, जो teams को उसी AWS environment में code writing, review, debugging और modernization में मदद करता है जहाँ वे पहले से build और deploy करते हैं
  • ये दोनों offerings AWS Commercial और GovCloud regions में उपलब्ध हैं
  • OpenAI और AWS, AWS के माध्यम से उपलब्ध OpenAI capabilities का विस्तार जारी रखने की योजना बना रहे हैं, ताकि teams कम friction और अधिक confidence के साथ evaluation से production तक जा सकें
  • भविष्य में उपलब्ध कराया जाने वाला Daybreak cyber models और Codex Security को शामिल करेगा, और इसे इस तरह डिज़ाइन किया गया है कि cyber defenders जोखिमों को पहले देख सकें, तेज़ी से प्रतिक्रिया दे सकें और software को अधिक resilient बना सकें

1 टिप्पणियां

 
Hacker News की राय
  • जब भी मैं लोगों को यह पूछते देखता हूँ कि AWS, Azure, GCP जैसी जगहों पर कोई भरोसा क्यों करता है, या इनके लिए प्रीमियम क्यों देता है, तो लगता है कि उन्होंने कभी एंटरप्राइज़ माहौल में काम नहीं किया
    जिस बड़ी कंपनी में मैं काम करता हूँ, वहाँ ग्राहक अनुबंधों में सख्त डेटा गवर्नेंस शामिल है, और हमारी अपनी गवर्नेंस आवश्यकताएँ भी हैं। ऐसे vendor का इस्तेमाल करना, जो सिर्फ infosec approval पा चुका हो इतना ही नहीं, बल्कि ग्राहक अनुबंध में data processor के रूप में भी दर्ज हो, नौकरी से निकाले जाने और मुकदमे से बचने का रास्ता है
    घर पर अपने code और data के साथ खेलते समय आप जो चाहें कर सकते हैं, लेकिन कंपनी और ग्राहक के data के साथ ऐसा बिल्कुल नहीं कर सकते। यही वजह है कि कोई भी ट्रेंडी नया frontier model बस यूँ ही नहीं इस्तेमाल किया जाता। side project और startup की बंदिशें और विचार पूरी तरह अलग होते हैं

    • मैं जानना चाहूँगा कि क्या आपने असली AWS contract और उन documents में लिखी सीमित liability देखी है, जिनके लिंक contract और marketing materials में दिए जाते हैं
      छोटा अक्षर पढ़ेंगे तो काफ़ी दिलचस्प चीज़ें मिलेंगी। data loss की ज़िम्मेदारी ज़्यादातर ग्राहक पर होती है, SLA claim के लिए ठोस सबूत देना पड़ता है, और जो remedy मिलती है वह आमतौर पर उसी product के future usage credit के रूप में होती है जिसमें data खोया था
      AWS की terms, GCP जैसी जगहों की तुलना में, उलटे काफ़ी reasonable लगती हैं। GCP का SLA ज़्यादातर enterprise procurement team को यह कहने में मदद करता दिखता है कि “SLA है, इसलिए due diligence भी हो गई, और इसे चुनने पर शायद नौकरी नहीं जाएगी।” दूसरी ओर GCP कह सकता है, “जब आपने contract sign किया था तभी proposed remedy मान ली थी, इसलिए अगर मुकदमा करेंगे तो हम वही clause दिखाएँगे। भरोसा करने के लिए धन्यवाद।” [0]
      [0] https://docs.cloud.google.com/storage/docs/storage-classes
      Standard multi-region या dual-region storage के लिए availability SLA 99.95% है, regional standard के लिए 99.9%, और regional Nearline, Coldline, Archive के लिए यह 99.0% तक गिर सकता है। credit प्रभावित service tier की monthly billing का 10%, 25%, 50% होता है, monthly aggregate cap 50% है, और यह future usage पर लागू होता है। Google यह भी कहता है कि अगर ग्राहक 30 दिनों के भीतर credit claim नहीं करता, तो उसे waived माना जाएगा
    • इसके अलावा, “उस टीम ने expense report में AI पर $1,000 खर्च कर दिए, आखिर मिला क्या?” और “कंपनी का कुल AWS bill कुछ प्रतिशत बढ़ गया है, समय मिले तो देखेंगे” — इन दोनों के बीच बहुत बड़ा फर्क है। दूसरा वाला किसी project को कहीं ज़्यादा यथार्थवादी बनाता है
    • AWS की security posture अलग है। AI startup, startup webapp builder tools, और VSCode plugin vendors के hack होकर data leak होने की संभावना काफ़ी ज़्यादा होती है
      AWS भी hack हो सकता है, लेकिन उसने इस संभावना को थोड़ा कम करने और यह ट्रैक करना आसान बनाने पर मेहनत की है कि कौन-से ग्राहक प्रभावित हुए। उदाहरण के लिए, अगर आप AWS logging में गहराई तक जाएँ, तो सिर्फ इसे enabled छोड़ देने भर से इतना रिकॉर्ड बचता है कि बाद में देखा जा सकता है कि किसने permissions या environment में क्या किया। AWS कर्मचारियों की access भी काफ़ी अच्छी तरह log होती होगी। पहले मेरे account पर AWS कर्मचारी को attach करने के लिए कई प्रक्रियाओं से गुजरना पड़ता था
    • संक्षेप में कहें तो, IBM खरीदने पर किसी को नौकरी से नहीं निकाला गया
    • मैं अभी-अभी ऐसे मुक्त माहौल से एक सख्त enterprise environment में आया हूँ, जहाँ कोई भी AI harness या model इस्तेमाल किया जा सकता था
      यह जानकर झटका लगा कि Azure में सिर्फ एक GitHub Copilot license इस्तेमाल करना कितना मुश्किल है। दोनों Microsoft product हैं, फिर भी IT को GitHub Enterprise सेट करना पड़ा, उसे Azure subscription से जोड़ना पड़ा, और न जाने कितनी चीज़ें समझनी पड़ीं
  • अगर आपने बड़ी कंपनी के माहौल में AI coding model इस्तेमाल किए हैं, तो आप जानते होंगे कि कई बड़े enterprise deployment में व्यवहारिक रूप से AWS Bedrock इस्तेमाल करना अनिवार्य हो जाता है। वजह सीधी है

    1. बड़ी कंपनियों का AWS के साथ पहले से relationship होता है, इसलिए नया vendor relationship बनाने की तुलना में प्रक्रिया बहुत आसान होती है
    2. बड़ी कंपनियों में अक्सर यह सख्त internal requirement होती है कि internal data कंपनी के control में ही रहे। AWS Bedrock इस्तेमाल करने पर इस बात का भरोसा कहीं ज़्यादा होता है कि model में डाला गया data किसी training dataset में जाकर नहीं घुसेगा। जहाँ मैं काम करता हूँ, वहाँ इसी requirement की वजह से OpenAI API सीधे इस्तेमाल करने के बजाय AWS Bedrock के ज़रिए जाना अनिवार्य है
    • एक कदम और भीतर जाएँ तो नया vendor जोड़ना अक्सर इसलिए असंभव होता है क्योंकि ग्राहकों के साथ हुए कई अनुबंधों में हमने अलग-अलग रूपों में वादा किया होता है कि ग्राहक data किसी दूसरे vendor को नहीं भेजेंगे
    • कई LLM में Bedrock आपको यह नियंत्रित करने देता है कि data किस देश में रहेगा। उदाहरण के लिए Claude API में ऐसा control नहीं है
      हम अमेरिका में काम नहीं करते, और यह सख्त requirement है कि data हमारे देश के भीतर ही रहे; Bedrock यह control देता है
    • दिलचस्प बात है
      अगर रुझान यही रहा तो आगे AI कैसे बढ़ता रहेगा, यह सोचने वाली बात है। अगर मान लें कि ज़्यादातर मूल्यवान data ऐसी firewalls के पीछे है, तो public data शायद पहले ही harvest किया जा चुका है, और संभव है कि training अवैध रूप से हासिल data पर भी हुई हो। यह हिस्सा धुंधला क्षेत्र है
      क्या आखिरकार यह बाहरी input के बिना एक closed ecosystem बन जाएगा?
    • Bedrock data बाहरी provider तक ट्रांसफ़र नहीं होता, इस पर आप इतना भरोसा कैसे कर सकते हैं, यह जानने की जिज्ञासा है
  • अगर आप सोच रहे हैं कि ये API सीधे इस्तेमाल करने के बजाय AWS के ज़रिए ज़्यादा पैसे देकर क्यों ली जाएँ, तो वजह यह है कि कुछ कंपनियों में नए vendor approval लेना लगभग असंभव होता है। अगर कंपनी के पास AWS contract है, तो AWS जो उपलब्ध कराता है वही इस्तेमाल करना पड़ता है

    • एक मिनट, क्या AWS किसी AI कंपनी के server access को resell कर रहा है, या AWS अपने hardware पर model चला रहा है?
    • मान लें approval मिल भी जाए, तब भी annual security audit का scope बढ़ जाता है, security assessment में disclose करने के लिए एक vendor और जुड़ जाता है, data एक और processor तक फैल जाता है, और invoices व budget discussions का एक अतिरिक्त सिरदर्द बढ़ता है
      ग्राहक अनुबंध के हिसाब से हो सकता है आपको नया vendor ग्राहकों को बताना पड़े, और इससे नया security review trigger हो जाए। लेकिन अगर बस Bedrock में एक model और जोड़ना है? तो यह कहीं आसान है
    • अब दुनिया भर के CEO, board, और middle manager AI buzzwords के पीछे भाग रहे हैं। अगर frontier lab के साथ सीधे contract करने का अनुरोध किया जाए, तो क्या सच में इतनी रुकावट आएगी?
  • OpenAI के लिए यह बहुत बड़ी खबर है। सिर्फ इसलिए कि AWS पर इस्तेमाल किया जा सकता था, Claude को अपनाने वाले enterprise मेरी कल्पना से कहीं ज़्यादा थे, और अब असली प्रतिस्पर्धा शुरू होगी

  • यह OpenAI के लिए अच्छा कदम है और Anthropic के लिए चिंताजनक बात। AWS lock-in और security requirements की वजह से कुछ समय तक Bedrock ही मेरे लिए base model इस्तेमाल करने का एकमात्र रास्ता था

    • Claude पहले से ही AWS से Anthropic server के through pass-through mode और Bedrock, दोनों रूपों में उपलब्ध है। https://aws.amazon.com/claude-platform/
      first-mover advantage खत्म होना उन्हें शायद पसंद नहीं आएगा, लेकिन इसकी उम्मीद उन्होंने बहुत पहले से की होगी
  • प्रतिस्पर्धा के लिए यह अच्छी खबर है
    Claude Code, Amazon Bedrock के ज़रिए इस्तेमाल करने वालों के लिए नए features लगातार बाहर रख रहा है। जैसे auto mode, Ultra plan, Claude for Chrome वगैरह। अगर competition थोड़ा और बढ़े, तो शायद उन्हें अपनी strategy पर फिर से सोचना पड़े

    • अजीब बात यह है कि Amazon Bedrock के Claude models उन सभी features को support करते हैं
      मैं कुछ समय से api.anthropic.com emulator बनाकर requests को “चुपके से” Amazon Bedrock तक forward कर रहा था। यह अच्छा काम करता है, और अब first-party-only features भी तुरंत इस्तेमाल किए जा सकते हैं
    • अब Bedrock में भी auto mode काम करता है
  • लगता है Anthropic को जल्दी IPO कर लेना चाहिए। उनकी भारी revenue growth लगभग पूरी तरह Gemini launch की नाकामी और OpenAI के Azure में बँधे होने की वजह से आई थी
    Anthropic model सचमुच AWS पर उपलब्ध एकमात्र व्यावहारिक serverless API थे, यानी Bedrock models। हाल की Qwen 3.5/3.6 series तो लॉन्च भी नहीं की गई। token efficiency और ROI-केंद्रित रुझान भी साथ जुड़ रहे हैं, इसलिए मैं सच में देखना चाहता हूँ कि Anthropic Q3 कैसे बंद करता है

  • frontier labs hyperscaler को frozen model builds देती हैं, जिनमें data collection के बिना सिर्फ serving होती है। उन ज़्यादातर कंपनियों के लिए, जो संवेदनशील data रखते हुए frontier LLM इस्तेमाल करना चाहती हैं, यह एक बुनियादी शर्त है

  • यह Azure के लिए बुरी बात है। वह चुना हुआ मंच था, लेकिन demand के साथ कदम नहीं मिला पाया
    जब OpenAI exclusive contract से इसलिए निकला कि Azure पर्याप्त stable नहीं था, तभी समझ आ गया था कि अगला ठिकाना AWS होगा