2 पॉइंट द्वारा GN⁺ 2026-04-29 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • OpenAI के frontier मॉडल Amazon Bedrock के AWS native agent runtime में आ रहे हैं, और यह सिर्फ मॉडल उपलब्ध कराने से आगे बढ़कर enterprise के लिए managed agent के रूप में एकीकृत हो रहे हैं
  • Bedrock Managed Agents identity, permissions, logging, governance, deployment को साथ में बाँधते हैं, जिससे ग्राहक उन हिस्सों को खुद जोड़े बिना enterprise environment में एजेंट्स को अधिक तेज़ी से चला सकें
  • अभी एजेंट performance केवल मॉडल खुद पर नहीं, बल्कि tools, state, memory, permissions, evals समेत harness के integration पर भी बहुत निर्भर करती है, और AWS व OpenAI इस integration को एक shared product की तरह देख रहे हैं
  • ग्राहक data AWS VPC के भीतर ही रहता है, OpenAI मॉडल Bedrock के जरिए चलते हैं, और support भी मुख्य रूप से AWS के माध्यम से संचालित होता है
  • जैसे शुरुआती cloud ने startup शुरू करना आसान बनाया था, वैसे ही यह integration भी AI adoption की बाधाएँ कम करने वाली धारा पर है, और तेज़ी से बढ़ती frontier demand के साथ एक नई platform layer बनने की कोशिश भी दिखती है

AWS और startup, AI adoption की रफ़्तार

  • AWS का शुरुआती cloud मॉडल ऐसी infrastructure को, जो पहले केवल बड़े enterprise के पास होती थी, कुछ डॉलर और एक credit card के सहारे इस्तेमाल करने लायक बनाता था, और इस तरीके से कि developer को पहले से यह तय नहीं करना पड़ता था कि वह क्या बनाएगा; इससे इंटरनेट पर निर्माण की सीमा बहुत बढ़ गई
  • AI adoption का प्रभाव भी उसी तरह या उससे भी बड़ा माना जा रहा है
    • application बनाने के लिए 10 साल coding सीखना ज़रूरी है, यह ढांचा कमजोर हो रहा है
    • सैकड़ों लोगों की टीम और लंबे development cycle के बिना भी छोटी टीमें तेज़ी से बनाकर बार-बार सुधार कर सकती हैं
    • यह दुनिया के कई क्षेत्रों में नई innovation खोलने के साधन की तरह काम कर रहा है
  • cloud के शुरुआती दौर से अलग, AI adoption की रफ़्तार बहुत तेज़ है
    • 2006 में cloud के लिए यह लंबा समझाना पड़ता था कि “एक bookstore company computing क्यों दे रही है”, लेकिन AI को लोग कहीं जल्दी समझ लेते हैं
    • साधारण intelligent chatbot से आगे बढ़कर enterprise के अंदर के काम करने तक जाने की प्रक्रिया में कुछ education की ज़रूरत थी, लेकिन तकनीकी बदलाव की गति के हिसाब से यह अपेक्षाकृत तेज़ रही
  • startup platform shifts को Internet, cloud, mobile, AI—इन चार चरणों में समेटा जाता है
    • YC के शुरुआती दौर में AWS जैसे cloud की वजह से कम पूंजी से भी कंपनी शुरू करना संभव हुआ
    • colo space किराये पर लेने, server जोड़ने और पहले से भारी पैसा जुटाने वाली बाधाएँ बहुत कम हो गईं
    • सिर्फ server cost पर ही दसियों हज़ार डॉलर लगने की धारणा टूटी और कम पूंजी वाले startup मॉडल संभव हुए
  • बड़े platform transition के दौरान startup अगर छोटे cycle और कम पूंजी के साथ चल सकें, तो वे बड़ी कंपनियों को हराने की बेहतर स्थिति में होते हैं
    • अभी AI के ऊपर भी तस्वीर कुछ वैसी ही दिख रही है
    • YC के भीतर तो batch की शुरुआत और अंत के बीच ही अच्छी कंपनियों की revenue expectation बदल जाती है; यानी revenue growth की रफ़्तार पहले की तुलना में बहुत तेज़ हो चुकी है
  • AWS को आज भी कई growth-stage startup द्वारा इस्तेमाल किए जाने वाले cloud के रूप में पेश किया जाता है
    • scale, availability, security, reliability, AWS के भीतर का ISV partner ecosystem, और AWS का customer base—ये सब साथ मिलकर इसकी ताकत बनते हैं
    • credits के अलावा system design सलाह और go-to-market सलाह भी दी जाती है, और startup को AWS की core foundation के रूप में लगातार देखा जाता है
    • हर quarter startup से सीधे मिलकर यह जाँचा जाता है कि product वास्तव में उनके काम का है या नहीं
  • आज के startup में general compute के लिए AWS और AI के लिए OpenAI API का साथ में इस्तेमाल एक बहुत आम pattern बन चुका है

Bedrock Managed Agents और shared product की दिशा

  • Bedrock Managed Agents को केवल इस रूप में नहीं पेश किया गया कि OpenAI मॉडल AWS पर आ रहे हैं, बल्कि इस रूप में कि OpenAI के frontier मॉडल AWS native agent runtime के भीतर रखे जा रहे हैं
    • identity, permission state, logging, governance, deployment जैसे operational तत्व इसमें साथ बँधते हैं
  • AI का अगला चरण text डालो और text पाओ से आगे बढ़कर, कंपनी के भीतर वास्तविक काम करने वाले stateful agent की ओर जा रहा है
    • “virtual co-workers” शब्द पूरी तरह सटीक नहीं माना गया, लेकिन सबसे कम असहज अभिव्यक्ति के रूप में लिया गया
    • पूरी industry अभी तक यह पूरी तरह तय नहीं कर पाई है कि इसे क्या कहा जाए और कैसे इस्तेमाल किया जाए
  • Codex को इस प्रवाह का एक स्पष्ट उदाहरण बताया गया
    • असल बात यह है कि जो काम चाहिए वह हो जाए; user फिर यह अलग नहीं करता कि मॉडल का योगदान ज़्यादा था या harness का
  • मॉडल और harness का integration एजेंट performance का मुख्य तत्व माना जा रहा है
    • tools, state, memory, permissions, evals असली व्यवहार को तय करते हैं
    • यह pre-training के बिल्कुल समान नहीं है, लेकिन post-training और prompt—दोनों स्तरों पर integration होता है
    • शुरुआत में अलग दिखने वाला tool-calling भी समय के साथ training process में अधिक गहराई से integrated हो रहा है
    • आगे चलकर model और harness, और pre-training व post-training के बीच भी अधिक मजबूत integration की संभावना बताई गई
  • industry maturity को अभी इतना शुरुआती बताया गया कि उसकी तुलना Homebrew Computer Club के दौर से की गई
  • AWS और OpenAI का shared work इस बात पर केंद्रित है कि जिन हिस्सों को ग्राहक अब तक खुद जोड़ते थे, उन्हें साथ बाँधकर enterprise environment में तेज़ी से value तक पहुँचना संभव बनाया जाए
    • ग्राहक चाहते हैं कि मॉडल और एजेंट memory बनाए रखें और साथ में अच्छे से काम करें
    • वे केवल third-party tools ही नहीं, बल्कि अपने tools, अपने data, अपने applications और अपने operating environment तक भी इन्हें जोड़ना चाहते हैं
    • अब तक इस तरह का integration हर ग्राहक को खुद करना पड़ता था
    • shared product में identity built-in होती है, और database authentication भी AWS VPC के भीतर हो, ऐसा design किया गया है
  • लक्ष्य केवल convenience बढ़ाना नहीं, बल्कि उन चीज़ों को भी संभव बनाना है जो पुराने तरीके से बहुत मेहनत से जोड़ने पर भी reliably implement नहीं हो पाती थीं
  • अभी developers को मॉडल का इस्तेमाल करके कुछ बनाने में बहुत ज़्यादा pain और manual work झेलना पड़ता है
    • ChatGPT के उपयोग में भी copy-paste और जटिल prompt combination बहुत होते हैं
    • यह friction आगे चलकर खत्म होगी, लेकिन अभी चीज़ें बहुत शुरुआती और असुविधाजनक चरण में हैं
  • यह collaboration इस वजह से भी सामने आई कि AWS पर पहले से मौजूद ग्राहक OpenAI technology चाहते थे, और OpenAI भी AWS customers तक अपनी पहुँच बढ़ाना चाहता था
  • केवल मॉडल distribution से आगे बढ़कर एक नया product साथ में बनाने वाली प्रकृति पर अधिक ज़ोर दिया गया
    • उम्मीद यह है कि एक साल बाद पीछे मुड़कर देखने पर “AWS से OpenAI मॉडल तक पहुँच मिल गई” से ज्यादा इस नए product का महत्व दिखाई दे
    • model, harness और capability के स्तर पर यह पुराने model API call से अलग एक नए computing approach के अधिक करीब पहुँचता है

AgentCore, Managed Agents, ऑपरेटिंग मॉडल

  • AgentCore को memory, सुरक्षित execution environment, authorization जैसे agent primitives के सेट के रूप में पेश किया गया
  • Bedrock Managed Agents को AgentCore components के ऊपर OpenAI models और कई operational elements को जोड़कर AWS और OpenAI द्वारा संयुक्त रूप से बनाया गया higher-level product बताया गया
  • सिर्फ AgentCore के साथ भी सीधे agentic workflow बनाया जा सकता है
    • ऐसे ग्राहक पहले से हैं जो इसे production में चला रहे हैं और वास्तविक उपयोग कर रहे हैं
  • अभी भी AgentCore का उपयोग करते हुए OpenAI model को external call करने का तरीका संभव है
    • यह Bedrock के अंदर native रूप से जुड़ा हुआ रूप नहीं है, लेकिन ऐसे ग्राहक हैं जो दूसरे cloud में मौजूद OpenAI models को सीधे call करते हैं
  • AWS इसे open ecosystem के रूप में देखता है
    • मनचाही capabilities को जोड़कर खुद बनाने का तरीका आगे भी जारी रह सकता है
    • जैसे कुछ लोग घर पर खुद कंप्यूटर बनाते हैं, वैसे ही लंबे समय तक खुद agent बनाना चाहने वाले builders भी बने रहेंगे
  • कई ग्राहक ज्यादा आसान तरीका चाहते हैं, जिसमें हर हिस्से को खुद configure न करना पड़े; यह सहयोगी लॉन्च उसी मांग को निशाना बनाता है
  • Azure में OpenAI का उपयोग सीधा API access अनुभव है, जबकि Amazon की यह घोषणा उससे अलग एक managed service के रूप में रखी गई
  • यह managed agent service फिलहाल Amazon के साथ exclusive रूप से आगे बढ़ रही है
    • इसे सिर्फ Amazon API इस्तेमाल करने के स्तर पर नहीं, बल्कि दोनों कंपनियों के joint effort के रूप में देखा जा रहा है
  • ग्राहक डेटा AWS के भीतर ही रहता है
    • पूरा सिस्टम VPC के अंदर रहता है और Bedrock environment के भीतर सुरक्षित रहता है
  • OpenAI models Bedrock के जरिए चलेंगे, और infrastructure में Trainium और GPU का मिश्रण इस्तेमाल होगा
    • इसका कुछ हिस्सा timing से जुड़ा है और कुछ capabilities से
    • समय के साथ अधिक हिस्सा Trainium की ओर जाएगा, ऐसी दिशा बताई गई
    • OpenAI ने भी इस बात पर बड़ा उत्साह दिखाया कि उसके models Trainium पर चलेंगे
  • AWS environment में OpenAI models चलाने पर पहला support contact point AWS होगा
    • ग्राहकों को AWS support और AWS account representatives के जरिए मदद मिलेगी
    • implementation के दौरान OpenAI की टीम भी शामिल होगी और उपयोग के तरीकों पर साथ मिलकर तालमेल करेगी
    • जिन bugs के लिए OpenAI की मदद चाहिए होगी, उन्हें AWS OpenAI तक escalate करेगा

लोकल, क्लाउड, permissions और security boundary

  • Codex ने शुरुआत cloud में की थी, लेकिन बाद में उसका रुख फिर local execution की ओर गया
  • local आसान होने का कारण है कि environment पहले से वहीं मौजूद होता है
    • कंप्यूटर settings, data और file access पहले से उपलब्ध होते हैं, इसलिए अतिरिक्त configuration कम लगता है
    • भले यह अंतिम स्थिति न हो, लेकिन अल्पकाल में ease of use अधिक महत्वपूर्ण रहता है
  • लंबी अवधि में agents का cloud में चलना अधिक उपयोगी दिशा माना गया; बहुत heavy काम या कंप्यूटर बंद करने की जरूरत होने पर काम को cloud में भेजना उपयोगी हो सकता है
  • local client के अपने फायदे अब भी हैं
    • जैसे iPhone app में local components होते हैं, वैसे ही connectivity, latency, local compute, file और application access के मामले में इसके लाभ हैं
    • लेकिन laptop को खुद scale-out नहीं किया जा सकता, इसलिए scalability की सीमा साफ है
  • enterprise environment में local तरीका ज्यादा कठिन हो जाता है
    • सिर्फ दो लोगों के बीच share करना भी कठिनाई बढ़ा देता है
    • permissions और security boundary को संभालना अधिक जटिल हो जाता है
    • आखिरकार local और cloud को जोड़ने वाले bridge की जरूरत पड़ती है
  • agents को उसी environment में develop करना स्वाभाविक है जहाँ उन्हें deploy किया जाएगा, और identity तथा permission design अब भी काफी अधूरा क्षेत्र है
    • क्या agent को वही human account इस्तेमाल करना चाहिए
    • क्या agent का अलग account होना चाहिए
    • कई agents होने पर उन्हें कैसे अलग-अलग पहचाना जाए, जैसे सवाल अभी बचे हुए हैं
  • "Ben का agent, Ben के रूप में login करे लेकिन यह भी दर्ज रहे कि वह असली Ben नहीं बल्कि agent है" जैसी primitive भी अभी मौजूद नहीं है
  • जैसे-जैसे agents workforce का हिस्सा बनेंगे और उनकी autonomy तथा task complexity बढ़ेगी, वैसे-वैसे कंपनी के भीतर और पूरे इंटरनेट में access control और permission models को भी विकसित होना होगा
  • cloud की ओर बढ़ने पर केंद्रीय संगठन के पास security control अधिक मजबूत हो सकते हैं
    • ग्राहकों को शक्तिशाली models और agents की संभावना पसंद है, लेकिन उन्हें सबसे ज्यादा डर ऐसे हादसों का है जिनसे कंपनी को भारी नुकसान हो जाए
    • boundaries को इस तरह नियंत्रित किया जा सकता है कि सिस्टम VPC के भीतर चले, किसी खास gateway से गुजरे, या environment के role की तरह permissions दी जाएँ
    • AWS ने 20 साल में जो security architecture बनाया है, उसी की वजह से इसे सिर्फ startups ही नहीं बल्कि global banks, healthcare institutions और government agencies भी इस्तेमाल कर सके
    • जितनी अधिक risk-averse organization होती है, उतना ही sandbox के भीतर के guardrails adoption को बढ़ा सकते हैं

AI स्टैक और enterprise architecture

  • enterprise ग्राहक ऐसी management layer चाहते हैं जो data और agents को जोड़े, और token spending tracking तथा oversight दे
  • बड़े enterprise ग्राहक लगातार ऐसे पैकेज की मांग कर रहे हैं जिसमें agent runtime environment, management layer और employees के लिए workspace साथ बंधे हों
    • employee workspace के उदाहरण के रूप में Codex जैसी संरचना दी गई
    • ऐसे package की मांग काफी स्थिर है, लेकिन असली offering अभी और विकसित की जानी बाकी है
  • इस बात पर सहमति है कि संगठन के भीतर कई databases, SaaS apps और बिखरे हुए data के बीच एक middleware / middle layer की जरूरत है
    • संबंधित संदर्भ के रूप में OpenAI Frontier का भी उल्लेख जुड़ता है
  • मौजूदा संरचना में ऐसा लगता है कि user interaction संभालने वाली user agent layer और कंपनी की management layer दोनों जरूरी हैं
    • user side पर कई agents के साथ interaction होता है, और ऐसे systems बनाए जा रहे हैं जहाँ अलग-अलग agents आपस में भी बात करते हैं
    • कंपनी की management layer में वह तरह-तरह का control महत्वपूर्ण है जिसकी जरूरत AI को file system आदि explore करते समय पड़ती है
  • हालांकि यदि models काफी अधिक smart हो जाएँ, तो इस पूरी संरचना को redesign करने की संभावना भी खुली हुई है
    • आज की यह dual-layer structure मौजूदा दुनिया के हिसाब से बनाई गई है
    • भविष्य की architecture ठीक कैसी होगी, यह अभी स्पष्ट नहीं है
    • किसी बिंदु पर यह निष्कर्ष निकल सकता है कि "यह तो सीधे model के अंदर होना चाहिए"
    • ग्राहक वास्तव में कैसे इस्तेमाल और निर्माण करते हैं, उससे यह सीखा जाएगा कि क्या चीज़ और आसान, तेज़ और बेहतर बनानी है

मांग, capacity, model tiering

  • OpenAI इस कारोबार में बहुत अधिक compute खरीद और काफी प्रयास लगा रहा है, और उसी अनुपात में revenue की भी उम्मीद कर रहा है
  • यदि कीमत पर्याप्त कम हो जाए तो intelligence की मांग को लगभग बिना ऊपरी सीमा वाली मांग जैसा माना जा रहा है
  • फिलहाल कीमत से ज्यादा बड़ी बाधा capacity की कमी दिखती है
    • कीमत चाहे जो हो, अधिक capacity चाहने और उसके लिए अतिरिक्त भुगतान करने को तैयार ग्राहक, कीमत पर मोलभाव करने वाले ग्राहकों से ज्यादा हैं
    • यह स्पष्ट विश्वास रखा गया कि मौजूदा स्तर की intelligence cost आगे चलकर नाटकीय रूप से कम होगी
  • कुल बाजार मांग का बड़ा हिस्सा absolute frontier पर केंद्रित है, इसे अपेक्षा से अधिक चौंकाने वाला संकेत माना गया
    • यह धारणा कि पुरानी पीढ़ी के models काफी होंगे, उससे ज्यादा मजबूत रुझान यह दिखा कि ग्राहक लगातार नवीनतम frontier models ही चाहते हैं
  • जैसे कई दशकों में compute cost बहुत कम होने के बावजूद बिक्री लगातार बढ़ती रही, वैसे ही AI भी इसी तरह के demand expansion path का अनुसरण कर सकता है
  • अभी उपयोगी काम करने के लिए कई मामलों में frontier models की जरूरत पड़ती है, इसलिए सभी की मांग उसी तरफ है
  • समय के साथ छोटे, सस्ते और तेज models और बहुत बड़े models साथ मौजूद रहने वाली मिश्रित संरचना बनने की उम्मीद है
    • कुछ छोटे models समय के साथ ऐसे काम भी कर सकेंगे जो अभी के नवीनतम OpenAI models भी नहीं कर पाते
    • बहुत बड़े models cancer treatment जैसे बड़े सवालों को निशाना बना सकते हैं
  • अभी यह सब शुरुआती चरण में है, और इस स्तर की मांग तथा growth का साथ दिखाई देना आगे की संभावनाओं को बहुत बड़ा बनाता है

Trainium, abstraction, internal compute

  • Trainium के बारे में इस सवाल पर कि नाम के विपरीत आगे चलकर इसकी मौजूदगी inference पक्ष में अधिक बढ़ सकती है, AWS ने जवाब दिया कि यह training और inference दोनों के लिए उपयोगी है
  • इस दिशा पर जोर दिया गया कि ग्राहक Trainium को सीधे संभालने के बजाय managed service की abstraction के जरिए उससे जुड़ेंगे
    • जैसे अधिकांश ग्राहक GPU से सीधे डील नहीं करते, वैसे ही OpenAI या Claude का उपयोग करते समय वे वास्तव में GPU, Trainium, TPU नहीं बल्कि interface के साथ इंटरैक्ट करेंगे
  • आगे भी accelerator chip संभवतः कुछ बड़े models और services के पीछे काम करते रहेंगे
    • संख्या 5, 10, 20 या 100 तक हो सकती है, लेकिन उन्हें सीधे प्रोग्राम करने वाले लोगों की संख्या लाखों में बढ़ने की संभावना नहीं मानी गई
    • model training पर बहुत पैसा लगता है और इसके संचालन के लिए उच्च स्तर की विशेषज्ञता चाहिए
    • OpenAI टीम बड़े compute clusters से अधिकतम value निकालने में बेहद सक्षम है, लेकिन ऐसी टीम रखने वाली जगहें बहुत अधिक नहीं हैं
  • OpenAI ने कहा कि वे पहले खुद को token factory की तरह सोचते थे, लेकिन फिर इसे सुधारते हुए कहा कि वे intelligence factory के अधिक करीब हैं
    • ग्राहकों को tokens की संख्या नहीं, बल्कि सबसे कम लागत पर पर्याप्त capacity के साथ सर्वश्रेष्ठ intelligence unit चाहिए
  • GPT-5.5 को ऐसे उदाहरण के रूप में पेश किया गया जहाँ प्रति token लागत 5.4 से अधिक है, लेकिन वही जवाब पाने के लिए जरूरी tokens की संख्या कहीं कम है
    • उपयोगकर्ता इस बात से ज़्यादा मतलब रखते हैं कि उनका काम पूरा हुआ या नहीं, बजाय इसके कि जवाब में कितने tokens लगे
  • चाहे बड़ा model कम tokens में चले या छोटा model ज़्यादा tokens में, और चाहे GPU हो या Trainium, ग्राहक आंतरिक implementation से अधिक कम लागत में अधिक उपयोगिता चाहते हैं
  • Codex या Amazon Bedrock के लिए Stateful Runtime Environment के भीतर नया agent बनाते समय भी, उपयोगकर्ता को internal compute selection के प्रति सचेत होने की जरूरत नहीं होनी चाहिए
  • token usage में कमी मुख्य रूप से model improvements का नतीजा है, जबकि harness का प्रभाव केवल आंशिक है
  • AWS ने इस सवाल पर कि क्या वह इसी तरह की managed service को दूसरे models तक भी बढ़ाएगा, सिर्फ इतना कहा कि फिलहाल उसका फोकस OpenAI के साथ collaboration पर है

बाज़ार की दिशा और platform strategy

  • ChatGPT को Facebook के बाद आए पहले बड़े नए consumer product के रूप में आंका गया
  • OpenAI ने कहा कि उसने केवल ChatGPT ही नहीं, बल्कि API और खासकर Codex में भी काफी अच्छे नतीजे हासिल किए हैं
    • यह भी याद किया गया कि पहले अधिक ध्यान इस संभावना पर था कि नया language interface इंटरनेट पर जानकारी खोजने के तरीके को बदल सकता है
    • Google को अब भी breadth और depth के लिहाज से phenomenal company माना गया
  • AWS ने शुरू से partner-केंद्रित strategy अपनाई है, और उसका लक्ष्य ऐसा ढांचा बनाना रहा है जिसमें partner सफल हों तो AWS भी सफल हो
    • यह उस मॉडल से अलग है जिसमें सब कुछ खुद own करना जरूरी माना जाता है, और यह अधिक pie को बड़ा करने जैसा है
    • उसका मानना है कि ग्राहकों को अपने लिए सबसे उपयुक्त विकल्प चुनने में सक्षम होना चाहिए, चाहे वह उसका अपना product हो या partner का
  • Bedrock भी इसी strategy के आधार पर design किया गया है ताकि वह व्यापक model range और विविध features को support कर सके
    • database, compute platform और अन्य क्षेत्रों में भी AWS इसी तरह का approach बनाए रखता आया है
  • AWS का मानना है कि infrastructure layer में वह S3 जैसे अपने core components को मज़बूती से आगे बढ़ाता है, लेकिन stack में ऊपर जाने पर व्यापक partner ecosystem को अपनाना ग्राहक के लिए भी अधिक फायदेमंद होता है
  • दोनों कंपनियों की भूमिका का ढांचा यह है: OpenAI Software, AWS Infrastructure, और दोनों मिलकर Platform बनाते हैं
  • अगले 1 साल में model capabilities के तेज़ी से आगे बढ़ने की उम्मीद को देखते हुए, दोनों का मानना है कि अभी साथ मिलकर platform बनाना अच्छा timing है

1 टिप्पणियां

 
GN⁺ 2026-04-29
Hacker News की राय
  • जिन privacy-sensitive organizations के साथ मैं काम करता हूँ, वहाँ Claude को कहीं ज़्यादा आसानी से स्वीकार किया गया
    क्योंकि उसे Amazon जैसे "trusted" intermediary के ज़रिए access किया जा सकता था। OpenAI प्रतिबंधित है और उस पर भरोसा नहीं किया जाता
    मैं ज़रूरी नहीं कि इन organizations की legal teams के फैसलों से सहमत हूँ, लेकिन उन्होंने service terms मुझसे कहीं ज़्यादा ध्यान से पढ़ी होंगी
    यह घोषणा खेल बदल देगी या नहीं, यह देखना होगा, लेकिन अभी मेरे अनुभव में OpenAI कई मायनों में काफ़ी पीछे दिखता है
    हालाँकि AI इंडस्ट्री में 2~8 हफ़्तों का फ़र्क बहुत बड़ा गैप भी नहीं होता, इसलिए यह वास्तविक असर से ज़्यादा perception की समस्या भी हो सकती है
    कम-से-कम मेरे information bubble में Sam Altman की वजह से OpenAI की reputation बिल्कुल नीचे है, और यह unethical भी लगता है; fabs से जुड़ी माँगों जैसी चीज़ें देखें तो काफ़ी unstable भी दिखता है, इसलिए पसंद नहीं आता
    • बड़े LLM providers कहीं भी ZDR contracts कर सकते हैं
      सिर्फ AWS इस्तेमाल करना काफ़ी नहीं है, और AWS model चलाए तब भी अगर सही ZDR चाहिए तो उसके लिए अलग से बात करनी पड़ेगी [0]
      [0]: https://platform.claude.com/docs/en/build-with-claude/claude...
    • Anthropic के पास बेहतरीन models और अपेक्षाकृत स्थिर leadership है, यह सही है, लेकिन enterprise accessibility को बहुत बढ़ाने का काम आख़िरकार AWS ने किया
      दोनों को इससे साफ़ फ़ायदा हुआ, और AWS customers की feedback loop culture ने शायद Anthropic को enterprise readiness तेज़ी से बनाने में मदद की
    • legal terms, SLA, और data concerns के लिहाज़ से क्या यह सच में OpenAI on Azure से बेहतर है?
      Azure वाला विकल्प तो पहले से काफ़ी समय से मौजूद है
    • OpenAI सिर्फ एक LLM बेचने पर केंद्रित नहीं है, वह video और image generation भी साथ कर रहा है
      जबकि Anthropic एक चीज़ पर फ़ोकस करता है, और शायद यही वजह है कि वह SWE benchmarks में लगातार शीर्ष पर रहता है
    • यह सिर्फ इसलिए नहीं है कि AWS एक "trusted intermediary" है, असली बात यह है कि model customer के अपने AWS account के अंदर अलग contract के तहत चलता है
      AWS साफ़ कहता है कि input और output model provider के साथ share नहीं किए जाते, और base model training में भी इस्तेमाल नहीं होते [1]
      ऊपर से OpenAI को NYT v. OpenAI मामले में मई 2025 का preservation order मिला है, और court उसे ChatGPT output logs को लगभग अनिश्चित समय तक सुरक्षित रखने के लिए मजबूर कर रही है
      इसमें वे user-deleted conversations भी शामिल हैं जो सामान्यतः 30 दिनों में हटा दी जातीं [2]
      इसलिए HIPAA/GDPR से बंधे organizations के लिए यह शुरुआती स्तर पर ही अयोग्य शर्त बन जाती है
      [1] https://aws.amazon.com/bedrock/faqs/
      [2] https://openai.com/index/response-to-nyt-data-demands/
  • मैं big tech में काम करता हूँ, और दो teams के बीच एक छोटा feature deploy करवाने के लिए भी endless meetings होती हैं, तो ऐसे model को Bedrock hardware पर लाने में कितनी meetings और कितने 6-pagers लगे होंगे, इसका अंदाज़ा भी नहीं लगा सकता
    • इस स्तर पर अक्सर बस फैसला लिया जाता है, एक SWAT team बनाई जाती है, और कुछ हफ़्तों में काम धकेल दिया जाता है
      politics या bureaucratic review ज़्यादातर निचले स्तर के लोगों को feature leftovers और operational कामों में उलझाए रखने जैसी चीज़ लगते हैं
    • implementation कैसे हुई, इस पर निर्भर करेगा, लेकिन Amazon पहले ही gpt-oss-20b जोड़ चुका है
      अगर model GPT के OSS variant से काफ़ी मिलता-जुलता है, तो शायद यह जितना लगता है उतना जटिल नहीं रहा होगा
  • अलग-अलग inference platforms पर चलने वाला वही model ज़रूरी नहीं कि बिल्कुल वही results दे
    quantization, custom serving silicon, batching, और दूसरी inference optimizations की वजह से hosted version का व्यवहार original provider वाले version से अलग हो सकता है
    यह paper बिल्कुल यही स्थिति नहीं देखता, बल्कि auditable open-weight Llama पर है, लेकिन मिलते-जुलते symptoms अच्छी तरह दिखाता है
    https://arxiv.org/pdf/2410.20247
    • जिन लोगों ने OpenAI और Microsoft दोनों के जरिए gpt-x इस्तेमाल किया है, उन्होंने यह अंतर बहुत साफ़ महसूस किया होगा
  • हमारे organization में भी Bedrock availability ही Anthropic के उपयोग को आगे बढ़ाने वाला मुख्य कारण था
    लगता है वहाँ अच्छा-ख़ासा margin भी निकाला जा सकता है
    यह Microsoft से दूर जाने वाले broader trend से सीधे जुड़ा है या नहीं, यह भी जानना चाहूँगा
    मेरे आसपास के उदाहरणों में, serious enterprise deployments में OpenAI को लगभग नज़रअंदाज़ किया जा रहा है, क्योंकि Azure पर उसका offering ख़ास नहीं है, और उसके अलावा enterprise-friendly रास्ते भी नहीं हैं
    ऐसा लगता है कि OpenAI को समझ आ गया कि अगर वह enterprise market को Anthropic + AWS के हाथ लगातार जाने देता रहा तो यह घातक होगा, इसलिए वह catch up करने के लिए आगे बढ़ा है
    • यह काफ़ी स्पष्ट लगता है कि OpenAI ने इसकी तैयारी करते समय contract renegotiation किया
      https://news.ycombinator.com/item?id=47921248
    • बिल्कुल जिज्ञासा से पूछ रहा हूँ, Azure वाली तरफ़ दिक्कत क्या है?
  • यहाँ दिलचस्प बात enterprise sales की प्रक्रिया है
    finance और healthcare जैसे regulated industries के पास अक्सर पहले से AWS के साथ data residency commitments वाले contracts होते हैं
    Bedrock पर OpenAI ऐसे organizations को OpenAI के साथ अलग से DPA negotiate करने की ज़रूरत से बचाता है, इसलिए यह कागज़ पर जितना दिखता है उससे कहीं बड़ा breakthrough हो सकता है
  • compliance के नज़रिए से यह काफ़ी स्वागतयोग्य बदलाव है
    एक subprocessor कम हो जाता है, और data पहले से AWS के भीतर है, इसलिए उसे कहीं और भेजे जाने की चिंता भी कम होती है
  • ऐसा लगता है कि OpenAI अब Anthropic के पीछे क़रीब-क़रीब लगा हुआ है
  • अब AWS के ज़रिए OpenAI खरीदा जा सकता है, लेकिन इसका मतलब यह भी है कि मुझे एक और मेरे tools के साथ पूरी तरह incompatible interface इस्तेमाल करना होगा
    जब तक AWS ने आख़िरकार हार मानकर Bedrock को उपयोगी बनाने के लिए OpenAI API compatibility नहीं जोड़ दी हो
  • उम्मीद से जल्दी आ गया
    • असली तैयारी में भले बहुत समय लगा हो, लेकिन जनता को दिखने वाला PR flow एक बारीकी से चलने वाली मशीन जैसा है
      सिर्फ इस HN पोस्ट में ही announcement links एक साथ 4 आईं, यह संयोग नहीं है
      अगर ग़लत बात ग़लत समय पर निकल जाए तो अरबों डॉलर की funding हिल सकती है, इसलिए messaging को बहुत सावधानी से तराशकर चरणबद्ध तरीके से बाहर भेजा जाता है
  • लगता है OpenAI आख़िरकार dumb pipe की दिशा में जा रहा है