AWS Bedrock, Mythos और आने वाले मॉडलों के लिए Anthropic के साथ डेटा साझा करना आवश्यक होगा

(news.ycombinator.com)

1 पॉइंट द्वारा GN⁺ 2026-06-12 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Mythos-श्रेणी के मॉडल ट्रैफ़िक को एकल इंटरैक्शन में दिखाई न देने वाले दुरुपयोग पैटर्न का पता लगाने के लिए 30 दिनों तक रखा जाएगा
Bedrock के Fable 5, Mythos 5, और समान या उससे अधिक क्षमता स्तर वाले आने वाले मॉडलों पर ये शर्तें लागू होंगी
सीमित अवधि का डेटा रिटेंशन Anthropic के लिए उन दुरुपयोग पैटर्नों का पता लगाने की शर्त है जो केवल एकल इंटरैक्शन से दिखाई नहीं देते
डेटा रिटेंशन के लिए सहमति देने पर डेटा AWS की डेटा और सुरक्षा सीमाओं के बाहर चला जाएगा
30 दिनों के बाद डेटा अपने आप हटा दिया जाएगा, लेकिन सुरक्षा जांच के दायरे में आने वाले या कानूनी रूप से संरक्षित रखे जाने वाले दुर्लभ मामलों में अपवाद होगा

किन पर लागू होगा और रिटेंशन की शर्तें

AWS घोषणा से उद्धरण Bedrock के Fable 5, Mythos 5, और समान या उससे अधिक क्षमता स्तर वाले आने वाले मॉडलों पर लागू होता है
Anthropic, Mythos-श्रेणी के मॉडलों के सभी ट्रैफ़िक के लिए 30-दिन रिटेंशन की मांग करता है
सीमित अवधि का डेटा रिटेंशन उन दुरुपयोग पैटर्नों का पता लगाने का तरीका है जो एकल इंटरैक्शन में दिखाई नहीं देते

डेटा सीमाएँ और हटाने के अपवाद

डेटा रिटेंशन के लिए सहमति देने पर संबंधित डेटा AWS की डेटा और सुरक्षा सीमाओं के बाहर चला जाता है
Claude सहायता दस्तावेज़ के अनुसार 30 दिनों के बाद डेटा अपने आप हटा दिया जाता है
यदि डेटा सुरक्षा जांच में शामिल हो या कानूनी रूप से उसे संरक्षित रखना आवश्यक हो, तो 30 दिनों बाद स्वचालित हटाने का अपवाद लागू होगा

1 टिप्पणियां

GN⁺ 2026-06-12

Hacker News की राय

समस्या की जड़ यह है कि AI as a service बंद-सा है। इसे देने वाली कंपनियों के पास उस सारे डेटा का इस्तेमाल करके प्रतिस्पर्धियों से आगे निकलने की बहुत मजबूत प्रेरणा होती है, और वे यह काम चुपचाप भी कर सकती हैं
ऊपर से, कानून लागू करने वाली एजेंसियाँ भी वहाँ तक पहुँचने के लिए बेचैन होंगी। उम्मीद है कि कभी open source और सस्ता hardware इतना आगे आए कि सक्षम मॉडल चलाए जा सकें
- यह पहले से हो रहा है
  https://www.theguardian.com/world/2026/feb/23/openai-tumber-...
- क्या “वे इसे चुपचाप कर सकती हैं” वाकई सही है? ZDR (Zero Data Retention) enterprise contracts में standard wording होता है, और अगर कोई vendor contract terms को नज़रअंदाज़ करके इतनी liability उठाने को तैयार हो, तो यह काफ़ी गंभीर बात लगती है
  ऊपर से Anthropic के पास SOC2 और ISO27001 हैं, इसलिए कुछ हद तक independent audit भी हुआ है। हाँ, वे ऐसे records या logging छिपाने की कोशिश कर सकते हैं, लेकिन दूसरी तरफ उस डेटा को चोरी-छिपे इकट्ठा न करने की भी मजबूत प्रेरणा है
  बस दिक्कत यह है कि ZDR पर अक्सर minimum contract amount जुड़ा होता है, इसलिए individual users या छोटी कंपनियाँ बाहर रह जाती हैं और सब कुछ provider की मर्ज़ी पर छोड़ दिया जाता है
- मेरी समझ से SOC 2 Type 2 audit में auditor को access verify करना होता है। अगर आप Anthropic, Google, OpenAI जैसे top 3 providers के paid/business versions खरीदते हैं, तो वे SOC 2 Type 2 होते हैं, और क्या ऐसे services में access logs बनाए नहीं रखे जाते तथा independent auditor यह verify नहीं करता कि डेटा तक नियमों के ख़िलाफ़ पहुँच या उसका इस्तेमाल नहीं हुआ?
  मूलतः AWS इस बारे में शुरू से रिपोर्ट इसलिए कर रहा है
- समस्या की जड़ यह है कि आम लोग अपनी ज़िंदगी में दिखने वाली समस्याओं पर पर्याप्त आवाज़ नहीं उठाते, और इस तरह वे practically पशुधन बन जाते हैं
  क्या कोई पशुधन की राय की परवाह करता है? कुछ लोग करेंगे, लेकिन ज़्यादातर नहीं
- यह सब बेहद dystopian है, और समझ नहीं आता कि यह बेहतर कैसे होगा। जिन कुछ megacorps के पास compute resources और चुराई हुई intellectual property के ढेर तक पहुँच है और जो secret models train कर सकते हैं, उनके पास वापस योगदान देने की कोई प्रेरणा नहीं है
  वे कह सकते हैं कि मॉडल आम लोगों के लिए बहुत ख़तरनाक हैं, इसलिए public versions को कमजोर करेंगे, और असली अच्छे secret versions तक पहुँच सिर्फ़ अपनी पसंद के megacorps या राष्ट्रीय साझेदारों को देंगे
  उम्मीद की जा सकती है कि चीन के open weights models बराबरी तक पहुँच जाएँ, लेकिन जिस पल वे monopoly frontier models के सचमुच बराबर होंगे, संभव है वे भी weights public करना बंद कर दें। वे यह सब भलाई में नहीं कर रहे
  कल्पना करना मुश्किल है कि कौन-सी चीज़ इस प्रवाह को पटरी से उतार सकती है
यह अजीब व्यवहार है, और इससे थोड़ा-बहुत सबूत मिलता है कि Anthropic को गंभीर लोग manage नहीं कर रहे। अगर AWS/GitHub/Zed आदि पर यह policy लागू की गई, तो enterprise और government sales में जो बड़ा advantage इनके पास है, वह ऐसे competitor को दे दिया जाएगा जिसके पास मिलते-जुलते performance वाले models और ठीक-ठाक UI हो
- जो competitors ऐसे models बना सकते हैं, वे बहुत पहले से consent-based data sharing के विचार पर लार टपका रहे थे। Anthropic ने पहले दरवाज़ा खोल दिया है, इसलिए अब दूसरी कंपनियाँ भी “पहली” बनने का बोझ उठाए बिना यही काम कर सकती हैं। मुझे लगता है OpenAI वगैरह के अगले models भी ऐसी ही requirements रखेंगे
  Mythos की घोषणा के बाद यह साफ़ हो गया है कि हम ऐसे भविष्य की ओर बढ़ रहे हैं जहाँ नवीनतम top-performance models अब आम लोगों को उपलब्ध नहीं होंगे। सिर्फ़ कीमत ज़्यादा नहीं होगी, बल्कि use-case verification और data sharing जैसी शर्तें भी माँगी जाएँगी। OpenAI का 5.5-Cyber model भी ऐसा ही है, इसलिए यह सिर्फ़ Anthropic की बात नहीं
  हमें बुरा इसलिए लग रहा है क्योंकि हम इस बात के आदी हो चुके हैं कि नया चमकदार model आते ही उसे तुरंत आज़मा सकें। लेकिन इस thread में Anthropic को “बेवकूफ़” कहना भावनात्मक wishful thinking जैसा लगता है
- सच कहूँ तो, जिन लोगों के बहुत बड़े पैसे दाँव पर लगे हैं, उन्होंने शायद इस comment को लिखते समय आई क्षणिक सोच से कहीं ज़्यादा गहराई से इस पर विचार किया होगा
- वे शायद इस पर दाँव लगा रहे हैं कि अगर competitor उनके सबसे ताक़तवर models को distill नहीं कर पाए, तो वे काफ़ी लंबे समय तक आगे रहेंगे, और आख़िर में लोग इन शर्तों को मान लेंगे
- OpenAI ने भी हाल में अपने models को Bedrock में जोड़ा है, इसलिए switch करना आसान हो गया है
- यह समझना मुश्किल है कि Anthropic अभी जो कह रहा है, उसमें कितना हिस्सा IPO से पहले की marketing bakwas है और कितनी लंबी चलने वाली policy
  अगर यह “हमारे models इतने ताक़तवर हैं कि रात में इन्हें बाँधकर रखना पड़ता है” जैसी marketing है, तो यह बेहद ग़लत तरह से बनाई गई strategy लगती है। ग्राहकों का मुश्किल से जीता गया trust तोड़ने का इससे बेहतर तरीका सोचना मुश्किल है
  1. अगर हमें तुम्हारा काम पसंद नहीं आया, या लगा कि तुम हमसे compete कर सकते हो, तो हम तुम्हारे पैसे देकर जनरेट कराए गए code को चुपचाप ख़राब कर देंगे
  2. privacy guarantees बहुत कमज़ोर हो जाएँगी। जाँच के दौरान तुम जो कुछ भेजोगे, उसे हम अनिश्चित समय तक रखेंगे
    दोनों ही बातें आत्मघाती लगती हैं, ख़ासकर यह देखते हुए कि Anthropic ने enterprise customers को, विशेषकर coding में, काफ़ी अच्छी तरह आकर्षित किया है और शायद military customers को भी लगातार target कर रहा है
    चुपचाप reject करना वाला हिस्सा सचमुच असामान्य है। समझ नहीं आता कि इसका मतलब सिर्फ़ जानबूझकर धीमा करना और पैसे के हिसाब से सेवा न देना है, या generated code में सक्रिय रूप से छेड़छाड़ करना। सीधे request को reject ही क्यों नहीं करते?
    शायद वे यह कहना चाहते हैं कि साफ़ इनकार करना ही इस बात का बहुत बड़ा signal दे देता है कि वे किसे मूल्यवान मानते हैं, लेकिन “recursive self-improvement” वाली बात मुझे IPO को चमकाने के लिए 100% bakwas लगती है। क्या वे सचमुच इतने घमंडी हैं कि सोचते हैं बाकी LLM बनाने वाली कंपनियाँ basic development infrastructure जैसी चीज़ें समझ ही नहीं पाईं?
    सिर्फ़ यह बात ही काफ़ी बुरी है कि Anthropic को लगता है कि अपने साथ compete करने वाली किसी चीज़ को बनाने वाले requests को चुपचाप fail कर देना थोड़ा भी ठीक है। ऊपर से “Fable” जिस तरह reject करता है, उसमें दिखने वाली भारी अक्षमता को देखते हुए, ऐसे फैसले इरादे से कहीं ज़्यादा requests को चुपचाप fail कर देंगे
    Anthropic के model names “Mythos”, “Fable” ऐसे लगते हैं जैसे किसी 14 साल के बच्चे ने सोचा हो कि “महाकाव्यात्मक” नाम रखने से model ज़्यादा ताक़तवर लगेगा। यह वैसा ही है जैसे Honda Civic पर racing stripes और शोर करने वाला fart-can exhaust लगा देना
यह नीति सभी providers पर लागू होती है। Cursor की warning यहाँ है: https://i.redd.it/7sfyker2ya6h1.png
Anthropic ने वादा किया है कि वह logged data से मॉडल को train नहीं करेगा, इसलिए यहाँ कुछ चिंताएँ पूरी तरह समझ में नहीं आतीं। सटीक threat model क्या है? क्या यह मान लिया जाए कि Anthropic terms का उल्लंघन करके मॉडल को train करेगा? पहले इतना भरोसा था कि वे data log नहीं करेंगे, लेकिन अब यह भरोसा नहीं कि logged data के उपयोग पर लगी पाबंदियों का पालन करेंगे?
कुछ replies ने मुझे कुछ हद तक convinced किया। फिर भी यह देखना ज़रूरी है कि यह बदलाव मुख्य रूप से Enterprise users को प्रभावित करता है। consumer plan का data पहले से 30 दिनों तक रखा जाता है। स्रोत: https://privacy.claude.com/en/articles/10023548-how-long-do-...
- आप दूसरी पार्टी पर कितना भरोसा करते हैं, यह खास मायने नहीं रखता। regulatory दुनिया में मायने सिर्फ यह रखता है कि क्या वे compliance की गारंटी देने वाले contract पर sign करते हैं
  AWS के साथ ऐसा contract है, लेकिन Anthropic के साथ नहीं। अगर Anthropic physical रूप से data capture करता है, तो वह खुद को उस party boundary के बाहर ले जाता है जिसके भीतर हम deal कर सकते हैं
  अगर वे contract sign करें और उसके अनुरूप सारे compliance controls लागू करें तो बात अलग है, लेकिन अगर आपको लगता है कि AWS ने 10 साल में जो बनाया है, उसकी बराबरी Anthropic अभी तुरंत AWS के हर operating jurisdiction में कर देगा, तो यह बिल्कुल भी समझदारी भरा सौदा नहीं है
- Meta ने भी privacy का सम्मान करने का वादा किया था। company name को दुनिया की top 50 कंपनियों में किसी से भी बदलकर देख लें, और फिर याद करें कि उन्होंने अपने वादे कितने निभाए या नियम तोड़कर भी कैसे बच निकले
  अमेरिका में ऐसे उल्लंघनों पर किसी कंपनी को बर्बाद कर देने वाले कानून नहीं हैं। इसलिए कोई गारंटी भी नहीं है
  Meta ने किताबें खुलेआम torrent की थीं, और किसी ने उनसे AI model हटाने या नष्ट करने की मांग नहीं की। Anthropic के लिए भी यह बस business cost ही होता। model को वैसे ही रहने दिया जाता, और नियम तोड़ने पर भी कोई वास्तविक नतीजा नहीं होता
- अब data के लिए भरोसा करने लायक एक और provider बढ़ गया। पहले मान लिया जाता था कि AWS data को सुरक्षित तरीके से संभाल रहा है, और वैसे भी data शायद AWS पर हो सकता था
  अब दो providers data संभाल रहे हैं, इसलिए अगर आप दोनों पर बराबर भरोसा भी करें तो risk दोगुना हो जाता है। अगर आपको लगता है कि AWS के data controls Anthropic से ज़्यादा मजबूत हैं, तो risk दोगुने से भी अधिक हो जाता है
  allowed storage/transfer countries, तरह-तरह के certifications, contracts जैसे data governance requirements भी हो सकते हैं, और अब इन्हें दूसरे data processor तक भी बढ़ाना पड़ेगा
  मूल रूप से, अगर आप पहले से AWS इस्तेमाल कर रहे हैं, तो AWS-only Bedrock model जोड़ना कानूनी रूप से आसान है और security posture भी बहुत नहीं बदलता। लेकिन अगर data Anthropic में भी log करना पड़े, तो विकल्प कहीं अधिक जटिल हो जाता है
- दोनों बातें एक साथ सच हो सकती हैं। शायद Anthropic हमारे Fable sessions से train नहीं करेगा, इस पर भरोसा किया जा सकता है, लेकिन ZDR का industry standard से कमजोर होना फिर भी एक खतरनाक precedent है
  data retention और सामान्य mass surveillance के बीच समानता है। दोनों systems सही safeguards के साथ पूरी तरह अच्छे उद्देश्यों के लिए इस्तेमाल हो सकते हैं। लेकिन इतिहास दिखाता है कि surveillance systems को बुरे उद्देश्यों के लिए हैरान कर देने वाली आसानी से hijack किया जा सकता है। model providers के पास भी retained data को internal purposes के लिए इस्तेमाल करने की मजबूत प्रेरणा होती है
  भले ही मुझे न लगे कि यह policy अभी तुरंत मेरी privacy का उल्लंघन करती है, फिर भी इसका विरोध करना उचित है
- यह कहना कि data store नहीं किया जाता, और यह कहना कि data को 30 दिन तक रखकर “समस्याओं” के लिए review किया जाता है, दोनों अलग बातें हैं
  कौन review करता है, कैसे review करता है, और वे कौन-सी “समस्याएँ” ढूँढ रहे हैं — ये बातें मेरी spidey sense को trigger करती हैं। यह बहुत अस्पष्ट है, और वे इस “खतरनाक” model को सिर्फ अपने पास रख सकते हैं
regulated companies या government customers के लिए यह लगभग निश्चित रूप से स्वीकार्य नहीं होगा। लेकिन AWS यह जानता ही होगा, इसलिए उसने सहमति क्यों दी, यह सवाल है
- उसने सहमति क्यों दी, यह साफ है, लेकिन कह देना फिर भी ठीक है। क्योंकि यह उतना valuable है। इस model की demand अभूतपूर्व है, और अगर AWS मना भी करता, तो Anthropic का एकमात्र नुकसान शायद बस इतना होता कि xAI और Google से हाल में मिले compute resources के साथ Fable तैयार करते समय revenue एक quarter के लिए टल जाता
- GitHub Copilot में भी यही स्थिति है [1]। GitHub Copilot, AWS solution की तुलना में government में ज़्यादा घुस चुका है
  Anthropic कोशिश कर रहा है, और देखना होगा कि यह bold strategy साबित होती है या नहीं
  1. https://github.blog/changelog/2026-06-09-claude-fable-5-is-g...
इसमें corporate espionage के advanced version जैसी गंध आती है। अगर मान लें कि आगे चलकर ज़्यादातर कंपनियाँ यही AI इस्तेमाल करेंगी, तो यह data सीधे Echelon जैसे network में जाएगा, और Boeing बनाम Airbus scandal की तरह “दिलचस्प जानकारी” दोस्ताना पक्षों तक लीक होती रहेगी। उस मामले को भी पहले खूब report किया गया था, फिर आधिकारिक रूप से दबा दिया गया
- अगर यह कोई गुप्त espionage program होता, तो इसका कुछ हिस्सा सार्वजनिक क्यों किया जाता?
  अगर data का इस्तेमाल गुप्त espionage या government surveillance के लिए करना होता, तो सब कुछ पूरी तरह secret रखा जाता
- इसमें government के साथ secret agreement जैसी गंध ज़्यादा आती है
उफ़। उम्मीद है कि सिर्फ हमारी company को ही Opus 4.8 पर बने रहने, किसी दूसरे model provider पर जाने, या फिर no model retraining और no third-party data transfer जैसी terms को बहुत कमजोर बनाकर update करने जैसा मुश्किल फैसला नहीं लेना पड़ेगा
मैं समझ सकता हूँ कि Anthropic यह क्यों चाहता है, लेकिन अगर data सीधे Anthropic तक न जाता, और Amazon पहले Anthropic tools से analysis चलाकर सिर्फ तब आगे देखता जब उसे लगे कि कुछ देखने लायक है, तो यह कहीं अधिक सहज होता। उस स्थिति में enterprise terms और privacy policy में इसे exception के रूप में रखना भी आसान होता
- क्या आप बता सकते हैं कि AWS फिलहाल वास्तव में क्या guarantee देता माना जाता है, और आपकी company के लिए उसमें सटीक value क्या है? मैं platform से बहुत परिचित नहीं हूँ, लेकिन दूसरी अमेरिकी कंपनियों की तरह मेरा मानना है कि CLOUD Act के तहत, storage location चाहे जो हो, वैध request आने पर वह अमेरिकी agencies को data दे देगा
हमारे लिए यह subprocessor नहीं है, इसलिए तुरंत अस्वीकार्य है। subprocessor list update भी उन्होंने बिगाड़ दी है
अगर यह cloud के भीतर process होता तो मुझे फर्क नहीं पड़ता, लेकिन governance और control दोनों ही नहीं हैं, इसलिए शुरुआत से ही यह संभव नहीं है
यह हर तरह के ऐप्स के लिए बाहर करने वाली शर्त बन जाती है
मैंने UKGov के लिए कुछ ऐप्स पर काम किया है, और अगर मैं होता तो इसे बहुत बड़ा खतरे का संकेत मानकर ज़रूर उठाता
बस, कहानी यहीं खत्म। अगर आप Fable पर गोपनीय डेटा चला रहे हैं, तो आप उसे मुफ्त में सौंप रहे हैं
हो सकता है पहले से भी ऐसा रहा हो, लेकिन अब इसे साफ़ तौर पर अनिवार्य किया जा रहा है
Mythos के प्रदर्शन पर अपने भरोसे के कारण खुद अपने पैर पर कुल्हाड़ी मारने की Anthropic की इच्छा को मानना पड़ेगा
- और भी अजीब बात यह है कि ये मॉडल सिर्फ एंटरप्राइज़ को बिना किसी सीमा के दिए जाएंगे, फिर भी डेटा स्टोर करना ज़रूरी है
  गेम प्लान क्या है?

AWS Bedrock, Mythos और आने वाले मॉडलों के लिए Anthropic के साथ डेटा साझा करना आवश्यक होगा

किन पर लागू होगा और रिटेंशन की शर्तें

डेटा सीमाएँ और हटाने के अपवाद

संबंधित पढ़ाई

1 टिप्पणियां

Hacker News की राय