AWS Bedrock, Mythos और आने वाले मॉडलों के लिए Anthropic के साथ डेटा साझा करना आवश्यक होगा
(news.ycombinator.com)- Mythos-श्रेणी के मॉडल ट्रैफ़िक को एकल इंटरैक्शन में दिखाई न देने वाले दुरुपयोग पैटर्न का पता लगाने के लिए 30 दिनों तक रखा जाएगा
- Bedrock के Fable 5, Mythos 5, और समान या उससे अधिक क्षमता स्तर वाले आने वाले मॉडलों पर ये शर्तें लागू होंगी
- सीमित अवधि का डेटा रिटेंशन Anthropic के लिए उन दुरुपयोग पैटर्नों का पता लगाने की शर्त है जो केवल एकल इंटरैक्शन से दिखाई नहीं देते
- डेटा रिटेंशन के लिए सहमति देने पर डेटा AWS की डेटा और सुरक्षा सीमाओं के बाहर चला जाएगा
- 30 दिनों के बाद डेटा अपने आप हटा दिया जाएगा, लेकिन सुरक्षा जांच के दायरे में आने वाले या कानूनी रूप से संरक्षित रखे जाने वाले दुर्लभ मामलों में अपवाद होगा
किन पर लागू होगा और रिटेंशन की शर्तें
- AWS घोषणा से उद्धरण Bedrock के Fable 5, Mythos 5, और समान या उससे अधिक क्षमता स्तर वाले आने वाले मॉडलों पर लागू होता है
- Anthropic, Mythos-श्रेणी के मॉडलों के सभी ट्रैफ़िक के लिए 30-दिन रिटेंशन की मांग करता है
- सीमित अवधि का डेटा रिटेंशन उन दुरुपयोग पैटर्नों का पता लगाने का तरीका है जो एकल इंटरैक्शन में दिखाई नहीं देते
डेटा सीमाएँ और हटाने के अपवाद
- डेटा रिटेंशन के लिए सहमति देने पर संबंधित डेटा AWS की डेटा और सुरक्षा सीमाओं के बाहर चला जाता है
- Claude सहायता दस्तावेज़ के अनुसार 30 दिनों के बाद डेटा अपने आप हटा दिया जाता है
- यदि डेटा सुरक्षा जांच में शामिल हो या कानूनी रूप से उसे संरक्षित रखना आवश्यक हो, तो 30 दिनों बाद स्वचालित हटाने का अपवाद लागू होगा
1 टिप्पणियां
Hacker News की राय
समस्या की जड़ यह है कि AI as a service बंद-सा है। इसे देने वाली कंपनियों के पास उस सारे डेटा का इस्तेमाल करके प्रतिस्पर्धियों से आगे निकलने की बहुत मजबूत प्रेरणा होती है, और वे यह काम चुपचाप भी कर सकती हैं
ऊपर से, कानून लागू करने वाली एजेंसियाँ भी वहाँ तक पहुँचने के लिए बेचैन होंगी। उम्मीद है कि कभी open source और सस्ता hardware इतना आगे आए कि सक्षम मॉडल चलाए जा सकें
https://www.theguardian.com/world/2026/feb/23/openai-tumber-...
ऊपर से Anthropic के पास SOC2 और ISO27001 हैं, इसलिए कुछ हद तक independent audit भी हुआ है। हाँ, वे ऐसे records या logging छिपाने की कोशिश कर सकते हैं, लेकिन दूसरी तरफ उस डेटा को चोरी-छिपे इकट्ठा न करने की भी मजबूत प्रेरणा है
बस दिक्कत यह है कि ZDR पर अक्सर minimum contract amount जुड़ा होता है, इसलिए individual users या छोटी कंपनियाँ बाहर रह जाती हैं और सब कुछ provider की मर्ज़ी पर छोड़ दिया जाता है
मूलतः AWS इस बारे में शुरू से रिपोर्ट इसलिए कर रहा है
क्या कोई पशुधन की राय की परवाह करता है? कुछ लोग करेंगे, लेकिन ज़्यादातर नहीं
वे कह सकते हैं कि मॉडल आम लोगों के लिए बहुत ख़तरनाक हैं, इसलिए public versions को कमजोर करेंगे, और असली अच्छे secret versions तक पहुँच सिर्फ़ अपनी पसंद के megacorps या राष्ट्रीय साझेदारों को देंगे
उम्मीद की जा सकती है कि चीन के open weights models बराबरी तक पहुँच जाएँ, लेकिन जिस पल वे monopoly frontier models के सचमुच बराबर होंगे, संभव है वे भी weights public करना बंद कर दें। वे यह सब भलाई में नहीं कर रहे
कल्पना करना मुश्किल है कि कौन-सी चीज़ इस प्रवाह को पटरी से उतार सकती है
यह अजीब व्यवहार है, और इससे थोड़ा-बहुत सबूत मिलता है कि Anthropic को गंभीर लोग manage नहीं कर रहे। अगर AWS/GitHub/Zed आदि पर यह policy लागू की गई, तो enterprise और government sales में जो बड़ा advantage इनके पास है, वह ऐसे competitor को दे दिया जाएगा जिसके पास मिलते-जुलते performance वाले models और ठीक-ठाक UI हो
Mythos की घोषणा के बाद यह साफ़ हो गया है कि हम ऐसे भविष्य की ओर बढ़ रहे हैं जहाँ नवीनतम top-performance models अब आम लोगों को उपलब्ध नहीं होंगे। सिर्फ़ कीमत ज़्यादा नहीं होगी, बल्कि use-case verification और data sharing जैसी शर्तें भी माँगी जाएँगी। OpenAI का 5.5-Cyber model भी ऐसा ही है, इसलिए यह सिर्फ़ Anthropic की बात नहीं
हमें बुरा इसलिए लग रहा है क्योंकि हम इस बात के आदी हो चुके हैं कि नया चमकदार model आते ही उसे तुरंत आज़मा सकें। लेकिन इस thread में Anthropic को “बेवकूफ़” कहना भावनात्मक wishful thinking जैसा लगता है
अगर यह “हमारे models इतने ताक़तवर हैं कि रात में इन्हें बाँधकर रखना पड़ता है” जैसी marketing है, तो यह बेहद ग़लत तरह से बनाई गई strategy लगती है। ग्राहकों का मुश्किल से जीता गया trust तोड़ने का इससे बेहतर तरीका सोचना मुश्किल है
दोनों ही बातें आत्मघाती लगती हैं, ख़ासकर यह देखते हुए कि Anthropic ने enterprise customers को, विशेषकर coding में, काफ़ी अच्छी तरह आकर्षित किया है और शायद military customers को भी लगातार target कर रहा है
चुपचाप reject करना वाला हिस्सा सचमुच असामान्य है। समझ नहीं आता कि इसका मतलब सिर्फ़ जानबूझकर धीमा करना और पैसे के हिसाब से सेवा न देना है, या generated code में सक्रिय रूप से छेड़छाड़ करना। सीधे request को reject ही क्यों नहीं करते?
शायद वे यह कहना चाहते हैं कि साफ़ इनकार करना ही इस बात का बहुत बड़ा signal दे देता है कि वे किसे मूल्यवान मानते हैं, लेकिन “recursive self-improvement” वाली बात मुझे IPO को चमकाने के लिए 100% bakwas लगती है। क्या वे सचमुच इतने घमंडी हैं कि सोचते हैं बाकी LLM बनाने वाली कंपनियाँ basic development infrastructure जैसी चीज़ें समझ ही नहीं पाईं?
सिर्फ़ यह बात ही काफ़ी बुरी है कि Anthropic को लगता है कि अपने साथ compete करने वाली किसी चीज़ को बनाने वाले requests को चुपचाप fail कर देना थोड़ा भी ठीक है। ऊपर से “Fable” जिस तरह reject करता है, उसमें दिखने वाली भारी अक्षमता को देखते हुए, ऐसे फैसले इरादे से कहीं ज़्यादा requests को चुपचाप fail कर देंगे
Anthropic के model names “Mythos”, “Fable” ऐसे लगते हैं जैसे किसी 14 साल के बच्चे ने सोचा हो कि “महाकाव्यात्मक” नाम रखने से model ज़्यादा ताक़तवर लगेगा। यह वैसा ही है जैसे Honda Civic पर racing stripes और शोर करने वाला fart-can exhaust लगा देना
यह नीति सभी providers पर लागू होती है। Cursor की warning यहाँ है: https://i.redd.it/7sfyker2ya6h1.png
Anthropic ने वादा किया है कि वह logged data से मॉडल को train नहीं करेगा, इसलिए यहाँ कुछ चिंताएँ पूरी तरह समझ में नहीं आतीं। सटीक threat model क्या है? क्या यह मान लिया जाए कि Anthropic terms का उल्लंघन करके मॉडल को train करेगा? पहले इतना भरोसा था कि वे data log नहीं करेंगे, लेकिन अब यह भरोसा नहीं कि logged data के उपयोग पर लगी पाबंदियों का पालन करेंगे?
कुछ replies ने मुझे कुछ हद तक convinced किया। फिर भी यह देखना ज़रूरी है कि यह बदलाव मुख्य रूप से Enterprise users को प्रभावित करता है। consumer plan का data पहले से 30 दिनों तक रखा जाता है। स्रोत: https://privacy.claude.com/en/articles/10023548-how-long-do-...
AWS के साथ ऐसा contract है, लेकिन Anthropic के साथ नहीं। अगर Anthropic physical रूप से data capture करता है, तो वह खुद को उस party boundary के बाहर ले जाता है जिसके भीतर हम deal कर सकते हैं
अगर वे contract sign करें और उसके अनुरूप सारे compliance controls लागू करें तो बात अलग है, लेकिन अगर आपको लगता है कि AWS ने 10 साल में जो बनाया है, उसकी बराबरी Anthropic अभी तुरंत AWS के हर operating jurisdiction में कर देगा, तो यह बिल्कुल भी समझदारी भरा सौदा नहीं है
अमेरिका में ऐसे उल्लंघनों पर किसी कंपनी को बर्बाद कर देने वाले कानून नहीं हैं। इसलिए कोई गारंटी भी नहीं है
Meta ने किताबें खुलेआम torrent की थीं, और किसी ने उनसे AI model हटाने या नष्ट करने की मांग नहीं की। Anthropic के लिए भी यह बस business cost ही होता। model को वैसे ही रहने दिया जाता, और नियम तोड़ने पर भी कोई वास्तविक नतीजा नहीं होता
अब दो providers data संभाल रहे हैं, इसलिए अगर आप दोनों पर बराबर भरोसा भी करें तो risk दोगुना हो जाता है। अगर आपको लगता है कि AWS के data controls Anthropic से ज़्यादा मजबूत हैं, तो risk दोगुने से भी अधिक हो जाता है
allowed storage/transfer countries, तरह-तरह के certifications, contracts जैसे data governance requirements भी हो सकते हैं, और अब इन्हें दूसरे data processor तक भी बढ़ाना पड़ेगा
मूल रूप से, अगर आप पहले से AWS इस्तेमाल कर रहे हैं, तो AWS-only Bedrock model जोड़ना कानूनी रूप से आसान है और security posture भी बहुत नहीं बदलता। लेकिन अगर data Anthropic में भी log करना पड़े, तो विकल्प कहीं अधिक जटिल हो जाता है
data retention और सामान्य mass surveillance के बीच समानता है। दोनों systems सही safeguards के साथ पूरी तरह अच्छे उद्देश्यों के लिए इस्तेमाल हो सकते हैं। लेकिन इतिहास दिखाता है कि surveillance systems को बुरे उद्देश्यों के लिए हैरान कर देने वाली आसानी से hijack किया जा सकता है। model providers के पास भी retained data को internal purposes के लिए इस्तेमाल करने की मजबूत प्रेरणा होती है
भले ही मुझे न लगे कि यह policy अभी तुरंत मेरी privacy का उल्लंघन करती है, फिर भी इसका विरोध करना उचित है
कौन review करता है, कैसे review करता है, और वे कौन-सी “समस्याएँ” ढूँढ रहे हैं — ये बातें मेरी spidey sense को trigger करती हैं। यह बहुत अस्पष्ट है, और वे इस “खतरनाक” model को सिर्फ अपने पास रख सकते हैं
regulated companies या government customers के लिए यह लगभग निश्चित रूप से स्वीकार्य नहीं होगा। लेकिन AWS यह जानता ही होगा, इसलिए उसने सहमति क्यों दी, यह सवाल है
Anthropic कोशिश कर रहा है, और देखना होगा कि यह bold strategy साबित होती है या नहीं
इसमें corporate espionage के advanced version जैसी गंध आती है। अगर मान लें कि आगे चलकर ज़्यादातर कंपनियाँ यही AI इस्तेमाल करेंगी, तो यह data सीधे Echelon जैसे network में जाएगा, और Boeing बनाम Airbus scandal की तरह “दिलचस्प जानकारी” दोस्ताना पक्षों तक लीक होती रहेगी। उस मामले को भी पहले खूब report किया गया था, फिर आधिकारिक रूप से दबा दिया गया
अगर data का इस्तेमाल गुप्त espionage या government surveillance के लिए करना होता, तो सब कुछ पूरी तरह secret रखा जाता
उफ़। उम्मीद है कि सिर्फ हमारी company को ही Opus 4.8 पर बने रहने, किसी दूसरे model provider पर जाने, या फिर no model retraining और no third-party data transfer जैसी terms को बहुत कमजोर बनाकर update करने जैसा मुश्किल फैसला नहीं लेना पड़ेगा
मैं समझ सकता हूँ कि Anthropic यह क्यों चाहता है, लेकिन अगर data सीधे Anthropic तक न जाता, और Amazon पहले Anthropic tools से analysis चलाकर सिर्फ तब आगे देखता जब उसे लगे कि कुछ देखने लायक है, तो यह कहीं अधिक सहज होता। उस स्थिति में enterprise terms और privacy policy में इसे exception के रूप में रखना भी आसान होता
हमारे लिए यह subprocessor नहीं है, इसलिए तुरंत अस्वीकार्य है। subprocessor list update भी उन्होंने बिगाड़ दी है
अगर यह cloud के भीतर process होता तो मुझे फर्क नहीं पड़ता, लेकिन governance और control दोनों ही नहीं हैं, इसलिए शुरुआत से ही यह संभव नहीं है
यह हर तरह के ऐप्स के लिए बाहर करने वाली शर्त बन जाती है
मैंने UKGov के लिए कुछ ऐप्स पर काम किया है, और अगर मैं होता तो इसे बहुत बड़ा खतरे का संकेत मानकर ज़रूर उठाता
बस, कहानी यहीं खत्म। अगर आप Fable पर गोपनीय डेटा चला रहे हैं, तो आप उसे मुफ्त में सौंप रहे हैं
हो सकता है पहले से भी ऐसा रहा हो, लेकिन अब इसे साफ़ तौर पर अनिवार्य किया जा रहा है
Mythos के प्रदर्शन पर अपने भरोसे के कारण खुद अपने पैर पर कुल्हाड़ी मारने की Anthropic की इच्छा को मानना पड़ेगा
गेम प्लान क्या है?