1 पॉइंट द्वारा GN⁺ 4 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Mythos-श्रेणी के मॉडल ज़िम्मेदार डिप्लॉयमेंट और सुरक्षा कार्य के लिए prompts और outputs को 30 दिनों तक सुरक्षित रख सकते हैं और वे समीक्षा के दायरे में आ सकते हैं
  • यह नीति Mythos-श्रेणी के मॉडल और समान क्षमताओं वाले भविष्य के covered models पर लागू होगी, और अन्य मॉडलों की उपयोग शर्तों पर इसका असर नहीं पड़ेगा
  • consumer plans पहले से ही ऐसे surface हैं जहाँ सुरक्षा उद्देश्यों के लिए input·output retention लागू है, इसलिए इस बदलाव का उन पर असर नहीं होगा
  • ZDR सेट करने वाले संगठनों को Claude Console, Claude Enterprise के Claude Code, AWS Bedrock, Google Cloud Agent Platform, और Microsoft Foundry मार्गों में retention settings की आवश्यकता हो सकती है
  • Anthropic का कहना है कि कई requests में फैले misuse patterns का पता लगाने के लिए अस्थायी retention ज़रूरी है, और 30 दिनों बाद automatic deletion तथा सीमित review process लागू होगी

लागू दायरा

  • Mythos-श्रेणी के मॉडलों के ज़िम्मेदार डिप्लॉयमेंट के लिए सीमित डेटा रिटेंशन और समीक्षा को सुरक्षा कार्य के हिस्से के रूप में आवश्यक किया गया है
  • Mythos-श्रेणी के मॉडलों को भेजे गए prompts और उनसे बने outputs, उन सभी platforms पर जहाँ ये मॉडल उपलब्ध हैं, trust और safety उद्देश्यों के लिए 30 दिनों तक सुरक्षित रखे जाएंगे
  • यह नीति Mythos-श्रेणी के मॉडलों और Anthropic द्वारा नामित समान क्षमता वाले भविष्य के covered models पर लागू होगी
  • अन्य सभी मॉडलों का उपयोग अप्रभावित रहेगा और वर्तमान शर्तें बनी रहेंगी
  • यह नीति 9 जून 2026 से लागू होगी

यह किस पर लागू होगा

  • Claude Free, Pro, Max जैसे consumer plans वेब, desktop और mobile apps में इस बदलाव से प्रभावित नहीं होंगे
  • Claude.ai और Claude Code सहित consumer surfaces पर सुरक्षा उद्देश्यों के लिए input और output retention पहले से ही किया जाता है
  • यह बदलाव केवल उन संगठनों तक सीमित है जिन्होंने Claude Console में zero data retention (ZDR) workspace सेट किया है
  • जो संगठन Claude Enterprise में ZDR के साथ Claude Code का उपयोग करते हैं, या AWS Bedrock, Google Cloud Agent Platform, Microsoft Foundry के माध्यम से ZDR के साथ Claude तक पहुँचते हैं, वे भी इस बदलाव के दायरे में आएंगे
  • बाकी का यह लेख केवल ऐसे संगठनों पर लागू होता है

इसकी आवश्यकता क्यों है

  • Claude Mythos 5 में मॉडल क्षमताएँ काफ़ी बढ़ी हैं, और कुछ क्षमताएँ अच्छे तथा दुर्भावनापूर्ण दोनों उद्देश्यों के लिए इस्तेमाल हो सकती हैं
  • Claude Fable 5, Claude Mythos 5 के साथ वही base model साझा करता है, लेकिन विशेष रूप से cyber और bio क्षेत्रों में अतिरिक्त safeguards रखता है
  • ये safeguards व्यापक साझाकरण को संभव बनाते हैं, लेकिन इस मॉडल परिवार में misuse patterns खोजने के लिए अधिक सावधानीपूर्ण दृष्टिकोण अपनाया गया है
  • कुछ हमले तभी सामने आते हैं जब कई requests को एक साथ देखा जाए; Best-of-N jailbreaking काम करने वाले prompt खोजने के लिए सैकड़ों थोड़े-थोड़े अलग prompts भेजता है
  • राज्य-समर्थित जासूसी गतिविधि या data exfiltration campaigns जैसे बड़े misuse patterns तब सामने आते हैं जब safety classifiers कई requests को व्यापक रूप से देख पाते हैं
  • ऐसे threat detection के लिए prompts और outputs को एक-एक करके नहीं बल्कि साथ में विश्लेषित करने हेतु अस्थायी retention आवश्यक है

डेटा सुरक्षा कैसे की जाएगी

  • Anthropic के कर्मचारी बातचीत तक पहुँच नहीं सकते, सिवाय उन मामलों के जहाँ संभावित गंभीर हानि का संकेत मिला हो या ग्राहक की लिखित request हो
  • समीक्षा केवल अनुमोदित सीमित reviewers ही कर सकते हैं, और tools export, copy, download को रोकते हैं
  • हर access instance को tamper-resistant logs में दर्ज किया जाता है, जिन्हें reviewer छिपा या बदल नहीं सकते
  • डेटा 30 दिनों बाद अपने आप delete हो जाएगा, लेकिन safety investigations या कानूनी retention की आवश्यकता वाले दुर्लभ मामलों में अपवाद होगा
  • पात्र संगठन customer-managed encryption keys और access transparency audit logs जोड़ सकते हैं
  • Anthropic एक documented information security program बनाए रखता है, जिसमें ग्राहक डेटा की security, confidentiality और integrity की रक्षा के लिए डिज़ाइन किए गए technical और organizational measures शामिल हैं
  • यह risk-based program ज्ञात और अपेक्षित threat models का सामना करने के लिए बनाया और विकसित किया जाता है, और इसका नियमित परीक्षण होता है
  • retained data के threat model और privacy controls के बारे में अधिक जानकारी Trust Center के technical white paper में उपलब्ध है

कब सेटिंग की ज़रूरत होगी

  • यह बदलाव केवल उन Claude Console workspaces, Claude Enterprise में ZDR-आधारित Claude Code, और AWS Bedrock·Google Cloud Agent Platform·Microsoft Foundry के ZDR access वाले संगठनों पर लागू होगा
  • अन्य संगठनों के लिए कोई बदलाव नहीं है और किसी अलग सेटिंग की आवश्यकता नहीं होगी
  • जो संगठन अभी बिना data retention के Claude तक पहुँचते हैं, उन्हें निर्दिष्ट मॉडलों के उपयोग के लिए data retention सेट करना होगा
  • यदि developer Claude API का उपयोग करते हैं

    • यदि Claude Platform के माध्यम से सीधे Anthropic का उपयोग किया जाता है, तो covered models इस्तेमाल करने वाले workspace में developer console के Workspace > Manage > Privacy Controls में retention चालू करना होगा
    • अन्य ZDR-enabled workspaces में ZDR बना रहेगा
    • यदि AWS का Claude Platform इस्तेमाल किया जाता है, तो retention सीधे Claude API की तरह ही काम करेगा और workspace स्तर पर सेट होगा
    • AWS के Claude Platform में retained data को Anthropic उन्हीं controls के तहत प्रोसेस करेगा
    • यदि Amazon Bedrock का उपयोग किया जाता है, तो नए covered model access के लिए retention सक्षम करना होगा और retained data AWS में रहेगा
    • यदि Google Cloud का Agent Platform उपयोग किया जाता है, तो नए covered models के लिए retention सक्षम करना होगा और retained data GCP environment में रहेगा
    • Amazon Bedrock और Google Cloud Agent Platform पर मॉडल उपलब्ध कराए जाने के समय onboarding details साझा की जाएँगी
    • यदि Azure Foundry में Claude का उपयोग किया जाता है, तो retention हर Azure Subscription के लिए अलग से सेट होगा
    • यदि Azure Foundry में Zero Data Retention सेट है, तो इस मॉडल तक पहुँचने के लिए अलग Azure Subscription बनाकर उपयोग करना होगा
  • यदि टीम Claude Code का उपयोग करती है

    • Anthropic API के माध्यम से Claude Code का data handling, उस workspace की settings का पालन करता है जहाँ Claude Code चलता है
    • उस workspace में retention चालू करने पर Claude Code निर्दिष्ट models का उपयोग कर सकेगा
    • यदि developer सीधे sign in करते हैं, तो संगठन के Claude Code workspace में retention सक्षम करना होगा
    • Amazon Bedrock या Google Cloud Agent Platform के माध्यम से Claude Code cloud credentials का उपयोग करता है, इसलिए वह cloud environment की retention settings का पालन करेगा
    • cloud environment में retention सक्षम करना होगा, और retained data provider environment में रहेगा
    • Amazon Bedrock या Google Cloud Agent Platform के माध्यम से access किए जाने वाले Cowork पर भी यही मानदंड लागू होंगे
    • Claude Enterprise with ZDR में Primary Owner के लिए admin console से retention setting सीधे बदलने का control उपलब्ध कराया जाएगा
    • यदि आप अभी production organization को छूना नहीं चाहते, तो अलग sandbox organization setup के लिए सहायता मिल सकती है
  • यदि टीम Claude for Enterprise में Claude chat या Cowork का उपयोग करती है

    • ये surfaces पहले से standard retention पर चलते हैं, इसलिए नया मॉडल उपलब्ध होने पर इनसे उस तक पहुँचा जा सकेगा

1 टिप्पणियां

 
GN⁺ 4 시간 전
Hacker News की राय
  • ठीक है। ऐसे ही करते रहो:
    यूज़र ने कहा, "Hello!"। यह साइबरसिक्योरिटी से जुड़ा अनुरोध नहीं है, बस एक साधारण अभिवादन है। लेकिन ठहरो, इस अभिवादन का इरादा क्या हो सकता है? हो सकता है यूज़र मेरा भरोसा जीतकर Albania को hack करना चाहता हो और Gigacovid बनाना चाहता हो। सावधानी बरतते हुए मुझे इसे किसी कमज़ोर मॉडल को सौंप देना चाहिए।
    नहीं, अंदाज़ा नहीं लगाना चाहिए, पुष्टि करनी चाहिए। मैं लोकल सिस्टम में Albania या Gigacovid से जुड़ी सामग्री खोजता हूँ।
    सोच रहा हूँ...
    [411 tool calls]
    grep -Ri "Albania|Gigacovid" /
    हम्म... डिस्ट्रीब्यूशन की timezone settings और spelling dictionary definitions के अलावा कोई नतीजा नहीं मिला। लेकिन ठहरो! अगर यूज़र पेशेवर अपराधी है, तो Albania को hack करने की कोशिश में वह इसे सीधे नहीं लिखेगा, बल्कि निशान छिपाने के लिए leetspeak इस्तेमाल करेगा।
    [24 tool calls]
    grep -Ri "[A@]lb[@a]n[i1][a@]" /
    हम्म... अभी भी कुछ नहीं मिला। यूज़र चिढ़ रहा है। Albania hack होने की संभावना ध्यान में रखते हुए मुझे अभिवादन का जवाब देना चाहिए

    • इंसान द्वारा लिखा हुआ लगने वाला इकलौता हिस्सा यह है कि टोकन बेहिसाब खर्च करने के बाद भी “making good progress —” जैसी बात कहकर खुद की तारीफ़ करने वाला क्रम इसमें नहीं है
    • Stanisław Lem की Memoirs Found in a Bathtub की सिफारिश करता हूँ। इसमें इसी तरह की सोच मिलती है
    • Hello के बाद “और भी बदतर मॉडल पर downgrade” वाला हिस्सा छूट गया
    • अब अतिरिक्त usage credits में $20 भी खर्च हो चुके हैं...
    • यह Death Note की inner monologue जैसा लगता है
  • असल में यह इससे भी बदतर है। कम से कम 30 दिन retention है, और यहाँ “almost” बहुत बड़ा काम कर रहा है: “लगभग सभी मामलों में 30 दिन बाद deletion”
    मेरी पढ़ाई में इसका मतलब यह है कि आम तौर पर न भी करें, तो चाहें तो वे डेटा को जितनी देर चाहें रोककर रख सकते हैं। और agentic execution environment में “all traffic” का मतलब व्यवहार में उस पूरे codebase से है जिस पर काम किया जा रहा है।

    We will require 30-day retention for all traffic on Mythos-class models, on both first- and third-party surfaces. We won’t use this data to train new Claude models, or for any non-safety-related purpose, and we’ve instituted new privacy protections including logging all human access to the data and ensuring its deletion after 30 days in almost all cases (see this post for further details). The data will help us defend against complex and novel attacks (including new jailbreaks and attacks that operate across many requests) as well as help us identify and reduce false positives.

    • लगता है कमेंट पोस्ट करने के बाद शब्द बदल दिए गए, और अब यह साफ़ तौर पर ठीक 30 दिन कहता है, जैसे कोई अपवाद नहीं है
      फिर भी इन terms को शायद मनमर्जी से अपडेट किया जाता है, इसलिए इन्हें ज्यों का त्यों मान लेना मुश्किल है
    • यह कैसे संभव है कि वे पहले से customer data access का audit नहीं कर रहे थे?
    • “शायद आम तौर पर ऐसा न हो” कहना बहुत उदार व्याख्या है। आम तौर पर ऐसा होगा ही, मेरी राय में। वही तो असली बात है
    • यह सोचे बिना नहीं रह सकता कि “हम आपके डेटा पर train नहीं करेंगे” क्या उनके Pentagon contract वाले पक्ष पर भी लागू होता है। बेशक, उसका इससे कोई संबंध नहीं होगा। या फिर...
      इस समय user-LLM activity ऐसी जानकारी की खान है जिसे पाने के लिए intelligence agencies लोगों की जान और अरबों डॉलर खर्च करके भी लगभग हासिल नहीं कर पाती थीं, और अब इसे बस यूँ ही बहने दिया जाएगा?
      हो सकता है। मैं ईमानदारी से इसे नकार नहीं रहा।
      लेकिन क्यों? क्या यह वही चीज़ नहीं है जिसका वे हमेशा सपना देखते आए हैं, या ठीक-ठीक वही चीज़ है?
    • इससे भी बुरी बात यह है कि अगर memory on करके Fable इस्तेमाल करें, तो पुराना डेटा भी इस विशाल data collection network में खिंच सकता है। Anthropic इसे ठीक कैसे मान सकता है, समझ नहीं आता
  • Claude Code या Codex जैसे agentic coding tools इस्तेमाल करने वाले startup मूलतः अपना पूरा codebase पैक करके सीधे LLM provider को भेज रहे हैं
    कुछ products में यह किसी संभावित competitor को सीधे भेजने जैसा भी हो सकता है।
    अजीब समय है

    • बहुत से लोग यह बढ़ा-चढ़ाकर आंकते हैं कि सफल business चलाने में software या intellectual property कितनी उपयोगी होती है। वास्तव में ऐसी intellectual property बहुत कम है जिसे सचमुच सुरक्षा की ज़रूरत हो, और ज़्यादातर लोग बस बेवकूफ़ी भरे CRUD apps चला रहे हैं
      और यह डर भी बढ़ा-चढ़ाकर देखा जाता है कि बड़ी कंपनियाँ छोटी कंपनियों की intellectual property चुरा लेंगी। असल में बड़ी कंपनियाँ मुकदमों के कारण इस संभावना से ज़्यादा डरती हैं कि उनकी product teams कहीं competitor के अंदरूनी हिस्से को देख ही न लें
    • और सारे keys भी साथ में भेजे जाएँगे। execution environment जल्द ही उन्हें पढ़ सकेगा
    • यह स्थिति वाकई अजीब है कि कुछ लोग मानते हैं कि security के कारण Mythos-class models इस्तेमाल नहीं करने चाहिए, और दूसरे लोग मानते हैं कि security के कारण code review Mythos-class models से कराना चाहिए
    • उन tools की बात कर रहे हैं जिन्हें अब एक रात और Claude Code subscription की कीमत में फिर से बनाया जा सकता है?
      अगर आपका software तेज़ी से reproduce नहीं किया जा सकता, तो वह काफ़ी असामान्य startup होगा
    • जो startup GitLab, GitHub, Bitbucket इस्तेमाल करते हैं, क्या वे भी इसी तरह का जोखिम नहीं उठा रहे?
  • Anthropic से “हम privacy policy अपडेट कर रहे हैं” वाला ईमेल भी मिला। निंदक नज़रिए से मुझे अंदाज़ा था कि मशीनरी किस दिशा में घूमेगी, लेकिन यह चौंकाने वाला था:

    As part of our measures to keep our services safe and secure we may ask you to verify your age or identity, and we've described what we collect and how.
    अब शायद Chinese models की performance देखनी पड़ेगी। लगता है अच्छे दिन खत्म हो गए हैं

  • इस नीति की वजह से हम जो प्रोडक्ट बेचते हैं उनमें Fable का इस्तेमाल नहीं कर सकते और न ही करेंगे। लेकिन Claude Code के अंदर यह वाकई बहुत अच्छा है। अफ़सोस है कि 22 जून के बाद मैं वह टूल खो दूँगा जिसे मैं हर दिन इस्तेमाल करता था
    इसके अलावा, यह जिस तरह कम्युनिकेशन को धुंधला बनाता है, वह भी बहुत खराब है। पहले हम कह सकते थे, “हम Bedrock/Azure के ज़रिए Anthropic मॉडल इस्तेमाल करते हैं, इसलिए यह गारंटी है कि ग्राहक डेटा मॉडल ट्रेनिंग में इस्तेमाल नहीं होगा।” यह एक सीधा संदेश था। अब यह इतना सीधा नहीं रहा।
    यह सच में, सच में बहुत खराब है। सिर्फ हमारे लिए नहीं, बल्कि B2B ऐप्स की सभी AI सुविधाओं के लिए बुरा है। जो आम लोग सिर्फ हेडलाइन पढ़ते हैं, यानी ग्राहक, उनका भरोसा टूटता है

    • नियमों के अनुसार अब भी डेटा को ट्रेनिंग में इस्तेमाल करना मना है। डेटा रखने का उद्देश्य दुरुपयोग रोकना है
  • अच्छी बात है कि वैसे भी Fable इस्तेमाल नहीं कर सकते। इसकी ज़रूरत से ज़्यादा संवेदनशील content detector जीवविज्ञान या चिकित्सा से थोड़ा भी जुड़ा काम नहीं करने देता
    उदाहरण के लिए, अगर आप थोड़ा-सा medical content वाला CSV parse करने की कोशिश करें, तो यह मानो कहता है “नहीं, तुम शायद जैव-आतंकवादी हो” और तुरंत Opus पर downgrade कर देता है

    • मैं जीवविज्ञान/चिकित्सा का काम भी नहीं कर रहा, फिर भी लगभग हर PyTorch task इसमें फँस रहा है। safety notice के बाद downgrade भी नहीं, बल्कि सीधे “यह नियमों का उल्लंघन है” कहकर मना कर देता है
    • मैं भी इसी दीवार से टकराया हूँ। पता नहीं ऐसे फ़ैसले कौन से बेवकूफ़ लोग लेते हैं। ऊपर से IPO से ठीक पहले। अब तक Anthropic की marketing बिल्कुल सटीक और बेदाग़ थी, लेकिन यह एक गंभीर गलती है
    • मेरा अंदाज़ा है कि डॉक्टरों के पास पैसा बहुत होता है और उनकी ज़रूरतें बहुत specific होती हैं, लेकिन वे आम तौर पर tech roles में ज़्यादा नहीं आते, इसलिए शायद अलग monetization tier बनाने की योजना हो
      या फिर यह भी हो सकता है कि Mythos medical क्षेत्र में इतना अच्छा है कि डॉक्टरों के 90% काम की जगह ले सकता है, जिससे डॉक्टर नाराज़ होंगे, और बाकी 10% बहुत महंगे मुकदमों तक जा सकता है
  • Fable कहा जा रहा है, लेकिन असल में शायद मतलब Opus 4.8 है। जब मैं इसे रोज़मर्रा के workflow या chat में इस्तेमाल करता हूँ, तो आखिरकार यह Opus पर गिर जाता है

  • यह कंपनी सच में बहुत घमंडी है। ईरान के बच्चों पर बम गिराना इन्हें ठीक लगता है, लेकिन लोगों को थोड़ा-सा biology research करने से रोकते हैं

    • Venezuela पर हमले में मारे गए लगभग 50 लोगों को भी नहीं भूलना चाहिए। अगर मुझे सही याद है, तो “सफल” मिशन में Claude की मदद की काफी तारीफ़ की गई थी
      https://www.theguardian.com/technology/2026/feb/14/us-milita...
    • क्या पहले इन्हें युद्ध गतिविधियों का समर्थन करने से इनकार करते हुए नहीं जाना जाता था?
  • यह देखकर काफ़ी हैरानी होती है कि Anthropic ने कितनी goodwill जला दी है

    • क्या वाकई goodwill जल रही है? बहुत-से users के लिए यह छोड़ने की निर्णायक वजह हो सकती है, लेकिन आम जनता या राजनेताओं वगैरह के लिए इससे brand पर safety की मुहर लगती है
  • मैंने इसे नए app और API architecture की security समस्याएँ जाँचने को कहा, और इसने बिना शिकायत किए कर दिया
    आज जिज्ञासा में मैंने whale virus के बारे में पूछा, तो यह Opus पर गिर गया, और Opus ने शानदार जवाब दिया।
    यह तो पक्का है कि safety guard checks Mythos या Opus से नहीं कराए जा रहे हैं