1 पॉइंट द्वारा GN⁺ 2025-06-07 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • New York Times सहित वादी पक्ष ने OpenAI के खिलाफ मुकदमे में उपयोगकर्ताओं के ChatGPT और API data को अनिश्चितकाल तक सुरक्षित रखने की मांग की है
  • OpenAI का कहना है कि यह मांग उपयोगकर्ता privacy के उसके वादों से टकराती है, इसलिए वह अदालत के आदेश पर सक्रिय रूप से आपत्ति और अपील कर रहा है
  • यह preservation order केवल ChatGPT Free, Plus, Pro, Team, और सामान्य API उपयोगकर्ताओं पर लागू होता है; Enterprise/Edu और ZDR API उपयोगकर्ता इससे प्रभावित नहीं हैं
  • हटाए गए data को भी अलग सिस्टम में कानूनी संरक्षण के लिए सुरक्षित रखना होगा, और इसकी पहुंच OpenAI की सख्ती से सीमित legal और security teams तक ही रहेगी
  • OpenAI का कहना है कि वह privacy protection को सर्वोच्च प्राथमिकता देता है और सभी कानूनी प्रक्रियाओं में उपयोगकर्ताओं की सुरक्षा के लिए जवाब देता रहेगा

How we’re responding to The New York Times’ data demands in order to protect user privacy

  • The New York Times सहित वादियों ने OpenAI के खिलाफ मुकदमे में consumer ChatGPT और API ग्राहक data को अनिश्चितकाल तक सुरक्षित रखने की मांग की है
  • यह मांग OpenAI द्वारा उपयोगकर्ताओं से किए गए privacy commitments से मूल रूप से टकराती है और industry standard तथा privacy protection के स्तर को कमजोर करती है
  • OpenAI इस मांग को अत्यधिक मानता है और user privacy को सर्वोच्च प्राथमिकता देते हुए अपील प्रक्रिया जारी रखे हुए है

मुख्य प्रश्न और उत्तर

1. The New York Times सहित वादियों की मांग का कारण

  • The New York Times ने OpenAI के खिलाफ मुकदमा दायर करते हुए, ऐसी अटकल के आधार पर कि मुकदमे के पक्ष में सबूत मिल सकते हैं, अदालत से सभी user content को अनिश्चितकाल तक सुरक्षित रखने की मांग की
  • OpenAI का मानना है कि यह मांग उपयोगकर्ता privacy के लिए खतरा है और मुकदमे के समाधान में भी वास्तविक मदद नहीं करती
  • ChatGPT Free, Plus, Pro, Team, और सामान्य API उपयोगकर्ता प्रभावित हो सकते हैं, लेकिन ChatGPT Enterprise, ChatGPT Edu, Zero Data Retention API ग्राहक इसमें शामिल नहीं हैं

2. OpenAI की कानूनी प्रतिक्रिया

  • OpenAI ने शुरुआत में ही यह कहते हुए विरोध दर्ज कराया कि सभी output data को सुरक्षित रखने की मांग अत्यधिक है और उसकी privacy policy से टकराती है
  • Magistrate Judge के समक्ष ChatGPT Enterprise को अपवाद माना जाना पुष्टि की गई
  • District Court Judge के पास अतिरिक्त अपील जारी है

3. business ग्राहकों के Zero Data Retention अनुबंध

  • Zero Data Retention API का उपयोग कर रहे business ग्राहक input और output data के संग्रहित न होने के कारण प्रभावित नहीं हैं

4. ChatGPT data delete करने पर

  • सामान्य consumer accounts पर मुकदमे का प्रभाव हो सकता है, लेकिन Enterprise·Edu ग्राहक और Zero Data Retention API उपयोगकर्ता प्रभावित नहीं हैं

5. data storage का तरीका और access permissions

  • अदालत के आदेश के दायरे में आने वाले data को अलग सुरक्षित सिस्टम में पृथक रूप से संग्रहित किया जाता है
  • इस data का कानूनी दायित्व पूरा करने के उद्देश्य के अलावा उपयोग नहीं किया जा सकता, और इसकी पहुंच OpenAI की legal और security teams के सख्ती से सीमित कुछ लोगों तक ही रहती है

6. data को बाहरी पक्षों के साथ साझा किए जाने की संभावना

  • सुरक्षित रखा गया data The New York Times जैसे बाहरी पक्षों को अपने आप नहीं भेजा जाता
  • यदि आगे और information disclosure की मांग होती है, तो OpenAI privacy की रक्षा के लिए सक्रिय रूप से जवाब देगा

7. data retention अवधि और समाप्ति का समय

  • फिलहाल अदालत के आदेश के तहत user data को अनिश्चितकाल तक सुरक्षित रखने के लिए बाध्य किया गया है, लेकिन OpenAI इसके खिलाफ सक्रिय कानूनी कार्रवाई कर रहा है
  • यदि कानूनी चुनौती सफल रहती है, तो मौजूदा data retention policy पर वापस लौटा जा सकता है

8. GDPR जैसे privacy laws के उल्लंघन का प्रश्न

  • अदालत के आदेश के अनुसार कानूनी दायित्वों का पालन किया जा रहा है, लेकिन The New York Times की मांग OpenAI के privacy standards से टकराती है
  • इस संबंध में अपील और policy response जारी है

9. model training policy में बदलाव है या नहीं

  • business ग्राहक data का डिफ़ॉल्ट रूप से model training में उपयोग नहीं किया जाता, और इस आदेश से policy में कोई बदलाव नहीं है
  • consumer ग्राहक अपनी individual settings के अनुसार training data के उपयोग को सीधे नियंत्रित कर सकते हैं, और इस आदेश का उस पर कोई प्रभाव नहीं है

10. users को जानकारी देना और transparency

  • OpenAI ने लगातार जानकारी देने और transparency बनाए रखने का वादा किया है
  • अदालत के आदेश में बदलाव या user data पर प्रभाव पड़ने की स्थिति में शीघ्र सूचना दी जाएगी

11. data retention policy का सारांश

  • ChatGPT(Free/Plus/Pro): बातचीत या account delete होने पर, data तुरंत account से हट जाता है और 30 दिनों के भीतर स्थायी रूप से delete किया जाना निर्धारित है
  • ChatGPT Team: प्रत्येक user यह नियंत्रित कर सकता है कि बातचीत सुरक्षित रखी जाए या नहीं; delete किया गया/संग्रहित न किया गया data 30 दिनों के भीतर delete हो जाता है (कानूनी दायित्वों को छोड़कर)
  • ChatGPT Enterprise/Edu: workspace admin data retention period प्रबंधित करता है; delete की गई बातचीत 30 दिनों के भीतर हटाई जाती है (कानूनी दायित्वों को छोड़कर)
  • API: business उपयोगकर्ता application state management के लिए retention period और तरीका स्वयं चुन सकते हैं; API input और output data 30 दिनों बाद logs से delete कर दिए जाते हैं (कानूनी दायित्वों को छोड़कर)
  • Zero Data Retention API: input/output data शुरू से ही संग्रहित नहीं किया जाता

निष्कर्ष

  • OpenAI user trust और privacy protection को अपनी policy की सर्वोच्च प्राथमिकता मानता है और कानूनी चुनौतियों का लगातार सामना कर रहा है
  • business, education, और ZDR API जैसे कुछ विशेष customer groups प्रभावित नहीं हैं, जबकि सामान्य consumer data के लिए अलग protective measures लागू हैं
  • कानूनी स्थिति में बदलाव और user data protection policy के बारे में पारदर्शी तरीके से जानकारी दी जाती रहेगी

1 टिप्पणियां

 
GN⁺ 2025-06-07
Hacker News राय
  • मुझे लगता है कि अगर OpenAI आधिकारिक तौर पर Zero Data Retention (ZDR) विकल्प के लिए आवेदन करने दे, तो यह वास्तव में बहुत मददगार होगा। कई एंटरप्राइज़ स्थितियों में request logs को रखने की कोई वजह ही नहीं होती। डॉक्यूमेंटेशन में कई बार लिखा है कि आवेदन किया जा सकता है, लेकिन व्यवहार में बस अनदेखा कर दिया जाता है। मैं समझता हूँ कि approval चाहिए और entry barrier है, लेकिन लगता है कि ZDR का ज़िक्र सिर्फ marketing के लिए किया जाता है। मैंने कई बार आवेदन किया, लेकिन कोई जवाब नहीं मिला। फ़ोरम पोस्ट्स देखें तो यह बहुत आम बात लगती है
    • मैं समझता हूँ कि approval process की ज़रूरत हो सकती है, लेकिन फिर default privacy या no retention क्यों नहीं है, यह समझ नहीं आता। बहुत से users को OpenAI के privacy commitments पर शक है। लगता है कि input values store, analyze और share की जाती होंगी। अगर सच में privacy चाहिए, तो locally चलने वाले LLM ही असली विकल्प हैं
    • मेरी समझ के अनुसार bug handling के लिए logs default रूप से 30 दिनों तक रखे जाते हैं। 0-day retention भी request की जा सकती है। यह बात official docs में लिखी है
    • मूल रूप से जो चीज़ गायब है, वह पैसा है
    • ऐसी policy है: "कुछ उपयोग मामलों के लिए zero data retention (ZDR) का अनुरोध किया जा सकता है। data processing के बारे में अधिक जानकारी के लिए Platform Docs पेज देखें" OpenAI Privacy Policy. 1) request की जा सकती है, लेकिन approval की गारंटी नहीं है। 2) default बहुत महत्वपूर्ण है। Silicon Valley का default privacy नहीं बल्कि revenue maximization है। OpenAI में भी default data retention है, output values तक store किए जाते हैं। इससे data preservation order के ख़िलाफ़ OpenAI के memo को गंभीरता से लेना मुश्किल हो जाता है
    • आधिकारिक तौर पर बार-बार लिखा है कि आवेदन किया जा सकता है, लेकिन शक होता है कि व्यवहार में यह पूरी तरह बेअसर marketing copy भर हो सकती है
  • अदालत के आदेश के तहत संरक्षित data को एक isolated system में रखा जाता है और legal obligations को पूरा करने के अलावा उस तक पहुँचा नहीं जा सकता। सिर्फ़ कुछ audited OpenAI legal और security team के लोग ही कानूनी दायित्व के तहत उसे access कर सकते हैं। अगर data leak होता है, तो OpenAI ज़िम्मेदार होगा। लेकिन इस पूरे लेख की भाषा, ख़ासकर बार-बार मुक़दमे को ‘निराधार’ कहना, विश्वसनीयता कम करती है और इसे भरोसेमंद बयान से ज़्यादा promotional post जैसा बनाती है
    • यह मामला news cycle में फैल गया, क्योंकि deleted chats मुक़दमे के कारण वास्तव में delete नहीं हो रही हैं—यह ख़बर issue बन गई, इसलिए OpenAI को customers को आश्वस्त करने के लिए प्रतिक्रिया देनी पड़ी
    • यदि मुक़दमे से जुड़ा data discovery process के दौरान इस मामले से संबंधित पाया जाता है, तो कम-से-कम दोनों पक्षों और अदालत को उस data तक पहुँच मिलेगी
    • OpenAI के नज़रिए से देखें तो वे स्वाभाविक रूप से अपनी ही स्थिति सामने रखेंगे। मुक़दमे को ‘निराधार’ कहना उनके लिए स्वाभाविक है
    • मैं OpenAI का user हूँ। यह उपयोगी है, इसलिए मैं इसके लिए पैसे भी देता हूँ। मैं नहीं चाहता कि data Terms of Service और privacy policy में बताए गए दायरे से अधिक store किया जाए। अगर अदालत यह नहीं समझती कि OpenAI की retention obligation करोड़ों users की privacy को ख़तरे में डालती है, तो मुझे लगता है कि वह उपयुक्त नहीं है
    • data security का पहला सिद्धांत यह है कि systems imperfect होते हैं, इसलिए एकमात्र सुरक्षा यह है कि data को रखा ही न जाए। अगर data breach होता है, तो OpenAI ज़िम्मेदार होगा। जो कंपनियाँ data security का वादा करती हैं, वे या तो अक्षम हैं या ईमानदार नहीं हैं
  • मुझे जिज्ञासा है कि क्या OpenAI की legal team वास्तविक chat histories की बजाय ssdeep hashes या content chunks जैसी धुंधली जानकारी को store करने का तरीका लागू कर सकती है। अगर NYT द्वारा माँगा गया data दायरे में सीमित है और problematic content API के माध्यम से generate हुआ है, तो hash values से comparison संभव हो सकता है। बेशक आदर्श स्थिति तो कुछ भी store न करना है, लेकिन अत्यधिक व्यापक court order को देखते हुए यह एक व्यावहारिक समझौता हो सकता है। अतिरिक्त रूप से, ssdeep, content chunks पर सामग्री भी देखी जा सकती है
    • यह ज़रूर रेखांकित किया जाना चाहिए कि अदालत में lawyers या judge को ऐसे technical terms समझाना बेहद कठिन होता है
    • फ़ैसले की मंशा से सक्रिय रूप से बचने की कोशिश करना अपने-आप में बहुत खराब विकल्प है
    • मुझे court order से जुड़े दस्तावेज़ नहीं मिले, लेकिन लगता है कि judge ने OpenAI से पूछा था कि क्या data को अलग-अलग श्रेणियों में बाँटा जा सकता है, और OpenAI ने सिर्फ़ मना नहीं किया बल्कि कोई जवाब ही नहीं दिया। ऐसा लगता है कि OpenAI वास्तव में समाधान खोजने को तैयार नहीं है और सिर्फ़ PR strategy इस्तेमाल कर रहा है
    • ऐसे technical proposals white paper में चाहे कितने भी शानदार लगें, हक़ीक़त में सभी ChatGPT conversations S3 में store हो रही हैं और तरह-तरह की संस्थाएँ उनका नियमित backup ले रही हैं। यह email की तरह एक text database है जो अंदरूनी संवेदनशील सामग्री से भरा है। management के “promises” पर मुझे बिल्कुल भरोसा नहीं है
  • पहले मुझे browser history leak होना बहुत शर्मनाक लगता था, लेकिन अब मुझे लगता है कि LLM conversation history का leak होना उससे कहीं ज़्यादा गंभीर है। यह किसी और के साथ private conversation से भी बढ़कर है—यह वह रिकॉर्ड है जिसमें मैं अकेले में जैसा हूँ, बिना कुछ छिपाए वैसा ही दर्ज हूँ
    • कुछ लोग पूछते हैं कि आख़िर ऐसा क्या पूछते हो कि LLM से secrecy की उम्मीद करते हो
  • संबंधित चर्चा: OpenAI slams court order to save all ChatGPT logs, including deleted chats (जून 2025, 878 comments)
  • मुझे NYT की ओर निर्देशित आलोचना अजीब लगती है। अगर NYT के पास मुक़दमे का आधार है, तो अदालत उसे मंज़ूर करेगी; अगर आधार नहीं है, तो OpenAI अदालत में जीत जाएगा। court order को NYT पर हमला करने के औज़ार की तरह इस्तेमाल करना अजीब है
    • NYT अमेरिकी क़ानूनी व्यवस्था की एक कमजोरी का उपयोग कर रहा है: बेहद व्यापक discovery process, जिसमें व्यक्तिगत privacy की लगभग कोई परवाह नहीं होती। यह अपने हित में कर रहा होगा, लेकिन इस मामले में मैं OpenAI के पक्ष में हुए बिना नहीं रह सकता
    • लगता है NYT परिस्थिति के हिसाब से अपना रुख़ बदलता है। पहले उसने freelancers के लेखों को database बनाकर बेचा था और copyright को कमज़ोर करने की बात की थी। अब वही copyright को सबसे अधिक महत्व दे रहा है। संदर्भ के लिए, NYT की policy shift पर यह लेख दिलचस्प है
    • NYT भी इस मामले का एक पक्षकार है। मुक़दमे को ‘निराधार’ कहना उसके लिए भी उचित है
    • अगर NYT के पास वास्तव में आधार न हो और फिर भी अदालत मंज़ूरी दे दे, तो वह भी असामान्य बात होगी
    • सिर्फ़ इसलिए कि कुछ क़ानूनी है, इसका मतलब यह नहीं कि क़ानूनी व्यवस्था का दुरुपयोग करने वालों को छूट मिल जानी चाहिए
  • OpenAI के “यह क्यों हो रहा है?” वाले स्पष्टीकरण में कुछ बातें गायब हैं। इसे ऐसे पेश किया गया है मानो लोग बिना वजह नाराज़ हैं, लेकिन customer के नज़रिए से देखें तो यह वाकई बेतुका लगता है
  • “Settings” में बताया जाता है कि user data का model training में उपयोग नियंत्रित किया जा सकता है, लेकिन व्यवहार में “Improve the model for everyone” toggle एक dark pattern है जिसका कोई असर नहीं पड़ता, और सीधे एक non-public portal में आवेदन करना पड़ता है, इसलिए इसे आसानी से ढूँढा भी नहीं जा सकता। इससे बहुत से users वास्तविक behavior को लेकर ग़लतफ़हमी में रहे
    • इस पर विस्तार से स्पष्टीकरण माँगा गया
    • “Improve the model for everyone” toggle का वास्तव में कोई प्रभाव नहीं है—इस दावे के बारे में अधिक ठोस विवरण और उस portal का link माँगा गया
  • मैंने हमेशा यह मानकर चला हूँ कि किसी external vendor API को भेजी गई हर चीज़ स्थायी रूप से store होती है। इसका उल्टा मानना और भी भोला होगा। यह वैसा ही भोला रवैया है जैसे मान लेना कि app web tracking नहीं करती
    • सबसे बुरा मानकर चलना समझदारी है, लेकिन बिना किसी प्रतिरोध के सबसे बुरी स्थिति को स्वीकार कर लेना मूर्खता है
    • privacy nihilism भी आख़िरकार ख़ुद का चुना हुआ निर्णय है
  • मैं OpenAI के इस आधिकारिक दावे से सहमत नहीं हूँ कि “trust और privacy मुख्य मूल्य हैं, और data management tools व deletion options उपलब्ध कराए जाते हैं।” अतिरिक्त शुल्क लेकर privacy देने का प्रचार किया जाता है, और Pro users भी “privacy” का लाभ नहीं ले सकते। कई बार information deletion request करने के बावजूद model और training data में मौजूद personal information को हटाने से इनकार किया गया
    • सभी users opt-out कर सकते हैं। ChatGPT Plus, Pro, Free—सभी में default रूप से data sharing enabled है, लेकिन कोई भी training data के उपयोग को disable कर सकता है। सिर्फ़ Enterprise में यह default से disabled है। संदर्भ: What if I want to keep my history on but disable model training?
    • यह कॉरपोरेट “trustwashing” से अधिक कुछ नहीं है। इसमें अस्पष्ट और धुंधले शब्द, अच्छा महसूस कराने वाली भाषा, और खोखले मूल्य भरे हुए हैं