- अमेरिकी अदालत ने OpenAI को सभी ChatGPT लॉग्स, जिनमें डिलीट की गई चैट्स भी शामिल हैं, अनिश्चितकाल तक सुरक्षित रखने का आदेश दिया, जिसके बाद दो उपयोगकर्ताओं ने इसे 'मास सर्विलांस' बताते हुए हस्तक्षेप की कोशिश की, लेकिन याचिका खारिज कर दी गई
- एक उपयोगकर्ता ने संवेदनशील व्यक्तिगत और व्यावसायिक जानकारी इनपुट करने के अपने अनुभव का हवाला देते हुए कहा कि यह आदेश पूरे अमेरिका में एक बड़े निगरानी कार्यक्रम के बराबर है
- जज ने स्पष्ट किया कि सिर्फ सबूत संरक्षित रखने का आदेश कोई निगरानी कार्यक्रम नहीं है, और न्यायपालिका कोई जांच एजेंसी नहीं है
- डिजिटल राइट्स संगठन (EFF) ने भी उपयोगकर्ता प्राइवेसी पर जोखिम और भविष्य में दुरुपयोग की संभावना को लेकर चिंता जताई
- उपयोगकर्ता OpenAI की कड़ी कानूनी रणनीति और भविष्य में डेटा साझा किए जाने या पारदर्शिता की कमी को लेकर चिंतित हैं
पृष्ठभूमि और अदालत का आदेश
- हाल ही में अदालत ने OpenAI को ChatGPT के सभी लॉग्स, डिलीट की गई चैट्स सहित, अनिश्चितकाल तक सुरक्षित रखने का आदेश दिया
- यह कदम समाचार मीडिया कंपनियों द्वारा दायर कॉपीराइट मुकदमे में सबूत सुरक्षित करने के लिए उठाया गया
- कुछ उपयोगकर्ताओं ने चिंता जताई कि यह आदेश डिलीट और anonymous चैट्स तक को कवर करता है और इसे उपयोगकर्ताओं को बताए बिना लागू किया जा रहा है
उपयोगकर्ताओं का हस्तक्षेप प्रयास और प्राइवेसी विवाद
- एक उपयोगकर्ता ने कहा कि उसने संवेदनशील व्यक्तिगत और व्यावसायिक जानकारी दर्ज की थी, इसलिए यह आदेश पूरे अमेरिका में बड़े पैमाने की निगरानी में बदल सकता है, और उसने हस्तक्षेप की मांग की
- उसने बिना पूर्व सूचना डिलीट और anonymous चैट्स को सुरक्षित रखने पर आपत्ति जताई और मेडिकल, फाइनेंस, लीगल जैसे संवेदनशील विषयों की चैट्स पर अपवाद लागू करने की मांग की
- अदालत ने यह कहते हुए याचिका खारिज कर दी कि "दस्तावेज़ सुरक्षित रखने का आदेश निगरानी से असंबंधित है, और अदालत कोई जांच एजेंसी नहीं है"
डिजिटल राइट्स समूह का दृष्टिकोण
- Electronic Frontier Foundation(EFF) की लीगल डायरेक्टर Corynne McSherry ने चिंता जताई कि "यह आदेश उपयोगकर्ता प्राइवेसी पर वास्तविक जोखिम डालता है और इसी तरह के मुकदमों पर नकारात्मक असर डाल सकता है"
- उन्होंने कहा कि यह आगे चलकर ऐसा precedent बन सकता है, जिसके आधार पर law enforcement agencies या मुकदमे के पक्षकार OpenAI से उपयोगकर्ता रिकॉर्ड सौंपने की मांग करें
- खास तौर पर उन्होंने जोर दिया कि अगर उपयोगकर्ता रिकॉर्ड पर नियंत्रण और सूचना देने की बाध्यता कमजोर रही, तो AI चैटबॉट एक नया surveillance vector बन सकते हैं
अदालत के फैसले की दलील
- जज ने कहा कि "दस्तावेज़ सुरक्षित रखने का आदेश किसी खास मुकदमे में सबूत सुरक्षित रखने के उद्देश्य से दिया गया कदम है", और संवैधानिक अधिकारों के उल्लंघन जैसे मुद्दे इस मुकदमे के मूल प्रश्न से संबंधित नहीं हैं
- अदालत ने माना कि हस्तक्षेप की कोशिश तथ्य स्पष्ट करने या मुकदमे के मुद्दों से संबंधित नहीं है और केवल मुकदमे में देरी करेगी, इसलिए इसके अधिकार को मान्यता नहीं दी गई
- फिलहाल समाचार कंपनियों को वास्तविक डेटा सौंपे जाने का कोई मामला सामने नहीं आया है, इसलिए यदि भविष्य में डेटा साझा किया जाता है तो आगे चर्चा संभव हो सकती है
उपयोगकर्ताओं की चिंता और आगे के मुद्दे
- उपयोगकर्ताओं ने चिंता जताई कि "OpenAI प्राइवेसी सुरक्षा की तुलना में मुकदमे की लागत, प्रतिष्ठा प्रबंधन और अन्य हितों को प्राथमिकता दे सकता है"
- EFF समेत अन्य समूहों ने जोर दिया कि AI चैट ऐप कंपनियों को डिलीट अनुरोध मिलने पर वास्तव में रिकॉर्ड मिटाने और डेटा अनुरोधों की पारदर्शी सूचना देने की जरूरत है
- अंततः उपयोगकर्ता डेटा के संरक्षण और खुलासे की प्रक्रिया में पारदर्शिता, सूचना प्रक्रिया और बाद की राहत के उपाय आगे प्रमुख मुद्दों के रूप में उभरेंगे
1 टिप्पणियां
Hacker News टिप्पणियाँ
लेख में उद्धृत जज की टिप्पणियाँ पढ़कर लगता है कि जज मुद्दे की मूल प्रकृति को ठीक से समझ नहीं रहे, और फैसले का तर्क भी अजीब लगता है
तर्क यह है कि "यदि ऐसे सवालों पर विचार किया जाए, तो इससे उन कानूनी मुद्दों के समाधान में अनुचित देरी होगी जिन्हें वास्तव में संबोधित किया जाना चाहिए"
चूँकि यह copyright से जुड़ा मुकदमा है, क्या इसका मतलब यह है कि constitutional मुद्दों को नज़रअंदाज़ किया जा सकता है?
और केवल इस वजह से कि आवेदन किसी वकील ने नहीं लिखा, उसे तुरंत खारिज कर देना जज की भूमिका के खिलाफ़ लगता है
ऐसा प्रतीत होता है कि इस बात को नज़रअंदाज़ किया गया कि बिना वकील के भी दावा दायर किया जा सकता है
लेख के साथ संलग्न पूरा आदेश(यहाँ) पढ़ने पर स्थिति अधिक स्पष्ट हो जाती है
मुद्दा उठाने वाले पक्ष ने एक विशेष प्रकार का "intervene अनुरोध" दायर किया था, जिसके लिए कड़े मानदंड होते हैं
वह उन मानदंडों को पूरा नहीं कर पाया
बिना वकील के दायर करने वाली बात का भी आदेश में उल्लेख है
कोई व्यक्ति स्वयं अपना प्रतिनिधित्व कर सकता है, लेकिन कोई legal entity(कंपनी) के लिए वकील अनिवार्य होता है
चूँकि मामला शुरुआत में कंपनी के नाम से दायर किया गया था, इसलिए लगता है कि जज ने कानून के अनुसार ही कार्रवाई की
मुझे भी कुछ ऐसा ही लगा, और इससे भी अधिक चिंता इस बात की है कि ऐसे बहुत से समान services हैं जो इस तरह की privacy समस्याओं से प्रभावित हो सकती हैं
इस तरह के अत्यधिक court orders को रोकने के लिए मज़बूत privacy law की ज़रूरत है, लेकिन अभी ऐसा कोई कानून नहीं है
उदाहरण के लिए, dating services को एक-दूसरे के बीच हुए सभी messages सुरक्षित रखने का आदेश, telecom companies को सभी text messages सहेजने का आदेश, या अरबों की संख्या में बनने वाले Google Docs को संरक्षित करने जैसे मामले संभव हैं
यह भी सोचने वाली बात है कि सरकार ने अभी तक Signal जैसी services में backdoor जोड़ने और सभी text messages सहेजने की माँग क्यों नहीं की
मुझे लगता है कि वास्तव में ऐसा करवाने के लिए बहुत मज़बूत justification चाहिए होगा
यह भी सवाल है कि क्या अमेरिकी सरकार पहले से ही सामान्य commercial services में इतना व्यापक surveillance कर चुकी है
Edward Snowden के खुलासों में पहले Google communications की wiretapping का भी मामला था
जज आमतौर पर वकील रहे होते हैं या उनके पास कानूनी अनुभव होता है
इस जज के पास भी वकालत का अनुभव है, और उनका एक अनोखा background यह भी है कि उन्होंने zoology में PhD लगभग पूरी कर ली थी
समाज में संरक्षित वर्गों का असंरक्षित वर्गों के साथ समान व्यवहार न करना बहुत स्वाभाविक बात है
मुझे इस मामले में कोई constitutional प्रश्न दिखता नहीं, और यदि हो भी तो यह उसका निर्णय करने का मंच नहीं है
बिना वकील के दायर करने पर इसे नज़रअंदाज़ किया गया, यह आलोचना 100% ग़लतफ़हमी है
Pro Se(स्वयं मुकदमा लड़ना) के लिए नियम अच्छी तरह स्थापित हैं
यदि आप किसी दूसरे पक्ष की legal entity का प्रतिनिधित्व करते हुए मुकदमा दायर कर रहे हैं, तो वकील अनिवार्य है
यह बात नहीं है कि "मुकदमा copyright का है इसलिए constitutional मुद्दों को नज़रअंदाज़ किया जा सकता है", बल्कि जज को लगा कि constitutional मुद्दा टिकता नहीं और इस पर समय लगाना केवल समय की बर्बादी होगा
"क्या copyright मुकदमा होने के कारण constitutional मुद्दों को नज़रअंदाज़ किया जा सकता है?" इस हिस्से पर
मैं जानना चाहूँगा कि इसमें कौन-सा constitutional मुद्दा देखा जा रहा है
"बिना वकील के भी संभव है" वाला दावा भी तथ्यात्मक रूप से गलत है, क्योंकि कानूनन कंपनियों को वकील रखना ही पड़ता है
अगर कोई व्यक्ति स्वयं दायर करे तो कुछ नरमी हो सकती है, लेकिन कंपनियों पर यह लागू नहीं होता
अगर ऐसी बुनियादी बातों पर ही तर्क डगमगा रहा है, तो बाकी बिंदुओं पर भरोसा करना कठिन लगता है
यह मामला इतना बड़ा news item नहीं लगता
OpenAI जल्द ही data preservation order को सीधे चुनौती देने के लिए oral argument करने वाला है, और ChatGPT के आम users द्वारा पहले से दायर दो अनुरोध ऐसे मामले नहीं थे जो नतीजे को तय कर देते
ऐसा दावा है कि जज ने कंपनी पर "सारा data preserve करो" आदेश का वास्तविक दुनिया पर पड़ने वाला असर ठीक से नहीं समझा, और इसे जल्दी से पुनर्विचार करने की इच्छा भी नहीं दिखाई
इसलिए शुरुआती आदेश का प्रभाव ही अपने-आप में newsworthy है
आजकल तो बहुत स्पष्ट निष्कर्ष भी अपने-आप में बड़ी खबर बन जाते हैं
हमने इस तरह यह पुष्टि की है कि users को सीधे भाग लेने का अधिकार है
plaintiff की तरह कोई व्यक्ति स्वयं मुकदमा दायर कर सकता है
नतीजा कुछ भी हो, यह अधिकार अपने-आप में मौजूद है
निष्कर्ष यही है कि जज को इस मुद्दे में दिलचस्पी नहीं दिखती, इसलिए उन्हें मनाने की कोशिश बेकार है
सवाल यह है कि OpenAI और users के पास विकल्प क्या हैं
यह सीधा जवाब नहीं है, लेकिन मुझे लगता है कि local LLM का उपयोग आगे चलकर सबसे व्यावहारिक विकल्प होगा
मैं खुद आजकल इन्हें चला रहा हूँ; अभी context retention और high performance में सीमाएँ हैं, लेकिन 1~2 साल में काफ़ी उपयोगी local LLM आ जाना अवास्तविक सपना नहीं लगता
मेरे लिए privacy से ज़्यादा offline usability आकर्षक है
अमेरिकी कानून के तहत कोई विकल्प नहीं है
यह एक सामान्य 'third-party doctrine' का मामला है
भले data आपका हो, लेकिन यदि आप उसे स्वेच्छा से किसी third party(OpenAI) को देते हैं, तो वह अब आपका नहीं माना जाता और privacy की reasonable expectation भी समाप्त हो जाती है
अपवाद केवल किसी विशेष रूप से बनाए गए नए कानून में ही संभव हैं, और मौजूदा कानून के तहत OpenAI पर ऐसा कोई अपवाद लागू नहीं होता
फैसला भी अमेरिकी कानून की इसी रूपरेखा के भीतर हुआ है, और OpenAI को भेजे गए conversation data पर वर्तमान मानक के अनुसार privacy protection नहीं है
अब third party से privacy की उम्मीद करना छोड़ देना चाहिए
bank information भी जाँच के आदेश पर उजागर की जा सकती है
बहुत से programmers इस वास्तविकता को समझे बिना केवल आज के चर्चित मुद्दों पर प्रतिक्रिया दे रहे हैं
आगे फैसला जैसा भी आए, appeal एक विकल्प हो सकता है
"OpenAI और users के पास विकल्प क्या हैं?" इस सवाल का
एक तरीका यह है कि ऐसी service खोजी जाए जो अपना data अमेरिका में न रखती हो
यदि कोई यह मानता है कि OpenAI chat या API में डाला गया सब कुछ store नहीं करेगा, तो उसे OpenAI board की मौजूदा स्थिति ज़रूर देखनी चाहिए
अगर OpenAI जैसे LLM providers को कानूनी रूप से data store करने से मना भी कर दिया जाए, तब भी यह भरोसा करना कठिन है कि वे वास्तव में उस policy का पालन करेंगे
सुझाव यही है कि sensitive data केवल local LLM में ही सीधे डाला जाए
कृपया इस double negative को समझें
अब दुनिया के पास रोज़मर्रा के जीवन के लगभग हर पहलू पर निगरानी रखने की तकनीकी क्षमता है, इसलिए असली सवाल यह है कि इससे निपटा कैसे जाए
भविष्य में इस विशाल data के कारण medicine, epidemiology, large-scale psychology(मैं इसे Massive open online psychology, moop कहता हूँ) जैसे नए क्षेत्र बन सकते हैं, और सरकार real-time big data के आधार पर वंचित नागरिकों को बेहतर सेवाएँ भी दे सकती है
लेकिन ऐसे भविष्य के लिए भरोसेमंद legal framework अनिवार्य होगा, और मुझे नहीं लगता कि इसे हर बार किसी एकल फैसले के जरिए टुकड़ों में लागू किया जा सकता है
व्यक्तिगत रूप से मेरा मानना है कि जो data किसी व्यक्ति की प्रत्यक्ष क्रिया के बिना बन ही नहीं सकता, वह हर हाल में उसी व्यक्ति का होना चाहिए, और उसका trusteeship केवल तभी स्वीकार्य होना चाहिए जब data का उपयोग उसी व्यक्ति के हित में हो
अगर "user/citizen के हित" जैसा ऊँचा मानदंड लागू हो, तो data companies की सोच पूरी तरह बदल जाएगी
इस बारे में दूसरे लोग क्या सोचते हैं, यह जानने में रुचि है
अभी HN जैसी जगहों पर यह दिशा कुछ हद तक taboo मानी जाती है, लेकिन मेरा मानना है कि privacy और big data, दोनों के लाभ एक साथ पाने के लिए data को user-केंद्रित तरीके से locked होना चाहिए और centralized silos के बजाय distributed होना चाहिए
इस मामले में जज वास्तव में एक magistrate हैं जिनका कार्यकाल लगभग एक साल ही बचा है
पहले भी ऐसे मामले हुए हैं जहाँ कमज़ोर फैसले देने वाले magistrate का कार्यकाल नहीं बढ़ाया गया, और उम्मीद है यहाँ भी ऐसा ही हो
कार्यकाल विस्तार की सार्वजनिक सूचना लिंक
मुझे समझ नहीं आता कि judge शब्द पर अनावश्यक उद्धरण चिह्न लगाने की ज़रूरत क्यों है
magistrate भी पूरी तरह judge ही होते हैं
संदर्भ: अमेरिकी संघीय अदालतों में judges के प्रकार
केवल Third Party Doctrine के सामान्य अनुप्रयोग के आधार पर किसी magistrate के कार्यकाल या प्रतिष्ठा को नुकसान पहुँचना उचित नहीं लगता
इसी विषय पर पिछली चर्चा देखें OpenAI ने सभी ChatGPT logs और deleted conversations तक को सुरक्षित रखने के court order का विरोध किया
10 साल से अधिक समय तक चलने वाले बड़े surveillance programs को कोई judge नहीं रोक सकता
अब यह मज़ाक और निरर्थक विवाद जैसा हो गया है
OpenAI भी दूसरी कंपनियों की तरह हर संभव जानकारी इकट्ठा करता है और हमारा profiling करता है
मुझे यह अजीब लगता है कि इतने लोग इस स्थिति पर shock या anger दिखा रहे हैं
शायद ज़्यादातर लोग यह नहीं जानते, या नज़रअंदाज़ करते हैं, कि वे जो रोज़मर्रा की online services इस्तेमाल करते हैं, वे भी ठीक यही करती हैं
व्यावहारिक रूप से, Signal जैसी E2EE service को छोड़कर Gmail, telecom carriers, Reddit, Xitter जैसी प्रमुख services सभी data और metadata सुरक्षित रखती हैं
यह सही है या गलत, इससे अलग, मौजूदा online services की दुनिया में यही सामान्य वास्तविकता है
गुस्सा इसलिए है क्योंकि लोगों को लगता है कि यह वास्तविकता अब अस्वीकार्य स्तर तक पहुँच गई है
terms या policy से अलग, OpenAI को वह data भी मजबूरन सुरक्षित रखना पड़ रहा है जिसे users के लिए मिटाया जाना था
मुझे तो उल्टा यह देखकर आश्चर्य नहीं होता कि लोग खुलकर अपनी स्थिति जाहिर कर रहे हैं
मेरा मानना है कि ज़्यादातर लोग इस तथ्य से पूरी तरह अनजान हैं
अपने आसपास के non-technical दोस्तों से या सड़क पर किसी भी व्यक्ति से पूछिए, अक्सर वे इस वास्तविकता से सचमुच परिचित नहीं होते