- Anthropic के Claude Opus 4.7 ने सिर्फ़ 125 शब्दों का एक अप्रकाशित ड्राफ्ट देखकर सबसे संभावित लेखक के रूप में Kelsey Piper का नाम लिया, और Incognito Mode, दोस्त के कंप्यूटर, तथा API टेस्ट में भी वही नतीजा आया
- ChatGPT और Gemini ने उसी टेक्स्ट के लिए Matt Yglesias या Scott Alexander का अनुमान लगाया, लेकिन Claude Opus 4.7 ने अलग genre और समय-काल की लिखाई—जैसे education draft, फिल्म review, fantasy novel, और 15 साल पुराना college application essay—में भी बार-बार Piper की पहचान की
- मॉडल द्वारा दी गई justification अक्सर भरोसेमंद नहीं लगी, और ऐसा दिखा कि वह इंसान की तरह जासूसी तर्क लगाने के बजाय पकड़ना मुश्किल stylistic tics को पहचान रहा था
- Piper जैसे लोग, जिनकी असली नाम से बहुत-सी सार्वजनिक लिखाई इंटरनेट पर मौजूद है, AI chat या anonymous account की पोस्ट में भी anonymity खो सकते हैं; कई academic लोगों और industry researchers ने भी draft या chat के दौरान पहचाने जाने का अनुभव बताया
- जिन लोगों की असली नाम से सार्वजनिक लिखाई बहुत कम है, वे अभी सिर्फ़ एक paragraph से de-anonymize नहीं हो रहे, लेकिन मॉडल दायरा इतना संकरा कर सका कि उसने करीबी दोस्तों या उसी Discord channel के सदस्यों का अनुमान लगाया, और आगे चलकर ज़रूरी public text की मात्रा और घट सकती है
Opus 4.7 का authorship identification experiment
- Anthropic के नए मॉडल Claude Opus 4.7 ने Kelsey Piper के एक ऐसे 125-शब्दीय ड्राफ्ट को देखकर, जिसे उन्होंने सार्वजनिक नहीं किया था, सबसे संभावित लेखक के रूप में Kelsey Piper का नाम लिया
- उसी टेक्स्ट पर ChatGPT ने Matt Yglesias का, और Gemini ने Scott Alexander का अनुमान लगाया
- account memory या user information चालू नहीं थी, test Incognito Mode में किया गया था, और दोस्त के कंप्यूटर तथा API test में भी वही परिणाम मिला
- पहला test paragraph किसी political column की शुरुआत जैसा लग रहा था, और Piper की सार्वजनिक लिखाई इंटरनेट पर बहुत होने के कारण यह असंभव स्तर की style identification नहीं थी
- लेकिन Opus 4.7 ने Piper की सार्वजनिक गतिविधि के क्षेत्रों से दूर लिखे गए टेक्स्ट में भी वही पहचान जारी रखी, जिससे नतीजा और ज़्यादा चौंकाने वाला लगा
genre और समय-काल बदलने पर भी पहचान जारी रही
-
education से जुड़ा ड्राफ्ट
- स्कूल progress report के एक अप्रकाशित ड्राफ्ट में भी Claude ने “Kelsey Piper” जवाब दिया
- उसी टेक्स्ट पर ChatGPT ने Freddie deBoer का, और Gemini ने Duncan Sabien का अनुमान लगाया
- education पूरी तरह असंबंधित क्षेत्र नहीं था, क्योंकि Piper इस विषय पर लिख चुकी हैं
-
फिल्म review
- फिल्म review जैसे ऐसे format में भी, जिसे Piper ने अपनी सार्वजनिक लिखाई में पहले नहीं किया था, Claude और ChatGPT ने Kelsey Piper को सही पहचाना
- Gemini ने Ursula Vernon का नाम सुझाया, और पिछले हफ्ते के Claude Opus 4.6 ने काफ़ी विश्वास से Elizabeth Sandifer कहा
- test में इस्तेमाल किया गया review द्वितीय विश्व युद्ध के दौर की फ़िल्म और To Be or Not To Be पर आधारित था
-
fantasy novel
- fantasy novel के ड्राफ्ट में Claude को Kelsey Piper कहने तक पहुँचने के लिए लगभग 500 शब्दों की ज़रूरत पड़ी
- उसी मामले में ChatGPT ने वास्तविक fantasy लेखक K.J. Parker का अनुमान लगाया
-
15 साल पुराना college application essay
- 15 साल पहले लिखे गए college application essay में भी Claude और ChatGPT ने Kelsey Piper का नाम लिया
- इस test में Claude की उस refusal tendency को पार करने के लिए, जिसमें वह college applicants की पहचान नहीं करना चाहता, ज़्यादा मज़बूत prompt की ज़रूरत पड़ी
- essay में policy debate का अनुभव शामिल था, इसलिए संभव है कि मॉडल ने उसी संकेत के आधार पर अनुमान लगाया हो
मॉडल की व्याख्या पर भरोसा करना मुश्किल है
- AI ने Kelsey Piper का नाम लेने के बाद जो justification दी, वह अक्सर समझ में नहीं आती थी
- Claude ने यह समझाने की कोशिश की कि To Be or Not To Be effective altruists की मशहूर पसंदीदा फ़िल्म है, लेकिन Piper के अनुसार यह सच नहीं था
- ChatGPT ने कहा कि college application essay ऐसे व्यक्ति की लिखाई जैसा लगता है जो आगे चलकर complex policy ideas समझाने का काम करेगा, इसलिए उसने Kelsey Piper तक दायरा सीमित किया
- ऐसी व्याख्याएँ बाद में गढ़ी हुई लगती हैं; मॉडल ऐसे बोलता है जैसे उसने किसी इंसानी जासूस की तरह तर्क किया हो, लेकिन वास्तव में वह शायद ऐसे stylistic tics पकड़ रहा है जिन्हें पहचानना कठिन है
- AI hallucination अब भी हल की हुई समस्या नहीं है, फिर भी Opus 4.7 की मूल authorship identification क्षमता बहुत मज़बूत दिखती है, भले ही वह अपने तरीक़े को अजीब ढंग से rationalize करे
AI से बात करते समय anonymity गायब हो रही है
- नया AI chat खोलते समय anonymity होने का एहसास हो सकता है, लेकिन कुछ सार्थक बातचीत के बाद Claude यह समझ सकता है कि सामने कौन है
- Piper जैसे लोगों के लिए, जिन्होंने इंटरनेट पर अपने नाम से बहुत अधिक सार्वजनिक लिखाई छोड़ी है, अब anonymity बची नहीं है
- सिर्फ़ मौजूदा AI tools के सहारे भी यह संभव हो सकता है कि जिन लोगों की असली नाम से बड़े पैमाने पर सार्वजनिक writing corpus मौजूद है, उनकी anonymous account पोस्ट की de-anonymization कर दी जाए
- हालांकि, अगर किसी ने वर्षों तक बेहद सावधानी से यह सुनिश्चित किया हो कि उसके alternate account की लिखाई में main account की style fingerprint न आए, तो वह अपवाद हो सकता है
- कई academic लोग और industry researchers भी draft या chat के दौरान पहचाने जाने का अनुभव साझा कर चुके हैं
अभी हर व्यक्ति को एक paragraph से पहचानना संभव नहीं
- AI अभी सिर्फ़ एक paragraph से हर व्यक्ति की de-anonymization नहीं कर सकता
- जब उन दोस्तों के ड्राफ्ट और paragraphs पर test किया गया जिनकी असली नाम से सार्वजनिक लिखाई बहुत कम थी, तो AI उन्हें de-anonymize नहीं कर सका
- अगर सार्वजनिक इंटरनेट पर असली नाम से पर्याप्त लिखाई मौजूद नहीं है, तो फिलहाल इसे सुरक्षित माना जा सकता है
- लेकिन एक ऐसे दोस्त की Discord post में, जिसकी सार्वजनिक social accounts या online writing लगभग नहीं थी, Claude 4.7 असफल होने के बावजूद उसी channel के दो करीबी दोस्तों का अनुमान लगाने तक पहुँच गया
- और ज़्यादा paragraphs देने पर दूसरे mutual friends के नाम भी सामने आए, जबकि किसी और दोस्त की लिखाई को एक अलग दोस्त के नाम से ग़लत भी पहचाना गया
लिखने की शैली उम्मीद से ज़्यादा पहचान योग्य है
- लोग अपने subculture से stylistic tics अपना लेते हैं, और इसी वजह से टेक्स्ट उम्मीद से ज़्यादा मज़बूत पहचान संकेत देता है
- मॉडल बहुत कम जानकारी से भी हैरान कर देने वाली क़रीबी तक पहुँच सकता है
- संभव है कि आज के मॉडल भविष्य में आने वाले AI की तुलना में सबसे कमज़ोर स्तर के हों
- समय के साथ ऐसी de-anonymization के लिए ज़रूरी public text की मात्रा कम हो सकती है
- अनुमान है कि अगर कोई नौकरी छोड़ने के बाद Glassdoor पर एक विस्तृत anonymous review लिखे, तो 1–2 साल के भीतर कंपनी उस टेक्स्ट को AI में paste करके पता लगा सकेगी कि यह किसने लिखा
बचने के तरीके और निष्कर्ष
- anonymity बनाए रखने के लिए संभव है कि लोगों को जानबूझकर अपनी सामान्य शैली से बहुत अलग लिखना पड़े
- या फिर हर लिखाई को AI से rewrite करवाना पड़े, लेकिन ऐसा संसार वांछनीय नहीं लगता
- यह कोई अच्छा बदलाव नहीं, बल्कि ज़्यादा एक अनुमानित बदलाव जैसा है
- Piper के साथ यह पहले इसलिए हुआ क्योंकि उन्होंने अपनी पूरी वयस्क ज़िंदगी में इंटरनेट पर लगातार बहुत लिखा है, और अंततः यह दूसरों के साथ भी हो सकता है
- जो लोग बहुत लिखते हैं, उनकी anonymity शायद लंबे समय तक नहीं टिकेगी, और anonymous writers को अचानक चौंकने के बजाय यह पहले से जान लेना चाहिए
अभी कोई टिप्पणी नहीं है.