Google DeepMind ने LLM द्वारा जनरेट किए गए टेक्स्ट को watermark करने और detect करने वाले SynthID को open source किया

(github.com/google-deepmind)

7 पॉइंट द्वारा GN⁺ 2024-10-31 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

Google DeepMind का SynthID एक ऐसी तकनीक है जो AI-जनरेटेड image, audio, text या video में सीधे digital watermark एम्बेड करके AI-जनरेटेड कंटेंट पर watermark लागू और पहचान करती है
- इस विधि का अधिक पूर्ण तकनीकी विवरण Nature पेपर में पढ़ा जा सकता है
SynthID Text को open source के रूप में उपलब्ध कराया गया है ताकि डेवलपर्स text generation में watermarking का उपयोग कर सकें

watermark लागू करना

SynthID Text एक Logits processor है जो Top-K और Top-P के बाद मॉडल की generation pipeline में लागू होता है
यह pseudo-random g-function का उपयोग करके मॉडल के logits को बढ़ाता है, ताकि text quality पर बड़ा असर डाले बिना watermarking जानकारी ऐसे encode की जा सके जिससे यह तय करने में मदद मिले कि text मॉडल द्वारा जनरेट किया गया है या नहीं
watermark को g-function को parameterize करने और generation के दौरान इसे कैसे लागू किया जाए, यह configure करने के लिए सेट किया जाता है
इस्तेमाल की जाने वाली हर watermarking configuration को सुरक्षित और निजी रूप से स्टोर किया जाना चाहिए
watermarking configuration के लिए दो आवश्यक parameter
- keys parameter: यूनिक random integers की सूची, जिसका उपयोग मॉडल की vocabulary में g-function scores की गणना के लिए किया जाता है। इस सूची की लंबाई लागू की जाने वाली watermarking layers की संख्या तय करती है
- ngram_len parameter: robustness और detectability के बीच संतुलन बनाने के लिए उपयोग होता है। मान जितना बड़ा होगा, watermark उतना बेहतर detect होगा, लेकिन बदलावों के प्रति उतना ही अधिक संवेदनशील होगा। डिफ़ॉल्ट के रूप में 5 उपयुक्त है
performance आवश्यकताओं के अनुसार watermark की अतिरिक्त configuration संभव है
- sampling table दो properties से बनती है: sampling_table_size और sampling_table_seed
- sampling के समय unbiased और stable g-function सुनिश्चित करने के लिए sampling_table_size कम से कम 2^16 या उससे अधिक होना चाहिए
- हालांकि sampling table का आकार inference के समय आवश्यक memory की मात्रा को प्रभावित करता है
- sampling_table_seed के लिए कोई भी इच्छित integer इस्तेमाल किया जा सकता है
- पिछले tokens के context_history_size में दोहराए गए n-grams को detectability बढ़ाने के लिए watermark नहीं किया जाता
SynthID Text watermark के साथ text जनरेट करने के लिए मॉडल पर अतिरिक्त training की आवश्यकता नहीं है
केवल वही watermarking configuration चाहिए जो मॉडल की .generate() method में पास की जाती है। इससे SynthID Text Logits processor सक्रिय हो जाता है
Hugging Face की blog post और Space में ऐसे code examples देखे जा सकते हैं जो Transformers library में watermark लागू करने का तरीका दिखाते हैं

watermark detect करना और verifiability

watermark detection probabilistic है
Bayesian detector, Hugging Face Transformers और GitHub पर उपलब्ध है
यह detector तीन संभावित detection states आउटपुट कर सकता है: watermarked, unwatermarked, या uncertain
दो threshold सेट करके इसके behavior को customize किया जा सकता है ताकि किसी विशिष्ट false positive rate और false negative rate को हासिल किया जा सके
वही tokenizer इस्तेमाल करने वाले मॉडल watermarking configuration और detector साझा कर सकते हैं, बशर्ते detector के training set में watermark साझा करने वाले सभी मॉडलों के examples शामिल हों
trained detector होने पर आप यह चुन सकते हैं कि detector को users और public के सामने उजागर करना है या नहीं, और कैसे करना है
- पूरी तरह private option में detector को किसी भी रूप में public या expose नहीं किया जाता
- semi-private option में detector को public नहीं किया जाता, लेकिन API के ज़रिए expose किया जाता है
- public option में detector को इस तरह public किया जाता है कि दूसरे लोग उसे download करके इस्तेमाल कर सकें

सीमाएँ

SynthID Text watermark कुछ transformations के प्रति मज़बूत है, लेकिन इसकी सीमाएँ हैं
- factual responses में watermarking कम प्रभावी होती है, क्योंकि accuracy घटाए बिना generation को बढ़ाने के अवसर कम होते हैं
- यदि AI-जनरेटेड text को पूरी तरह से फिर से लिखा जाए या किसी दूसरी भाषा में अनुवाद किया जाए, तो detector का confidence score काफ़ी कम हो सकता है
SynthID Text को इस तरह डिज़ाइन नहीं किया गया है कि यह जानबूझकर हमला करने वाले attackers को सीधे नुकसान पहुँचाने से रोक सके
हालांकि यह AI-जनरेटेड कंटेंट का दुरुपयोग करना अधिक कठिन बना सकता है, और अन्य approaches के साथ मिलकर कंटेंट प्रकारों और platforms में बेहतर coverage दे सकता है

GN⁺ की राय

SynthID Text watermark के ज़रिए AI-जनरेटेड कंटेंट के स्रोत की पहचान करने की उपयोगी क्षमता देता है
लेकिन watermark अपने आप में कंटेंट की authenticity की गारंटी नहीं देता। क्योंकि गलत जानकारी या हानिकारक कंटेंट पर भी watermark लगाया जा सकता है
इसलिए watermark के साथ-साथ कंटेंट की सामग्री पर भी reliability validation की आवश्यकता होगी
Hugging Face जैसी प्रमुख libraries में integration होने से डेवलपर्स इसे आसानी से उपयोग कर सकते हैं, यह एक बड़ा फ़ायदा है
हालांकि detector को public करना है या नहीं, यह सावधानी से तय किया जाना चाहिए। क्योंकि पूरी तरह public करने पर watermark को bypass करने की कोशिशें बढ़ सकती हैं
कुल मिलाकर, AI-जनरेटेड कंटेंट के तेज़ी से फैलने की स्थिति में स्रोत पहचान की तकनीक के रूप में SynthID Text का महत्व बढ़ने की संभावना है

Google DeepMind ने LLM द्वारा जनरेट किए गए टेक्स्ट को watermark करने और detect करने वाले SynthID को open source किया

watermark लागू करना

watermark detect करना और verifiability

सीमाएँ

GN⁺ की राय

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.