Gemini के SynthID watermark को reverse engineer करके detect और remove करने वाला open source
(github.com/aloshdenny)- Google के SynthID encoder/decoder तक पहुंच के बिना, सिर्फ signal processing और spectrum analysis से Gemini images के invisible watermark structure को reconstruct किया गया
- मुख्य खोज: SynthID हर resolution पर अलग frequency positions में carrier insert करता है, और एक ही model से बनी images के बीच phase template consistency 99.5% से अधिक है — यानी लगभग fixed pattern
- मौजूदा JPEG compression और noise injection तरीके quality loss ज़्यादा करते हैं, लेकिन V3 multi-resolution spectrum codebook subtraction तरीके से PSNR 43dB से अधिक बनाए रखते हुए 91% phase consistency reduction हासिल की गई
- resolution-wise profiles को codebook में store करके, input image के अनुसार automatic selection → FFT domain subtraction → multi-pass iteration से residual watermark हटाया जाता है
- Green channel में watermark signal सबसे मजबूत है, और channel-wise weights (G=1.0, R=0.85, B=0.70) लगाकर precise removal किया जाता है
- detector 90% accuracy के साथ watermark की मौजूदगी और confidence output करता है, और codebook-based multi-scale analysis का उपयोग करता है
- research और education purpose का project है, AI-generated images को human-made दिखाने के उपयोग की अनुमति नहीं है
- Python में लिखा गया है, GitHub पर पूरा code public है
1 टिप्पणियां
Hacker News की राय
लाखों pixels वाली image में पता न चलने वाला 1-bit watermark डालना इतना मुश्किल काम नहीं है
अगर मान लें कि Google काफ़ी सक्षम है, तो वह शायद दो तरह के watermark इस्तेमाल करता होगा — एक बाहर सार्वजनिक किया गया ढीला version, और दूसरा internal use या law enforcement requests के लिए private version
इसके अलावा, Google शायद बनाई गई सभी images को (या उनके neural hash को) account से जोड़कर database में store करता होगा
यह मानकर चलना कि बाहरी layer eventually टूट जाएगी, और दूसरी ऐसी layer बनाए रखना जिसे publicly test नहीं किया जा सकता, security का बुनियादी सिद्धांत है
लेकिन models लगातार नए बन रहे हैं और उनमें non-deterministic गुण भी हैं, तो ऐसी स्थिति में user इसे साबित कर पाएगा या नहीं, यह सवाल है
यह repo, AI-assisted research कहने लायक भी low quality का है, और Google के SynthID detector से ठीक तरह compare भी नहीं करता
सच कहें तो सिर्फ LLM की मदद से भी network requests की reverse engineering करके browser या Gemini के बिना SynthID detection implement किया जा सकता है. वही असली ground truth होगा
और कई बार लोग source पर हमला करते हैं या “AI ने लिखा है” कहकर खारिज कर देते हैं
आजकल HN community धीरे-धीरे AI tools की नफ़रत वाली दिशा में जाती लग रही है
आज Nano Banana से generate की गई image में मुझे watermark दिखा था, ऐसा लगा
मैंने Chrome में image को Slack पर copy किया, लेकिन result सिर्फ काले square पर लाल dots जैसा दिखा
कहीं ऐसा ही कोई mistake तो नहीं था, यह सोच रहा हूँ
पता था कि कोई न कोई आखिरकार ऐसा कुछ बना ही देगा, लेकिन समझ नहीं आता कि AI-generated images को detect करने के तरीक़े को जानबूझकर क्यों हटाना चाहेंगे
अगर सिर्फ बुरे लोग ही जानते रहें, तो जोखिम और बढ़ जाता है
आम लोग “watermark नहीं है, तो image असली है” जैसी binary logic को समझ नहीं पाते
आखिरकार AI watermarking का असफल होना तय है
और पहले भी manipulated media पर invisible watermark नहीं लगाए जाते थे — यह technology से ज़्यादा philosophy का सवाल है
Stable Diffusion में low denoising strength के साथ चलाने पर watermark लगभग ग़ायब हो जाता है
इस report में दावा है कि यह उससे कम destructive तरीका देता है, लेकिन README में दिख रहे AI-generated traces की वजह से भरोसा नहीं होता
SynthID कुछ images में (ख़ासकर edges या text वाले इलाक़ों में) साफ़ नज़र आता है
सोच रहा हूँ कि क्या इस report का तरीका उन हिस्सों को ज़्यादा natural बना पाएगा
README देखें तो उसमें Claude के निशान बहुत साफ़ दिखते हैं
table walls गड़बड़ हैं, और sentence structure भी Claude के typical pattern जैसा है
ASCII table की नकल करने की कोशिश है, लेकिन characters की width अलग-अलग होने से lines align नहीं होतीं
यहाँ तक कि off-by-one error भी है
लगता है 2037 में भी हम अब भी unaligned Unicode tables ही देख रहे होंगे
यह repo अपनी watermark removal performance को सिर्फ अपने ही detector से test करता है
Google के SynthID app से verify ही नहीं करता, इसलिए इसका कोई मतलब नहीं बनता
project description में लिखा है कि “AI-generated content को human-made जैसा दिखाकर धोखा मत दो”, लेकिन असल में यह watermark removal CLI tool distribute करता है
“aggressive”, “maximum” जैसे setting names भी काफ़ी खुल्लमखुल्ला हैं
README बिना edit किए AI output जैसा लगता है, उसमें content दोहराया गया है और structure भी बिखरा हुआ है
मूल idea (resolution-dependent carrier, images के बीच phase consistency) दिलचस्प है, लेकिन packaging भरोसा तोड़ देती है
image को downscale करके फिर upscale करने से watermark हट जाता है
सच में, यह इतना मुश्किल नहीं है
इस बारे में लेख deepwalker.xyz blog पर है