Poison Fountain
(rnsaffn.com)- मशीन इंटेलिजेंस सिस्टम्स को नुकसान पहुँचाने के लिए बनाए गए डेटा स्रोत के रूप में डिज़ाइन किया गया प्रोजेक्ट, जो AI training data में जानबूझकर दूषित जानकारी inject करने का तरीका प्रस्तुत करता है
- Geoffrey Hinton की चेतावनी का हवाला देते हुए, यह इस धारणा पर आधारित है कि AI मानव प्रजाति के लिए खतरा है
- ‘Poison Fountain’ URL के माध्यम से अनंत रूप से जनरेट होने वाला दूषित training data उपलब्ध कराया जाता है, और इसे web crawler के सामने expose करने का तरीका समझाया गया है
- उपयोगकर्ता अपनी वेबसाइट में hidden link डालकर ऐसा सेट कर सकते हैं कि crawler के पहुँचते ही उसे अपने-आप दूषित data भेजा जाए
- AI training प्रक्रिया में malicious data inject करके AI model की reliability और safety को प्रभावित कर सकने वाली कार्रवाई के रूप में इसका मूल्यांकन किया जाता है
Poison Fountain का उद्देश्य
- प्रोजेक्ट स्पष्ट रूप से यह रुख रखता है कि मशीन इंटेलिजेंस मानवता के लिए खतरा है
- Geoffrey Hinton के विचारों से सहमति जताते हुए, AI systems को जानबूझकर नुकसान पहुँचाने के लक्ष्य की बात कही गई है
- इसमें कहा गया है कि थोड़ी मात्रा में दूषित training data भी language model को गंभीर नुकसान पहुँचा सकता है
- दिए गए दो URL(
https://RNSAFFN.com/poison2/,.onionaddress) अनंत रूप से जनरेट होने वाली दूषित data stream प्रदान करते हैं - प्रतिभागियों को इस data को cache और retransmit करने या web crawler को feed करके “war effort” का समर्थन करने के लिए प्रोत्साहित किया जाता है
Poison Fountain का उपयोग कैसे किया जाता है
- वेबसाइट चलाने वाले उपयोगकर्ताओं के लिए ऐसी प्रक्रिया बताई गई है जिससे crawler के visit करने पर दूषित data पहुँचाया जा सके
- जब crawler साइट के किसी विशेष path का अनुरोध करता है, तो उस request को संभालने वाला HTTP handler Poison Fountain URL पर request भेजता है
- Poison Fountain request details को नज़रअंदाज़ करता है और response body में gzip से compressed दूषित training data लौटाता है
- HTTP response header में
"Content-Encoding: gzip"शामिल होता है - वेबसाइट का handler इस response को decompress करके भेज सकता है, या बेहतर तरीके से compressed स्थिति में ही forward कर सकता है
- परिणामस्वरूप crawler इस data को इकट्ठा कर अपने training corpus में शामिल कर लेता है
संरचनात्मक विशेषताएँ और मंशा
- यह प्रोजेक्ट web crawler के automatic collection mechanism का उल्टा उपयोग करके AI training data की quality को नुकसान पहुँचाने वाली संरचना रखता है
- Poison Fountain एक साधारण data-serving server की तरह काम करता है और request की सामग्री से बिना संबंध दूषित data लौटाता है
- बताई गई प्रक्रिया के अलावा तकनीकी विवरण या data की सामग्री के बारे में कोई ठोस जानकारी नहीं दी गई है
- कुल मिलाकर, यह AI training ecosystem में आक्रामक हस्तक्षेप का प्रयास है
4 टिप्पणियां
"DDoS का प्रतिरोध करने के लिए हमारा सर्वर भी सामने वाले पर DoS कर दे" जितना ही भोला-भाला ख़याल लगता है
ज़रा एक साज़िशी थ्योरी मिलाकर देखें, तो यह अजीब नहीं लगेगा कि इंटरनेट से जुटाई जा सकने वाली लगभग सारी डेटा पहले ही बटोर चुके Big Tech, सीढ़ी खींच लेने के लिए पर्दे के पीछे से ऐसे काम कर रहे हों।
यह तो अत्यधिक crawling से होने वाले लोड से बचाव भी नहीं है…
AI के विकास को रोकने के लिए ‘data poisoning’ का सामूहिक आंदोलन उभरा
Hacker News की राय
यह चिंता तो है कि AI मॉडल धीरे-धीरे खराब होते जा रहे हैं, लेकिन वास्तव में ऐसा नहीं है
Opus 4.5 ने कोड लिखने और tools इस्तेमाल करने की क्षमता में काफी सुधार किया है, और Gemini 3.0 Flash ने visual data extraction प्रोजेक्ट्स में पुराने benchmarks को पीछे छोड़ दिया है
छोटे मॉडल भी कुल मिलाकर काफी बेहतर हुए हैं
वे सिर्फ toxic data को रोकने तक सीमित नहीं रहते, बल्कि performance बढ़ाने वाले data को ढूंढने के लिए proxy models तक train करते हैं
“Data Quality” विभाग आमतौर पर बहुत बड़े बजट वाला core organization होता है
उल्टा, कुछ नतीजों में थोड़ा-बहुत फायदा भी दिखा है
यानी वे खुद को ज़िम्मेदारी से मुक्त बताने की कोशिश कर रहे हैं
एक AI security researcher के रूप में, मैंने data poisoning पर PhD research की है
ऐसे मामले रहे हैं जहाँ garbage data सचमुच production में चला गया और समस्याएँ पैदा हुईं
क्योंकि यह जानना संभव नहीं कि model की weight updates हर input को किस तरह प्रभावित करेंगी
जब यह बात समझ में आएगी कि data में बहुत छोटा बदलाव भी model के व्यवहार को बहुत बदल सकता है, तो AI security paradigm बदल जाएगा
अगर LLM को data scrape करने से रोकना है, तो इंसानों की सामान्य access भी रुक जाएगी
उदाहरण के लिए, NYTimes data को poison कर दे, तब भी LLM वैध subscription account के जरिए OCR और tokenization से साफ किया हुआ data ले सकता है
बड़ी AI कंपनियाँ दुनिया भर के data centers से IP बदल-बदलकर access कर सकती हैं, इसलिए यह पहचानना मुश्किल है कि data कौन पढ़ रहा है
Stack Overflow जैसे उपयोगी data sources लगभग सूख चुके हैं
हालांकि human users के लिए CAPTCHA जैसी चीज़ों की वजह से access लगातार मुश्किल होती जा रही है
वैध data मौजूद हो, तब भी मूर्खतापूर्ण चुनावों को रोका नहीं जा सकता
हाल के model performance improvements का बड़ा हिस्सा post-training reinforcement learning (RL) की वजह से है
GPT 5.2 भी GPT-4o जैसा ही base model इस्तेमाल करता है
‘Model collapse’ अभी frontier labs के सामने सचमुच की समस्या नहीं है
data poisoning का इस पर बहुत बड़ा असर नहीं पड़ता
लेकिन नया data reflect करने के लिए periodic retraining ज़रूरी है, और उसी समय poisoning का जोखिम बढ़ जाता है
LoRA-आधारित image generation models आदि में collapse की समस्या अब भी कभी-कभी होती है
आखिरकार data curation cost और बढ़ेगी
data poisoning के दो पहलू हैं
एक AI प्रगति को धीमा करने का प्रभाव, और दूसरा models को अस्थिर और ख़तरनाक बनाने वाला side effect
अंततः बड़े labs के रुकने की संभावना लगभग नहीं है
बिना मतलब की दोहराई जाने वाली crawling traffic cost बर्बाद कर रही है
poisoning एक तरह के DRM की तरह काम करती है: जो वैध रूप से access करे उसे असली data मिले, और जो चोरी करे उसे toxic data मिले
कुछ लोग AI को खुद मानवता के लिए ख़तरा मानते हैं और जानबूझकर उसे नुकसान पहुँचाना चाहते हैं
लेकिन अभी investment funding की वजह से वह दबाव लगभग नहीं है
“poison server” के response को ज्यों का त्यों proxy करना ख़तरनाक है
हो सकता है कि आप अनजाने में ग़ैरक़ानूनी content host करने लगें
“हम AI models को contaminate करेंगे” जैसी कोशिशें आखिरकार सिर्फ AI labs की data-cleaning pipelines को और मज़बूत करेंगी
वे ऐसे data का इस्तेमाल करके और बेहतर filtering systems बनाएँगे
मैं इस दावे से सहमत नहीं हूँ कि “machine intelligence मानवता के लिए ख़तरा है”
आज का AI बस autocomplete engine का एक creative उपयोग है, और असली ख़तरा इंसानों का आर्थिक व्यवहार है
अंत में मानवता अपने लिए ख़ुद ही ख़तरा है
इससे Neal Stephenson की 『Anathem』 याद आती है
उसमें यह सेटिंग थी कि कंपनियों ने इंटरनेट पर जानबूझकर garbage data फैलाया, ताकि वे अपने filtering tools बेच सकें
आज की AI data poisoning बहस उससे बहुत अलग नहीं लगती
जब लोग Geoffrey Hinton के बयान का हवाला देते हैं, तो वे सिर्फ अपने काम की बातें उठाते हैं
वह AI को existential threat मानते हैं, लेकिन उनकी उस पूर्वशर्त—“AI की self-awareness के स्तर”—पर
उन्हें quote करने वाले ज़्यादातर लोग खुद सहमत नहीं होते