AI के खिलाफ प्रतिरोध बढ़ रहा है
(stephvee.ca)- इंटरनेट AI द्वारा बनाए गए निम्न-गुणवत्ता वाले कंटेंट (slop) से भरता जा रहा है, और इसके बीच लोग AI का सक्रिय रूप से प्रतिरोध करने के लिए तरह-तरह की पहलें कर रहे हैं
- Reddit कम्युनिटी r/PoisonFountain, AI crawler को हर दिन 1TB poisoned data उपलब्ध कराने के लक्ष्य के साथ 2026 के अंत तक सक्रिय है
- AI video summarizer को भ्रमित करने की तकनीकों से लेकर social media पर जानबूझकर गलत डेटा डालने तक, प्रतिरोध के कई रूप सामने आ रहे हैं
- AI crawler द्वारा robots.txt को नज़रअंदाज़ करना और छोटे वेबसाइटों पर DDoS-स्तर का लोड पैदा करना, इस प्रतिरोध की पृष्ठभूमि है
- अगर यह भावना शांतिपूर्ण और कानूनी प्रतिरोध में बदलती है, तो उम्मीद है कि Silicon Valley का डेटा इकट्ठा करने का तरीका बदल सकता है
AI crawler के खिलाफ data poisoning community
- Reddit कम्युनिटी r/PoisonFountain उन लोगों द्वारा बनाई गई कम्युनिटी है जो खुद को AI industry insider बताते हैं, और ज़्यादा से ज़्यादा लोगों को web crawler के लिए बड़ी मात्रा में garbage data (poison) उपलब्ध कराने के लिए प्रोत्साहित करती है
- लक्ष्य है 2026 के अंत तक crawler को हर दिन 1TB poisoned data देना
- यह poisoned data मुख्य रूप से rnsaffn.com पर होस्ट किया गया है, और ऐसे garbage links के बीच रखा गया है जो AI crawler को आकर्षित कर सकते हैं
- ऊपर से देखने पर यह सामान्य code जैसा लगता है, लेकिन वास्तव में इसमें सूक्ष्म त्रुटियाँ शामिल होती हैं, जो unusable code बनाती हैं
- इन त्रुटियों को फ़िल्टर करना संभव है, लेकिन बड़े पैमाने पर इसकी लागत बहुत अधिक है
- AI कंपनियाँ इंसानों द्वारा बनाए गए नए डेटा के बिना अपने model को बेहतर नहीं कर सकतीं, इसलिए data theft का समय और लागत बढ़ाना इस रणनीति का मूल है
- Miasma एक ऐसा टूल है जो इस poisoned data का उपयोग करके malicious bot को बड़ी मात्रा में garbage देता है; इसके डेवलपर ने इसे "slop machine के लिए endless slop buffet" कहा
AI crawler की समस्याग्रस्त हरकतें
- AI crawler भेजने वाली टीमें छोटे वेबसाइटों पर नियमित रूप से DDoS-स्तर का लोड पैदा कर रही हैं, जिससे सभी की hosting cost बढ़ रही है
- वे robots.txt का पालन नहीं करते, और कई बार crawler को residential proxy के पीछे छिपाया जाता है
- अगर training data को नैतिक तरीके से जुटाया नहीं जा सकता, तो किसी भी website operator के पास data theft को आसान बनाने का कोई कारण नहीं है
AI video summarizer को poison करने की कोशिश
- r/PoisonFountain के ज़रिए चर्चित हुए एक वीडियो में, @f4mi नाम के creator ने YouTube subtitle loophole का उपयोग करके AI video summarizer को poison करने की तकनीक दिखाई
- अब YouTube ने उस subtitle loophole को ठीक कर दिया है, इसलिए यह तकनीक अब काम नहीं करती
- यह अस्थायी था, लेकिन AI system को बाधित करने में सफल रहा, और दिखाता है कि लोग सक्रिय रूप से प्रतिरोध की कोशिश कर रहे हैं
social media पर जानबूझकर AI sabotage
- Reddit जैसी social media platform पर जानबूझकर गलत जानकारी लिखकर AI training data को poison करने की घटनाएँ बढ़ रही हैं
- उदाहरण के तौर पर, "Everybody Loves Raymond" में Idris Elba ने Raymond की माँ की भूमिका निभाई जैसी स्पष्ट रूप से झूठी जानकारी पोस्ट की जाती है
- इंसान संदर्भ के आधार पर तुरंत समझ सकता है कि यह झूठ है, लेकिन automated web scraper इसे high-quality human-generated data समझ सकता है
- अगर यह data OpenAI जैसी कंपनियों तक पहुँचता है, तो training dataset से इसे हटाने में अतिरिक्त resources लगते हैं
- इसे औद्योगिक क्रांति के दौर में कपड़ा मज़दूरों द्वारा power loom तोड़ने की आधुनिक रूपांतरण के रूप में देखा जा सकता है; अगर पर्याप्त लोग bot के लिए झूठी जानकारी से public space को contaminate करें, तो AI कंपनियों पर training data collection के तरीकों पर फिर से विचार करने का दबाव पड़ सकता है
AI के प्रति व्यापक नाराज़गी
- लोगों में AI के दुनिया पर पड़ने वाले असर को लेकर नकारात्मक भावना है, खासकर online community, environment, प्राथमिक स्कूल और विश्वविद्यालय, mental health risk group, और livelihood पर उसके प्रभाव को लेकर
- कुछ लोग AI slop का उपभोग और निर्माण करते हैं, लेकिन offline और online दोनों जगह इस तकनीक से नफ़रत और इसे ठुकराने वाले लोग कहीं अधिक हैं
- नफ़रत शायद ही कभी अच्छे नतीजे लाती है; AI delivery robot को लात मारना या पलट देना, या Sam Altman के घर पर Molotov cocktail फेंकने जैसी हिंसक हरकतों का लेखक विरोध करता है
- लेकिन अगर AI के प्रति यह भावना शांतिपूर्ण और कानूनी प्रतिरोध में बदलती है, तो Silicon Valley के काम करने के तरीके को वास्तव में बदलने की संभावना है
परवर्ती टिप्पणी: Hacker News पर वायरल होने के बाद मूल लेख में संशोधन
- यह लेख बड़े news hub (Hacker News) के front page पर पहुँच गया, जिससे अप्रत्याशित रूप से बहुत बड़ा ट्रैफ़िक आया
- कुछ गिने-चुने IP पते से उस पेज पर हज़ारों request भेजकर दुर्भावनापूर्ण server overload attack किया गया
- अगर यह सस्ती shared hosting पर होता, तो साइट पूरी तरह डाउन हो सकती थी; जवाब में उस URL के ट्रैफ़िक को अस्थायी रूप से ब्लॉक किया गया
- AI expert न होने के बावजूद, कुछ commenters ने expert-level accuracy की माँग करते हुए ज़रूरत से ज़्यादा आलोचना की
- एक comment में "library जलाने वाले समूह से बेहतर नहीं" जैसी अभिव्यक्ति इस्तेमाल की गई, जो library और knowledge sharing पसंद करने वाले blogger के लिए खास तौर पर निराशाजनक प्रतिक्रिया थी
- लेखक का कहना है कि मूल उद्देश्य अपने छोटे ब्लॉग follower के लिए anti-AI रुझानों के लिंक साझा करना था, और अगर पता होता कि इतने बड़े platform पर नकारात्मक ध्यान आकर्षित होगा, तो इसे पोस्ट नहीं किया जाता
- इसके बाद लेखक ने AI पर निजी राय वाली पोस्ट कम करने का फैसला किया, और ब्लॉग चलाने के अपने मूल उद्देश्य small web में आनंद पर ध्यान केंद्रित करने की बात कही
- यह दिखाने वाला एक उदाहरण है कि small web में स्वतंत्र राय-प्रकाशन वायरल फैलाव के कारण कैसे सिमट सकता है
5 टिप्पणियां
Hacker News की राय
मुझे अच्छा लगा कि इस व्यक्ति ने एक community ढूंढ ली, लेकिन ऐसा भी लगता है कि वह anti-AI भावना से कुछ ज़्यादा ही अभिभूत है। मेरा मानना है कि अगले 30 साल तक भी AI से नफरत करने और उसे रोकने की कोशिश करने वाले समूह मौजूद रहेंगे। smartphone, Internet और TV के साथ भी हमेशा ऐसे विरोधी रहे हैं। दूसरी तरफ, अगर model poisoning सच में स्थिर रूप से संभव हो जाए, तो वह काफ़ी दिलचस्प computer science समस्या होगी। मैं anti-AI activists के साथ नहीं हूँ, लेकिन attack techniques में मेरी काफ़ी रुचि है। इसलिए अगर वे इस तरह का research जारी रखते हैं, तो जो लोग उनके उद्देश्य से सहमत नहीं हैं वे भी उस चर्चा को गंभीरता से पढ़ेंगे
मुझे दुख होता है कि poisoning की कोशिशें इतनी गलत दिशा में energy लगाती हुई दिखती हैं। training के लिए इस्तेमाल होने लायक unpoisoned data पहले से ही बहुत है, और नया content भी real-world automated collection या Africa के बड़े workhouses में quality-controlled labor के ज़रिए लगातार बन रहा है। इसलिए पुराना Internet गंदा करना संभव हो सकता है, लेकिन time's arrow को उलटना नहीं। इसके अलावा अब API और public announce federation पर केंद्रित एक नया Internet भी बढ़ रहा है, इसलिए इस तरह की पारंपरिक poisoning की अहमियत धीरे-धीरे कम होती लगेगी
मुझे वह समय याद है जब पुरानी hacker culture का मुख्य एजेंडा DRM, DMCA, patent troll और PGP export control जैसी उन बाधाओं को हटाना था जो information का उपयोग मुश्किल बनाती थीं। “Information wants to be free” जैसे नारे वाले दौर की तुलना में आज यह बहुत बड़ा बदलाव लगता है कि अगर companies ethical तरीके से training data नहीं ला पा रहीं, तो website operators पर उसे चोरी करना आसान बनाने की कोई ज़िम्मेदारी नहीं है। 25 साल पहले इस बदलाव की भविष्यवाणी करना मुश्किल होता
मुझे लगता है कि AI resistance बढ़ाने का सबसे आसान तरीका है Dario Amodei और Sam Altman को TV पर भेज देना और बस उन्हें बोलने देना
मैं AI को एक corporate tool के रूप में देखता हूँ जिसका मकसद employees से और ज़्यादा काम निकलवाना है। साथ ही यह employees को यह भ्रम देने वाली चीज़ भी लगती है कि वे जैसे कोई turbo-charged dev बन गए हों। आज की tech industry मुझे मानवता को गंभीरता से बेहतर बनाने की कोशिश से ज़्यादा, पैसे से भरे एक circus जैसी लगती है
मुझे यह poisoning movement slacktivism के ज़्यादा करीब लगती है। मैं उस विश्लेषण को कुछ हद तक समझता हूँ जिसमें कहा जाता है कि working class का काम compute से replace किया जा रहा है, और compute शुद्ध capital है, इसलिए अंततः capitalist class working class का गला घोंट रही है। और मुझे लगता है कि capitalists सच में यही दिशा चाहते भी हो सकते हैं। लेकिन अगर ऐसा है, तो model को थोड़ा-बहुत poison करना अभी जो हो रहा है उसका सीधा सामना करने के लिए बहुत ही अपर्याप्त है
मुझे यह trend Reddit पर खास तौर से ज़्यादा दिखता है। कुछ communities इतनी pro-AI हैं कि वे AI summary comments जोड़ती हैं और AI-written posts को encourage करती हैं, जबकि दूसरी subreddits cautious या खुलकर anti-AI दिशा में जा रही हैं। photo communities इस समस्या से जूझ रही हैं कि उनके काम पर AI होने का शक किया जाता है, और programmer communities आम तौर पर इसे पसंद भी करती हैं और साथ ही skeptical भी रहती हैं। कुल मिलाकर, पारंपरिक subreddits भी अब AI spectrum पर कहीं-न-कहीं अपनी जगह लेने लगी हैं। उदाहरण के तौर पर https://www.reddit.com/r/vibecoding/, https://www.reddit.com/r/isthisAI/, https://www.reddit.com/r/aiwars/, https://www.reddit.com/r/antiai/, https://www.reddit.com/r/photography/comments/1q4iv0k/what_do_you_say_to_people_who_think_every_photo/, https://www.reddit.com/r/webdev/comments/1s6mtt7/ai_has_sucked_all_the_fun_out_of_programming/ जैसे स्थान याद आते हैं
मैं चाहता हूँ कि कभी हम AI और दुनिया में उसकी भूमिका पर अधिक सूक्ष्म बातचीत कर सकें। अभी तो माहौल लगभग सिर्फ दो ध्रुवों का लगता है। एक तरफ AI को दुनिया से पूरी तरह हटाने की बात है, और दूसरी तरफ सब कुछ उसके हवाले कर देने की। मैं इनके बीच कहीं responsible use, social guardrails और energy consumption जैसी व्यावहारिक बातों पर चर्चा करना चाहूँगा
मुझे लगता है कि original blog का गुस्सा भी कुछ ज़्यादा है, लेकिन यह सच्चे मन से मान लेना कि ऐसी poisoning कोशिशें model training पर ज़रा भी बुरा असर नहीं डाल सकतीं, तकनीकी समझ की कमी जैसा लगता है और इससे थोड़ा खिन्नता होती है
मेरे मन में “Resistance is futile” वाला मज़ाक आता है, लेकिन साथ ही मुझे इस दावे से काफ़ी सहमति भी है कि AI वास्तव में communities को नुकसान पहुँचा रहा है। उदाहरण के लिए YouTube ने reports handle करना भी AI पर डाल दिया है, जिससे malicious actors किसी और के original video पर अपना दावा ठोककर demonetize के ज़रिए उसकी कमाई छीन सकते हैं। Davie504 जैसे बड़े YouTuber के साथ भी ऐसा हुआ, और appeal की प्रक्रिया भी फिर robot ही संभालता है, जो बहुत निराशाजनक है
AI जिस data पर training करता है उसे दूषित करने के अलावा, क्या प्रतिरोध के और तरीके नहीं हो सकते?
जैसे कि AI द्वारा बनाए गए content का उपभोग ही न किया जाए...
मैंने भी इसे पढ़ते हुए सोचा कि कहीं यह अनजाने में इंसानों के लिए भी poisoning तो नहीं बन रहा है।
पता नहीं समस्या कहाँ हुई, लेकिन 'kkim', 'bom', 'doem', 'jim' के बाद मेल न खाने वाला 'eum' जुड़ रहा है। क्या यह भी कहीं poisoning तो नहीं है ;)
शायद मॉडल में थोड़ा बदलाव हुआ है, इसलिए वही prompt गलत तरीके से काम कर रहा है। मैंने यह हिस्सा ठीक कर दिया है।