• इंटरनेट AI द्वारा बनाए गए निम्न-गुणवत्ता वाले कंटेंट (slop) से भरता जा रहा है, और इसके बीच लोग AI का सक्रिय रूप से प्रतिरोध करने के लिए तरह-तरह की पहलें कर रहे हैं
  • Reddit कम्युनिटी r/PoisonFountain, AI crawler को हर दिन 1TB poisoned data उपलब्ध कराने के लक्ष्य के साथ 2026 के अंत तक सक्रिय है
  • AI video summarizer को भ्रमित करने की तकनीकों से लेकर social media पर जानबूझकर गलत डेटा डालने तक, प्रतिरोध के कई रूप सामने आ रहे हैं
  • AI crawler द्वारा robots.txt को नज़रअंदाज़ करना और छोटे वेबसाइटों पर DDoS-स्तर का लोड पैदा करना, इस प्रतिरोध की पृष्ठभूमि है
  • अगर यह भावना शांतिपूर्ण और कानूनी प्रतिरोध में बदलती है, तो उम्मीद है कि Silicon Valley का डेटा इकट्ठा करने का तरीका बदल सकता है

AI crawler के खिलाफ data poisoning community

  • Reddit कम्युनिटी r/PoisonFountain उन लोगों द्वारा बनाई गई कम्युनिटी है जो खुद को AI industry insider बताते हैं, और ज़्यादा से ज़्यादा लोगों को web crawler के लिए बड़ी मात्रा में garbage data (poison) उपलब्ध कराने के लिए प्रोत्साहित करती है
  • लक्ष्य है 2026 के अंत तक crawler को हर दिन 1TB poisoned data देना
  • यह poisoned data मुख्य रूप से rnsaffn.com पर होस्ट किया गया है, और ऐसे garbage links के बीच रखा गया है जो AI crawler को आकर्षित कर सकते हैं
    • ऊपर से देखने पर यह सामान्य code जैसा लगता है, लेकिन वास्तव में इसमें सूक्ष्म त्रुटियाँ शामिल होती हैं, जो unusable code बनाती हैं
    • इन त्रुटियों को फ़िल्टर करना संभव है, लेकिन बड़े पैमाने पर इसकी लागत बहुत अधिक है
  • AI कंपनियाँ इंसानों द्वारा बनाए गए नए डेटा के बिना अपने model को बेहतर नहीं कर सकतीं, इसलिए data theft का समय और लागत बढ़ाना इस रणनीति का मूल है
  • Miasma एक ऐसा टूल है जो इस poisoned data का उपयोग करके malicious bot को बड़ी मात्रा में garbage देता है; इसके डेवलपर ने इसे "slop machine के लिए endless slop buffet" कहा

AI crawler की समस्याग्रस्त हरकतें

AI video summarizer को poison करने की कोशिश

  • r/PoisonFountain के ज़रिए चर्चित हुए एक वीडियो में, @f4mi नाम के creator ने YouTube subtitle loophole का उपयोग करके AI video summarizer को poison करने की तकनीक दिखाई
  • अब YouTube ने उस subtitle loophole को ठीक कर दिया है, इसलिए यह तकनीक अब काम नहीं करती
  • यह अस्थायी था, लेकिन AI system को बाधित करने में सफल रहा, और दिखाता है कि लोग सक्रिय रूप से प्रतिरोध की कोशिश कर रहे हैं

social media पर जानबूझकर AI sabotage

  • Reddit जैसी social media platform पर जानबूझकर गलत जानकारी लिखकर AI training data को poison करने की घटनाएँ बढ़ रही हैं
  • उदाहरण के तौर पर, "Everybody Loves Raymond" में Idris Elba ने Raymond की माँ की भूमिका निभाई जैसी स्पष्ट रूप से झूठी जानकारी पोस्ट की जाती है
    • इंसान संदर्भ के आधार पर तुरंत समझ सकता है कि यह झूठ है, लेकिन automated web scraper इसे high-quality human-generated data समझ सकता है
    • अगर यह data OpenAI जैसी कंपनियों तक पहुँचता है, तो training dataset से इसे हटाने में अतिरिक्त resources लगते हैं
  • इसे औद्योगिक क्रांति के दौर में कपड़ा मज़दूरों द्वारा power loom तोड़ने की आधुनिक रूपांतरण के रूप में देखा जा सकता है; अगर पर्याप्त लोग bot के लिए झूठी जानकारी से public space को contaminate करें, तो AI कंपनियों पर training data collection के तरीकों पर फिर से विचार करने का दबाव पड़ सकता है

AI के प्रति व्यापक नाराज़गी

  • लोगों में AI के दुनिया पर पड़ने वाले असर को लेकर नकारात्मक भावना है, खासकर online community, environment, प्राथमिक स्कूल और विश्वविद्यालय, mental health risk group, और livelihood पर उसके प्रभाव को लेकर
  • कुछ लोग AI slop का उपभोग और निर्माण करते हैं, लेकिन offline और online दोनों जगह इस तकनीक से नफ़रत और इसे ठुकराने वाले लोग कहीं अधिक हैं
  • नफ़रत शायद ही कभी अच्छे नतीजे लाती है; AI delivery robot को लात मारना या पलट देना, या Sam Altman के घर पर Molotov cocktail फेंकने जैसी हिंसक हरकतों का लेखक विरोध करता है
  • लेकिन अगर AI के प्रति यह भावना शांतिपूर्ण और कानूनी प्रतिरोध में बदलती है, तो Silicon Valley के काम करने के तरीके को वास्तव में बदलने की संभावना है

परवर्ती टिप्पणी: Hacker News पर वायरल होने के बाद मूल लेख में संशोधन

  • यह लेख बड़े news hub (Hacker News) के front page पर पहुँच गया, जिससे अप्रत्याशित रूप से बहुत बड़ा ट्रैफ़िक आया
  • कुछ गिने-चुने IP पते से उस पेज पर हज़ारों request भेजकर दुर्भावनापूर्ण server overload attack किया गया
    • अगर यह सस्ती shared hosting पर होता, तो साइट पूरी तरह डाउन हो सकती थी; जवाब में उस URL के ट्रैफ़िक को अस्थायी रूप से ब्लॉक किया गया
  • AI expert न होने के बावजूद, कुछ commenters ने expert-level accuracy की माँग करते हुए ज़रूरत से ज़्यादा आलोचना की
    • एक comment में "library जलाने वाले समूह से बेहतर नहीं" जैसी अभिव्यक्ति इस्तेमाल की गई, जो library और knowledge sharing पसंद करने वाले blogger के लिए खास तौर पर निराशाजनक प्रतिक्रिया थी
  • लेखक का कहना है कि मूल उद्देश्य अपने छोटे ब्लॉग follower के लिए anti-AI रुझानों के लिंक साझा करना था, और अगर पता होता कि इतने बड़े platform पर नकारात्मक ध्यान आकर्षित होगा, तो इसे पोस्ट नहीं किया जाता
  • इसके बाद लेखक ने AI पर निजी राय वाली पोस्ट कम करने का फैसला किया, और ब्लॉग चलाने के अपने मूल उद्देश्य small web में आनंद पर ध्यान केंद्रित करने की बात कही
  • यह दिखाने वाला एक उदाहरण है कि small web में स्वतंत्र राय-प्रकाशन वायरल फैलाव के कारण कैसे सिमट सकता है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.