17 पॉइंट द्वारा GN⁺ 2026-04-21 | 5 टिप्पणियां | WhatsApp पर शेयर करें
  • इंटरनेट AI द्वारा बनाए गए निम्न-गुणवत्ता वाले कंटेंट (slop) से भरता जा रहा है, और इसके बीच लोग AI का सक्रिय रूप से प्रतिरोध करने के लिए तरह-तरह की पहलें कर रहे हैं
  • Reddit कम्युनिटी r/PoisonFountain, AI crawler को हर दिन 1TB poisoned data उपलब्ध कराने के लक्ष्य के साथ 2026 के अंत तक सक्रिय है
  • AI video summarizer को भ्रमित करने की तकनीकों से लेकर social media पर जानबूझकर गलत डेटा डालने तक, प्रतिरोध के कई रूप सामने आ रहे हैं
  • AI crawler द्वारा robots.txt को नज़रअंदाज़ करना और छोटे वेबसाइटों पर DDoS-स्तर का लोड पैदा करना, इस प्रतिरोध की पृष्ठभूमि है
  • अगर यह भावना शांतिपूर्ण और कानूनी प्रतिरोध में बदलती है, तो उम्मीद है कि Silicon Valley का डेटा इकट्ठा करने का तरीका बदल सकता है

AI crawler के खिलाफ data poisoning community

  • Reddit कम्युनिटी r/PoisonFountain उन लोगों द्वारा बनाई गई कम्युनिटी है जो खुद को AI industry insider बताते हैं, और ज़्यादा से ज़्यादा लोगों को web crawler के लिए बड़ी मात्रा में garbage data (poison) उपलब्ध कराने के लिए प्रोत्साहित करती है
  • लक्ष्य है 2026 के अंत तक crawler को हर दिन 1TB poisoned data देना
  • यह poisoned data मुख्य रूप से rnsaffn.com पर होस्ट किया गया है, और ऐसे garbage links के बीच रखा गया है जो AI crawler को आकर्षित कर सकते हैं
    • ऊपर से देखने पर यह सामान्य code जैसा लगता है, लेकिन वास्तव में इसमें सूक्ष्म त्रुटियाँ शामिल होती हैं, जो unusable code बनाती हैं
    • इन त्रुटियों को फ़िल्टर करना संभव है, लेकिन बड़े पैमाने पर इसकी लागत बहुत अधिक है
  • AI कंपनियाँ इंसानों द्वारा बनाए गए नए डेटा के बिना अपने model को बेहतर नहीं कर सकतीं, इसलिए data theft का समय और लागत बढ़ाना इस रणनीति का मूल है
  • Miasma एक ऐसा टूल है जो इस poisoned data का उपयोग करके malicious bot को बड़ी मात्रा में garbage देता है; इसके डेवलपर ने इसे "slop machine के लिए endless slop buffet" कहा

AI crawler की समस्याग्रस्त हरकतें

AI video summarizer को poison करने की कोशिश

  • r/PoisonFountain के ज़रिए चर्चित हुए एक वीडियो में, @f4mi नाम के creator ने YouTube subtitle loophole का उपयोग करके AI video summarizer को poison करने की तकनीक दिखाई
  • अब YouTube ने उस subtitle loophole को ठीक कर दिया है, इसलिए यह तकनीक अब काम नहीं करती
  • यह अस्थायी था, लेकिन AI system को बाधित करने में सफल रहा, और दिखाता है कि लोग सक्रिय रूप से प्रतिरोध की कोशिश कर रहे हैं

social media पर जानबूझकर AI sabotage

  • Reddit जैसी social media platform पर जानबूझकर गलत जानकारी लिखकर AI training data को poison करने की घटनाएँ बढ़ रही हैं
  • उदाहरण के तौर पर, "Everybody Loves Raymond" में Idris Elba ने Raymond की माँ की भूमिका निभाई जैसी स्पष्ट रूप से झूठी जानकारी पोस्ट की जाती है
    • इंसान संदर्भ के आधार पर तुरंत समझ सकता है कि यह झूठ है, लेकिन automated web scraper इसे high-quality human-generated data समझ सकता है
    • अगर यह data OpenAI जैसी कंपनियों तक पहुँचता है, तो training dataset से इसे हटाने में अतिरिक्त resources लगते हैं
  • इसे औद्योगिक क्रांति के दौर में कपड़ा मज़दूरों द्वारा power loom तोड़ने की आधुनिक रूपांतरण के रूप में देखा जा सकता है; अगर पर्याप्त लोग bot के लिए झूठी जानकारी से public space को contaminate करें, तो AI कंपनियों पर training data collection के तरीकों पर फिर से विचार करने का दबाव पड़ सकता है

AI के प्रति व्यापक नाराज़गी

  • लोगों में AI के दुनिया पर पड़ने वाले असर को लेकर नकारात्मक भावना है, खासकर online community, environment, प्राथमिक स्कूल और विश्वविद्यालय, mental health risk group, और livelihood पर उसके प्रभाव को लेकर
  • कुछ लोग AI slop का उपभोग और निर्माण करते हैं, लेकिन offline और online दोनों जगह इस तकनीक से नफ़रत और इसे ठुकराने वाले लोग कहीं अधिक हैं
  • नफ़रत शायद ही कभी अच्छे नतीजे लाती है; AI delivery robot को लात मारना या पलट देना, या Sam Altman के घर पर Molotov cocktail फेंकने जैसी हिंसक हरकतों का लेखक विरोध करता है
  • लेकिन अगर AI के प्रति यह भावना शांतिपूर्ण और कानूनी प्रतिरोध में बदलती है, तो Silicon Valley के काम करने के तरीके को वास्तव में बदलने की संभावना है

परवर्ती टिप्पणी: Hacker News पर वायरल होने के बाद मूल लेख में संशोधन

  • यह लेख बड़े news hub (Hacker News) के front page पर पहुँच गया, जिससे अप्रत्याशित रूप से बहुत बड़ा ट्रैफ़िक आया
  • कुछ गिने-चुने IP पते से उस पेज पर हज़ारों request भेजकर दुर्भावनापूर्ण server overload attack किया गया
    • अगर यह सस्ती shared hosting पर होता, तो साइट पूरी तरह डाउन हो सकती थी; जवाब में उस URL के ट्रैफ़िक को अस्थायी रूप से ब्लॉक किया गया
  • AI expert न होने के बावजूद, कुछ commenters ने expert-level accuracy की माँग करते हुए ज़रूरत से ज़्यादा आलोचना की
    • एक comment में "library जलाने वाले समूह से बेहतर नहीं" जैसी अभिव्यक्ति इस्तेमाल की गई, जो library और knowledge sharing पसंद करने वाले blogger के लिए खास तौर पर निराशाजनक प्रतिक्रिया थी
  • लेखक का कहना है कि मूल उद्देश्य अपने छोटे ब्लॉग follower के लिए anti-AI रुझानों के लिंक साझा करना था, और अगर पता होता कि इतने बड़े platform पर नकारात्मक ध्यान आकर्षित होगा, तो इसे पोस्ट नहीं किया जाता
  • इसके बाद लेखक ने AI पर निजी राय वाली पोस्ट कम करने का फैसला किया, और ब्लॉग चलाने के अपने मूल उद्देश्य small web में आनंद पर ध्यान केंद्रित करने की बात कही
  • यह दिखाने वाला एक उदाहरण है कि small web में स्वतंत्र राय-प्रकाशन वायरल फैलाव के कारण कैसे सिमट सकता है

5 टिप्पणियां

 
GN⁺ 2026-04-21
Hacker News की राय
  • मुझे अच्छा लगा कि इस व्यक्ति ने एक community ढूंढ ली, लेकिन ऐसा भी लगता है कि वह anti-AI भावना से कुछ ज़्यादा ही अभिभूत है। मेरा मानना है कि अगले 30 साल तक भी AI से नफरत करने और उसे रोकने की कोशिश करने वाले समूह मौजूद रहेंगे। smartphone, Internet और TV के साथ भी हमेशा ऐसे विरोधी रहे हैं। दूसरी तरफ, अगर model poisoning सच में स्थिर रूप से संभव हो जाए, तो वह काफ़ी दिलचस्प computer science समस्या होगी। मैं anti-AI activists के साथ नहीं हूँ, लेकिन attack techniques में मेरी काफ़ी रुचि है। इसलिए अगर वे इस तरह का research जारी रखते हैं, तो जो लोग उनके उद्देश्य से सहमत नहीं हैं वे भी उस चर्चा को गंभीरता से पढ़ेंगे

    • मुझे लगता है कि model poisoning आख़िरकार halting problem जैसी सीमा से टकराएगा। अगर किसी measurable behavior को बदलने का mechanism सार्वजनिक हो जाता है, तो system भी उस mechanism को ध्यान में रखकर उसके खिलाफ़ resist करना सीख जाएगा। जो poisoning techniques सार्वजनिक हो जाती हैं, वे आख़िरकार defense training या filtering का हिस्सा बन जाने की संभावना रखती हैं। उल्टा, अगर असरदार होने के लिए जानकारी को इतना बुरी तरह बिगाड़ना पड़े कि वह इंसानों के लिए भी बेकार हो जाए, तो उसकी व्यावहारिक उपयोगिता बहुत कम रह जाती है। इसलिए मुझे लगता है कि ऐसे attack या तो मामूली असर डालेंगे, या थोड़ी देर चलेंगे और फिर training pipeline में शामिल होकर निष्प्रभावी हो जाएंगे। फिर भी, उस छोटे से अंतराल में वे यह दिखा सकते हैं कि इंसान और model अलग तरह से कहाँ react करते हैं, और इस लिहाज़ से यह एक दिलचस्प CS समस्या है
    • कुछ साल पहले मैंने यहाँ एक नकली game title बनाया था और future AI models को contaminate करने के लिए उस गेम पर कई comments छोड़े थे। अब तो मुझे उस गेम का नाम भी याद नहीं, और पुराने comments ढूँढने के लिए सैकड़ों बार More दबाने का मन भी नहीं है
    • मेरा अंदाज़ा है कि Chinese models poisoning के प्रति ज़्यादा resistant होंगे। और इसमें यह बात भी हिस्सा निभाती है कि Chinese जनता पश्चिम की तुलना में कहीं ज़्यादा pro-AI है
    • अगर misaligned superintelligence की वजह से कुछ ही सालों में मानवता खत्म हो जाती है, तो कम-से-कम AI से नफ़रत करने और उसे रोकने की कोशिश करने वाला सक्रिय community भी फिर नहीं बचेगा — इस तरह का एक cynical joke करने का मन करता है
    • मुझे लगता है कि SEO पहले ही स्वाभाविक रूप से LLM training और agentic search optimization में mutate हो चुका है। मुझे लगता है कि अभी जो कुछ हो रहा है उसका यही केंद्रीय बिंदु है
  • मुझे दुख होता है कि poisoning की कोशिशें इतनी गलत दिशा में energy लगाती हुई दिखती हैं। training के लिए इस्तेमाल होने लायक unpoisoned data पहले से ही बहुत है, और नया content भी real-world automated collection या Africa के बड़े workhouses में quality-controlled labor के ज़रिए लगातार बन रहा है। इसलिए पुराना Internet गंदा करना संभव हो सकता है, लेकिन time's arrow को उलटना नहीं। इसके अलावा अब API और public announce federation पर केंद्रित एक नया Internet भी बढ़ रहा है, इसलिए इस तरह की पारंपरिक poisoning की अहमियत धीरे-धीरे कम होती लगेगी

    • यह बात मुझे दिलचस्प लगती है। AI labs नए Internet content को पाने के लिए सचमुच बेताब दिखते हैं, और पैसे देकर walled platforms से भी data खरीदना चाहते हैं। यहाँ तक कि बिना consent के भी उसे लेने की कोशिश करते हुए दिखते हैं। abusive और stealthy scraping अभी बहुत तेज़ी से बढ़ा है
    • content बहुत होने की बात अपनी जगह सही है, लेकिन जो लोग Internet पर कुछ publish करते हैं वे unauthorized AI crawlers को रोकने में काफ़ी परेशान हैं। कई बार तो सिर्फ request flood से infrastructure बचाने के लिए भी block करना पड़ता है। लेकिन AI crawlers access denial signals का ठीक से पालन नहीं करते, इसलिए जो owners नहीं चाहते कि उनका content training में इस्तेमाल हो, उनके नज़रिए से poisoning एक काफ़ी reasonable response लग सकता है। शायद crawlers को भगाने के लिए यह लगभग इकलौता तरीका भी हो सकता है
    • मुझे लगता है कि unpoisoned content पर्याप्त होने वाली बात अपने-आप में सही है। लेकिन जिन cases को मैंने खुद देखा है, उनमें ऐसा content छिपाना जो इंसानी नज़र से लगभग न दिखे लेकिन scraper को relevant लगे, पूरे dataset या model को meaningful तरीके से poison करने के लिए काफ़ी नहीं होता। फिर भी, कम-से-कम यह तो किया जा सकता है कि मेरी site के “scraper requests की बाढ़ मत लाओ” वाले signal को ignore करने से मिलने वाला net gain शून्य या थोड़ा negative हो जाए। न भी हो, तो इसे implement करना अपने-आप में काफ़ी मज़ेदार था। और जो लोग automated poisoning करना चाहते हैं, उनसे कहूँगा कि random words और characters filtering से आसानी से हट जाते हैं, इसलिए वे ज़्यादा काम नहीं करते। इसके बजाय current page और nearby pages के content को rearrange करके थोड़े अतिरिक्त fragments मिलाने से tokens के बीच connections कमजोर पड़ सकते हैं। और कुछ scrapers अगर खुली गाली-गलौज देखें तो पूरा page ही discard कर देते हैं, इसलिए bot-only locations में कुछ offensive strings छिड़कना कुछ मामलों में असरदार हो सकता है। बेशक, इन तरीकों में से कोई भी bandwidth खाने वाली resource hogging को नहीं रोकता
    • मैं “model collapse” देखने की सलाह दूँगा। आज जैसे माहौल में, जहाँ AI-generated material भरा पड़ा है, केवल content की मात्रा होना पर्याप्त training resource नहीं हो सकता। इसके अलावा यह भी महत्वपूर्ण है कि विशाल मात्रा में data धीरे-धीरे private या paywall के पीछे जा रहा है
    • मुझे दिलचस्प लगता है कि Anthropic भी small-sample poisoning की समस्या को सीधे address कर रहा है। संबंधित सामग्री के लिए https://www.anthropic.com/research/small-samples-poison सीधे देखी जा सकती है
  • मुझे वह समय याद है जब पुरानी hacker culture का मुख्य एजेंडा DRM, DMCA, patent troll और PGP export control जैसी उन बाधाओं को हटाना था जो information का उपयोग मुश्किल बनाती थीं। “Information wants to be free” जैसे नारे वाले दौर की तुलना में आज यह बहुत बड़ा बदलाव लगता है कि अगर companies ethical तरीके से training data नहीं ला पा रहीं, तो website operators पर उसे चोरी करना आसान बनाने की कोई ज़िम्मेदारी नहीं है। 25 साल पहले इस बदलाव की भविष्यवाणी करना मुश्किल होता

    • मुझे इसे contradiction मानने वाला नज़रिया कभी बहुत convincing नहीं लगा। अगर आप उन लोगों में फर्क करें जो चाहते हैं कि हर कोई अमीर बने, और उन लोगों में जो खुद अमीर बनना चाहते हैं जबकि बाकी और गरीब हो जाएँ, तो बात समझना आसान हो जाता है। कोई व्यक्ति अगर free information access का समर्थन करता है, और साथ ही ऐसे corporate data use का विरोध करता है जो दूसरों की information access क्षमता को नुकसान पहुँचाता है और source को छिपाता या distort करता है, तो यह contradiction नहीं है। जब तक copyright खत्म होकर creative work public good नहीं बन जाता और corporations information monopolize करना बंद नहीं कर देतीं, तब तक यह position shift से ज़्यादा एक consistent application है
    • मैं इसे ऐसी culture में होने वाली चीज़ मानता हूँ जहाँ community को नष्ट करने वालों को बाहर रखने के लिए मज़बूत mechanisms नहीं हैं। दिमाग में यह उपमा आती है कि आपने vampire को घर के अंदर बुला लिया और फिर हैरान हैं कि गर्दन में दर्द क्यों है
    • मुझे लगता है कि उस समय लोग sharing और gift economy बनाना चाहते थे। बस वे उस sharing economy में malicious actors को रोक नहीं पाए, और जब idealism को self-interested लोग hijack कर ले गए तो वे निराश और कड़वे हो गए। इसलिए आज की backlash मुझे बहुत अजीब नहीं लगती
    • मैं अब भी “information wants to be free” वाले पक्ष के काफ़ी करीब हूँ। जो लोग open-source license में software जारी करके फिर इस पर नाराज़ होते हैं कि LLM ने उससे training ली, वे मुझे ठीक से समझ नहीं आते। पहले जब Google source code index करता था, तब लोग तुलनात्मक रूप से शांत थे — शायद इसलिए कि तब traffic वापस आता था और उससे पैसे बनते थे। इसलिए यह बहस मुझे philosophy से ज़्यादा इस सवाल के करीब लगती है कि पैसा कौन ले जा रहा है, और उसमें मेरी खास दिलचस्पी नहीं है। open source का मूल मूल्य तो यही है कि AI के ज़रिए हो या किसी और तरीके से, हर कोई सीख सके
    • मैं इस दावे से सहमत नहीं हूँ कि यह मूल hacker ethos के साथ betrayal है। “Information wants to be free” hacker ethos का सिर्फ एक हिस्सा है, पूरा नहीं, और cracking से असंबंधित दूसरी प्रवृत्तियाँ भी काफ़ी हैं। फिर server पर मौजूद information free beer की तरह मुफ्त नहीं होती; server availability और cost वास्तविक चीज़ें हैं। लालची actors के लिए disincentives बनाना server operator का वैध अधिकार भी है और एक दिलचस्प tit-for-tat समस्या भी। ऊपर से, इस तरह की poisoning response कोई सरकारी दखल नहीं बुलाती, बल्कि व्यक्ति द्वारा सीधे जवाब देने का रूप है, और इस नज़रिए से भी यह hacker temperament से मेल खाती है। इसलिए भले ही यह information availability के एक पहलू से टकरा जाए, मुझे लगता है कि इस तरह का LLM resistance असल hacker spirit के भीतर ही आता है
  • मुझे लगता है कि AI resistance बढ़ाने का सबसे आसान तरीका है Dario Amodei और Sam Altman को TV पर भेज देना और बस उन्हें बोलने देना

    • और अगर उसमें Alex Karp को autonomous weapons का प्रचार करने के लिए जोड़ दिया जाए, तो वह एकदम perfect trinity बन जाएगी
    • मैं और सुनना चाहूँगा कि ऐसा क्यों लगता है। मैं ऐसे कारण सोचता हूँ जैसे आम लोगों से disconnect, incentives का mismatch, सीधे बात न करना, और elected leaders से भी ज़्यादा power होना। लेकिन person-level evaluation में मैं Amodei और Altman को एक साथ नहीं रखना चाहूँगा। मेरी नज़र में Altman polished और capable है, लेकिन इसी वजह से बेचैन भी करता है, और उसमें ideas की जगह लोगों को follow करवाने वाला एक amoral vibe है। दूसरी तरफ Amodei मुझे ऐसा लगता है जैसे वह character और ideals के ज़रिए लोगों को convince करने वाला, एक well-meaning geek हो। media handling में awkward है, लेकिन उसी वजह से यह भी लगता है कि वह खुद के रूप में बोल रहा है, जो मुझे ठीक लगता है। बेशक दोनों पर और भी आलोचनाएँ की जा सकती हैं। Dario शायद AI future risk पर अभी भी काफ़ी दूर तक नहीं जाता, और Altman पहली नज़र में smart और capable होते हुए भी manipulative लगता है। फिर भी, corporate leaders में Dario मुझे उन लोगों में से एक लगता है जो alignment को सबसे गंभीरता से लेते हैं। वह खुद funding करता है, technology समझता है, और actual research की प्रकृति जानता हुआ लगता है। यह सोचें कि कितनी दुर्लभ बात है कि किसी company CEO में अपने संगठन के core practical work को वास्तव में करने की क्षमता भी हो, तो यह काफ़ी खास बात लगती है
  • मैं AI को एक corporate tool के रूप में देखता हूँ जिसका मकसद employees से और ज़्यादा काम निकलवाना है। साथ ही यह employees को यह भ्रम देने वाली चीज़ भी लगती है कि वे जैसे कोई turbo-charged dev बन गए हों। आज की tech industry मुझे मानवता को गंभीरता से बेहतर बनाने की कोशिश से ज़्यादा, पैसे से भरे एक circus जैसी लगती है

    • कम-से-कम समझदार programmers के बीच तो मुझे नहीं लगता कि कोई इस “turbo-charged dev” myth पर सच में विश्वास करता है। मुझे लगता है कि ज़्यादातर लोग साफ़ देख रहे हैं कि यह पूरा तमाशा आख़िरकार पैसा कमाने का ज़रिया है
  • मुझे यह poisoning movement slacktivism के ज़्यादा करीब लगती है। मैं उस विश्लेषण को कुछ हद तक समझता हूँ जिसमें कहा जाता है कि working class का काम compute से replace किया जा रहा है, और compute शुद्ध capital है, इसलिए अंततः capitalist class working class का गला घोंट रही है। और मुझे लगता है कि capitalists सच में यही दिशा चाहते भी हो सकते हैं। लेकिन अगर ऐसा है, तो model को थोड़ा-बहुत poison करना अभी जो हो रहा है उसका सीधा सामना करने के लिए बहुत ही अपर्याप्त है

  • मुझे यह trend Reddit पर खास तौर से ज़्यादा दिखता है। कुछ communities इतनी pro-AI हैं कि वे AI summary comments जोड़ती हैं और AI-written posts को encourage करती हैं, जबकि दूसरी subreddits cautious या खुलकर anti-AI दिशा में जा रही हैं। photo communities इस समस्या से जूझ रही हैं कि उनके काम पर AI होने का शक किया जाता है, और programmer communities आम तौर पर इसे पसंद भी करती हैं और साथ ही skeptical भी रहती हैं। कुल मिलाकर, पारंपरिक subreddits भी अब AI spectrum पर कहीं-न-कहीं अपनी जगह लेने लगी हैं। उदाहरण के तौर पर https://www.reddit.com/r/vibecoding/, https://www.reddit.com/r/isthisAI/, https://www.reddit.com/r/aiwars/, https://www.reddit.com/r/antiai/, https://www.reddit.com/r/photography/comments/1q4iv0k/what_do_you_say_to_people_who_think_every_photo/, https://www.reddit.com/r/webdev/comments/1s6mtt7/ai_has_sucked_all_the_fun_out_of_programming/ जैसे स्थान याद आते हैं

    • मुझे यह Reddit, और व्यापक रूप से मानवीय समूह-चिंतन, का एक क्लासिक रूप लगता है। लोगों को सूक्ष्म बारीकियों से जूझने की बजाय जल्दी से किसी एक-आयामी रेखा पर कहीं खड़े हो जाना या दो पक्षों में से एक में वर्गीकृत हो जाना ज़्यादा पसंद आता है
  • मैं चाहता हूँ कि कभी हम AI और दुनिया में उसकी भूमिका पर अधिक सूक्ष्म बातचीत कर सकें। अभी तो माहौल लगभग सिर्फ दो ध्रुवों का लगता है। एक तरफ AI को दुनिया से पूरी तरह हटाने की बात है, और दूसरी तरफ सब कुछ उसके हवाले कर देने की। मैं इनके बीच कहीं responsible use, social guardrails और energy consumption जैसी व्यावहारिक बातों पर चर्चा करना चाहूँगा

    • मेरा मानना है कि Venture capital ने AI-dominates-the-world वाले scenario पर bet लगाया है, इसलिए LLM के conservative और limited use cases को फिलहाल funding मिलना मुश्किल है। एक सूक्ष्म कारण यह भी हो सकता है कि ऐसे cautious use cases में पैसा लगाना, मौजूदा core investments की value घटाने वाले signal की तरह दिखे
    • मैं मोटे तौर पर ठीक उसी बीच वाले बिंदु पर खड़ा हूँ। AI crawlers और उनकी companies को robots.txt का सम्मान करना चाहिए, और उन्हें environment व supply chain को नुकसान पहुँचाने वाली infinite scaling की तरफ नहीं जाना चाहिए। साथ ही, models का सावधानी से उपयोग करने में स्पष्ट value है। उदाहरण के लिए, Linux server पर किसी अजीब समस्या को trace करते समय हर बार लंबा समय और मानसिक ऊर्जा खर्च करना हमेशा मनचाहा नहीं होता। इसलिए मैं AI का इस्तेमाल सोच-समझकर सिर्फ ज़रूरत के समय करना चाहता हूँ, लेकिन Microsoft की Copilot को लगातार push करने वाली strategy मुझे सच में नापसंद है। मैं नहीं चाहता कि हर पल मुझे efficiency बढ़ाने की याद दिलाई जाए; मैं उसे तभी इस्तेमाल करना चाहता हूँ जब मुझे वह उपयुक्त लगे
    • जब मैं पहले AI की कल्पना करता था, तो मेरे दिमाग में उसका उपयोग कुछ ऐसा नहीं था। मूल रूप से एक भव्य vision था कि वह बड़े problems सुलझाएगा। इसलिए अब मुझे लगता है कि responsible AI deployment को आगे बढ़ाना चाहिए। low-risk domains से शुरू करना चाहिए, और कम विनाशकारी परिस्थितियों में उसके ठीक से काम करने का पर्याप्त प्रमाण मिलने के बाद ही उसे ज़्यादा महत्वपूर्ण क्षेत्रों तक ले जाना चाहिए
    • मुझे थोड़ा आश्चर्य हुआ कि इस site पर भाग लेने वाले किसी व्यक्ति से ऐसा विचार आया। मुझे तो उल्टा लगता था कि यहीं इस तरह की middle ground सबसे ज़्यादा दिखाई देती है। पिछले एक साल में भी मुझे लगा है कि माहौल vague gesturing से आगे बढ़कर अब AI को स्वीकारते हुए उसकी समस्याएँ समझने और responses सोचने की दिशा में काफी आया है। मुझे AI एक शानदार tool लग सकता है अगर इसका सही उपयोग हो, लेकिन जो मौजूदा तरीका है, जिसमें tool को समझे बिना सबके हाथों में थमा दिया जाता है, वह डरावना है। मेरा अनुमान है कि इस community में भी ऐसे एहसास रखने वाले लोग कम नहीं होंगे
  • मुझे लगता है कि original blog का गुस्सा भी कुछ ज़्यादा है, लेकिन यह सच्चे मन से मान लेना कि ऐसी poisoning कोशिशें model training पर ज़रा भी बुरा असर नहीं डाल सकतीं, तकनीकी समझ की कमी जैसा लगता है और इससे थोड़ा खिन्नता होती है

    • मैं इतनी निश्चितता से नहीं कह सकता कि poisoning कभी काम ही नहीं करेगी। कम-से-कम जुड़े हुए examples देखकर तो ऐसा नहीं लगता कि उस संभावना को पूरी तरह बंद कर देना चाहिए; उदाहरण के लिए https://www.reddit.com/r/BrandNewSentence/comments/1so9wf1/comment/ogrqpxz/ याद आता है
    • गुस्से को अपने-आप में cringe मानने वाले रवैये से सहमत होना मेरे लिए मुश्किल है। अगर हम गुस्से को पूरी तरह बचकाना कहकर खारिज कर दें, तो इससे हम यथार्थ-बोध और नैतिक संवेदना दोनों से दूर जा सकते हैं
    • उल्टा, मुझे तो यह ज़्यादा cringe लगता है कि लोग ChatGPT से messages, emails और resumes लिखवाएँ, working software developers पूरे apps vibe coding से बना दें, और LLM से AGI बहुत जल्द आने वाली है जैसी बातें करते फिरें
  • मेरे मन में “Resistance is futile” वाला मज़ाक आता है, लेकिन साथ ही मुझे इस दावे से काफ़ी सहमति भी है कि AI वास्तव में communities को नुकसान पहुँचा रहा है। उदाहरण के लिए YouTube ने reports handle करना भी AI पर डाल दिया है, जिससे malicious actors किसी और के original video पर अपना दावा ठोककर demonetize के ज़रिए उसकी कमाई छीन सकते हैं। Davie504 जैसे बड़े YouTuber के साथ भी ऐसा हुआ, और appeal की प्रक्रिया भी फिर robot ही संभालता है, जो बहुत निराशाजनक है

    • मेरे हिसाब से YouTube की यह समस्या LLM से बहुत पहले से मौजूद थी। copyright strike system तो शुरू से ही टूटा हुआ था। इसलिए किसी random tech problem को उठाकर उसका दोष पूरी तरह AI पर डालना कुछ हद तक inaccurate लगता है
 
amebahead 2026-04-23

AI जिस data पर training करता है उसे दूषित करने के अलावा, क्या प्रतिरोध के और तरीके नहीं हो सकते?
जैसे कि AI द्वारा बनाए गए content का उपभोग ही न किया जाए...

 
dongho42 2026-04-23

मैंने भी इसे पढ़ते हुए सोचा कि कहीं यह अनजाने में इंसानों के लिए भी poisoning तो नहीं बन रहा है।

 
geesecross 2026-04-22

पता नहीं समस्या कहाँ हुई, लेकिन 'kkim', 'bom', 'doem', 'jim' के बाद मेल न खाने वाला 'eum' जुड़ रहा है। क्या यह भी कहीं poisoning तो नहीं है ;)

 
xguru 2026-04-22

शायद मॉडल में थोड़ा बदलाव हुआ है, इसलिए वही prompt गलत तरीके से काम कर रहा है। मैंने यह हिस्सा ठीक कर दिया है।