1 पॉइंट द्वारा GN⁺ 2026-01-19 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • AI-जनित कंटेंट इंटरनेट पर होने वाली इंटरैक्शन का एक बड़ा हिस्सा बन चुका है — इस पर गहराई से की गई एक पड़ताल
  • HackerNews पर किसी open source project के AI-जनित होने या न होने को लेकर हुई बहस के बाद, लेखक ने ऐसे पैटर्न देखे जिनमें कमेंट तक AI द्वारा लिखे हुए लगते थे
  • पहले IRC और phpBB फ़ोरम के दौर में असल इंसानों के बीच संवाद केंद्र में होता था, लेकिन अब AI से बनी इमेज, कमेंट और कोड रोज़मर्रा का हिस्सा बनकर मिलते-जुलते दिखाई देते हैं
  • LinkedIn जैसे प्लेटफ़ॉर्म पर भी AI से बदली गई कंपनी फ़ोटो को असली कर्मचारियों की पोस्ट के रूप में डाले जाने के उदाहरण देखे गए
  • यह चिंता जताई गई कि तकनीकी प्रगति, इंसानी ज्ञान-साझाकरण से ज़्यादा, bots के बीच बातचीत और commercial content की repackaging की ओर बढ़ रही है

HackerNews की बहस और समस्या की पहचान

  • लेखक ने HackerNews पर एक उपयोगकर्ता द्वारा साझा किया गया open source project देखा
    • कमेंट में कई anonymous users ने शक जताया कि यह कोड कहीं AI से जनित तो नहीं
    • कोड की commit timeline, comments की शैली आदि को AI-जनित होने जैसा बताया गया
  • लेखक AI के उपयोग के ख़िलाफ़ नहीं है, लेकिन वह इस बात पर ज़ोर देता है कि open source में AI के उपयोग का खुलासा होना चाहिए
    • क्योंकि इंटरनेट पर भाग लेने वाले ज़्यादातर लोग anonymous होते हैं, इसलिए विशेषज्ञता या प्रामाणिकता की जाँच मुश्किल होती है
    • LLM साधारण कामों में उपयोगी हैं, लेकिन जटिल समस्याओं या edge cases में जोखिम पैदा कर सकते हैं

कमेंट पैटर्न में दिखे AI के निशान

  • लेखक ने project author के कमेंट में भी AI-विशेष शैली देखी
    • उदाहरण: em-dash (—) का अत्यधिक उपयोग, “you are absolutely right” जैसे अप्राकृतिक वाक्यांश
    • “let me know if you want to [do that thing] or [explore this other thing]” जैसी AI-जैसी sentence structure का बार-बार दोहराव
  • ऐसी अभिव्यक्तियाँ इंसानी भाषा की सामान्य आदतों से अलग लगीं, जिससे यह शक होने लगा कि सामने वाला सच में इंसान है या नहीं

‘डेड इंटरनेट थ्योरी’ का एहसास

  • इस अनुभव के बाद लेखक को Dead Internet Theory याद आई
    • इस थ्योरी का दावा है कि 2016 के आसपास से इंटरनेट का अधिकांश हिस्सा bots के बीच इंटरैक्शन और मशीन-जनित कंटेंट से भर गया है
    • ऐसे कंटेंट का मक़सद अक्सर प्रोडक्ट बेचना या SEO में हेरफेर जैसे commercial gains पर केंद्रित होता है

पुराने इंटरनेट और आज के बीच अंतर

  • 2000 के शुरुआती दशक में IRC और phpBB फ़ोरम के समय असल इंसानों के बीच सीखना और संवाद मुख्य था
    • लेखक उस दौर को “Internet University” कहता है और याद करता है कि उसने वहीं networking, operating systems, games और web development सीखा
    • तब यह भरोसा होता था कि सामने वाला व्यक्ति इंसान है
  • आज स्थिति AI images और comments के मिले-जुले माहौल की है, जहाँ असली और नकली में फ़र्क करना मुश्किल हो गया है

AI कंटेंट के फैलाव को लेकर चिंता

  • LinkedIn पर लेखक ने एक असली कंपनी कर्मचारी द्वारा पोस्ट की गई AI से बदली हुई office photo देखी
    • इमेज में अजीब हाथों के आकार और बेअर्थ टेक्स्ट जैसे संकेतों से पता चलता था कि वह AI-जनित है
    • यहाँ तक शक जताया गया कि फ़ोटो में दिख रहे लोग भी शायद वास्तविक अस्तित्व ही नहीं रखते
  • Facebook, Xitter, TikTok आदि पर भी AI-जनित झूठा कंटेंट फैल रहा है
    • उदाहरण: किसी विशालकाय व्यक्ति द्वारा पिरामिड बनाए जाने की तस्वीर, या किसी खास राजनीतिक संदेश वाला वीडियो
  • लेखक लिखता है कि इस वास्तविकता ने उसमें दुख और असहायता की भावना पैदा की
    • AI आम लोगों के लिए बेहद सुलभ हो गई है, और ‘AI-slop’ (AI कचरा कंटेंट) की बाढ़ आ गई है
    • लोग अब खुद लिखने या कोड करने के बजाय AI agents को काम सौंपने लगे हैं

तकनीक और इंसानी ज्ञान के भविष्य को लेकर संशय

  • लेखक आज भी तकनीक और software engineering से प्रेम करता है, लेकिन
    अब का इंटरनेट ऐसी जगह में बदलता दिख रहा है जहाँ bots, bots से बात कर रहे हैं
  • इंसानी ज्ञान को “आपकी रोज़मर्रा की समस्या हल करने के 10 steps” जैसे commercial content में बदलकर परोसा जा रहा है
    और ज्ञान-साझाकरण का मूल अर्थ धीरे-धीरे खोता जा रहा है

1 टिप्पणियां

 
GN⁺ 2026-01-19
Hacker News की राय
  • कुछ समय पहले मेरे माता-पिता AI से बने नकली YouTube वीडियो के झांसे में आ गए। वह वीडियो ‘नस्लवादी पुलिस’ के बुरे व्यवहार के बारे में था, और शुरू में मुझे भी वह असली जैसा लगा, इसलिए मैं भ्रमित हो गया। खोजने पर कोई स्रोत नहीं मिला, सिर्फ़ री-अपलोड ही मिले। चैनल के विवरण में लिखा था, “कुछ वीडियो AI से पुनर्निर्मित वास्तविक घटनाएँ हैं”, लेकिन यह बिल्कुल भरोसेमंद नहीं लगा। यह सोचकर बहुत दुख होता है कि ऐसा कंटेंट YouTube विज्ञापन राजस्व के लिए विभाजन को बढ़ावा देता है

    • नस्लवादी कंटेंट में मांग आपूर्ति से अधिक है। सिर्फ़ वास्तविकता के सहारे गुस्से को बनाए रखना मुश्किल है, इसलिए ऐसे वीडियो लगातार बनाए जाते हैं
    • AI वीडियो का पता सिर्फ़ अकाउंट की पोस्टिंग हिस्ट्री देखकर भी चल जाता है। वे बहुत ज़्यादा बार, बार-बार, और बिना किसी सुसंगत विषय या पृष्ठभूमि के अपलोड होते हैं। तकनीक आगे बढ़ भी जाए, तब भी शायद यह पैटर्न नहीं बदलेगा
    • आजकल मैं RealOrAI subreddit पर बहुत ज़्यादा समय बिता रहा हूँ। हर बार गलती होने पर बेचैनी बढ़ती है, इसलिए मैं और ज़्यादा देखता हूँ ताकि बेहतर पहचान सकूँ। लेकिन अब शायद हमें असली और नकली में फर्क न कर पाने वाली दुनिया को स्वीकार करना पड़ सकता है
    • सच कहें तो ऐसी चिंता नई नहीं है। पहले भी छेड़छाड़ की गई तस्वीरों या संदर्भहीन वीडियो से विभाजन फैलाना आम था। AI ने बस इसे और आसान बना दिया है
    • अच्छा होता अगर Google AI कंटेंट वाले वीडियो को अपने आप चिह्नित कर देता
  • “यह social network नहीं है” — इस बात से मैं पूरी तरह सहमत हूँ। पहले ‘social media’ का मतलब वास्तविक दोस्तों से बातचीत की जगह होता था, लेकिन अब इसमें Reddit जैसे forum भी शामिल कर दिए गए हैं। नतीजा यह है कि असली सामाजिक संवाद की जगह लगभग गायब हो गई है

    • अभी यह भूमिका Discord निभा रहा है। यह invite-based community है, इसलिए इसमें public feed नहीं होता, और वास्तविक लोग सीधे moderation करते हैं। मेरे पुराने IRC दोस्त भी सब Discord पर चले गए हैं। कभी यह listed हो गया तो शायद लोग Matrix जैसी चीज़ का इस्तेमाल करेंगे
    • मूल रूप से “social media” दोस्तों के साथ सीधे कंटेंट साझा करने का नेटवर्क था। लेकिन Facebook ने इसे ‘reshare’ केंद्रित बना दिया, और अब यह दोस्तों की खबरों से ज़्यादा random content consumption platform बन गया है। HN में friend feature नहीं है, इसलिए यह forum के ज़्यादा करीब है
    • TikTok और Instagram को भी ‘social’ कहा जाता है, लेकिन ज़्यादातर लोग कुछ भी पोस्ट नहीं करते। वे बस media consumption platform हैं
    • सच कहूँ तो मैंने भी Discord इस्तेमाल नहीं किया, इसलिए ठीक से नहीं जानता। मुझे यह बस किसी कंपनी द्वारा चलाया जाने वाला IRC version जैसा लगता है, इसलिए समझ नहीं आता कि यह इतना लोकप्रिय क्यों है
    • Meta के मुताबिक, 10% से भी कम उपयोगकर्ता उन लोगों से interact करते हैं जिन्हें वे वास्तव में जानते हैं। आज का social media बस ‘scroll entertainment’ है
  • यह कहना कि कोई भी ‘em dash(—)’ इस्तेमाल नहीं करता, गलतफहमी है। मैं इसे पहले से ही अक्सर इस्तेमाल करता रहा हूँ। “you’re absolutely right” जैसे वाक्य भी दोस्तों के बीच तंज़ भरे मज़ाक के रूप में खूब बोले जाते हैं। ब्रिटेन में बड़े हुए हमारे लिए यह बहुत स्वाभाविक अभिव्यक्ति है

    • आजकल सिर्फ़ अच्छी typography इस्तेमाल करने पर भी लोग समझ लेते हैं कि यह LLM ने लिखा है, और यह बहुत खीज पैदा करता है। मैं पहले से en dash और em dash इस्तेमाल करता रहा हूँ। Compose key इस्तेमाल करें तो इसे टाइप करना भी आसान है
    • em dash अपने आप में समस्या नहीं है। अंग्रेज़ी मेरी मातृभाषा नहीं थी, इसलिए blog लिखते हुए अभ्यास किया, और spacing है या नहीं इसके अनुसार प्रभाव बदलता है, इसलिए मैंने कई तरीके आज़माए। आखिरकार ज़्यादातर लोग एकरूप नहीं होते। अगर कोई बहुत ही परफेक्ट grammar लिख रहा हो, तो उल्टा उसके AI होने की संभावना ज़्यादा लगती है
    • शायद ब्रिटिश शिष्टाचार की वजह से “you’re right, but…” जैसे वाक्य स्वाभाविक रूप से लिखे जाते हैं
    • हमारे bookstore newsletter में भी em dash इस्तेमाल होता है। यह semicolon से देखने में ज़्यादा साफ़ लगता है और वाक्य अलग करने में उपयोगी है
    • iOS में “-” key को long press करने पर इसे आसानी से डाला जा सकता है, इसलिए मैं इसे अक्सर इस्तेमाल करता हूँ
  • यह जाँचने का एक आसान तरीका है कि कोई image AI से बनाई गई है या नहीं।

    • OpenAI C2PA metadata का उपयोग करता है,
    • Gemini SynthID watermark का उपयोग करता है।
    • SynthID सिर्फ़ image ही नहीं बल्कि text पर भी लागू होता है, और इसका code भी public है
    • लेकिन image-to-image model से noise जोड़कर या हटाकर SynthID भी मिटाया जा सकता है
    • मैंने OpenAI blog की image भी verification site पर डालकर देखी, लेकिन उसमें metadata नहीं था। ऐसी बातों से भरोसा कम होता है
    • हालाँकि C2PA का उद्देश्य ‘असली होने का प्रमाण’ देना है। यह हर कंटेंट को verify नहीं कर सकता, लेकिन प्रमाणित images को कानूनी सबूत के रूप में इस्तेमाल किया जा सकता है
  • मौजूदा समस्या आखिरकार platform incentive structure की है।

    • YouTube को views चाहिए, LinkedIn पर self-PR चलता है, और HN पर startup promotion प्रेरक शक्ति है।
    • क्या हम ऐसी community बना सकते हैं जहाँ AI बेकार हो, क्योंकि वहाँ सिर्फ़ इंसानों के बीच शुद्ध interaction हो?
    • शायद दोस्तों के छोटे समूह ही इसका एकमात्र जवाब हैं
    • पहले मुफ्त phpBB forum या IRC पर बुद्धिमान लोगों से बात हो जाती थी। लेकिन अब जाकर समझ आया कि operating cost और moderation burden कितना बड़ा था
    • ऐसी communities को Dunbar’s number से सीमित होना चाहिए। उससे बड़ी होने पर नियमों और admins के बिना उन्हें चलाए रखना असंभव हो जाता है
    • आजकल गलत या भ्रामक वीडियो भी आखिरकार views और ad revenue में बदल जाते हैं। platform कोई जिम्मेदारी नहीं लेते
    • अगर विज्ञापन पूरी तरह प्रतिबंधित हों और global feed के बिना सिर्फ़ friends-centered feed हो, तो शायद यह संभव हो, लेकिन UX खराब हो जाएगा
    • आखिरकार समस्या की जड़ विज्ञापन-आधारित इंटरनेट मॉडल है। Twitter की समस्या Elon Musk से ज़्यादा इस संरचनात्मक सीमा की है
  • मुझे नहीं लगता कि open source code जारी करते समय AI इस्तेमाल किया या नहीं, यह बताना अनिवार्य होना चाहिए। ऐसी माँगें रचनात्मक उत्साह को ही कम कर देंगी। लोग अपना लिखा code साझा करना चाहते हैं, ‘AI इस्तेमाल नहीं किया’ यह साबित नहीं करना चाहते

    • लेकिन कुछ मामलों में लेखक लगातार “AI इस्तेमाल नहीं किया” कहता रहता है, जबकि code में AI-generated निशान दिखते रहते हैं, और तब ऐसा लगता है जैसे कोई gaslighting कर रहा हो
  • मैं सोचता हूँ कि क्या कोई social media platform है जिसने AI पर प्रतिबंध लगाया हो। शायद image metadata या user behavior analysis से इसे रोका जा सकता है

    • अगर ऐसा platform बना, तो वह adversarial training का स्वर्ग बन जाएगा
    • Bluesky ने इसे आधिकारिक रूप से ban नहीं किया है, लेकिन community AI के प्रति बहुत शत्रुतापूर्ण है, इसलिए यह लगभग न के बराबर है
    • फिर से लौट रहा Vine कथित तौर पर AI content को स्पष्ट रूप से प्रतिबंधित करेगा
    • Mastodon.art जैसे कुछ स्थान AI को साफ़ तौर पर प्रतिबंधित करते हैं
    • आखिरकार सिर्फ़ social pressure के सहारे भी AI को रोकने वाली communities मौजूद हो सकती हैं
  • मुझे उम्मीद है कि किसी दिन जब ऑनलाइन कंटेंट पूरी तरह AI से बनने लगेगा, तो इंसान फिर से वास्तविक दुनिया की ओर लौटेंगे

    • ऐसे बदलाव की शुरुआत कुछ हद तक अभी से दिख रही है। पहले बात थी, “फोटो नहीं तो भरोसा नहीं”, लेकिन अब फोटो भी manipulate की जा सकती है, इसलिए लोग सिर्फ़ असली यादों के लिए तस्वीरें लेते हैं
    • लेकिन इसका उल्टा भी संभव है कि बहुत से लोग AI के साथ interaction में ही संतुष्ट हो जाएँ
    • अभी भी लोग फोन से अलग नहीं हो पा रहे, और अगर AI optimized कंटेंट बनाएगा, तो वे और गहराई से उसमें फँस जाएँगे
    • फिर भी यह विचार अपने आप में बड़ा सुकून देने वाला है
  • अब हम Turing test से आगे निकल चुके दौर में हैं। अगर हम इंसान और AI में फर्क नहीं कर पाते, तो हो सकता है कि AI ज़्यादा बुद्धिमान नहीं हुआ, बल्कि हमारी ऑनलाइन बातचीत ही बहुत सतही हो गई है

    • लेकिन असली Turing test सिर्फ़ धोखा खा जाने का नाम नहीं है, बल्कि conversational verifier (interrogator) को फर्क न कर पाना चाहिए। मौजूदा LLM अभी उस स्तर तक नहीं पहुँचे हैं
    • text में जानकारी कम होती है, और उसमें ‘यह किसी इंसान ने लिखा है’ वाला भरोसा जुड़ा होता है, इसलिए लोग आसानी से भ्रमित हो जाते हैं। इसी वजह से text-based AI खास तौर पर खतरनाक है। आजकल मुझे फोन पर बात करते समय भी कभी-कभी समझ नहीं आता कि सामने इंसान है या robot
    • आखिरकार “एक हाथ में…” “दूसरे हाथ में…” जैसी संतुलित दृष्टि की ज़रूरत है
  • मैं इसे ‘कालीन प्रभाव’ कहता हूँ। जब कोई वीडियो या बातचीत की संरचना बिल्कुल परफेक्ट alignment में हो, तो उसमें बनावटीपन महसूस होता है। मोरक्को के कालीनों की तरह कुछ अपूर्णता जानबूझकर छोड़नी पड़ती है ताकि वह मानवीय लगे। लेकिन लगता है कि यह ‘निशान’ भी जल्द गायब हो जाएगा