1 पॉइंट द्वारा GN⁺ 18 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Lobsters में LLM-जनित लेखों पर रोक और टैग बदलने को लेकर चर्चा जारी रही, लेकिन ऐसा लगता है कि कम मेहनत और कम जानकारी वाले पोस्ट को स्पैम के रूप में रिपोर्ट करके आगे बढ़ने पर सहमति है
  • टिप्पणियों में सिर्फ “this is LLM slop” जैसी बात छोड़ देना, लेख की सामग्री पर बात करने के बजाय केवल यह तय करने तक सीमित रहना है कि वह जनित है या नहीं, इसलिए इसे विषय से भटका हुआ मानकर रिपोर्ट करने का प्रस्ताव है
  • Lobsters पढ़ने की कम से कम 80% वजह वहाँ की टिप्पणियों की गुणवत्ता है, लेकिन LLM आउटपुट है या नहीं, इस पर होने वाली बहसों को छाँटकर पढ़ना असुविधाजनक है
  • जिस लेख को रोचक समझकर साझा किया गया हो, उस पर अगर एकमात्र टिप्पणी “अगर यह सिर्फ LLM से लिखा हुआ न होता” जैसी हो, तो यह साझा करने वाले के लिए निराशाजनक है
  • खुद लिखे गए लेख पर LLM-जनित होने का शक किया जाना और भी ज़्यादा हतोत्साहित करता है, और ऐसा अन्य प्लेटफ़ॉर्मों पर भी हुआ है तथा Lobsters के दूसरे लेखकों के साथ भी हुआ है

प्रस्ताव

  • LLM-जनित लेखों पर रोक, ai/vibecoding टैग बदलने आदि को लेकर चर्चा चलती रही, लेकिन कम मेहनत और कम जानकारी वाले पोस्ट को स्पैम के रूप में रिपोर्ट करके आगे बढ़ने पर सहमति बनती दिखती है
  • टिप्पणियों में सिर्फ “this is LLM slop” या उसी तरह की बात छोड़ देने वाली प्रतिक्रिया को विषय से भटका हुआ मानकर रिपोर्ट करने का प्रस्ताव है
  • Lobsters पढ़ने की कम से कम 80% वजह वहाँ की टिप्पणियों की गुणवत्ता है, लेकिन चर्चा के केंद्र में मौजूद लेख LLM आउटपुट है या नहीं, इस पर चलने वाली बहसों को छाँटकर पढ़ना निराशाजनक है
  • अगर किसी लेख को रोचक समझकर साझा किया गया हो और उस पर एकमात्र टिप्पणी “अगर यह LLM ने लिखा हुआ न होता तो यह अच्छा लेख होता” जैसी हो, तो साझा करने वाले के नज़रिए से भी यह निराशाजनक है
  • बिना LLM के, खुद लिखे गए लेख के साझा होने के बाद उसे LLM-जनित समझ लिया जाना और भी अधिक निराशाजनक और हतोत्साहित करने वाला है
  • यह घटना अपने लेखों के साथ Lobsters पर नहीं हुई, लेकिन अन्य प्लेटफ़ॉर्मों पर ऐसी प्रतिक्रियाएँ मिली हैं, और Lobsters के दूसरे लेखकों के साथ भी ऐसा होते देखा गया है

पृष्ठभूमि और मंशा

  • समुदाय के भीतर LLM एक ध्रुवीकरण वाला विषय है और यह स्थिति सबके लिए थकाऊ है, इसलिए इस समय एक-दूसरे की राय बदलने की संभावना कम मानी जा रही है
  • प्रस्ताव का मुख्य बिंदु यह है कि “कम मेहनत वाले लेखों को स्पैम के रूप में रिपोर्ट करके आगे बढ़ें” के साथ-साथ “सिर्फ LLM होने या न होने की ओर इशारा करने वाली मेटा टिप्पणियों को विषय से भटका हुआ मानकर रिपोर्ट करके आगे बढ़ें”
  • “slop” किसे कहा जाए, इसका मानदंड हर व्यक्ति का अलग हो सकता है, इसलिए मंशा यह है कि टिप्पणी-चर्चा लेख की सामग्री के बजाय LLM है या नहीं, इसी निर्णय की ओर न बहक जाए

1 टिप्पणियां

 
Lobste.rs की राय
  • यह पसंद न आए, ऐसा हो सकता है, लेकिन मुझे ऐसी सूचना उपयोगी लगती है। मैं AI-जनित लेख पढ़ने में समय नहीं लगाना चाहता, और मुझे लगता है कि जब लोग लिखना किसी tool को सौंप देते हैं तो वे अपनी आवाज़ खो देते हैं, इसलिए “assisted” writing में भी मैं खास दिलचस्पी नहीं रखता।
    हम लेख सिर्फ उसकी सामग्री देखने के लिए नहीं पढ़ते, बल्कि लेखक का नज़रिया और शैली देखने के लिए भी पढ़ते हैं। यह भी चर्चा का विषय है कि लेख कैसे लिखा गया, यह अप्रासंगिक क्यों माना जाए, और इससे यह भी बेहतर पता चलता है कि लेखक उस काम में कितना शामिल था।
    शुरुआती संकेत जो मुझे पहले ही तय करने दें कि सामग्री के साथ कैसे पेश आना है, मूल्यवान होते हैं। पसंद न हो तो [-] बटन दबा सकते हैं, और मैं hide बटन इस्तेमाल कर सकता हूँ।

    • सबसे बड़ी समस्या यह है कि अगर कोई लेख 17 पैराग्राफ का फालतू लेख हो और यह बात 10वें पैराग्राफ तक पहुँचकर समझ आए, तो तब तक आप कम-मूल्य वाले लेख पर काफी समय बर्बाद कर चुके होते हैं।
      ऐसे में पहले से कोई संकेत मिल जाता तो अच्छा होता।
    • यह समझ आता है कि लोग LLM-generated content को नापसंद करते हैं, लेकिन LLM का उपयोग “सब कुछ ढूँढकर लिख दो” से लेकर “मैं native speaker नहीं हूँ, इसे अंग्रेज़ी में translate/organize कर दो” तक एक spectrum पर होता है। ज़्यादा महत्वपूर्ण बात यह है कि हर पोस्ट पर ऊपर के दस-पंद्रह comments इस बात पर बहस करते रहें कि इसे LLM ने लिखा या नहीं, इसकी ज़रूरत नहीं है।
      मैंने ऐसे पोस्ट पर भी लगातार LLM इस्तेमाल होने का शक लगते देखा है जहाँ लेखक कहता है कि उसने खुद लिखा है और उस पर शक करने की कोई वजह भी नहीं होती। अगर comments LLM content को reliably पहचान ही नहीं सकते, तो वे सिर्फ शोर हैं, और सबसे अच्छी हालत में भी AI फालतू-लेख वाले articles जितने ही बुरे हैं।
  • किसी submission के LLM-generated होने की जानकारी देने वाले comments मददगार होते हैं, और मैं ऐसे comments देखकर उसे spam के रूप में report करके hide कर देता हूँ।
    हाँ, मैं ऐसे comments पर आँख मूँदकर भरोसा नहीं करता, खुद भी जाँचता हूँ।

  • अगर items को फालतू लेख/spam के रूप में report किया जा सकता हो, तो ऐसे comments गायब हो जाएँगे।

    • ये comments साफ़ तौर पर reporting system की कमी को bypass कर रहे हैं। Spam को commercial तत्व वाली चीज़ के रूप में परिभाषित किया गया है, इसलिए उस परिभाषा के हिसाब से देखें तो बहुत-सी फालतू पोस्ट उस category में फिट नहीं बैठतीं।
      Reporting feature को सुधारे बिना सिर्फ comments पर रोक लगाना बेकार है। लक्षण से ज़्यादा मूल कारण से निपटना चाहिए।
    • मैं शायद उम्रदराज़ हूँ, इसलिए दूसरों जितनी सहजता से ‘फालतू AI लेख’ पहचान नहीं पाता। शायद इसलिए कि यह मुझे कुछ साल पहले इंसानों द्वारा बनाए गए marketing nonsense जैसा ही लगता है, कोई अलग phenomenon नहीं।
      मेरे लिए यह काफी खीझ पैदा करने वाली बात है कि किसी साधारण-से खराब लेख की उत्पत्ति को लेकर लंबी बहस चलती रहे। खासकर तब, जब उसके अंदर कुछ उपयोगी तथ्य दबे हुए हों।
      सोचता हूँ कि लेख की interestingness पर upvote/downvote से अलग, उसकी quality या ‘फालतूपन’ पर लोग व्यक्तिगत numeric rating दे सकें तो कैसा रहेगा। उसका average निकाला जा सकता है, और user auto-hide threshold भी सेट कर सकता है।
      इससे lobste.rs शायद अपनी मूल मंशा से ज्यादा जटिल हो जाएगा, लेकिन जिस काफी dystopian माहौल में हम अभी हैं, उसे संभालने के लिए यह शायद तर्कसंगत हो।
    • क्या items को पहले से ही spam के रूप में report नहीं किया जा सकता? मैं तो अक्सर ऐसा करता हूँ।
  • “यह LLM फालतू-लेख है” जैसे comments की वजह से मैंने कई बार समय बचाया है, और मेरे अपने पोस्ट किए गए कम-से-कम एक लेख में भी ऐसा हुआ था। मैं फालतू लेख पढ़ना नहीं चाहता, और उससे भी कम फालतू लेख पोस्ट करना चाहता हूँ

  • एक पाठक के रूप में मुझे ऐसे comments उपयोगी लगते हैं। खासकर जब वे यह भी बताते हैं कि उन्हें ऐसा क्यों लगा; तब वे सिर्फ report से भी ज़्यादा काम के होते हैं।
    about page पर “spam” report की परिभाषा यह है:

    For stories, these are: "Off-topic" for stories that are not about computing; "Already Posted" for duplicate submissions and links that elaborate on or responses to a thread that's less than a week old (see merging); and "Broken Link" for links that 404, 500, or present a paywall; "Spam" for links that promote a commercial service.
    इस परिभाषा, सुझाए गए व्यवहार, और उस व्यवहार की तुलना में जिसे पहले कम-से-कम एक moderator का समर्थन मिलता मैंने देखा है, मुझे लगता है कि ऐसे comments बने रहना बेहतर है।
    फालतू AI लेखों से बचने की इच्छा content marketing से बचने की इच्छा से बड़ी है। Marketing को context में रखना आसान है, और सिर्फ report भी काफी जानकारी दे देती है। जब तक फालतू AI लेखों के लिए अलग report नहीं आती, तब तक खासकर वजह बताने वाले comments की अनुमति बनी रहनी चाहिए।

    • मैं व्यक्तिगत रूप से “spam” शब्द का इस्तेमाल about page की परिभाषा से कहीं व्यापक अर्थ में करता हूँ। यह सिर्फ पुराने ज़माने वाले अनचाहे commercial email तक सीमित नहीं है; मैं इसमें वे लंबे copy-paste भड़काऊ posts भी शामिल मानता हूँ जो कुछ Usenet groups पर छा जाया करते थे।
      वे posts ऐसे लोग या trolls डालते थे जो कई threads को बाधित करना चाहते थे। कम-गुणवत्ता वाला LLM-generated content मुझे उसी तरह की सामग्री से अलग नहीं लगता।
  • अगर किसी ने LLM से सिर्फ grammar या spelling ठीक करवाई हो, तो उसे कैसे देखा जाएगा? अगर किसी ने स्पेनिश में लिखे एक अच्छी तरह व्यवस्थित तर्क का LLM से अनुवाद करवाया हो, तब? अगर dyslexia वाला कोई व्यक्ति मुख्य bullet points दे और LLM से उसे गद्य में बदलवा ले, तब?
    काश हम सूक्ष्म समस्या को इतना सरल न बना दें। इससे दिलचस्प योगदान बाहर रह जाने का खतरा है। बेशक, मैं भी यहाँ ऐसी AI फालतू-लेखन सामग्री नहीं देखना चाहता जिसमें कोई सूचना-मूल्य ही न हो, या उससे भी बदतर, तथ्यात्मक hallucination हो।

    • LLM-generated text के फायदे-नुकसान पर पहले ही बेहद बार चर्चा हो चुकी है। मैं बस इतना चाहता हूँ कि comments में वह बहस बंद हो। spam के रूप में report करो और आगे बढ़ो, या फिर उसे रहने दो।
  • व्यक्तिगत तौर पर मुझे दोनों पक्षों की बात में दम लगता है। नीचे जो है, वह site की official position नहीं, सिर्फ मेरी निजी राय है, और कोई बहुत गहराई से सोचा-समझा निष्कर्ष भी नहीं। लगा कि चर्चा में मदद मिले तो अपनी मौजूदा सोच साझा कर दूँ।
    लोग यह कार्रवाई क्यों चाहते हैं, इसका कारण वाजिब है और उससे सहानुभूति भी है। मेहनत से लिखी चीज़ को ऐसे खारिज कर देना मानो उसमें इंसान की कोई भूमिका ही न रही हो, सचमुच हतोत्साहित करने वाला है। खासकर अगर ऐसा em dash जैसी सतही वजहों से किया जाए, तो और भी। मेरी जगह होता तो मैं भी शायद जल्दी ही वहाँ से चला जाता।
    लेकिन यह भी हो सकता है कि वह कदम अपने उद्देश्य के लिए सबसे आदर्श न हो। मुझे लगता है कि ऐसे हस्तक्षेप का असर यह होगा कि हम बिना-मानव सामग्री के खिलाफ अपनी सबसे बड़ी रक्षा-पंक्ति खो देंगे। जब लोग मिलकर सामाजिक मानदंड बनाते हैं और उन्हें लगातार लागू करते हैं, तो वह ऊपर से थोपी गई authority की तुलना में कहीं बेहतर scale करता है। इसलिए मैं इस समय महत्वपूर्ण भूमिका निभा रही उस social dynamic को दबाने को लेकर बहुत सावधान हूँ। नुकसान दिखता हो तब भी, और बाद में अगर उसकी भूमिका कम महत्वपूर्ण हो जाए तो फिर से देखा जा सकता है।
    क्या कोई और कदम है जो मदद कर सकता है? अगर यहाँ अब तक न आया हो तो कोई भी सुझाव दे।
    और हाँ, मैं चाहूँगा कि सब लोग बिना पर्याप्त भरोसे के लापरवाह आरोप लगाने से बचें। चाहे आप किसी भी तर्क को सही मानते हों, बिना सोचे-समझे प्रतिक्रियात्मक व्यवहार बहुत विनाशकारी होता है। अगर लोग बार-बार एक-दूसरे पर व्यक्तिगत हमले करने लगें, तो किसी भी जगह का समुदाय बने रहना मुश्किल हो जाता है।

  • मैं पूरी तरह सहमत हूँ। कई बार किसी लेख को पढ़ते हुए मुझे बिल्कुल नहीं लगता कि वह AI-generated है, लेकिन कोई दूसरा पूरे भरोसे के साथ कह देता है कि है। मैं गलत हो सकता हूँ, लेकिन आख़िर किसी चीज़ के AI-generated होने का पक्का पता कैसे चलेगा?
    अगर वह सचमुच फालतू लेख है, तो मुझे लगता है लोग उसे upvote नहीं करेंगे और बात अपने-आप संभल जाएगी।

    • मुझे यक़ीन नहीं कि AI-generated text में ऐसा कोई अंतर्निहित गुण होता है जिसे लोग, या ज़्यादातर लोग, हमेशा पहचान ही लें। आख़िरकार ऐसा भी हो सकता है कि सिर्फ text देखकर फर्क करना लगभग असंभव हो जाए। अगर ऐसा है, तो फिर कोई चीज़ LLM ने लिखी हो लेकिन कोई पहचान न पाए, तो क्या वह “वास्तविक फालतू लेख” है?
      जब लोग कहते हैं कि वे लेखक का दृष्टिकोण और अंतर्दृष्टि चाहते हैं, तो उसमें सचमुच कुछ महत्वपूर्ण बात है। मान लें किसी ने prompt के अलावा किसी मानवीय मदद के बिना LLM से एक काल्पनिक blog post बनवाई, और वह संयोग से सुसंगत, तथ्यात्मक रूप से सही और दिलचस्प भी निकली—फिर भी मैं उसे खास तौर पर पढ़ना नहीं चाहूँगा। कम-से-कम lobsters के संदर्भ में तो नहीं।
      ऐसे content के लिए कोई LLM text encyclopedia जैसा platform हो सकता है, जहाँ मैं उसकी प्रकृति जानकर जाऊँ। लेकिन मुझे नहीं लगता कि वह मानवीय सोच और रचनात्मकता से बने समुदाय के लिए उपयुक्त है।
      यह बात अभी मौजूदा पोस्ट पर बहुत बड़ा असर नहीं डालती, क्योंकि “इसमें LLM की गंध है” जैसे comments वास्तव में कितने सही होते हैं, यह मैं आत्मविश्वास से नहीं कह सकता। फिर भी, समुदाय के सदस्यों की इस इच्छा से मुझे गहरी सहानुभूति है कि उन्हें भरोसा रहे कि वे किसी सजग इंसान द्वारा लिखा गया लेख पढ़ रहे हैं।
  • इस प्रस्ताव से थोड़ा अलग सवाल है: यह प्रस्ताव off-topic या spam के रूप में report क्यों किया जा रहा है, यह जानने की उत्सुकता है। मुझे तो यह किसी भी मानदंड में फिट नहीं लगता।
    मुझे पता है about section में कहा गया है कि ऐसे meta सवाल अच्छे नहीं माने जाते, लेकिन सच में जानना चाहता हूँ कि कहीं मैं कुछ मिस तो नहीं कर रहा।

    • इस site पर ऐसे मानव फालतू-लेख बेचने वाले काफी हैं जो कोई भी नापसंद लेख देखते ही उसे off-topic या spam बताने लगते हैं। बहुत झुंझलाहट होती है। पहले भी ऐसा हुआ है: https://lobste.rs/s/irxjid/ai_vampire#c_d0zhhi
  • जिन bloggers की मातृभाषा अंग्रेज़ी नहीं है, वे अपनी blog post की भाषा निखारने के लिए AI का उपयोग कर सकते हैं। जो लोग अंग्रेज़ी से अधिक परिचित हैं, वे ऐसे text को AI फालतू लेख समझ सकते हैं, जबकि वह वास्तव में सिर्फ एक तरह की सहायक writing हो सकती है।
    मेरी मातृभाषा भी अंग्रेज़ी नहीं है, इसलिए मैं भी ऐसे texts में AI के इस्तेमाल को आसानी से नहीं पहचान पाता। मेरे लिए सबसे महत्वपूर्ण बात यह है कि मुख्य संदेश कैसे पहुँचाया गया है।

    • यह meta thread इस बारे में नहीं है कि लोग LLM क्यों इस्तेमाल करते हैं या क्यों नहीं। मैं तो बस यह चाहता हूँ कि यहाँ हर comment thread में “यह robot ने बनाया है!” “नहीं!” “हाँ, बिल्कुल साफ़ है” जैसी बहसें अब और न दिखें। बेशक, यह मैंने थोड़ा बढ़ा-चढ़ाकर कहा है।