- साइट पर LLM-जनित लेख पोस्ट किए जाने पर क्या करना चाहिए, इस पर काफी चर्चा होती है, लेकिन इसे अनुमति देनी है या नहीं, इस बारे में कोई स्पष्ट नीति नहीं दिखती
- यह मत है कि जो उपयोगकर्ता नियमित रूप से LLM-जनित लेख पोस्ट करते हैं, उन्हें साइट से प्रतिबंधित किया जाना चाहिए
- submission page पर “LLM-जनित लेख यहाँ अनुमत नहीं हैं” जैसी सूचना दिखाने का प्रस्ताव सामने आया
- स्पष्ट नीति और सूचना, LLM-जनित लेखों को flag किया जाए या comments में जवाब दिया जाए इस बहस को कम कर सकती है
- मुख्य बात यह है कि LLM-जनित submissions की अनुमति नहीं है, ऐसा स्पष्ट मानदंड तय किया जाए ताकि समुदाय की प्रतिक्रिया सरल हो सके
1 टिप्पणियां
Lobste.rs की रायें
कभी-कभी कम-गुणवत्ता वाली पोस्ट निकलकर आ जाए तो भी ठीक लगता है। LLM-जनित कंटेंट पर प्रतिबंध को स्पष्ट रूप से रखना, आदर्श रूप से बिना ऐसे अपवादों के जिन पर कमेंट्स में झगड़ा हो, पहले पेज के कबाड़ को कम करेगा और बार-बार नियम तोड़ने वालों को बैन करने का स्पष्ट आधार देगा
कुल मिलाकर सहमत हूँ। अगर कोई पोस्ट लिखने की मेहनत भी खुद नहीं करता, तो मैं उसे पढ़ना नहीं चाहता
लेकिन LLM-जनित वाक्यों की पूरी तरह पहचान कैसे की जाए, यह मुझे नहीं पता, और सिर्फ इस शक पर कि पोस्ट जनरेटेड हो सकती है, किसी व्यक्ति या स्रोत को बैन करना मुझे पसंद नहीं। कभी-कभी मुझ पर सिर्फ em dash इस्तेमाल करने के कारण LLM इस्तेमाल करने का शक किया गया है, जबकि मैं यह तरीका 25 साल से ज़्यादा समय से इस्तेमाल कर रहा हूँ
सिर्फ इसलिए कि कम-गुणवत्ता वाली पोस्ट की पहचान पूरी तरह परफ़ेक्ट नहीं है, हम नीति ही न बना सकें, ऐसा नहीं होना चाहिए। गलतियाँ कभी-कभी होंगी, लेकिन वेब पर छा रहे और इंसानों द्वारा लिखी चीज़ों को बाहर धकेल रहे LLM-जनित कचरे के खिलाफ ज़रूर प्रतिरोध होना चाहिए
सहमत हूँ
आम तौर पर यह काफी स्पष्ट होता है कि कोई चीज़ LLM-जनित लेख है, और मैंने ऐसे मामले भी देखे हैं जहाँ पोस्ट में तो नहीं लिखा था, लेकिन लेखक ने अपनी साइट पर कहीं और LLM के इस्तेमाल का ज़िक्र किया हुआ था। तब फैसला और आसान हो जाता है
कम-गुणवत्ता पहचानने को लेकर कम्युनिटी की समझ भी काफी सटीक लगती है। मुझे याद नहीं कि वास्तव में LLM इस्तेमाल न करने वाले किसी लेखक को बड़े कमेंट थ्रेड में LLM इस्तेमाल करने वाला बताकर घेरा गया हो। अगर कोई फर्क ही न कर पाए, तो बस फर्क नहीं कर पाएगा
जो मामले सच में अस्पष्ट हों, उनमें good faith मान लेना ठीक है। समस्या आम तौर पर उन पोस्टों से होती है जो बहुत ज़ाहिर होती हैं, न कि ऐसी स्थिति से जहाँ कोई चुपके से ज्यादा से ज्यादा LLM लेख घुसाकर lobsters को धोखा देने की कोशिश कर रहा हो
मुझे LLM-जनित लेख सच में बहुत नापसंद हैं और मैं चाहता हूँ कि वे गायब हो जाएँ। ऐसे चरम मामले स्पष्ट होते हैं और संभवतः पहचानना भी आसान होता है, और मुझे लगता है कि उन्हें हटाने का विरोध बहुत कम लोग करेंगे
लेकिन अगर किसी ने ऐसा software submit किया हो जिसमें कुछ LLM-जनित commits शामिल कर लिए गए हों तो? या अगर किसी ने सब कुछ LLM से बनाया हो, लेकिन उस प्रक्रिया को विश्लेषणात्मक लेख के रूप में दस्तावेज़ित किया हो तो? ये आपत्तियाँ मैं जानबूझकर devil’s advocate बनकर उठा रहा हूँ, लेकिन यह साफ है कि lobsters के भीतर भी स्वीकार्यता का एक spectrum है
LLM का ज़रा भी स्पर्श पाए हर कंटेंट पर पूरी तरह प्रतिबंध लगाना शायद स्वीकार्य नहीं होगा। सबसे व्यापक रूप से स्वीकार्य जवाब शायद karma penalty के बिना flag होगा। यानी “मेरे हिसाब से यह जनरेटेड है, सावधान रहें” जैसा संकेत आगे देखने वालों के लिए छोड़ देना। अभी बड़े कमेंट थ्रेड लगभग यही काम कर रहे हैं, और इससे कमेंट की लड़ाई कम करते हुए कंटेंट की visibility के बारे में संकेत भी दिया जा सकता है
यह उचित लगता है। अगर कोई अपने विचारों को व्यवस्थित करने में समय नहीं लगाता, तो मैं क्यों उसे पढ़ने में अपना समय लगाऊँ
दलील को polish करने या grammar जाँचने के लिए chatbot को rubber duck की तरह इस्तेमाल करना ठीक है। मुझे नहीं लगता कि इसके लिए किसी खास detection की ज़रूरत है; कम्युनिटी के सदस्यों की अपेक्षाएँ और साफ मामलों में हटाना ही काफी है
जो पोस्ट पसंद न आए, उस पर तुरंत “LLM low-quality post!” चिल्लाना बहुत आसान है। फिर क्या होगा। मैं ऐसे पोस्ट भी देखना चाहता हूँ जिनसे मैं सहमत हूँ और जो विषयानुकूल हैं, और ऐसे भी जिनसे मैं सहमत नहीं हूँ — यही स्वस्थ बात है
किसी पोस्ट को “low-quality” कैसे आँका जाए, इस पर मुझे यक़ीन नहीं है। कुछ उदाहरण स्पष्ट होते हैं, लेकिन कुछ धुंधले भी होते हैं। यह भी संभव है कि लेखक संयोग से वही खास writing style इस्तेमाल करता हो जिसकी LLM अक्सर नकल करती है, इसलिए एक वैध पोस्ट भी सतही लगे
“authored by” submissions में submitter की कुल मिलाकर लापरवाही को देखना शायद उचित हो सकता है। अगर कोई लगातार साफ तौर पर low-quality पोस्ट डालता रहे, तो लेखक को लापरवाह मानकर चिह्नित किया जाए, और मॉडरेटर “अब बंद करो” कहकर संपर्क करने के बाद भी वह न रुके, तो बैन कर दिया जाए
किसी दूसरे के ज़रिए submit हुई “लापरवाह पोस्ट” को भी उसी तरह गिना जाना चाहिए या नहीं, यह मुझे नहीं पता। ऐसा लगता है कि जो लोग बार-बार low-quality लगने वाली चीज़ें submit करते हैं, उनके पोस्ट करने की क्षमता को स्थायी रूप से बैन करने के बजाय कुछ समय के लिए ठंडा किया जा सकता है। लेकिन ऐसा ढाँचा सुखद नहीं होगा जिसमें हर submitter को पोस्ट के स्रोत का बचाव न कर पाने पर बैन कर दिया जाए
लगता है आप LLM low-quality पोस्ट लिखने के असामाजिकपन को कम आँक रहे हैं। अभी भी ऐसे साफ मामले पहले पेज पर कई दिनों तक बने रहते हैं क्योंकि AI लहर पर सवार लोग उन्हें submit करते रहते हैं
संबंधित पोस्ट: https://lobste.rs/s/wee21u/this_is_written_by_llm_comments_should_be
उदाहरण:
https://lobste.rs/s/ojvhq9/coding_is_thinking_why_i_still_write_code
https://lobste.rs/s/eaxtmb/claude_for_legal_suite_plugins_for_legal
https://lobste.rs/s/fvqkke/new_claude_code_programmatic_usage
मैं इस बात से सहमत हूँ कि LLM-जनित टेक्स्ट को filter या flag किया जा सकना चाहिए
समस्या यह है कि अगर पोस्ट LLM-जनित है लेकिन वास्तव में विषयानुकूल भी है, तो उसे “off-topic” का लेबल देना उल्टा इस्तेमाल हो सकता है। पहले भी नए flag option पर चर्चा हुई थी। उदाहरण: https://lobste.rs/s/po97lh/new_tag_suggestion_genai_assisted
अब भी मुझे लगता है कि https://lobste.rs/s/rkjpob/proposal_add_ai_generated_as_flag_reason में चर्चा के अनुसार “off-topic” flag का दुरुपयोग करने से नया flag option बेहतर है
इसे filter या flag किया जा सके, यह मुझे बहुत महत्वपूर्ण नहीं लगता। जो उपयोगकर्ता इसे पोस्ट करते हैं, उन्हें साइट से हटाया जाना चाहिए। अगर flag या tag से वास्तविक कार्रवाई नहीं होती, तो वे बेकार हैं
शायद मैं सिर्फ बेकार उदाहरण चुन रहा हूँ, लेकिन https://lobste.rs/s/hfnps5/osmand_s_faster_offline_navigation का LLM-जनित टेक्स्ट कुल मिलाकर कचरा-गुणवत्ता का होते हुए भी वास्तव में विषयानुकूल मौलिक सामग्री भी रखता है
अब हर तरह का dash गैरकानूनी है
--से em dash बनाता हैचिंता यह है: किसी टेक्स्ट के LLM-जनित होने का पूरी सटीकता से पता लगाना आसान नहीं है। फिर भी ज़्यादातर मामलों में यह साफ होता है
कभी-कभी किसी न किसी कारण से “महत्वपूर्ण” या “ध्यान देने योग्य” पोस्ट LLM-जनित हो सकती है। उदाहरण के लिए CopyFail रिपोर्ट
प्रस्ताव: LLM-जनित कंटेंट पर, high-impact security vulnerability जैसी अपवादात्मक स्थितियों को छोड़कर, प्रतिबंध होना चाहिए। टेक्स्ट LLM-जनित है या नहीं, इसका फैसला करते समय सतर्क रुख अपनाना चाहिए और सीमा-रेखा वाले मामलों में शक के बजाय लाभ दिया जाना चाहिए। “अपवादात्मक स्थितियाँ” मॉडरेटर के विवेक पर छोड़ी जा सकती हैं, या नीति विकसित होने के साथ ऐसी शर्तों की सूची बनाकर उसे बार-बार बेहतर किया जा सकता है