क्या हम सभी अब साहित्यिक चोरी करने वाले बन गए हैं?
(economist.com)- AI के युग में बौद्धिक संपदा की चोरी के मानदंड धुंधले होते जा रहे हैं, जिससे साहित्यिक चोरी की परिभाषा और उसकी स्वीकार्य सीमा पर बहस तेज हो गई है
- साहित्यिक चोरी का साहित्य, संगीत और भाषणों में लंबा इतिहास रहा है, और ऐसे मामले भी मौजूद हैं जहाँ प्रसिद्ध रचनाएँ भी आसानी से बच निकलीं
- स्पष्ट परिभाषा के अभाव में साहित्यिक चोरी की व्याख्या शाब्दिक कॉपी से लेकर विचार उधार लेने तक बहुत व्यापक रूप से की जाती है, और तकनीकी प्रगति ने पता लगाना और नकल करना दोनों आसान बना दिया है
- सृजन और मौलिकता की सीमा बहुत पहले से धुंधली रही है, और Chaucer, Shakespeare, Swift जैसे साहित्यिक दिग्गजों पर भी साहित्यिक चोरी के आरोप लग चुके हैं
- Anthropic ने 70 लाख pirated किताबों के उपयोग को लेकर लेखकों को 1.5 अरब डॉलर देने पर सहमति की
- रचनात्मकता और मौलिकता हमेशा नकल के साथ तनावपूर्ण रिश्ते में रही हैं, और AI ने इस पुराने सवाल को व्यक्तिगत और सामाजिक, दोनों स्तरों तक फैला दिया है
प्रसिद्ध साहित्यिक कृतियाँ और साहित्यिक चोरी के प्रति उदारता
- ऐसा मामला मौजूद है जिसमें Jane Austen की 『Pride and Prejudice』 के एक हिस्से को थोड़ा बदलकर नई रचना के रूप में भेजा गया, फिर भी कई संपादक उसे पहचान नहीं पाए
- यह दिखाता है कि मशहूर वाक्यों को पहचानना भी पाठक के संदर्भ और अपेक्षाओं पर निर्भर करता है
साहित्यिक चोरी का इतिहास और उसका आधुनिक अर्थ
- Roger Kreuz की नई किताब में संगीत(Bob Dylan), साहित्य(Dylan Thomas), भाषण(Joe Biden) आदि में 20वीं सदी के विभिन्न साहित्यिक चोरी के मामलों की चर्चा है
- Bob Dylan के Nobel साहित्य पुरस्कार स्वीकृति भाषण में "Moby Dick" का उल्लेख करते समय SparkNotes जैसी अभिव्यक्तियाँ पाई गईं
- plagiarism शब्द स्वयं रोमन कवि Martial की कविता से लिया गया है, और लैटिन plagiarius का अर्थ "अपहरणकर्ता" होता है
- रोमन क़ानून के अनुसार साहित्यिक चोर को ऐसा अपराधी माना गया जो "पहले सार्वजनिक आयोजन में जंगली जानवरों के सामने फेंक दिया जाना चाहिए"
AI युग में फिर उभरी साहित्यिक चोरी की बहस
- साहित्यिक चोरी की अवधारणा पुरानी है, लेकिन AI training और generation के कारण यह व्यक्तिगत और कानूनी दोनों स्तरों पर फिर महत्वपूर्ण हो गई है
- AI से self-introduction letter या प्रेम पत्र लिखवाने की नैतिकता का सवाल
- copyrighted सामग्री पर training को लेकर AI कंपनियों की कानूनी ज़िम्मेदारी का सवाल
- AI ने बौद्धिक चोरी और प्रेरणा के बीच की रेखा को और भी धुंधला कर दिया है
परिभाषित करना कठिन साहित्यिक चोरी और तकनीक का प्रभाव
- साहित्यिक चोरी का दायरा शब्दशः कॉपी से लेकर विचार उधार लेने तक फैला हुआ है
- डिजिटल तकनीक ने नकल को आसान बनाया है, लेकिन पहचान को भी उतना ही मजबूत किया है
- हस्तलिपि और छापाखाने के पुराने युगों की तुलना में कॉपी की लागत में भारी गिरावट ने साहित्यिक चोरी की आवृत्ति बढ़ाई है
AI और साहित्यिक चोरी का नया चरण
- ChatGPT, Claude जैसे LLM विशाल copyrighted सामग्री पर train किए जाते हैं, इसलिए उन पर रचनाकारों की कृतियों का दुरुपयोग करने के आरोप भी लगते हैं
- एक मुकदमे में वादियों ने दावा किया कि AI कंपनियाँ "बड़े पैमाने पर संगठित चोरी" कर रही हैं
- 15 जनवरी 2026 को दो प्रकाशकों ने GoogleAI के खिलाफ "इतिहास का सबसे व्यापक copyright उल्लंघन" बताते हुए class action में शामिल होने की अर्जी दी
- Anthropic ने 70 लाख अवैध किताबों का training में उपयोग करने पर 1.5 अरब डॉलर भुगतान करने पर सहमति दी
- Kreuz का तर्क है कि ChatGPT का उपयोग किसी एक मूल स्रोत से सीधी नकल नहीं करता, इसलिए इसे साहित्यिक चोरी नहीं कहा जा सकता
- उन्होंने LLM की तुलना ऐसे बिना श्रेय वाले "ghostwriter" से की, लेकिन कई लोग इसे "AI साझेदार के साथ की गई साहित्यिक चोरी" मानते हैं
- आलोचनात्मक नज़रिए से यह दोहरा अपराध है: AI training material के शब्द चुराता है, और उपयोगकर्ता उन्हीं शब्दों को अपना बताकर लाभ उठाता है
सृजन और साहित्यिक चोरी की पुरानी सीमा
- Chaucer, Shakespeare, Swift जैसे साहित्यिक दिग्गजों पर भी साहित्यिक चोरी के आरोप लगे, मानो यह "साहित्यिक जगत की Who’s Who सूची" हो
- Shakespeare ने "Antony and Cleopatra" के barge scene को Plutarch से उधार लिया, लेकिन उसे हाथ से कॉपी करना पड़ता था
- Dickens की नकल वाली रचनाएँ "Martin Guzzlewit", "Oliver Twiss" आदि बनाने के लिए समय और typesetting का काम चाहिए होता था
- Ctrl+C key के आने के बाद साहित्यिक चोरी और आसान हो गई, और उस पर नियंत्रण कठिन हो गया
- Laurence Sterne ने 250 साल पहले साहित्यिक चोरों की तुलना दवा बेचने वालों से करते हुए आलोचना की थी, लेकिन बाद में पता चला कि वह अभिव्यक्ति भी Robert Burton से ली गई थी
- Mark Twain ने कहा था कि "मानव अभिव्यक्ति में साहित्यिक चोरी के अलावा लगभग कुछ भी नहीं है"
प्रेरणा और साहित्यिक चोरी के बीच अंतर
- T.S. Eliot का प्रसिद्ध कथन: "अपरिपक्व कवि नकल करते हैं, परिपक्व कवि चुराते हैं"
- लेकिन इसका बाद वाला हिस्सा कम जाना जाता है: "खराब कवि जो लाते हैं उसे बिगाड़ देते हैं, जबकि अच्छे कवि उसे बेहतर या अलग चीज़ में बदल देते हैं"
- Anthropic मुकदमे में न्यायाधीश ने कंपनी की तुलना "ऐसे पाठक से की जो लेखक बनना चाहता है" और माना कि वह नई रचनाएँ बनाती है
copyright व्यवस्था का जन्म और तकनीक का प्रभाव
- 18वीं सदी में copyright व्यवस्था स्थापित होने के बाद प्रतिलिपि अधिकार स्पष्ट हुए और उल्लंघनों पर मुकदमा चलाना आसान हुआ
- Oxford के अंग्रेज़ी साहित्य के प्रोफेसर Robert Douglas-Fairhurst: "लेखन एक पेशा है, इसलिए व्यक्ति को अपनी संपत्ति की रक्षा करनी चाहिए"
- Charles Dickens ने प्रतियाँ छापने वाले मुद्रकों पर copyright को लेकर ग़ुस्से और आर्थिक कारणों से मुकदमे किए
AI detection तकनीक का विकास
- विश्वविद्यालय AI से लिखे गए assignments की पहचान के लिए AI का उपयोग कर रहे हैं
- छात्र Dumb it Down जैसी सेवाओं से AI-लिखित सामग्री को अधिक स्वाभाविक दिखाने की कोशिश करते हैं
- plagiarism detection सेवा Turnitin के CEO Chris Caren के अनुसार, साहित्यिक चोरी वाला लेखन "beige" जैसा होता है—अच्छा लिखा हुआ, लेकिन जीवंत नहीं
- AI-लिखित सामग्री की भाषाई विशेषताएँ: "holistic" जैसे उबाऊ शब्द और "notably" का बार-बार उपयोग
साहित्यिक चोरी अब सबकी समस्या
- New York Times में साहित्यिक चोरी के उल्लेख की आवृत्ति 1950 के दशक की तुलना में 8 गुना बढ़ गई है
- साहित्यिक चोरी के मामले बढ़े हो सकते हैं, लेकिन वे त्रुटिपूर्ण नायक के पतन वाली लगभग परिपूर्ण दुखांत कथा का रूप लेते हैं, इसलिए वे जन-ध्यान भी खींचते हैं
- AI युग में साहित्यिक चोरी की बहस अब सिर्फ लेखकों तक सीमित नहीं रही, बल्कि पूरे समाज का मुद्दा बन गई है
निष्कर्षात्मक संकेत
- पूरा लेख व्यंग्यात्मक ढंग से ऐसे समय का चित्रण करता है जहाँ साहित्यिक चोरी अपवाद नहीं, बल्कि सामान्य व्यवहार बनती दिख रही है
- उपशीर्षक “steal industry is booming” साहित्यिक चोरी के सामान्यीकृत सांस्कृतिक परिघटना की आलोचनात्मक अभिव्यक्ति है
- यह संकेत देता है कि केवल साहित्य ही नहीं, बल्कि समूची संस्कृति में सृजन की प्रामाणिकता और मौलिकता चुनौती के घेरे में है
- “क्या हम सभी अब साहित्यिक चोरी करने वाले बन गए हैं?” यह प्रश्न सृजन की नैतिकता और उसके मूल्य की पुनर्समीक्षा की आवश्यकता उठाता है
1 टिप्पणियां
Hacker News की राय
मेरी राय सरल है
लंबे वाक्य या शब्दों को जैसा का तैसा दोबारा इस्तेमाल करना और स्रोत न बताना ठीक नहीं है
मौजूदा विचारों को दूसरे शब्दों में दोबारा व्याख्यायित करना ठीक है
किसी को धोखा देने की नीयत से लगभग वैसी ही तस्वीर की नकल करना ठीक नहीं है
लेकिन शैली या सामग्री की नकल, अगर अलग तरीके से की जाए, तो ठीक है
लोग नवीनता को लेकर बहुत ज़्यादा आसक्त हैं। अगर कोई मेरे काम से प्रेरित होकर उसे फिर से गढ़े या दोबारा अभिव्यक्त करे, तो वह अच्छी बात है
उदाहरण के लिए Star Wars एक सामान्य hero narrative structure का ही पालन करती है, फिर भी उसका मूल्य है। ज़्यादातर modern fantasy भी Middle Earth की fanfic जैसी लगती है, लेकिन उनका होना अपने आप में अच्छा है
अगर कोई व्यक्ति पूरी ज़िंदगी बेतरतीब ढंग से सुर बनाता रहे, तो वह उसके बाद कई दशकों में बने सारे संगीत का मालिक नहीं हो सकता
गैर-परिवर्तनकारी उपयोग समस्या है, लेकिन परिवर्तनकारी उपयोग स्वीकार्य है
स्रोत को लेकर धोखा देने की नीयत नहीं होनी चाहिए, और सिर्फ़ शैली की नकल करना ठीक है
ज़्यादातर अच्छी कहानियाँ किसी न किसी हद तक इस संरचना का पालन करती हैं, लेकिन उनका implementation ही उन्हें खास बनाता है
जैसे “React की हूबहू कॉपी किया गया webapp” कहना, जबकि वास्तव में वह पूरी तरह अलग चीज़ हो सकती है
AI से लिखे गए लेखन को पकड़ने की कोशिश करने वाले विश्वविद्यालय बढ़ रहे हैं
लेकिन Turnitin की AI detection accuracy लगभग 90% बताने वाली एक research report है
इसलिए यह मानना मुश्किल है कि पहचान बिल्कुल परफ़ेक्ट है
कुछ लोगों की writing style AI जैसी हो सकती है, और AI इंसान जैसी लिख सकती है
AI ने अगर सिर्फ़ कुछ वाक्यों में मदद की हो, तब भी पूरे लेखन को AI-जनित बताया जा सकता है
आख़िरकार इंसान और AI की सीमा धुंधली हो जाती है
इसलिए उसे AI के लिखे हुए से अलग करना मुश्किल है, और सीखने के प्रमाण के रूप में writing का अर्थ खत्म हो रहा है
अब शायद मौखिक प्रस्तुति या चर्चा ही सीखने के प्रमाण का एकमात्र तरीका रह जाए
संभावना ज़्यादा हो तो quotations की जाँच करता हूँ, और फिर भी संदेह हो तो छात्र को बुलाकर सीधे सवाल पूछता हूँ
अंततः मानवीय निर्णय ज़रूरी होता है
यह false positives से ज़्यादा false negatives कम करने की दिशा में किया गया समायोजन है
चाहें तो इसे अधिक संतुलित detector की तरह ट्यून किया जा सकता है
वास्तव में यह sensitivity 90% और specificity 100% है
यानी 100 AI cheating करने वालों में 10 छूट सकते हैं, लेकिन इंसान द्वारा लिखा गया लेखन ग़लत तरीके से चिह्नित नहीं होता
बड़ी मेहनत से बनाया गया काम मशीन द्वारा अनंत बार पुनः उपयोग हो, और बिना स्रोत के बार-बार दोहराया जाए, तो कड़वाहट महसूस होना स्वाभाविक है
उसे अपना सृजन कहकर गर्व महसूस करना इंसानी स्वभाव है
बौद्धिक संपदा अधिकार (IP) नैतिकता से ज़्यादा मनोवैज्ञानिक प्रोत्साहन का साधन हैं
आदर्श दुनिया में शोध निजी लाभ के बजाय शुद्ध जिज्ञासा से होता, लेकिन हक़ीक़त ऐसी नहीं है
कर्मचारी को श्रम का भुगतान मिलता है, और नतीजे का स्वामित्व कंपनी के पास होता है
जबकि self-employed व्यक्ति परिणाम का मालिक होता है, लेकिन श्रम के लिए वेतन नहीं पाता
अगर आपने ‘sharing spirit’ से कुछ सार्वजनिक किया, तो आपने अपना पूंजीगत संसाधन मुफ़्त में बाँट दिया
अगर बदला चाहते हैं, तो paid model अपनाइए, या brand और reputation के ज़रिए प्रतिफल पाइए
AI के आने के बाद और ज़्यादा लोग copyright का बचाव करने लगे—यह विडंबना है
अगर creators के अधिकार कमज़ोर किए जाएँ, तो distributor की शक्ति बढ़ती है
आर्थिक लाभ का ज़्यादातर हिस्सा बीच के वितरकों तक बहने लगता है
Germany जैसे देशों में copyright transfer न हो पाने वाली व्यवस्था इसे रोकने में मदद करती है
oil industry की तरह, बीच की परतों में संपत्ति सोख लेने वाली संरचना पूरे समाज में फैल चुकी है
AI उन्माद भी अंततः “मेरा हिस्सा कैसे बने” वाली लालच का ही विस्तार लगता है
creator की उत्पादन क्षमता सीमित होती है, लेकिन distributor अनंत मात्रा में copyright जमा कर सकता है
उपन्यास और academic papers में plagiarism की अवधारणा अलग है
उपन्यास में ideas उधार लेना ठीक हो सकता है, लेकिन academia में idea खुद मुख्य संपत्ति होता है, इसलिए source citation अनिवार्य है
सिर्फ़ वाक्य बदल देना plagiarism का सबसे चालाक रूप है
अच्छे papers citations और references से भरे होते हैं, और उन्हीं के ऊपर नई अंतर्दृष्टि जोड़ी जाती है
citation के बिना वाक्य ज्यों का त्यों लिखना plagiarism है, और paraphrase + citation सही है
हालाँकि ‘common knowledge’ की सीमा अस्पष्ट होने से भ्रम पैदा होता है
AI युग की असली त्रासदी यह है कि लोग copyright की अवधारणा को बिना आलोचना के स्वीकार करने लगे हैं
RiP!: A Remix Manifesto और YouTube वीडियो की सिफारिश है
यह 20 साल पुराना काम है, लेकिन इंसान भी आखिरकार remix machine ही है
मुझे लगता है कि LLM मानव रचनात्मकता के एक हिस्से का तकनीकी रूप से लागू किया गया पहला उदाहरण है
इसमें भावनाएँ नहीं हैं, लेकिन इंसान अंतिम फ़िल्टर के रूप में quality और emotion जोड़ता है
engineers के लिए बौद्धिक संपदा अधिकार (IP) समझना मुश्किल होने की वजह यह है कि यह क़ानून इरादे(intent) पर केंद्रित है
अदालतें ‘इरादे’ का अनुमान लगाकर फ़ैसला करती हैं, और यह ढाँचा engineers की सोच से मेल नहीं खाता
“plagiarism story” एक दुखांत hero narrative की तरह दिलचस्प कहानी है
लेकिन ‘tech companies’ खुद content नहीं बनाती थीं, वे सिर्फ़ access की मध्यस्थ थीं
अब वे generative AI से सीधे content बना रही हैं
इस प्रक्रिया में बड़े पैमाने पर copyrighted सामग्री का बिना अनुमति उपयोग हुआ या नहीं, यही विवाद का मुद्दा है, और यह अदालत तय करेगी
अंततः ये मध्यस्थ कंपनियाँ अब भी data इकट्ठा करती हैं, निगरानी करती हैं, और उस जानकारी का खुलकर उपयोग करती हैं
AI युग में plagiarism और inspiration की सीमा धुंधली है
ChatGPT का इस्तेमाल plagiarism है, या ‘AI सह-लेखक’ के साथ सहयोग—इस पर बहस है
यहाँ तक कि लेख पढ़कर सुनाने वाली AI voice भी अगर किसी वास्तविक व्यक्ति की voice characteristics सीखकर बनी हो, तो वह भी copyright मुद्दे से अलग नहीं है
“अगर किसी ने कभी SF लिखा ही न होता, तो क्या AI सचमुच SF लिख पाती?” — ऐसा सवाल उठाया गया
गिलगमेश का महाकाव्य और रामायण में भी काल्पनिक तत्व पहले से मौजूद हैं
genre इतना व्यापक है कि वह किसी के स्वामित्व की चीज़ नहीं हो सकता
प्रेरणा plagiarism नहीं है
बिना किसी आधार के SF गढ़ पाना उसके लिए मुश्किल है