LLM में L का मतलब "झूठ बोलना (Lying)" है

(acko.net)

13 पॉइंट द्वारा GN⁺ 2026-03-06 | 3 टिप्पणियां | WhatsApp पर शेयर करें

LLM-आधारित कोडिंग टूल्स के आसपास की भारी-भरकम hype के बावजूद, वास्तविक software development outputs की गुणवत्ता में कोई बड़ा सुधार नहीं हुआ है, बल्कि जालसाज़ी (forgery) के करीब पहुँचने वाले outputs की भरमार हो गई है
LLM जो मूल काम करता है, वह है किसी व्यक्ति को अपने या दूसरों के संभावित outputs की नकल करके उन्हें अधिक तेज़ी से तैयार करने देना; समस्या तब पैदा होती है जब इन्हें असली चीज़ के विकल्प के रूप में इस्तेमाल किया जाता है
open source projects को AI-जनित low-quality PRs की वजह से public contributions बंद करने या bug bounty रोकने जैसी वास्तविक हानि झेलनी पड़ रही है
game industry उपभोक्ताओं के नेतृत्व में AI content labeling और filtering की मांग कर प्रभावी ढंग से प्रतिरोध कर रही है, जबकि software engineers इसे लगभग बिना बचाव के स्वीकार कर रहे हैं
अगर LLM को झूठ बोलना बंद करना है, तो सही source attribution अनिवार्य है, लेकिन मौजूदा model architecture में यह तकनीकी रूप से असंभव है

AI के इस्तेमाल की अनिवार्यता वाले फ्रेम के खिलाफ तर्क

उद्योग की hype के अनुसार पारंपरिक software development खत्म हो चुका है, लेकिन कई वर्षों तक LLM-आधारित tools इस्तेमाल करने के बाद भी परिणाम पहले जैसे ही हैं
तकनीक के इर्द-गिर्द बेहद ज़्यादा hype भारी निवेश को खींचती है, और वही निवेश बदले में और अधिक hype की मांग करता है — एक चक्रीय संरचना
नए models लगातार इसीलिए train किए जा रहे हैं ताकि वे उन वादों को पूरा कर सकें जिन्हें पहले से रिटायर हो चुके models को पूरा करना चाहिए था
"AI का इस्तेमाल न करना भी पूरी तरह ठीक है" — यह कोई पुरातन सोच नहीं है; बल्कि AI अपनाने वालों की तुलना में यह कम तनावपूर्ण और अधिक संतोषजनक हो सकता है

शिल्पकौशल (Craft) vs mass production (Kraft): जालसाज़ी का फ्रेम

LLM के काम को लेकर कई तरह के फ्रेम मौजूद हैं (मदद, रचनात्मकता, उत्पादकता vs आलस्य, disposable काम, चोरी), लेकिन हैरानी की बात है कि जो शब्द गायब है, वह है जालसाज़ी (forgery)
Van Gogh शैली में चित्र बनाकर उस पर उसका हस्ताक्षर डालना जालसाज़ी है, कानूनी दस्तावेज़ की नकल करना जालसाज़ी है, data में हेरफेर वाला शोध जालसाज़ी है — जालसाज़ी वस्तु और उसके बनाए जाने के तरीके दोनों में निहित होती है
LLM ऐसे tools हैं जो व्यक्तियों को अपने या दूसरों के संभावित outputs की जाली प्रतियाँ अधिक तेज़ी से बनाने में सक्षम बनाते हैं
नकल अपने-आप में अभिव्यक्ति की स्वतंत्रता के तहत वैध हो सकती है, लेकिन समस्या तब पैदा होती है जब जाली वस्तु को असली के विकल्प के रूप में इस्तेमाल किया जाए
Santa Claus के नाम से चिट्ठी "जाली" बनाओ तो गिरफ़्तार नहीं होगे, लेकिन बेहद परिष्कृत "नकली मुद्रा" को सिर्फ़ संग्रहणीय वस्तु कहकर रखना भी कई न्यायक्षेत्रों में स्वीकार्य नहीं है

मूल-स्थान संरक्षण और गुणवत्ता मानकों की उपमा

फ़्रांस का "Brie de Meaux" जैसे origin-controlled food products पारंपरिक निर्माण पद्धति, उच्च-गुणवत्ता raw materials और विशिष्ट भौगोलिक origin — तीनों की मांग करते हैं
अगर विदेशी उत्पादन की अनुमति दे दी जाए, तो इसका नतीजा लगभग तय है: सस्ती नकली वस्तुओं की बाढ़, जो असली brand को नुकसान पहुँचाएगी और पीढ़ियों से चली आ रही दुर्लभ स्थानीय विशेषज्ञता को भी ख़तरे में डालेगी
सिर्फ़ व्यक्तिगत उपभोक्ता का निर्णय बाज़ार के सही कामकाज की गारंटी नहीं दे सकता; दुकानों में क्या रखा जाएगा, यह पहले से ही उपभोक्ता नियंत्रण से बाहर के कई कारकों से तय होता है
artisan cheese की गुणवत्ता एक आधुनिक ढंग से संचालित पूरी supply chain का प्रतिनिधित्व करती है; इसे कहीं और दोहराने के लिए human capital, infrastructure और agriculture में भारी निवेश चाहिए
हर समाज को "पारंपरिक artisan cheese" और "औद्योगिक रसायनों से बने नकली अंडों" के बीच कहीं न कहीं रेखा खींचनी ही पड़ती है; और सिर्फ़ वही समाज, जो food craftsmanship का मूल्य समझते और बचाते हैं, 70% से अधिक obesity rate (Nauru उदाहरण) जैसी स्थिति से बच सकते हैं

open source और रोज़मर्रा की coding में AI slop का नुकसान

open source maintainers ने सबसे पहले दुष्प्रभाव महसूस किए — पहले से प्रेरित contributors ढूँढना और उन्हें project के goals तथा engineering mindset के अनुरूप ढालना पहले ही कठिन था
GitHub résumé चमकाने के लिए slop-coded PRs भेजने वाले contributors सामने आने लगे
- tldraw ने public contributions बंद कर दिए, curl project ने bug bounty रोक दी, और कुछ अन्य projects ने नकली contributors का मज़ाक उड़ाकर प्रतिक्रिया दी
vibe-coding करने वाले सहकर्मी के साथ रोज़मर्रा के काम में भी ऐसा ही असर दिखता है — लगता है कि नया कर्मचारी जल्दी ramp up हो रहा है, लेकिन वास्तव में वह शुरुआती सीखने की प्रक्रिया bot पर डाल रहा होता है
2026 तक, अगर कोई junior employee बहुत विस्तार से समझाया गया और comments से भरा PR भेजे, तो उसके हर शब्द पर शक करना चाहिए

senior engineers और 10x/100x उत्पादकता का भ्रम

कहा जाता है कि AI इस्तेमाल करने वाले अनुभवी veterans पहले से 10x, 100x अधिक code लिख रहे हैं, लेकिन वे अभी भी यह नहीं समझते कि जिस भी code line को आप चलाते और जिस पर निर्भर करते हैं, वह liability है
यह दावा कि "AI coding इसलिए शानदार है क्योंकि agent को जो कुछ चाहिए वह codebase में समझाया हुआ है" — घातक रूप से ग़लत दावा है; अगर यह सच होता, तो असली coding work बचता ही नहीं
मूल अंतर इस बात में है कि engineer ने अपने करियर का ज़्यादातर हिस्सा दूसरे software द्वारा पैदा की गई समस्याएँ सुलझाने में बिताया है, या उन समस्याओं को हल करने में जो software से पहले भी लोगों के पास थीं
- सिर्फ़ दूसरा रास्ता ही व्यक्ति को समस्या की वास्तविक constraints और user needs के बारे में सोचना सिखाता है
जब software खुद ही उद्देश्य बन जाता है, तो आप ऐसी over-engineered cloud infrastructure बना बैठते हैं जिसे वास्तव में $10/month VPS से चलाया जा सकता था

slop code की विशेषताएँ और उद्योग की प्रतिक्रिया

craftsmanship वाले engineers review के दौरान slop को आसानी से पहचान लेते हैं — अत्यधिक दोहराव वाला code, अनावश्यक जटिलता, refactoring से इनकार जैसी रूपों में
यह भी देखा गया है कि senior लोग, वर्षों के अनुभव के बावजूद, vibe coding के चलते शर्मनाक गलतियाँ करते हैं और उन्हें आगे बढ़ा देते हैं
Microsoft के Co-pilot Discord में "Microslop" जैसे अपमानजनक शब्द पर रोक लगाने की घटना — जहाँ user backlash को "spam" या "harmful" बताकर फ्रेम किया गया, यानी वादों को वास्तविक परिणामों से ज़्यादा महत्वपूर्ण माना गया
इन tools को "addictive" या "सबसे अच्छा दोस्त जो आपके पास हो सकता है" कहा जाता है, लेकिन इससे जुड़ा रचनात्मकता और उपलब्धि का कोई Cambrian explosion नज़र नहीं आता

software industry की संरचनात्मक समस्याएँ और AI की भूमिका

AI से जो चीज़ें बन रही हैं, उनमें ज़्यादातर वह glue code है जिसकी ज़रूरत PC revolution के बाद software applications के ज़्यादा closed, fragmented और corporate होने से पड़ी
HTTP API ऐसी कमज़ोर documentation वाले JSON blobs मांगते हैं जिनकी schema हर रात बदल जाती है, इसलिए वे असली openness नहीं दे पाते
कई कंपनियाँ अब भी मुख्यतः Excel पर चलती हैं, और JSON के लिए Excel जैसा कोई साधन मौजूद नहीं है
कहा गया था कि SQL business को proprietary tools पर निर्भरता से मुक्त करेगा, लेकिन वह विफल रहा; इतिहास खुद को दोहरा रहा है
जब vibe-coded Electron apps अब भी multi-platform native apps पर तरजीह पाते हैं, तब 100x productivity की असलियत पर सवाल उठता है
जब Apple जैसी कंपनी भी नए OS में उचित forms और icon system बनाए नहीं रख पा रही, तो web slop पर train की गई AI से उम्मीद और भी कम हो जाती है

game industry का प्रभावी प्रतिरोध

software engineers बिना life jacket के पानी में कूद पड़े, लेकिन game industry उपभोक्ताओं के नेतृत्व में प्रभावी प्रतिरोध कर रही है
कई game titles ने बिना label वाले AI content पर माफ़ी माँगी और उसे हटाया
Steam के पास AI content पर स्पष्ट policy है, और SteamDB AI-generated games को filter करने के tools देता है
- Steam policy को हाल ही में update किया गया ताकि player को दिखाए जाने वाले content को generate न करने वाले development tools के "efficiency improvement" उपयोग को इससे बाहर रखा जाए
game market के प्रभावी प्रतिरोध के दो कारण हैं:
- digital distribution का शुद्ध D2C (direct-to-consumer) market — gamers के पास पूरा चयनाधिकार है, और transparency की मांग करने वाले tastemakers भी वही gamers हैं
- अधिकांश games कलात्मक होते हैं, और उन्हें एक खास artistic appeal के लिए खरीदा जाता है — कला में नकल को मूल रचना का मूल्य घटाने और credit चुराने के रूप में देखा जाता है

code reuse और कलात्मक मौलिकता का विरोधाभास

code आम तौर पर reuse से नुकसान नहीं उठाता; infrastructure के मामले में तो यह अक्सर फ़ायदे का कारण बन सकता है
यही वजह है कि open source projects, प्रतिभाशाली कलात्मक creatives को आकर्षित करने के लिए खास तौर पर अनुपयुक्त हैं — बिना लागत साझा करने की भावना का मतलब है कि artistic design को उसके मूल संदर्भ से काटकर तुरंत उठा लिया जाएगा
पारंपरिक procedural generation एक उल्लेखनीय precedent है, और सामान्यतः यह उम्मीदों पर खरी नहीं उतरी
- No Man's Sky (2016 version) का मामला — सीमित स्रोतों से exponential content पैदा करने का वादा अंततः अपने ही output की विविधता को बेकार बना देता है

generative AI, pirate libraries, और कानूनी धुंधलापन

यह स्वाभाविक है कि कलाकार generative AI को mass plagiarism कहकर निंदा करें, और यह भी स्वाभाविक है कि tech entrepreneurs और data curators इसे न समझें और pirate shadow libraries पर models train करें
- Nvidia पर Anna's Archive के विशाल pirate book collection तक high-speed access deal करने की कोशिश का आरोप है
outputs साधारण, भद्दे और संदिग्ध क्यों लगते हैं, इसका स्पष्ट कारण है — training sources के विविध samples खुद मशीन के लिए slop से ज़्यादा कुछ नहीं हैं
इससे यह तय करना असंभव हो जाता है कि क्या citation है, क्या hallucination है, और क्या मौलिक है — एक तरह की plausible deniability बन जाती है
AI content पर AI-generated label या watermark लगाना अधिकतर जवाबदेही से बचने का तरीका है, वास्तविक जिम्मेदार disclosure नहीं
अगर vibe coding को स्वीकार्य और न्यायसंगत ठहराना है, तो engineer को यह मानना पड़ेगा कि उसका अपना output disposable है, रचनात्मक नहीं है, और credit के लायक नहीं है — यह एक विरोधाभासी स्थिति है

source attribution ही समाधान

किसी भी अदालत को AI output को पूरी तरह वैध या copyright-योग्य घोषित नहीं करना चाहिए था; बिना source वाले outputs को जालसाज़ी माना जाना चाहिए
LLM समस्या का समाधान स्पष्ट है, लेकिन लगभग अप्राप्य: LLM को reasoning के साथ सही source attribution करना होगा
- इससे सिर्फ़ कलात्मक पक्ष ही नहीं, बल्कि यह भी उजागर हो सकता है कि vibe code का बड़ा हिस्सा मौजूदा codebases से copy/paste किया गया है, बिना मूल लेखक, license या links के
मौजूदा models में वास्तविक attribution तकनीकी रूप से असंभव है — LLM का source का उल्लेख और citation देने की क्षमता खुद एक emergent property है, जो संकलित data से उभरती है
- LLM केवल तब source cite कर सकता है जब वह text के मौजूदा स्थान पर उपयुक्त लगे; यानी यह अक्सर सिर्फ़ उन्हीं चीज़ों को cite करने का citation role-play है जिन्हें आम तौर पर cite किया जाता है
attribution की मांग के निहितार्थ बहुत बड़े हैं: अगर weights attributable हों और forward pass auditable हो, तो backpropagation कैसी दिखेगी? वह int4 में समा नहीं सकेगी
"AI detection tools" मूलतः इसी समस्या को उल्टी दिशा से हल करने की कोशिश कर रहे हैं
यह अपने-आप में विडंबना है कि World Wide Web और उस पर काम करने वाले Google-scale search engines के बाद अगली बड़ी तकनीक ऐसी है जो डिज़ाइन के स्तर पर जानकारी के स्रोत नहीं बता सकती
अगर machine को झूठ बोलना बंद करना है, तो उसे स्रोत सही ढंग से cite करने होंगे — और AI कंपनियों को भी

3 टिप्पणियां

hungryman 2026-03-06

क्या है ये, लगता है मेरी शब्द-संपदा कम पड़ने लगी है।
"उद्भव, slop, source attribution, framing effect, Cambrian explosion" खोजकर बैठा हूँ।

GN⁺ 2026-03-06

Hacker News राय

वीडियो गेम बाज़ार उन दुर्लभ मामलों में से लगता है जहाँ उपभोक्ताओं ने AI के खिलाफ प्रतिक्रिया दी, लेकिन वास्तव में प्रतिक्रिया सिर्फ AI art assets के खिलाफ थी
कोड AI से लिखा गया हो या नहीं, किसी को परवाह नहीं है। Steam के AI सर्वे को देखें तो code generation पहले से ही अनुमति प्राप्त है
आख़िरकार LLM coding का प्रसार अपरिहार्य है। Procedural generation भी इसी तरह, यह टूल की समस्या कम और इस्तेमाल करने वाले की क्षमता पर ज़्यादा निर्भर है
- यह कहना कि procedural generation असफल रही, अज्ञानपूर्ण नज़रिया है। Elite, Powermonger जैसे क्लासिक्स से लेकर हाल के roguelike गेम्स तक, सफल उदाहरण बहुत हैं
- यह सही है कि LLM दोहराव वाले कोड को कम करता है, लेकिन वह code reuse नहीं है। यह समस्या पहले से libraries से हल की जा सकती थी
- एक कलाकार दोस्त को AI की आलोचना करते हुए, लेकिन marketing copy में AI का उपयोग करते देख विरोधाभासी रवैया याद आया
- Steam सर्वे के मुताबिक इसमें code generation भी शामिल है, लेकिन अंततः यह libraries इस्तेमाल करने से बहुत अलग नहीं है
- Open-world गेम्स का आकर्षण कम हुआ है क्योंकि उनमें नवीनता खत्म हो गई है। LLM समय बचाता है, यह दावा भी कमज़ोर है। तुरंत मिलने वाला परिणाम लंबे समय के लाभ की गारंटी नहीं देता
LLM पर बहस अब थकाऊ लगती है। इस तकनीक का उपयोग लोगों को सशक्त करने की बजाय नियंत्रित करने, layoffs आसान बनाने, और संपत्ति को और अधिक केंद्रित करने की दिशा में हो रहा है
यह कुछ ऐसा है जैसे सूअर bacon machine की उपयोगिता पर बहस कर रहे हों
- महीने के 20 डॉलर में जिसे कोई भी इस्तेमाल कर सकता है, ऐसा AI काफ़ी सार्वभौमिक टूल है। उल्टा, यह बाधाएँ कम कर रहा है। यह बदलाव से डरने वालों की प्रतिक्रिया ज़्यादा लगती है
- ऐसी दलीलें औद्योगिक क्रांति के बाद से हर automation technology के बारे में दोहराई जाती रही हैं
- AI हमें व्यावसायिक निर्भरता से मुक्त भी कर सकता है। शायद हम सीधे अपना OS या app बना सकें
- हमें पूर्ण automation और basic income guarantee की मांग करनी चाहिए। AGI से बड़ा असली ख़तरा इंसान है
- अगर अधिकांश लोग नौकरियाँ खो देंगे तो बाज़ार ही ढह जाएगा। लेकिन प्रतिस्पर्धा की वजह से कंपनियाँ अंततः नई नौकरियाँ बनाएँगी
Luddite movement सिर्फ तकनीक-विरोध नहीं था। उन्हें गुणवत्ता में गिरावट की चिंता थी, और वे वास्तव में सही थे
मध्ययुगीन यूरोप के हाथ से बने ऊनी स्कार्फ आधुनिक फैक्टरी उत्पादों से पूरी तरह अलग थे। तकनीकी प्रगति हमेशा 1:1 replacement नहीं होती
आज भी जब गैर-तकनीकी लोगों द्वारा बनाए गए internal tools सैकड़ों घंटे बचाते दिखते हैं, तो लगता है कि पूर्णता ज़रूरी नहीं, अगर असर है तो वही काफ़ी है
- जापान एक औद्योगिक समाज है, लेकिन आज भी हस्तशिल्प परंपरा का सम्मान करता है
- 800 साल बाद संग्रहालय में जो कोड बचेगा, वह सिर्फ़ बहुत अच्छा कोड होगा। अतीत को महिमामंडित करने वाला survivorship bias मौजूद है
- Jonathan Blow का व्याख्यान Preventing the Collapse of Civilization सुझाया गया
- software engineers को Luddite कहना ग़लत है। ज़्यादातर engineering दरअसल हस्तशिल्प जैसे काम के अधिक करीब है, दोहराव वाला और अनुभव-आधारित
- औद्योगिकीकरण से पहले के दौर में लौटने की बात सिर्फ़ अभिजात nostalgia है। उल्टा, LLM custom software की accessibility आम लोगों के लिए खोलता है
LLM ने जो वास्तविकता उजागर की है, वह यह है कि अधिकांश programming दरअसल boilerplate code है
असली मूल्य ऊपरी स्तर के छोटे innovations में है
- अगर development speed सच में महत्वपूर्ण होती, तो संगठनात्मक ढाँचा पहले ही बदल चुका होता। असली समस्या अकार्यकुशल bureaucracy है
- libraries और abstraction उल्टा code bloat पैदा करते हैं। LLM ने भी ऐसा ही कोड सीखा है, इसलिए साफ़-सुथरा कोड बनाना उसके लिए मुश्किल है
- दोहराव वाले कोड में भी कारीगरी हो सकती है। बुनियाद मज़बूत करना भी मूल्यवान काम है
- पहले coding के चरणों को ‘क्या करना है चुनना–लिखना–debugging’ में बाँटा जाता था, लेकिन अब वह समय से कटा हुआ लगता है
- किताबें भी अंततः सैकड़ों पन्नों के boilerplate से भरे सरल शोधपत्र जैसी ही हैं
LLM का आदर्श उपयोग शिक्षक की भूमिका है। कोड की जगह concepts जल्दी सिखाने वाले टूल के रूप में इसका इस्तेमाल बेहतर है
- अभी वही समय है। Prompt में साफ़ लिखना चाहिए: “कोड मत लिखो, एक अच्छे शिक्षक बनो”
- लेकिन अविश्वसनीय शिक्षक से सीखना बेचैन करने वाला अनुभव है। धीरे सही, पर स्थिर सीखना ज़्यादा बेहतर लगता है
कारीगरों के cheese या ham की तरह, भविष्य में शायद Artisanal Coding भी हो
- ‘Handmade Network’ पहले से ही ऐसी philosophy पर काम कर रहा है। LLM तो बस औद्योगिकीकृत software development का अंतिम पड़ाव है
  यानी यह इंसानों की जगह specifications को code में बदलने वाली मशीन बन गया है
- Steve Gibson जैसे assembly को सीधे हाथ से कोड करने वाले उदाहरण सबसे नज़दीकी मिसाल हैं। लेकिन यह कभी मुख्यधारा नहीं था
- geographical indication जैसी परंपरा-सुरक्षा वाली दलीलों का आधार ज़्यादातर कमज़ोर होता है
कठोर सच्चाई यह है कि किसी को हमारे कोड खुद में दिलचस्पी नहीं है
ज़्यादातर लोग सिर्फ़ यह देखते हैं कि वह काम करता है या नहीं, तेज़ है या नहीं, और लागत कितनी है। अंततः हम फैक्टरी मज़दूरों के ज़्यादा करीब हैं
यह वैसा ही है जैसा घड़ीसाज़ ने automatic lathe को देखकर महसूस किया होगा
- लोग गुणवत्ता की परवाह नहीं करते, जब तक कि technical debt से सिस्टम ढह न जाए
- enterprise software में ‘बस काम कर जाए’ काफ़ी है, लेकिन consumer products में quality और polish महत्वपूर्ण हैं
- मैं कोड को debt मानता हूँ। जब उसकी ज़रूरत न रहे और उसे निडरता से फेंक दिया जाए, तो खुशी होती है
- coding न तो रचनात्मक है, न glamorous। दुनिया सिर्फ़ यह देखती है कि “क्या यह अच्छी तरह काम करता है, तेज़ है, सस्ता है, और प्रतियोगी से पहले लॉन्च होता है?”
  अंततः जिस रोमांटिक आख्यान को हमने ‘रचनात्मक पेशा’ मानकर बचाए रखा था, वह टूट रहा है
यह सारी चर्चा अंततः TTP(Time To Penis) meme की तरह बार-बार लौटने वाली मानवीय प्रकृति की समस्या लगती है
यह लेख सचमुच यथार्थवादी और संतुलित दृष्टिकोण दिखाता है

parkindani 2026-03-06

मुख्य लेख भी और टिप्पणियां भी हैरान कर देने वाली हद तक नकारात्मक हैं। लगता है जैसे किसी ने भी Claude Code चलाकर देखा ही नहीं है..