- LLM-आधारित कोडिंग टूल्स के आसपास की भारी-भरकम hype के बावजूद, वास्तविक software development outputs की गुणवत्ता में कोई बड़ा सुधार नहीं हुआ है, बल्कि जालसाज़ी (forgery) के करीब पहुँचने वाले outputs की भरमार हो गई है
- LLM जो मूल काम करता है, वह है किसी व्यक्ति को अपने या दूसरों के संभावित outputs की नकल करके उन्हें अधिक तेज़ी से तैयार करने देना; समस्या तब पैदा होती है जब इन्हें असली चीज़ के विकल्प के रूप में इस्तेमाल किया जाता है
- open source projects को AI-जनित low-quality PRs की वजह से public contributions बंद करने या bug bounty रोकने जैसी वास्तविक हानि झेलनी पड़ रही है
- game industry उपभोक्ताओं के नेतृत्व में AI content labeling और filtering की मांग कर प्रभावी ढंग से प्रतिरोध कर रही है, जबकि software engineers इसे लगभग बिना बचाव के स्वीकार कर रहे हैं
- अगर LLM को झूठ बोलना बंद करना है, तो सही source attribution अनिवार्य है, लेकिन मौजूदा model architecture में यह तकनीकी रूप से असंभव है
AI के इस्तेमाल की अनिवार्यता वाले फ्रेम के खिलाफ तर्क
- उद्योग की hype के अनुसार पारंपरिक software development खत्म हो चुका है, लेकिन कई वर्षों तक LLM-आधारित tools इस्तेमाल करने के बाद भी परिणाम पहले जैसे ही हैं
- तकनीक के इर्द-गिर्द बेहद ज़्यादा hype भारी निवेश को खींचती है, और वही निवेश बदले में और अधिक hype की मांग करता है — एक चक्रीय संरचना
- नए models लगातार इसीलिए train किए जा रहे हैं ताकि वे उन वादों को पूरा कर सकें जिन्हें पहले से रिटायर हो चुके models को पूरा करना चाहिए था
- "AI का इस्तेमाल न करना भी पूरी तरह ठीक है" — यह कोई पुरातन सोच नहीं है; बल्कि AI अपनाने वालों की तुलना में यह कम तनावपूर्ण और अधिक संतोषजनक हो सकता है
शिल्पकौशल (Craft) vs mass production (Kraft): जालसाज़ी का फ्रेम
- LLM के काम को लेकर कई तरह के फ्रेम मौजूद हैं (मदद, रचनात्मकता, उत्पादकता vs आलस्य, disposable काम, चोरी), लेकिन हैरानी की बात है कि जो शब्द गायब है, वह है जालसाज़ी (forgery)
- Van Gogh शैली में चित्र बनाकर उस पर उसका हस्ताक्षर डालना जालसाज़ी है, कानूनी दस्तावेज़ की नकल करना जालसाज़ी है, data में हेरफेर वाला शोध जालसाज़ी है — जालसाज़ी वस्तु और उसके बनाए जाने के तरीके दोनों में निहित होती है
- LLM ऐसे tools हैं जो व्यक्तियों को अपने या दूसरों के संभावित outputs की जाली प्रतियाँ अधिक तेज़ी से बनाने में सक्षम बनाते हैं
- नकल अपने-आप में अभिव्यक्ति की स्वतंत्रता के तहत वैध हो सकती है, लेकिन समस्या तब पैदा होती है जब जाली वस्तु को असली के विकल्प के रूप में इस्तेमाल किया जाए
- Santa Claus के नाम से चिट्ठी "जाली" बनाओ तो गिरफ़्तार नहीं होगे, लेकिन बेहद परिष्कृत "नकली मुद्रा" को सिर्फ़ संग्रहणीय वस्तु कहकर रखना भी कई न्यायक्षेत्रों में स्वीकार्य नहीं है
मूल-स्थान संरक्षण और गुणवत्ता मानकों की उपमा
- फ़्रांस का "Brie de Meaux" जैसे origin-controlled food products पारंपरिक निर्माण पद्धति, उच्च-गुणवत्ता raw materials और विशिष्ट भौगोलिक origin — तीनों की मांग करते हैं
- अगर विदेशी उत्पादन की अनुमति दे दी जाए, तो इसका नतीजा लगभग तय है: सस्ती नकली वस्तुओं की बाढ़, जो असली brand को नुकसान पहुँचाएगी और पीढ़ियों से चली आ रही दुर्लभ स्थानीय विशेषज्ञता को भी ख़तरे में डालेगी
- सिर्फ़ व्यक्तिगत उपभोक्ता का निर्णय बाज़ार के सही कामकाज की गारंटी नहीं दे सकता; दुकानों में क्या रखा जाएगा, यह पहले से ही उपभोक्ता नियंत्रण से बाहर के कई कारकों से तय होता है
- artisan cheese की गुणवत्ता एक आधुनिक ढंग से संचालित पूरी supply chain का प्रतिनिधित्व करती है; इसे कहीं और दोहराने के लिए human capital, infrastructure और agriculture में भारी निवेश चाहिए
- हर समाज को "पारंपरिक artisan cheese" और "औद्योगिक रसायनों से बने नकली अंडों" के बीच कहीं न कहीं रेखा खींचनी ही पड़ती है; और सिर्फ़ वही समाज, जो food craftsmanship का मूल्य समझते और बचाते हैं, 70% से अधिक obesity rate (Nauru उदाहरण) जैसी स्थिति से बच सकते हैं
open source और रोज़मर्रा की coding में AI slop का नुकसान
- open source maintainers ने सबसे पहले दुष्प्रभाव महसूस किए — पहले से प्रेरित contributors ढूँढना और उन्हें project के goals तथा engineering mindset के अनुरूप ढालना पहले ही कठिन था
- GitHub résumé चमकाने के लिए slop-coded PRs भेजने वाले contributors सामने आने लगे
- tldraw ने public contributions बंद कर दिए, curl project ने bug bounty रोक दी, और कुछ अन्य projects ने नकली contributors का मज़ाक उड़ाकर प्रतिक्रिया दी
- vibe-coding करने वाले सहकर्मी के साथ रोज़मर्रा के काम में भी ऐसा ही असर दिखता है — लगता है कि नया कर्मचारी जल्दी ramp up हो रहा है, लेकिन वास्तव में वह शुरुआती सीखने की प्रक्रिया bot पर डाल रहा होता है
- 2026 तक, अगर कोई junior employee बहुत विस्तार से समझाया गया और comments से भरा PR भेजे, तो उसके हर शब्द पर शक करना चाहिए
senior engineers और 10x/100x उत्पादकता का भ्रम
- कहा जाता है कि AI इस्तेमाल करने वाले अनुभवी veterans पहले से 10x, 100x अधिक code लिख रहे हैं, लेकिन वे अभी भी यह नहीं समझते कि जिस भी code line को आप चलाते और जिस पर निर्भर करते हैं, वह liability है
- यह दावा कि "AI coding इसलिए शानदार है क्योंकि agent को जो कुछ चाहिए वह codebase में समझाया हुआ है" — घातक रूप से ग़लत दावा है; अगर यह सच होता, तो असली coding work बचता ही नहीं
- मूल अंतर इस बात में है कि engineer ने अपने करियर का ज़्यादातर हिस्सा दूसरे software द्वारा पैदा की गई समस्याएँ सुलझाने में बिताया है, या उन समस्याओं को हल करने में जो software से पहले भी लोगों के पास थीं
- सिर्फ़ दूसरा रास्ता ही व्यक्ति को समस्या की वास्तविक constraints और user needs के बारे में सोचना सिखाता है
- जब software खुद ही उद्देश्य बन जाता है, तो आप ऐसी over-engineered cloud infrastructure बना बैठते हैं जिसे वास्तव में $10/month VPS से चलाया जा सकता था
slop code की विशेषताएँ और उद्योग की प्रतिक्रिया
- craftsmanship वाले engineers review के दौरान slop को आसानी से पहचान लेते हैं — अत्यधिक दोहराव वाला code, अनावश्यक जटिलता, refactoring से इनकार जैसी रूपों में
- यह भी देखा गया है कि senior लोग, वर्षों के अनुभव के बावजूद, vibe coding के चलते शर्मनाक गलतियाँ करते हैं और उन्हें आगे बढ़ा देते हैं
- Microsoft के Co-pilot Discord में "Microslop" जैसे अपमानजनक शब्द पर रोक लगाने की घटना — जहाँ user backlash को "spam" या "harmful" बताकर फ्रेम किया गया, यानी वादों को वास्तविक परिणामों से ज़्यादा महत्वपूर्ण माना गया
- इन tools को "addictive" या "सबसे अच्छा दोस्त जो आपके पास हो सकता है" कहा जाता है, लेकिन इससे जुड़ा रचनात्मकता और उपलब्धि का कोई Cambrian explosion नज़र नहीं आता
software industry की संरचनात्मक समस्याएँ और AI की भूमिका
- AI से जो चीज़ें बन रही हैं, उनमें ज़्यादातर वह glue code है जिसकी ज़रूरत PC revolution के बाद software applications के ज़्यादा closed, fragmented और corporate होने से पड़ी
- HTTP API ऐसी कमज़ोर documentation वाले JSON blobs मांगते हैं जिनकी schema हर रात बदल जाती है, इसलिए वे असली openness नहीं दे पाते
- कई कंपनियाँ अब भी मुख्यतः Excel पर चलती हैं, और JSON के लिए Excel जैसा कोई साधन मौजूद नहीं है
- कहा गया था कि SQL business को proprietary tools पर निर्भरता से मुक्त करेगा, लेकिन वह विफल रहा; इतिहास खुद को दोहरा रहा है
- जब vibe-coded Electron apps अब भी multi-platform native apps पर तरजीह पाते हैं, तब 100x productivity की असलियत पर सवाल उठता है
- जब Apple जैसी कंपनी भी नए OS में उचित forms और icon system बनाए नहीं रख पा रही, तो web slop पर train की गई AI से उम्मीद और भी कम हो जाती है
game industry का प्रभावी प्रतिरोध
- software engineers बिना life jacket के पानी में कूद पड़े, लेकिन game industry उपभोक्ताओं के नेतृत्व में प्रभावी प्रतिरोध कर रही है
- कई game titles ने बिना label वाले AI content पर माफ़ी माँगी और उसे हटाया
- Steam के पास AI content पर स्पष्ट policy है, और SteamDB AI-generated games को filter करने के tools देता है
- Steam policy को हाल ही में update किया गया ताकि player को दिखाए जाने वाले content को generate न करने वाले development tools के "efficiency improvement" उपयोग को इससे बाहर रखा जाए
- game market के प्रभावी प्रतिरोध के दो कारण हैं:
- digital distribution का शुद्ध D2C (direct-to-consumer) market — gamers के पास पूरा चयनाधिकार है, और transparency की मांग करने वाले tastemakers भी वही gamers हैं
- अधिकांश games कलात्मक होते हैं, और उन्हें एक खास artistic appeal के लिए खरीदा जाता है — कला में नकल को मूल रचना का मूल्य घटाने और credit चुराने के रूप में देखा जाता है
code reuse और कलात्मक मौलिकता का विरोधाभास
- code आम तौर पर reuse से नुकसान नहीं उठाता; infrastructure के मामले में तो यह अक्सर फ़ायदे का कारण बन सकता है
- यही वजह है कि open source projects, प्रतिभाशाली कलात्मक creatives को आकर्षित करने के लिए खास तौर पर अनुपयुक्त हैं — बिना लागत साझा करने की भावना का मतलब है कि artistic design को उसके मूल संदर्भ से काटकर तुरंत उठा लिया जाएगा
- पारंपरिक procedural generation एक उल्लेखनीय precedent है, और सामान्यतः यह उम्मीदों पर खरी नहीं उतरी
- No Man's Sky (2016 version) का मामला — सीमित स्रोतों से exponential content पैदा करने का वादा अंततः अपने ही output की विविधता को बेकार बना देता है
generative AI, pirate libraries, और कानूनी धुंधलापन
- यह स्वाभाविक है कि कलाकार generative AI को mass plagiarism कहकर निंदा करें, और यह भी स्वाभाविक है कि tech entrepreneurs और data curators इसे न समझें और pirate shadow libraries पर models train करें
- Nvidia पर Anna's Archive के विशाल pirate book collection तक high-speed access deal करने की कोशिश का आरोप है
- outputs साधारण, भद्दे और संदिग्ध क्यों लगते हैं, इसका स्पष्ट कारण है — training sources के विविध samples खुद मशीन के लिए slop से ज़्यादा कुछ नहीं हैं
- इससे यह तय करना असंभव हो जाता है कि क्या citation है, क्या hallucination है, और क्या मौलिक है — एक तरह की plausible deniability बन जाती है
- AI content पर AI-generated label या watermark लगाना अधिकतर जवाबदेही से बचने का तरीका है, वास्तविक जिम्मेदार disclosure नहीं
- अगर vibe coding को स्वीकार्य और न्यायसंगत ठहराना है, तो engineer को यह मानना पड़ेगा कि उसका अपना output disposable है, रचनात्मक नहीं है, और credit के लायक नहीं है — यह एक विरोधाभासी स्थिति है
source attribution ही समाधान
- किसी भी अदालत को AI output को पूरी तरह वैध या copyright-योग्य घोषित नहीं करना चाहिए था; बिना source वाले outputs को जालसाज़ी माना जाना चाहिए
- LLM समस्या का समाधान स्पष्ट है, लेकिन लगभग अप्राप्य: LLM को reasoning के साथ सही source attribution करना होगा
- इससे सिर्फ़ कलात्मक पक्ष ही नहीं, बल्कि यह भी उजागर हो सकता है कि vibe code का बड़ा हिस्सा मौजूदा codebases से copy/paste किया गया है, बिना मूल लेखक, license या links के
- मौजूदा models में वास्तविक attribution तकनीकी रूप से असंभव है — LLM का source का उल्लेख और citation देने की क्षमता खुद एक emergent property है, जो संकलित data से उभरती है
- LLM केवल तब source cite कर सकता है जब वह text के मौजूदा स्थान पर उपयुक्त लगे; यानी यह अक्सर सिर्फ़ उन्हीं चीज़ों को cite करने का citation role-play है जिन्हें आम तौर पर cite किया जाता है
- attribution की मांग के निहितार्थ बहुत बड़े हैं: अगर weights attributable हों और forward pass auditable हो, तो backpropagation कैसी दिखेगी? वह
int4 में समा नहीं सकेगी
- "AI detection tools" मूलतः इसी समस्या को उल्टी दिशा से हल करने की कोशिश कर रहे हैं
- यह अपने-आप में विडंबना है कि World Wide Web और उस पर काम करने वाले Google-scale search engines के बाद अगली बड़ी तकनीक ऐसी है जो डिज़ाइन के स्तर पर जानकारी के स्रोत नहीं बता सकती
- अगर machine को झूठ बोलना बंद करना है, तो उसे स्रोत सही ढंग से cite करने होंगे — और AI कंपनियों को भी
अभी कोई टिप्पणी नहीं है.