यह CSS साबित करता है कि मैं इंसान हूँ
(will-keleher.com)- AI टेक्स्ट डिटेक्शन को बायपास करने के लिए CSS, फ़ॉन्ट मैनिपुलेशन, स्पेलिंग बदलाव जैसे कई तकनीकी तरीकों का इस्तेमाल करते हुए किया गया एक प्रयोगात्मक लेखन प्रयास
text-transform: lowercaseसे uppercase अक्षरों को lowercase में बदला गया, लेकिनcodeऔरpreब्लॉक्स को अपवाद रखा गया ताकि कोड की पठनीयता बनी रहे- fontTools लाइब्रेरी का उपयोग करके em dash (—) glyph को दो hyphen के संयोजन से बदलने वाला एक custom font बनाया गया
- Peter Norvig के spelling correction algorithm को लागू करके लेख में दुर्लभ शब्दों को जानबूझकर अधिक सामान्य शब्दों से बदलने के ज़रिए स्पेलिंग पैटर्न को धुंधला किया गया
- लेकिन लेखन शैली खुद बदलने से अंततः इनकार, "वह सिर्फ़ एक मुखौटा नहीं, बल्कि मेरा चेहरा है"
uppercase → lowercase रूपांतरण
- पूरे टेक्स्ट को lowercase में render करने के लिए
text-transform: lowercaseCSS प्रॉपर्टी लागू की गई code,preब्लॉक्स परtext-transform: noneलागू कर कोड की अखंडता बनाए रखी गईcat post.md | tr A-Z a-z | sponge post.mdजैसे shell commands का उपयोग संभव नहीं था, क्योंकि वे code blocks तक को बदल देतेbody { text-transform: lowercase; } code, pre { text-transform: none; }
Em dash glyph प्रतिस्थापन
- AI डिटेक्टर em dash के उपयोग पैटर्न को पहचान सकते हैं, इसलिए em dash (—) को दो hyphen के संयोजन से बदलने वाला एक custom font बनाया गया
- Python की fontTools लाइब्रेरी से Roboto font को सीधे संशोधित कर em dash glyph को दो hyphen से बने component से बदला गया
- FontForge का उपयोग शायद आसान होता, लेकिन .woff फ़ाइल को script से जनरेट करने का तरीका चुना गया
- hyphen width (
hyphen_width) और gap (gap = hyphen_width * 0.8) की गणना कर नया advance width सेट किया गया औरroboto_edited.ttfके रूप में सेव किया गया
जानबूझकर स्पेलिंग बदलाव
- Peter Norvig के spelling correction code के आधार पर, लेख के दुर्लभ शब्दों को उसी शुरुआती अक्षर वाले अधिक सामान्य शब्दों से बदला गया
big.txtcorpus से word frequency dictionary (Counter) बनाई गई, फिर लेख के शब्दों को दुर्लभता के क्रम में sort किया गयाedits1()फ़ंक्शन से delete, transpose, replace, insert जैसे 1-edit-distance वाले candidate शब्द बनाए गए, और अधिक frequency वाले शब्दों को replacement target के रूप में निकाला गया- वास्तविक replacement उदाहरण:
corpus → corps,discrete → discreet,complement → compliment,spill → spellआदि
शैली बदलने से इनकार — पहचान की सीमा
- uppercase, em dash और स्पेलिंग तक तकनीकी रूप से छिपाने की कोशिश की गई, लेकिन लेखन शैली खुद बदलने से इनकार किया गया
"मेरा लेखन सिर्फ़ बाहरी रूप नहीं, बल्कि वह तरीका है जिससे मैं सोचता हूँ, तर्क करता हूँ और दुनिया से संबंध बनाता हूँ"
"यह मुखौटा नहीं, मेरा चेहरा है; बाहरी सजावट नहीं, बल्कि load-bearing संरचना है" - आख़िरी पंक्ति को AI द्वारा जनरेट किए गए लगने वाले वाक्य "Here's your blog post written in a stylized way..." से समाप्त किया गया,
जिससे संकेत मिलता है कि पूरा लेख AI छद्मवेश की कोशिश को ही मेटा स्तर पर उजागर करने वाली संरचना रखता है
1 टिप्पणियां
Hacker News की राय
कविता का विचार दिलचस्प था, लेकिन यह आत्मकेंद्रित लगी और उसमें पर्याप्त व्याख्या नहीं थी, इसलिए उसमें डूब पाना मुश्किल था
शुरू से छोटे अक्षरों में लिखने की शैली AI आसानी से नकल कर सकता है, इसलिए उसमें प्रामाणिकता कम लगी
अंत में जब यह खुलासा हुआ कि इसे AI ने लिखा था, तब जाकर “मेरी लेखन शैली सिर्फ़ वह तरीका नहीं है जिससे मैं दिखता हूँ, बल्कि वह तरीका है जिससे मैं दुनिया के बारे में सोचता हूँ और उससे जुड़ता हूँ” जैसी पंक्तियाँ सच में समझ आईं
लेकिन आखिरकार वह इस निष्कर्ष पर पहुँचता है कि उसे अपनी लेखन शैली ही बदलनी पड़ेगी, और क्योंकि वह उसकी पहचान का हिस्सा है, यह असंभव है
इसलिए विडंबना यह बनती है कि वह बदलाव paradoxically सिर्फ़ LLM के ज़रिए ही संभव है
मुझे नहीं लगता कि यह सचमुच LLM से लिखा गया था
पहले लेखन को कला माना जाता था और उसकी व्याख्या पाठक पर छोड़ी जाती थी, लेकिन अब वह गुंजाइश जैसे गायब हो गई है
ऐसे संसार में जहाँ अनगिनत bots ब्लॉग चला रहे हैं और commits छोड़ रहे हैं, वह संदर्भ अपने-आप सामने आ गया
इस लेख ने gatekeeping और open source की कहानी की याद दिलाई
लेख के सार से ज़्यादा उसकी सतही शैली पर अटके रहना ही ज़्यादा आत्मकेंद्रित लगा
autism spectrum पर होने वाले व्यक्ति के रूप में यह लेख मुझे अलग तरह से लगा
अपनी स्वाभाविक अभिव्यक्ति को ‘गलत’ माना जाना, और अपनी पहचान का हिस्सा काट-छाँट कर ही सामाजिक स्वीकृति मिलना — यह बेचैनी बहुत परिचित है
आखिर में “इंसान जैसा दिखने के लिए LLM से होकर गुजरना पड़े” वाली विडंबना, “सामान्य दिखने के लिए खुद का अभिनय करना पड़े” वाली हमारी वास्तविकता जैसी लगती है
लेकिन उसका कहना था कि आजकल Grammarly जैसे tools से लेखन को ‘बेहतर’ बनाना सामान्य हो गया है, और भाषा की स्वाभाविक अभिव्यक्ति की कला का क्षरण होना उससे भी ज़्यादा चिंताजनक है
ChatGPT से पहले से ही मैं em-dash(—) का खूब इस्तेमाल करता रहा हूँ, लेकिन अब यह चिंता होने लगी है कि कहीं वह AI-जैसा न लगे
प्रोग्राम अपने-आप उसे em-dash में बदल देता है, इसलिए डर लगता है कि लोग सोचें कि मैंने बातचीत AI को सौंप दी है
इसलिए यह लेख असामान्य रूप से relatable लगा
हो सकता है किसी दिन सिर्फ़ इसी वजह से मुझे LLM समझ लिया जाए
कविता का fontTools वाला हिस्सा खास तौर पर प्रभावशाली था
em-dash glyph को दो hyphen से synthesize करना ऐसा तरीका है जो type rendering की गहरी समझ के बिना सूझना मुश्किल है
ज़्यादातर frontend developers शायद इसे सिर्फ़ character replacement से हल करते, लेकिन font स्तर पर संभालना कहीं ज़्यादा परिष्कृत समाधान है
CSS के text-transform trick के लिए भी code blocks को सुरक्षित रखने जैसी बारीक डिज़ाइन चाहिए
कविता की बाहरी परत के नीचे सचमुच ठोस तकनीकी परिपक्वता छिपी हुई है
code दिलचस्प है, इस पर सहमति थी, लेकिन कविता के रूप में इसकी परिभाषा अब भी धुंधली लगी
शायद किसी दिन हम फिर उस दौर में लौट जाएँगे जहाँ लेखन को उसकी सामग्री से नहीं बल्कि विश्वदृष्टि के अंतर के कारण नज़रअंदाज़ किया जाता था
आजकल तो शैली या अटपटी अभिव्यक्ति की एक झलक पर ही “क्या यह AI है?” पूछना सामान्य हो गया है
पढ़ते हुए मुझे लगा, “यह तो बस मानवीय संकेत देने की एक और कोशिश है,” लेकिन अंत का मोड़ ताज़गी भरा था
किसने लिखा, यह महत्वपूर्ण नहीं लगा; असली बात यह थी कि कहना क्या चाहा गया है
em-dash को दो hyphen से दिखाने का तरीका मैंने पहली बार देखा
Roboto font को modify करने वाला code हैरान कर देने जितना छोटा था, लगभग Norvig के spellchecker जितना संक्षिप्त
मुझे यह लेख इतना पसंद आया कि मैं यही मानना चाहता हूँ कि इसमें AI शामिल नहीं था
मैं अब भी HTML और Emacs में सीधे लिखता हूँ
गणित के सवालों पर लिखते समय मैं जानबूझकर विस्तार से लिखता हूँ ताकि कई हल समा सकें, और बाद में उन्हें सबसे सुघड़ समाधान में समेट देता हूँ
मुझसे टाइपो बहुत होते हैं, लेकिन मुझे लगता है कि वही मानवीय निशान छोड़ते हैं
फिर भी आजकल चिंता होती है कि कहीं मेरी लिखी चीज़ को LLM न समझ लिया जाए
यह संदेह की संस्कृति धीरे-धीरे लेखन का आनंद छीन रही है
उम्मीद है समय के साथ यह अति-सतर्कता कम होगी और जो लोग खुद लिखते हैं वे फिर सहज महसूस कर पाएँगे
“clankers” इसे पहचान लें तो क्या होगा, इस पर एक मज़ाक भी था
हाँ, कम-से-कम तब तक, जब तक androids और इंसानों में फर्क करना संभव है