- Karlsruhe Institute of Technology के Institute of Theoretical Computer Science के छात्र Jan Strehmel द्वारा प्रस्तुत शोध।
- गालियों वाले 3,800 से अधिक repositories और बिना गालियों वाले 7,600 से अधिक repositories एकत्र किए गए।
- C/C++ code quality measurement tool SoftWipe का उपयोग करके कोड की गुणवत्ता मापी गई और विभिन्न सांख्यिकीय तरीकों से उसका विश्लेषण किया गया।
- परिणामस्वरूप, यह पाया गया कि गालियों वाले कोड की गुणवत्ता औसतन अधिक थी।
- परिकल्पना यह है कि गालियों का उपयोग कोड की जटिलता के साथ भावनात्मक जुड़ाव दिखाता है, और इससे कोड का अधिक आलोचनात्मक विश्लेषण होकर बेहतर कोड बनता है।
- लेकिन शोध की समीक्षा में कहा गया कि गालियों और कोड गुणवत्ता के बीच संबंध स्पष्ट रूप से खोजना कठिन है, और अध्ययन की प्रतिनिधिकता भी अपर्याप्त है।
11 टिप्पणियां
मुझे Quake के vector calculation algorithm का code याद आ गया।
float Q_rsqrt( float number )
{
long i;
float x2, y;
const float threehalfs = 1.5F;
x2 = number * 0.5F;
y = number;
i = * ( long * ) &y; // evil floating point bit level hacking
i = 0x5f3759df - ( i >> 1 ); // what the fuck?
y = * ( float * ) &i;
y = y * ( threehalfs - ( x2 * y * y ) ); // 1st iteration
// y = y * ( threehalfs - ( x2 * y * y ) ); // 2nd iteration, this can be removed
return y;
}
‘अगर कोई गाली अच्छी तरह देता है, तो उसे ठीक से शिक्षा नहीं मिली होगी’ जैसी आम धारणा के विपरीत, एक अध्ययन में पाया गया कि जो लोग गालियों का कुशलता से इस्तेमाल करते हैं, उनकी शब्द-संपदा तुलनात्मक रूप से बेहतर होती है." - https://www.mk.co.kr/news/society/7115122
ऐसे अध्ययन भी हैं जिनमें कहा गया है कि जो लोग गालियां अच्छी तरह देते हैं, उनकी शब्द-संपदा अधिक होती है। अगर एक व्यक्ति सिर्फ 'नहीं' कहता है, और दूसरा 'नहीं' और 'नहीं sex' में फर्क करके दोनों का इस्तेमाल करता है, तो बाद वाले की शब्द-संपदा और अभिव्यक्ति-क्षमता ज़्यादा बेहतर लगती है।
यह लेख पढ़ने के बाद मैंने commit message में commit type को
feat:की जगहf-wordसे एक जैसा कर दिया।क्या ऐसा नहीं हो सकता कि कोड किसी ऐसे बेहद प्रतिभाशाली व्यक्ति ने लिखा हो, जो सहकर्मी का कोड देखकर गाली दिए बिना रह ही नहीं पाता?
या फिर किसी ऐसे व्यक्ति ने कोड लिखा हो जिसकी काबिलियत इतनी हो कि वह कोड में गालियां ठूंस दे तब भी कोई उससे कुछ कह न सके, हा हा
मैं भी ऐसा ही सोचता हूँ। बहुत आम स्तर का व्यक्ति तो भला comment में गाली लिखने की हिम्मत भी नहीं करेगा... शायद वह खुद ही self-censorship कर लेगा। लगता है कि सिर्फ कुछ बेहतरीन programmers में से, जिनमें संयम नहीं है या जो जानबूझकर संयम नहीं रखते, वही थोड़े लोग गाली छोड़ते होंगे। मूल comment को देखें तो उसमें Torvalds का ज़िक्र भी है, lol
यह तो क्लिकबेट लेख लिखने वाले पत्रकारों को पसंद आने वाला विषय है।
यह कुछ अजीब-सा रिसर्च लगता है। गाली वाले comments देखें तो मूड खराब हो जाएगा -.-;
मूल रूप से इस शोध में भी गाली-गलौज और code quality के बीच सहसंबंध बताया गया है, लेकिन कारण-परिणाम संबंध नहीं है, इसलिए गाली देने से code quality बेहतर हो जाती है, ऐसा नहीं कहा गया है.
और अभी निष्कर्ष निकालना थोड़ा जल्दबाज़ी होगी, ऐसा भी कहा गया है कि और शोध की ज़रूरत है.
Hacker News पर भी इसको लेकर काफी पक्ष-विपक्ष की बहस है. कुछ लोग कहते हैं कि सच में ऐसा लगता है, और कुछ कहते हैं कि नहीं...
एक टिप्पणी में यह भी कहा गया कि सुरक्षित माहौल में, यानी जहाँ दमन न हो, लोग गाली देते हैं, और ऐसे माहौल में बेहतर code quality बनती है...
यह भी कहा गया कि गाली देने से भावनात्मक तनाव थोड़ा निकल जाता है, इसलिए code quality पर ज़्यादा ध्यान दे पाना संभव होता है.
यह बात सही है या नहीं, पता नहीं, लेकिन कहा जा रहा है कि OpenJDK में भी गालियाँ हैं.
पेपर का AI सारांश
PDF में चर्चा की गई है कि open source code में गाली-गलौज का इस्तेमाल code quality से जुड़ा है या नहीं।
इसकी जांच के लिए, लेखक ने GitHub से 3,800 से अधिक ऐसे C repositories और 7,600 से अधिक ऐसे C repositories crawl किए जिनमें गाली-गलौज नहीं थी।
लेखक ने repositories की code quality को coding standards के अनुपालन के आधार पर मात्रात्मक रूप से मापने के लिए SoftWipe नामक टूल का उपयोग किया।
नतीजों से, सांख्यिकीय सत्यापन के आधार पर, यह सामने आया कि गाली-गलौज वाले repositories का code quality score, बिना गाली-गलौज वाले repositories की तुलना में काफी अधिक था।
लेखक ने यह परिकल्पना दी कि गाली-गलौज का इस्तेमाल प्रोग्रामरों की भावनात्मक भागीदारी और code के अधिक गहन विश्लेषण को दर्शाता है, जिससे बेहतर गुणवत्ता मिलती है।
हालांकि, लेखक यह भी मानते हैं कि सहसंबंध का अर्थ कारण-परिणाम संबंध नहीं होता, और गाली-गलौज अपने-आप code quality में सुधार नहीं करती।
यह अध्ययन दिलचस्प शुरुआती नतीजे देता है, लेकिन लेखक कहते हैं कि बड़ा dataset हासिल करना (जिसमें C++ code शामिल हो और गाली-गलौज की अधिक सटीक पहचान हो),
और code quality के नतीजों पर code lines, stars, और गाली-गलौज की संख्या के प्रभाव की अधिक विस्तार से जांच करना, और अधिक अंतर्दृष्टि दे सकता है।
संक्षेप में, इस अध्ययन का मुख्य निष्कर्ष यह है कि open source C code में गाली-गलौज के इस्तेमाल और उच्च code quality score के बीच सांख्यिकीय रूप से महत्वपूर्ण सहसंबंध पाया गया।
हालांकि, लेखक सावधान करते हैं कि इस सहसंबंध के कारणों और इसके व्यावहारिक निहितार्थों को बेहतर समझने के लिए अतिरिक्त शोध की आवश्यकता है।
शायद ऐसा इसलिए भी हो सकता है क्योंकि C की major culture, aggressive criticism की culture थी.