repo-slopscore: कमिट इतिहास के विश्लेषण से Git रिपॉज़िटरी में AI/LLM योगदान की पहचान
(slopscan.ava.pet)- repo-slopscore को Git रिपॉज़िटरी के कमिट इतिहास का विश्लेषण करके AI/LLM योगदान का पता लगाने वाले टूल के रूप में पेश किया गया है
- सेवा होम, रिपॉज़िटरी स्कैन, और सोर्स कोड लिंक प्रदान करती है, तथा सोर्स कोड codeberg.org/polyphony/repo-slopscore पर सार्वजनिक है
- स्कैन की गई कुल रिपॉज़िटरी की संख्या 3058 दिखाई गई है, और हालिया स्कैन सूची रिपॉज़िटरी URL के साथ UTC विश्लेषण समय भी दिखाती है
- स्कैन का दायरा सिर्फ GitHub तक सीमित नहीं है; इसमें Codeberg, Bitbucket, SourceHut, git.kernel.org, chromium.googlesource.com जैसे कई Git hosting शामिल हैं
- कुछ रिपॉज़िटरी में स्लैश या
.gitsuffix के अंतर के कारण डुप्लिकेट जैसे आइटम मौजूद हैं, इसलिए सूची की व्याख्या करते समय URL normalization के अंतर को ध्यान में रखना चाहिए
मुख्य बिंदु
- repo-slopscore को कमिट इतिहास विश्लेषण के आधार पर Git रिपॉज़िटरी में AI/LLM योगदान का पता लगाने वाली सेवा के रूप में प्रस्तुत किया गया है
- सार्वजनिक पेज रिपॉज़िटरी स्कैन सुविधा, हाल ही में स्कैन की गई रिपॉज़िटरी की सूची, और सोर्स कोड लिंक प्रदान करता है
- कुल स्कैन की गई रिपॉज़िटरी की संख्या 3058 दिखाई गई है
- हालिया स्कैन सूची में helix-editor/helix, Agoric/Agoric-sdk, FiloSottile/age, github/copilot-cli, fish-shell/fish-shell, tmux/tmux, httpie/cli आदि शामिल हैं
- हर स्कैन परिणाम लिंक
slopscan.ava.pet/repo/के नीचे URL-encoded मूल रिपॉज़िटरी पते को जोड़कर बनाया गया है
महत्वपूर्ण संदर्भ
- स्कैन का दायरा GitHub तक सीमित नहीं है, बल्कि इसमें Codeberg, Bitbucket, SourceHut, git.kernel.org, chromium.googlesource.com, gcc.gnu.org, gerrit.wikimedia.org, git.ffmpeg.org जैसे कई hosting domains शामिल हैं
- सूची में OpenRGB, coreboot, gentoo/gentoo, guix/guix, wlroots, forgejo, ziglang/zig, FFmpeg, FreeCAD, WebKit, NixOS/nixpkgs जैसे प्रसिद्ध open source प्रोजेक्ट शामिल हैं
- सुरक्षा·सिस्टम·इन्फ्रास्ट्रक्चर से जुड़ी रिपॉज़िटरी के रूप में Mbed-TLS/mbedtls, OpenVPN/openvpn, WireGuard/wireguard-windows, Yubico/yubikey-manager, NationalSecurityAgency/ghidra, ReFirmLabs/binwalk आदि दिखाए गए हैं
- सूची में AI या slop से जुड़े नाम वाली रिपॉज़िटरी भी हैं, जिनमें anthropics/claude-code, anthropics/claudes-c-compiler, codeberg.org/brib/slopfree-software-index, codeberg.org/jruz/slop-detector शामिल हैं
- विश्लेषण समय 2026 के मई की शुरुआत से 2026 के 14 जून 00 बजे UTC तक फैला है, और हालिया स्कैन सूची 2026 के 13 जून 23:22:37 +0000 से 2026 के 14 जून 00:36:00 +0000 तक की प्रविष्टियाँ दिखाती है
- aur.archlinux.org/yay और aur.archlinux.org/yay.git, TeamNewPipe/NewPipe और TeamNewPipe/NewPipe/ जैसे उदाहरण दिखाते हैं कि एक ही प्रोजेक्ट अलग URL रूपों में अलग-अलग प्रविष्टियों के रूप में दिखाई दे सकता है
1 टिप्पणियां
Lobste.rs की राय
मैं किसी और के बनाए हुए काम के बारे में नकारात्मक नहीं बोलना चाहता, लेकिन यह प्रोजेक्ट ऐसा लगता है जैसे इसका मकसद ही नकारात्मकता हो।
यह ऐसे टूल जैसा दिखता है जो उन software projects के प्रति तिरस्कार को automate करता है जो ऐसे tools या तरीकों से बने हैं जिनसे आप सहमत नहीं हैं, या जो ऐसे contributions स्वीकार करते हैं।
scoring भी उपयोगी नहीं लगती। nixpkgs gets a
0 (F)score को AI इस्तेमाल का संकेत देने वाले 228 “commit signals” की वजह से 0 मिला, लेकिन nixpkgs repository में अभी 1,016,046 commits हैं। यानी कुल का सिर्फ 0.022% होने पर भी 0 अंक मिल जाता है।Bevy gets a
97 (A+)score को 100 न मिलने की वजह सिर्फ एक single pull request है जिस पर “co-authored by Claude” टिप्पणी लगी है। उस PR की quality अच्छी थी या नहीं, maintainers ने merge करते समय “co-authored by” टिप्पणी देखी भी थी या नहीं, या Bevy के पास उचित AI contribution policy है—इनमें से कुछ भी इसमें नहीं दिखता।मूल बात यह है कि यह टूल context और nuance को हटा देता है। जब चिंता हो तो किसी इंसान द्वारा सीधे प्रोजेक्ट को देखना, maintainers क्या सोचते हैं यह समझना, और प्रोजेक्ट बनाने वालों के कारणों व भावनाओं को जानना—इन सबकी जरूरत ही खत्म कर देता है। बस URL डालो और score मिल जाता है।
“slop” शब्द के निहितार्थ और इसकी कठोर scoring की वजह से यह जानबूझकर नकारात्मक लगता है, और AI की मदद ली गई हो तब भी software production में शामिल इंसानी judgement और योगदान को एक single score में समेट देने की कोशिश के कारण यह अमानवीय भी लगता है। अगर यह सच में ऐसा प्रोजेक्ट है जिसे दूसरों द्वारा बनाए जा रहे software और उनके काम करने के तरीकों में दिलचस्पी है, तो इस टूल और इसे बनाने की प्रक्रिया में संवेदनशीलता और विचारशीलता की कमी दिखती है।
मुझे उम्मीद थी कि यह असली code देखकर LLM के निशान पकड़ने वाला, लगभग pangram-जैसा तरीका होगा।
कोई भी टूल परफेक्ट नहीं होता, लेकिन यह जानकारी ढूँढना आसान बनाता है। उस जानकारी का इस्तेमाल कैसे करना है, यह user पर निर्भर है। “slop” शब्द समस्या वाला है, इस बात से मैं सहमत हूँ, लेकिन बाकी आलोचनाओं से सहमत नहीं हूँ।
ऐसे टूल हर चीज़ को नज़रअंदाज़ कर सब कुछ slop या vibe coding कह देते हैं, और प्रोजेक्ट owners को परेशान करने वाली प्रतिक्रियाएँ निकलती हैं। जिन लोगों को मैं empathy, understanding और खुलेपन को महत्व देने वाला मानता था, उनसे anti-AI पक्ष की आक्रामकता आना काफ़ी चौंकाने वाला है।
हाँ, अगर LLMs इस codebase को scrape करेंगे तो उन्हें शायद बहुत बुरा लगेगा :(
क्या कोई तरीका है कि मेरा प्रोजेक्ट इस सूची में न दिखे, यानी opt-out किया जा सके? मुझे harassment की चिंता है, इसलिए मैं चाहता हूँ कि ऐसा होने से पहले ही वह संभावना खत्म हो जाए।
“मैं इस टूल का लेखक हूँ, इसलिए self-promo” यह disclaimer नहीं बल्कि disclosure के ज़्यादा क़रीब है।
और क्योंकि चुना गया “I am the author” दिखाई देता है, इसलिए “via ava” की जगह “authored by ava” दिखता है। इसे body में अलग से फिर लिखने की ज़रूरत नहीं लगती।
curl वाला entry मज़ेदार है, और लगभग पूरी तरह गलत फ़ैसले जैसा दिखता है।
टूल के result पर आँख बंद करके भरोसा करने की ज़रूरत नहीं; आप खुद देख सकते हैं, “अच्छा, यह false positive है।” जिन projects ने पहले AI इस्तेमाल किया था लेकिन अब नहीं करते, वहाँ भी “हाँ, यह सही है, लेकिन वह commit 2 साल पुराना है” जैसी जानकारी फ़ैसले के लिए अतिरिक्त आधार देती है।
LibAFL को इस सूची में देखकर बहुत दुख होता है। इसलिए नहीं कि यह गलत है, बल्कि इसलिए कि मैं अपने co-maintainers को codebase में slop न डालने के लिए मना नहीं पाया।
यही एक बड़ा कारण है कि इसे ठीक करने की मेरी इच्छा कम हो गई है।
vibe coding टैग नहीं है।
मुझे चिंता है कि अगर projects आसानी से पहचाने जाने से बचने के लिए LLM tools के इस्तेमाल को छिपाने लगें, तो detection कहीं बहुत ज़्यादा कठिन न हो जाए।
अपनाने को रोकने के लिए shaming से बेहतर शायद यह होगा कि एक ऐसा पेज हो जो references के साथ अच्छी तरह समझाए कि LLM tools का इस्तेमाल क्यों नहीं करना चाहिए। बहुत से maintainers शायद pro-AI content के ज़्यादा संपर्क में रहे हैं और उसी दिशा में उनकी राय बनी है, इसलिए हो सकता है कि उन्होंने पूरी तस्वीर न देखी हो।
कुछ समय पहले आई एक somewhat related post: https://lobste.rs/s/avubpi/can_we_measure_software_slop_experiment
एक मिलती-जुलती वेबसाइट भी है: https://slop-o-meter.dev/. इस implementation की जो बात मुझे खास पसंद है, वह सिर्फ इसका मज़ेदार और playful design नहीं, बल्कि यह भी है कि scoring algorithm के parameters को अपनी पसंद के अनुसार adjust किया जा सकता है। हर repository पर एक ही criteria बिल्कुल एक जैसा लागू नहीं होगा, इसलिए यह उचित लगता है। विडंबना यह है कि implementation खुद भी slop है :/