1 पॉइंट द्वारा GN⁺ 4 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • repo-slopscore को Git रिपॉज़िटरी के कमिट इतिहास का विश्लेषण करके AI/LLM योगदान का पता लगाने वाले टूल के रूप में पेश किया गया है
  • सेवा होम, रिपॉज़िटरी स्कैन, और सोर्स कोड लिंक प्रदान करती है, तथा सोर्स कोड codeberg.org/polyphony/repo-slopscore पर सार्वजनिक है
  • स्कैन की गई कुल रिपॉज़िटरी की संख्या 3058 दिखाई गई है, और हालिया स्कैन सूची रिपॉज़िटरी URL के साथ UTC विश्लेषण समय भी दिखाती है
  • स्कैन का दायरा सिर्फ GitHub तक सीमित नहीं है; इसमें Codeberg, Bitbucket, SourceHut, git.kernel.org, chromium.googlesource.com जैसे कई Git hosting शामिल हैं
  • कुछ रिपॉज़िटरी में स्लैश या .git suffix के अंतर के कारण डुप्लिकेट जैसे आइटम मौजूद हैं, इसलिए सूची की व्याख्या करते समय URL normalization के अंतर को ध्यान में रखना चाहिए

मुख्य बिंदु

  • repo-slopscore को कमिट इतिहास विश्लेषण के आधार पर Git रिपॉज़िटरी में AI/LLM योगदान का पता लगाने वाली सेवा के रूप में प्रस्तुत किया गया है
  • सार्वजनिक पेज रिपॉज़िटरी स्कैन सुविधा, हाल ही में स्कैन की गई रिपॉज़िटरी की सूची, और सोर्स कोड लिंक प्रदान करता है
  • कुल स्कैन की गई रिपॉज़िटरी की संख्या 3058 दिखाई गई है
  • हालिया स्कैन सूची में helix-editor/helix, Agoric/Agoric-sdk, FiloSottile/age, github/copilot-cli, fish-shell/fish-shell, tmux/tmux, httpie/cli आदि शामिल हैं
  • हर स्कैन परिणाम लिंक slopscan.ava.pet/repo/ के नीचे URL-encoded मूल रिपॉज़िटरी पते को जोड़कर बनाया गया है

महत्वपूर्ण संदर्भ

  • स्कैन का दायरा GitHub तक सीमित नहीं है, बल्कि इसमें Codeberg, Bitbucket, SourceHut, git.kernel.org, chromium.googlesource.com, gcc.gnu.org, gerrit.wikimedia.org, git.ffmpeg.org जैसे कई hosting domains शामिल हैं
  • सूची में OpenRGB, coreboot, gentoo/gentoo, guix/guix, wlroots, forgejo, ziglang/zig, FFmpeg, FreeCAD, WebKit, NixOS/nixpkgs जैसे प्रसिद्ध open source प्रोजेक्ट शामिल हैं
  • सुरक्षा·सिस्टम·इन्फ्रास्ट्रक्चर से जुड़ी रिपॉज़िटरी के रूप में Mbed-TLS/mbedtls, OpenVPN/openvpn, WireGuard/wireguard-windows, Yubico/yubikey-manager, NationalSecurityAgency/ghidra, ReFirmLabs/binwalk आदि दिखाए गए हैं
  • सूची में AI या slop से जुड़े नाम वाली रिपॉज़िटरी भी हैं, जिनमें anthropics/claude-code, anthropics/claudes-c-compiler, codeberg.org/brib/slopfree-software-index, codeberg.org/jruz/slop-detector शामिल हैं
  • विश्लेषण समय 2026 के मई की शुरुआत से 2026 के 14 जून 00 बजे UTC तक फैला है, और हालिया स्कैन सूची 2026 के 13 जून 23:22:37 +0000 से 2026 के 14 जून 00:36:00 +0000 तक की प्रविष्टियाँ दिखाती है
  • aur.archlinux.org/yay और aur.archlinux.org/yay.git, TeamNewPipe/NewPipe और TeamNewPipe/NewPipe/ जैसे उदाहरण दिखाते हैं कि एक ही प्रोजेक्ट अलग URL रूपों में अलग-अलग प्रविष्टियों के रूप में दिखाई दे सकता है

1 टिप्पणियां

 
GN⁺ 4 시간 전
Lobste.rs की राय
  • मैं किसी और के बनाए हुए काम के बारे में नकारात्मक नहीं बोलना चाहता, लेकिन यह प्रोजेक्ट ऐसा लगता है जैसे इसका मकसद ही नकारात्मकता हो।
    यह ऐसे टूल जैसा दिखता है जो उन software projects के प्रति तिरस्कार को automate करता है जो ऐसे tools या तरीकों से बने हैं जिनसे आप सहमत नहीं हैं, या जो ऐसे contributions स्वीकार करते हैं।
    scoring भी उपयोगी नहीं लगती। nixpkgs gets a 0 (F) score को AI इस्तेमाल का संकेत देने वाले 228 “commit signals” की वजह से 0 मिला, लेकिन nixpkgs repository में अभी 1,016,046 commits हैं। यानी कुल का सिर्फ 0.022% होने पर भी 0 अंक मिल जाता है।
    Bevy gets a 97 (A+) score को 100 न मिलने की वजह सिर्फ एक single pull request है जिस पर “co-authored by Claude” टिप्पणी लगी है। उस PR की quality अच्छी थी या नहीं, maintainers ने merge करते समय “co-authored by” टिप्पणी देखी भी थी या नहीं, या Bevy के पास उचित AI contribution policy है—इनमें से कुछ भी इसमें नहीं दिखता।
    मूल बात यह है कि यह टूल context और nuance को हटा देता है। जब चिंता हो तो किसी इंसान द्वारा सीधे प्रोजेक्ट को देखना, maintainers क्या सोचते हैं यह समझना, और प्रोजेक्ट बनाने वालों के कारणों व भावनाओं को जानना—इन सबकी जरूरत ही खत्म कर देता है। बस URL डालो और score मिल जाता है।
    “slop” शब्द के निहितार्थ और इसकी कठोर scoring की वजह से यह जानबूझकर नकारात्मक लगता है, और AI की मदद ली गई हो तब भी software production में शामिल इंसानी judgement और योगदान को एक single score में समेट देने की कोशिश के कारण यह अमानवीय भी लगता है। अगर यह सच में ऐसा प्रोजेक्ट है जिसे दूसरों द्वारा बनाए जा रहे software और उनके काम करने के तरीकों में दिलचस्पी है, तो इस टूल और इसे बनाने की प्रक्रिया में संवेदनशीलता और विचारशीलता की कमी दिखती है।

    • मुझे चिंता है कि इस वजह से लोग मुझे परेशान करेंगे। यह साल पहले ही बहुत कठिन रहा है।
    • लगता है signals काफ़ी कमज़ोर मानदंडों पर निर्भर करते हैं। मैंने ऐसा repository डालकर देखा जिसमें LLM-generated code और human-written code लगभग 50:50 थे, लेकिन क्योंकि कोई co-signed commit नहीं था, सिर्फ agents.md के आधार पर पकड़ा गया और 95 score आया।
      मुझे उम्मीद थी कि यह असली code देखकर LLM के निशान पकड़ने वाला, लगभग pangram-जैसा तरीका होगा।
    • इस प्रोजेक्ट का उद्देश्य data को transparent बनाना है। यानी सवाल यह data है कि “क्या commit history या source tree में LLM इस्तेमाल के निशान दिखाई देते हैं?”
      कोई भी टूल परफेक्ट नहीं होता, लेकिन यह जानकारी ढूँढना आसान बनाता है। उस जानकारी का इस्तेमाल कैसे करना है, यह user पर निर्भर है। “slop” शब्द समस्या वाला है, इस बात से मैं सहमत हूँ, लेकिन बाकी आलोचनाओं से सहमत नहीं हूँ।
    • यह देखकर बहुत दुख होता है कि open source community का एक बड़ा हिस्सा अब वैसा होता दिख रहा है, जिसके खिलाफ वह कुछ समय पहले तक खुद लड़ रहा था।
      ऐसे टूल हर चीज़ को नज़रअंदाज़ कर सब कुछ slop या vibe coding कह देते हैं, और प्रोजेक्ट owners को परेशान करने वाली प्रतिक्रियाएँ निकलती हैं। जिन लोगों को मैं empathy, understanding और खुलेपन को महत्व देने वाला मानता था, उनसे anti-AI पक्ष की आक्रामकता आना काफ़ी चौंकाने वाला है।
    • कुछ vibe coders को नाराज़ कर देना AI industry से होने वाले मानवीय नुकसान की तुलना में कुछ भी नहीं है।
      हाँ, अगर LLMs इस codebase को scrape करेंगे तो उन्हें शायद बहुत बुरा लगेगा :(
  • क्या कोई तरीका है कि मेरा प्रोजेक्ट इस सूची में न दिखे, यानी opt-out किया जा सके? मुझे harassment की चिंता है, इसलिए मैं चाहता हूँ कि ऐसा होने से पहले ही वह संभावना खत्म हो जाए।

  • “मैं इस टूल का लेखक हूँ, इसलिए self-promo” यह disclaimer नहीं बल्कि disclosure के ज़्यादा क़रीब है।
    और क्योंकि चुना गया “I am the author” दिखाई देता है, इसलिए “via ava” की जगह “authored by ava” दिखता है। इसे body में अलग से फिर लिखने की ज़रूरत नहीं लगती।

    • यह language barrier की वजह से हुआ। मैं अभी भी इस community में काफ़ी नया हूँ, इसलिए मुझे लगा थोड़ा सावधान रहना बेहतर होगा। बताने के लिए धन्यवाद, याद रखूँगा।
  • curl वाला entry मज़ेदार है, और लगभग पूरी तरह गलत फ़ैसले जैसा दिखता है।

    • सही। मूल बात यह है कि इसका mechanism बहुत simple है। फिर भी यह उपयोगी है कि flagged signals सच में दिखाए जाते हैं।
      टूल के result पर आँख बंद करके भरोसा करने की ज़रूरत नहीं; आप खुद देख सकते हैं, “अच्छा, यह false positive है।” जिन projects ने पहले AI इस्तेमाल किया था लेकिन अब नहीं करते, वहाँ भी “हाँ, यह सही है, लेकिन वह commit 2 साल पुराना है” जैसी जानकारी फ़ैसले के लिए अतिरिक्त आधार देती है।
  • LibAFL को इस सूची में देखकर बहुत दुख होता है। इसलिए नहीं कि यह गलत है, बल्कि इसलिए कि मैं अपने co-maintainers को codebase में slop न डालने के लिए मना नहीं पाया।
    यही एक बड़ा कारण है कि इसे ठीक करने की मेरी इच्छा कम हो गई है।

  • vibe coding टैग नहीं है।

    • vibe coding पर दूसरे posts के साथ consistency रखने के लिए vibe coding टैग होना चाहिए।
  • मुझे चिंता है कि अगर projects आसानी से पहचाने जाने से बचने के लिए LLM tools के इस्तेमाल को छिपाने लगें, तो detection कहीं बहुत ज़्यादा कठिन न हो जाए।
    अपनाने को रोकने के लिए shaming से बेहतर शायद यह होगा कि एक ऐसा पेज हो जो references के साथ अच्छी तरह समझाए कि LLM tools का इस्तेमाल क्यों नहीं करना चाहिए। बहुत से maintainers शायद pro-AI content के ज़्यादा संपर्क में रहे हैं और उसी दिशा में उनकी राय बनी है, इसलिए हो सकता है कि उन्होंने पूरी तस्वीर न देखी हो।

  • कुछ समय पहले आई एक somewhat related post: https://lobste.rs/s/avubpi/can_we_measure_software_slop_experiment
    एक मिलती-जुलती वेबसाइट भी है: https://slop-o-meter.dev/. इस implementation की जो बात मुझे खास पसंद है, वह सिर्फ इसका मज़ेदार और playful design नहीं, बल्कि यह भी है कि scoring algorithm के parameters को अपनी पसंद के अनुसार adjust किया जा सकता है। हर repository पर एक ही criteria बिल्कुल एक जैसा लागू नहीं होगा, इसलिए यह उचित लगता है। विडंबना यह है कि implementation खुद भी slop है :/