AI-SLOP Detector — AI द्वारा बनाए गए ‘बढ़ा-चढ़ाकर लिखे गए झूठे कोड’ का विश्लेषण और पता लगाने का टूल

(github.com/flamehaven01)

2 पॉइंट द्वारा flamehaven01 2026-01-09 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

यह टूल एक व्यक्तिगत असफलता के अनुभव से शुरू हुआ।

कुछ दिन पहले, मैंने पूरे आत्मविश्वास के साथ
“HRPO-X v1.0.1 – हाइब्रिड रीजनिंग ऑप्टिमाइज़ेशन फ्रेमवर्क इम्प्लिमेंटेशन”
नाम की एक भारी-भरकम रिपॉज़िटरी सार्वजनिक की।
यह एक ऐसा प्रोजेक्ट था, जिसके बारे में मुझे विश्वास था कि मैंने नवीनतम पेपर के आधार पर उसकी आर्किटेक्चर इम्प्लिमेंट की है।

लेकिन सार्वजनिक होते ही आई पहली प्रतिक्रिया ने मेरी उम्मीदों को पूरी तरह तोड़ दिया।

“ज़रा देखने आया था, और जैसा सोचा था वैसा ही निकला।
Hallucination के ढेर से बना हुआ AI Slop repo.”

पहले मुझे लगा यह सिर्फ़ ट्रोलिंग है।
लेकिन जब मैंने कोड फिर से खोला और एक-एक चीज़ को ध्यान से देखा,
तो वह टिप्पणी दर्दनाक रूप से सही निकली।

समस्या “इरादे” की नहीं, “घनत्व” की थी

यह प्रोजेक्ट कोई साधारण डेमो नहीं था,
बल्कि पेपर को production architecture में बदलने की प्रक्रिया पर आधारित एक शोध-परिणाम था।

आर्किटेक्चर डिज़ाइन मौजूद
फ़ोल्डर ट्री व्यवस्थित
config फ़ाइल मौजूद
class definitions और interfaces पूरे
internal audit algorithm भी सही से पास

ऊपर से देखने पर सब कुछ परफ़ेक्ट लगता था।
यहाँ तक कि मौजूदा linter और structural integrity checks भी सभी पास हो गए थे।

लेकिन जब मैंने कारण की गहराई में जाना,
तो एक गंभीर समस्या सामने आई।

“Structural Integrity पूरी तरह सही थी,
लेकिन Content Density शून्य के करीब जा रही थी।”

यानी,

बाहरी ढांचा काफ़ी भरोसेमंद दिखता था
लेकिन असली implementation logic खाली था या pass पर खत्म हो जाता था
और बाकी हिस्सा बढ़ा-चढ़ाकर लिखी गई टिप्पणियों से भरा था

आख़िरकार मुझे मानना पड़ा कि यह
AI द्वारा जनरेट किए गए कोड का एक विशिष्ट कचरा-पैटर्न था,
यानी “AI Slop”.

इसलिए बनाया गया टूल: AI-SLOP Detector

इसी वजह से मैंने AI-SLOP Detector बनाया।

इसका लक्ष्य सरल है।

कोड कितना अच्छा चलता है, यह नहीं
बल्कि कोड और उसके विवरण के बीच कितना अंतर है
इसे static तरीके से observe करना

इसके लिए नीचे दिए गए metrics का उपयोग किया जाता है।

यह क्या डिटेक्ट करता है

README में परिभाषित AI Slop patterns को मोटे तौर पर तीन भागों में बाँटा गया है।

1. Empty Function Slop (खोखला function)

विवरण जटिल हो
लेकिन असली implementation pass स्तर का हो

2. Buzzword Inflation (टर्म इन्फ्लेशन)

कोड की complexity से अलग
neural, transformer, quantum, enterprise जैसे शब्द
अत्यधिक मात्रा में इस्तेमाल किए गए हों

3. Overhyped Comments (अतिशयोक्तिपूर्ण comments)

साधारण logic पर
“innovative”, “state-of-the-art” जैसे शब्द बार-बार आने वाली टिप्पणियाँ

विश्लेषण का तरीका (संक्षेप में)

AI-SLOP Detector Python AST के आधार पर,
कई metrics को parallel में गणना करके Deficit Score (0–100) निकालता है।

मुख्य metrics

LDR (Logic Density Ratio)

पूरे कोड में वास्तविक logic का अनुपात
मानक: 45% से कम होने पर CRITICAL(F) ग्रेड

Inflation Score

दस्तावेज़/टिप्पणियों में buzzword density की तुलना में code complexity
मानक: 2.0x या उससे अधिक होने पर CRITICAL

DDC (Dependency Density Check)

उपयोग न किए गए import
अर्थहीन dependencies का अनुपात

Pattern Registry

empty function
bare except
TODO / FIXME का अत्यधिक उपयोग
AI-generated code के कई विशिष्ट पैटर्न की पहचान

इन सभी मानों को मिलाकर इसे नीचे दी गई अवस्थाओं में वर्गीकृत किया जाता है।

CLEAN
SUSPICIOUS
INFLATED
CRITICAL

प्रोजेक्ट की स्थिति

Python 3.8+
CLI और Python API उपलब्ध
34 tests पास
नवीनतम संस्करण: v2.5.0 (2026-01-09)

यह टूल किनके लिए है

no-code / low-code टूल्स का उपयोग करने वाले लोग
वे डेवलपर्स जिन्हें AI-generated code की समीक्षा करनी पड़ती है
वे लोग जिन्हें अक्सर “ऊपर से ठीक दिखने वाली लेकिन असहज महसूस कराने वाली repositories” मिलती हैं

इन लोगों के लिए
“यह कोड अजीब क्यों लग रहा है” इसे समझाने वाले संकेत
देना ही इसका उद्देश्य है।

अंत में

ऊपर उल्लेखित HRPO-X v1.0.1 को पूरी तरह refactor करने के बाद,
अब उसे शिक्षण-उपयोग के लिए अधिक यथार्थवादी संस्करण के रूप में फिर से व्यवस्थित किया गया है।

उम्मीद है कि यह लेख और यह टूल
ऐसी ही उलझनों से गुजर रहे लोगों के लिए
थोड़ी-सी मदद साबित होंगे।

सभी डेवलपर्स को शुभकामनाएँ!