AI-SLOP Detector — AI द्वारा बनाए गए ‘बढ़ा-चढ़ाकर लिखे गए झूठे कोड’ का विश्लेषण और पता लगाने का टूल
(github.com/flamehaven01)यह टूल एक व्यक्तिगत असफलता के अनुभव से शुरू हुआ।
कुछ दिन पहले, मैंने पूरे आत्मविश्वास के साथ
“HRPO-X v1.0.1 – हाइब्रिड रीजनिंग ऑप्टिमाइज़ेशन फ्रेमवर्क इम्प्लिमेंटेशन”
नाम की एक भारी-भरकम रिपॉज़िटरी सार्वजनिक की।
यह एक ऐसा प्रोजेक्ट था, जिसके बारे में मुझे विश्वास था कि मैंने नवीनतम पेपर के आधार पर उसकी आर्किटेक्चर इम्प्लिमेंट की है।
लेकिन सार्वजनिक होते ही आई पहली प्रतिक्रिया ने मेरी उम्मीदों को पूरी तरह तोड़ दिया।
“ज़रा देखने आया था, और जैसा सोचा था वैसा ही निकला।
Hallucination के ढेर से बना हुआ AI Slop repo.”
पहले मुझे लगा यह सिर्फ़ ट्रोलिंग है।
लेकिन जब मैंने कोड फिर से खोला और एक-एक चीज़ को ध्यान से देखा,
तो वह टिप्पणी दर्दनाक रूप से सही निकली।
समस्या “इरादे” की नहीं, “घनत्व” की थी
यह प्रोजेक्ट कोई साधारण डेमो नहीं था,
बल्कि पेपर को production architecture में बदलने की प्रक्रिया पर आधारित एक शोध-परिणाम था।
- आर्किटेक्चर डिज़ाइन मौजूद
- फ़ोल्डर ट्री व्यवस्थित
- config फ़ाइल मौजूद
- class definitions और interfaces पूरे
- internal audit algorithm भी सही से पास
ऊपर से देखने पर सब कुछ परफ़ेक्ट लगता था।
यहाँ तक कि मौजूदा linter और structural integrity checks भी सभी पास हो गए थे।
लेकिन जब मैंने कारण की गहराई में जाना,
तो एक गंभीर समस्या सामने आई।
“Structural Integrity पूरी तरह सही थी,
लेकिन Content Density शून्य के करीब जा रही थी।”
यानी,
- बाहरी ढांचा काफ़ी भरोसेमंद दिखता था
- लेकिन असली implementation logic खाली था या
passपर खत्म हो जाता था - और बाकी हिस्सा बढ़ा-चढ़ाकर लिखी गई टिप्पणियों से भरा था
आख़िरकार मुझे मानना पड़ा कि यह
AI द्वारा जनरेट किए गए कोड का एक विशिष्ट कचरा-पैटर्न था,
यानी “AI Slop”.
इसलिए बनाया गया टूल: AI-SLOP Detector
इसी वजह से मैंने AI-SLOP Detector बनाया।
इसका लक्ष्य सरल है।
- कोड कितना अच्छा चलता है, यह नहीं
- बल्कि कोड और उसके विवरण के बीच कितना अंतर है
- इसे static तरीके से observe करना
इसके लिए नीचे दिए गए metrics का उपयोग किया जाता है।
यह क्या डिटेक्ट करता है
README में परिभाषित AI Slop patterns को मोटे तौर पर तीन भागों में बाँटा गया है।
1. Empty Function Slop (खोखला function)
- विवरण जटिल हो
- लेकिन असली implementation
passस्तर का हो
2. Buzzword Inflation (टर्म इन्फ्लेशन)
- कोड की complexity से अलग
neural,transformer,quantum,enterpriseजैसे शब्द
अत्यधिक मात्रा में इस्तेमाल किए गए हों
3. Overhyped Comments (अतिशयोक्तिपूर्ण comments)
- साधारण logic पर
“innovative”, “state-of-the-art” जैसे शब्द बार-बार आने वाली टिप्पणियाँ
विश्लेषण का तरीका (संक्षेप में)
AI-SLOP Detector Python AST के आधार पर,
कई metrics को parallel में गणना करके Deficit Score (0–100) निकालता है।
मुख्य metrics
LDR (Logic Density Ratio)
- पूरे कोड में वास्तविक logic का अनुपात
- मानक: 45% से कम होने पर CRITICAL(F) ग्रेड
Inflation Score
- दस्तावेज़/टिप्पणियों में buzzword density की तुलना में code complexity
- मानक: 2.0x या उससे अधिक होने पर CRITICAL
DDC (Dependency Density Check)
- उपयोग न किए गए import
- अर्थहीन dependencies का अनुपात
Pattern Registry
- empty function
- bare
except - TODO / FIXME का अत्यधिक उपयोग
- AI-generated code के कई विशिष्ट पैटर्न की पहचान
इन सभी मानों को मिलाकर इसे नीचे दी गई अवस्थाओं में वर्गीकृत किया जाता है।
CLEANSUSPICIOUSINFLATEDCRITICAL
प्रोजेक्ट की स्थिति
- Python 3.8+
- CLI और Python API उपलब्ध
- 34 tests पास
- नवीनतम संस्करण: v2.5.0 (2026-01-09)
यह टूल किनके लिए है
- no-code / low-code टूल्स का उपयोग करने वाले लोग
- वे डेवलपर्स जिन्हें AI-generated code की समीक्षा करनी पड़ती है
- वे लोग जिन्हें अक्सर “ऊपर से ठीक दिखने वाली लेकिन असहज महसूस कराने वाली repositories” मिलती हैं
इन लोगों के लिए
“यह कोड अजीब क्यों लग रहा है” इसे समझाने वाले संकेत
देना ही इसका उद्देश्य है।
अंत में
ऊपर उल्लेखित HRPO-X v1.0.1 को पूरी तरह refactor करने के बाद,
अब उसे शिक्षण-उपयोग के लिए अधिक यथार्थवादी संस्करण के रूप में फिर से व्यवस्थित किया गया है।
उम्मीद है कि यह लेख और यह टूल
ऐसी ही उलझनों से गुजर रहे लोगों के लिए
थोड़ी-सी मदद साबित होंगे।
सभी डेवलपर्स को शुभकामनाएँ!
अभी कोई टिप्पणी नहीं है.