- uBlock Origin में AI द्वारा बनाई गई content farm साइटों को ब्लॉक करने के लिए एक सार्वजनिक ब्लैकलिस्ट प्रोजेक्ट
- generative AI द्वारा लिखी गई वेबसाइटें अक्सर विज्ञापनों और referral links से भरी होती हैं और इनमें अविश्वसनीय जानकारी शामिल होती है
- उपयोगकर्ता
list.txt फ़ाइल को subscribe कर सकते हैं या URL को सीधे जोड़कर block list लागू कर सकते हैं
- AI-जनित साइटों की विशेषताएँ और पहचान के मानदंड विस्तार से दिए गए हैं, और contributors के Pull Request के ज़रिए सूची का विस्तार किया जा सकता है
- search results में ऊपर दिखने वाली AI content pollution की समस्या को कम करने के लिए एक व्यावहारिक टूल के रूप में उपयोग किया जा सकता है
परियोजना अवलोकन
- AI uBlock Blacklist uBlock Origin extension में इस्तेमाल के लिए AI-जनित content block list प्रदान करता है
- generative AI द्वारा लिखी गई वेबसाइटें ब्राउज़ करते समय मिलें तो उन्हें मैन्युअली सूची में जोड़ा जाता है
- कोई automation tool इस्तेमाल नहीं किया जाता, और यह स्पष्ट किया गया है कि algorithm से यह तय करना कठिन है कि content AI-जनित है या नहीं
परियोजना का उद्देश्य
- generative AI द्वारा लिखी गई वेबसाइटों में अक्सर उपयोगी जानकारी कम होती है और वे विज्ञापन व referral links से कमाई करने की संरचना रखती हैं
- AI द्वारा लिखा गया content बिना समीक्षा के बड़े पैमाने पर प्रकाशित होता है, इसलिए इसमें खतरनाक जानकारी शामिल हो सकती है
- उदाहरण के तौर पर circuit short करना,
rm -rf / कमांड चलाना, bleach और ammonia मिलाना जैसी खतरनाक सलाह दिए जाने की संभावना का उल्लेख है
- इन कारणों से AI-जनित content पर भरोसा नहीं किया जा सकता और उसे ब्लॉक करने की ज़रूरत है
- लेखक इतालवी नागरिक है, इसलिए इतालवी साइटें अधिक संख्या में शामिल हैं, और अन्य भाषाओं की साइटें जोड़ने के लिए contributions का स्वागत है
वेबसाइट जोड़ने का तरीका
- जिन उपयोगकर्ताओं के पास तकनीकी ज्ञान नहीं है, वे GitHub Issue के माध्यम से संदिग्ध साइटों की रिपोर्ट कर सकते हैं
- Pull Request के ज़रिए सीधे जोड़ते समय, डोमेन स्तर या किसी विशेष ब्लॉग पाथ स्तर पर ब्लॉक किया जा सकता है
- उदाहरण:
||example.com/@slopUser^$doc या ||example.com^$doc प्रारूप
- यदि SEO और digital marketing services बेचने वाली कोई संस्था कई content farms चला रही हो, तो संबंधित साइटों को साथ में जोड़ने की सिफारिश की गई है
AI content farm की पहचान के मानदंड
- अनावश्यक भूमिका और निष्कर्ष, ‘Comprehensive Guide’ जैसे बढ़ा-चढ़ाकर लिखे गए शीर्षक, बाहरी links या स्रोतों का अभाव, बहुत सारे referral links
- कम समय में हज़ारों पोस्ट, गलत जानकारी (hallucination), नवंबर 2022 के बाद की पोस्ट, AI-जनित images और logos
- खराब formatting वाला text, render न हुआ Markdown syntax, विषय से असंबंधित लंबा text, search में बार-बार ऊपर दिखना
- संपर्क जानकारी का अभाव, अस्पष्ट परिचय पेज, AI की अंध-प्रशंसा करने वाला content आदि भी प्रमुख संकेत बताए गए हैं
Google Dorks का उपयोग
- यदि AI द्वारा बनाई गई पंक्तियाँ ज्यों-की-त्यों कॉपी करके पोस्ट की गई हों, तो विशिष्ट वाक्यांश खोजकर AI पेजों को ढूँढा जा सकता है
- उदाहरण:
"Sure! Here's an article about" (अंग्रेज़ी), "Certo! Ecco un articolo" (इतालवी)
- ऐसे वाक्यांशों वाले पेज मिलें तो पूरे डोमेन को ब्लैकलिस्ट में जोड़ दिया जाता है
समान परियोजनाएँ
अभी कोई टिप्पणी नहीं है.