Google Search बड़े पैमाने के spam हमले से अभिभूत
- पिछले कुछ दिनों में Google के search results पर spam हमला हुआ है और स्थिति पूरी तरह नियंत्रण से बाहर बताई जा रही है.
- कई domains सैकड़ों हज़ार keywords के लिए rank कर रहे हैं, इसलिए इस हमले का पैमाना लाखों keyword phrases तक पहुँच सकता है.
Google का algorithm कैसे इस्तेमाल किया जा सकता है
- ऐसा लगता है कि spam sites, Google द्वारा websites को rank करने के तरीके में कम-से-कम तीन मौकों का फायदा उठा रही हैं.
- जिन search queries पर spam sites rank हो रही हैं, उनमें competition कम है, इसलिए rank करना आसान है.
- local search algorithm, long-tail keywords, और newly registered domains से जुड़े मौके मौजूद हैं.
- नई sites को थोड़े समय के लिए यह फायदा मिल जाता है कि Google का algorithm साइट को समझने के दौरान उन्हें search queries पर rank कर देता है.
Links, Google को spam sites खोजने में मदद करते हैं
- Bill Hartzer ने Majestic backlink tool का उपयोग करके कई spam sites के link network को उजागर करने वाली एक post साझा की, जिससे यह बात सामने आई.
- backlink network बनाने में बहुत मेहनत की गई, लेकिन ऊँची ranking तय करने में links वास्तव में मुख्य कारण नहीं हैं.
- links, Google को नई spam sites खोजने, crawl करने और अंततः rank करने में मदद करते हैं.
Google SERPs में बेकाबू spam
- कई sites, ऐसे long-tail phrases और local search component वाले phrases पर rank कर रही हैं जिन्हें rank करना आसान है.
- long-tail का concept लगभग 20 साल से मौजूद है और 2006 में प्रकाशित "The Long Tail" नामक किताब से लोकप्रिय हुआ.
- spam sites कम प्रतिस्पर्धा वाले phrases पर rank कर सकती हैं और इसका उपयोग करके कम समय में सैकड़ों हज़ार keywords पर rank कर रही हैं.
Spam pages कैसे दिखते हैं
- spam pages को browser से सीधे विज़िट करना संभव नहीं है.
- spam sites अपने-आप दूसरे domains पर redirect हो जाती हैं.
- spam site पर जाने और page का HTML रिकॉर्ड करने के लिए Google के Rich Results tester का उपयोग किया गया.
एक domain 300,000 से अधिक keywords पर rank कर रहा है
- Bill द्वारा भेजी गई spreadsheet में उन keyword phrases की सूची शामिल थी जिन पर एक spam site rank कर रही थी.
- एक spam site 300,000 से अधिक keyword phrases पर rank कर रही थी.
यह spam technique प्रभावी क्यों है
- local search, non-local algorithm से अलग algorithm का उपयोग करता है.
- local search algorithm, local प्रकार की sites को rank करने के मामले में अधिक permissive है.
- Google को इस spam समस्या की जानकारी कम-से-कम 19 दिसंबर से थी, जिसकी पुष्टि Danny Sullivan के tweet से होती है.
GN⁺ की राय
- इस लेख की सबसे महत्वपूर्ण बात यह है कि Google Search के results बड़े पैमाने के spam हमले के प्रति संवेदनशील हैं, और इससे search engine की विश्वसनीयता प्रभावित हो सकती है.
- spam हमले के प्रभावी होने की वजह यह है कि वह Google algorithm की कुछ खास कमजोरियों का फायदा उठाता है, जो यह दिखाता है कि Google को अपने algorithm में सुधार करने की ज़रूरत है.
- यह लेख इसलिए दिलचस्प है क्योंकि यह सिर्फ तकनीकी पहलू नहीं दिखाता, बल्कि यह भी बताता है कि Google जैसी बड़ी tech company भी अब तक अप्रत्याशित समस्याओं का सामना कर सकती है.
7 टिप्पणियां
Google स्पैम रिपोर्ट वेब दस्तावेज़: जब आप वेब स्पैम की रिपोर्ट करें और डोमेन
abc.abc.uk/trashasdaजैसा हो, तोabc.ukके रूप में रिपोर्ट करें, औरabc.abc.uk/sitemap.xmlको ऐसे सर्च क्वेरी में डालकर रिपोर्ट करें जिससे समस्या को ठीक-ठीक समझा जा सके। लगता है कि यह पहले से किसी solution से मज़बूत किया गया web है, लेकिन इसकी संरचना ऐसी है कि सामान्य user के पहुँचते ही यह तुरंत derived documents फिर से बना देता है। इससे निपटने का सही तरीका है कि आप सक्रिय रूप से रिपोर्ट करें। Google में जितनी बार इसे दबाया जाता है, उतनी ही बार फिर से spam pages बन जाते हैं, औरgoogle.com/url,image.google.com/url,naver redirectआदि के ज़रिए bot को पहुँचने दिया जाता है, जिससे वह फिर생성된spam page पर चला जाता है। इसलिए इन्हें क्लिक न करें; सिर्फ़ link कॉपी करके रिपोर्ट करें। जब तकgoogle.com/urlके ज़रिए होने वाले redirecting algorithm को हटाया नहीं जाता, तब तक लगता है कि मौजूदा समस्या लगातार बनी रहेगी।(स्पैम, स्पैम वेब दस्तावेज़ रिपोर्ट)
ऊपर दिए गए स्पैम समाधान के अंतर्गत आने वाले वेब दस्तावेज़ की रिपोर्ट करते समय
कुल 5 खानों में पहले में मुख्य डोमेन लिखना सही है, और 4 अतिरिक्त URL में उससे निकली हुई दस्तावेज़ों की सूची लिखनी चाहिए। साथ ही, उस डोमेन का sitemap खोज शब्द में डालना बेहतर है। sitemap खोलकर देखें तो वे
/new/asdasdजैसी पाथ को एक्सेस करते ही बना देने की रणनीति अपनाए हुए हैं, इसलिए जब आप रिपोर्ट दस्तावेज़ तैयार करते हैं तो अंततः Google के देखने के समय भाग जाने वाले दस्तावेज़ों को अतिरिक्त रूप से बना देते हैं। यह इतना चालाक मामला है कि आपको पूरे डोमेन को ही रिपोर्ट करना चाहिए।मेरे मामले में
(h को x से, / को | से बदल दिया है)
xttp:||baddomain.com
xttp:||baddomain.com/blogs
xttp:||baddomain.com/blogs/asdasd1
xttp:||baddomain.com/asdasd1
xttp:||baddomain.com/asdasd2
ऐसे रिपोर्ट तैयार करने के बाद
अगर मामला ऐसा है जहाँ subdomain से ही सब सड़ चुका हो, तो
site:*baddomain.comkeyword के साथ इसी तरह रिपोर्ट बनाकर भेज देता हूँ.
इसके बाद अगर साइट खुद पूरी तरह spam प्रकृति की हो, तो phishing site report भी साथ में भेज देता हूँ.
विडंबना यह है कि इन spam websites का software Tag Manager से जुड़ा हुआ है, और https://picsum.photos जैसी sites इस्तेमाल होने के बावजूद indexing सामान्य रूप से हो रही है। इसका मतलब यह भी है कि Google में कोई proper review नहीं हो रहा। spam activity सामान्य दायरे से बहुत आगे निकल जाने के बाद भी, अगर spam web pages + AdWords ads लगे हुए हों, तो report करने पर भी ad traffic जितनी तेजी से derivative pages बनते जाते हैं। यह बात सचमुच सिहराने वाली है कि spam websites Tag Manager का सामान्य रूप से इस्तेमाल कर रही हैं।
मैं एक महीने से spam report सबमिट कर रहा हूँ, लेकिन अगर आप इसे spam document, fraud document के रूप में report करने के साथ phishing site report page पर भी साथ में report कर दें, तो इसे ज़्यादा जल्दी साफ़ किया जा सकता है। उस page को भी शामिल किया जाता है, लेकिन अगर top-level domain
abc.abc.ukहै, तोabc.ukदर्ज करना चाहिए, तभी domain को ही साफ़ करने में मदद मिलती है। यह webmasters के लिए रोज़मर्रा का एक होमवर्क बन गया है।वैसे भी Google के search results की overall quality पहले से ही गिरती हुई साफ़ दिख रही थी, और अगर इस तरह कम समय में बड़े पैमाने पर हमले होते रहे तो बहुत से लोग Google search results पर और भी कम भरोसा करेंगे।
Hacker News की राय
स्पैम साइटें Googlebot के IP address की जांच करती हैं
Kagi search engine पर स्विच करने वाले user का अनुभव
साधारण सवालों का जवाब देने के लिए बहुत ज़्यादा text देने वाली साइटों में बढ़ोतरी
Google search results की quality में गिरावट पर टिप्पणी
search engines को लेकर सवाल
Google के search engine algorithm changes पर टिप्पणी
Google द्वारा organic search छोड़ देने का दावा
Google search engine की सीमाओं पर टिप्पणी
Bing पर स्विच करने का अनुभव साझा किया गया
एक advertising company के रूप में Google के व्यवहार की आलोचना