- 10 साल पहले अगर आप एक नया WordPress ब्लॉग शुरू करते थे, तो Google कुछ घंटों में, और कभी-कभी कुछ मिनटों में ही कंटेंट को इंडेक्स कर देता था
- Google का मिशन "दुनिया की जानकारी को व्यवस्थित करना और उसे सार्वभौमिक रूप से सुलभ व उपयोगी बनाना" था
- यूज़र्स के लिए इसका मतलब था कि अगर जानकारी वेब पर कहीं मौजूद है, तो उसे Google Search से पाया जा सकता है
- कंटेंट क्रिएटर्स के लिए यह एक सुनहरा मौका था कि वे कंटेंट बनाएं और Google उसे खोजने योग्य बना दे
SEO हथियारों की दौड़ और Google की प्रतिक्रिया
- जहाँ अवसर होता है, वहाँ दुरुपयोग भी होता है
- कम-गुणवत्ता वाले कंटेंट की वेब पर बाढ़ आ गई
- लिंक की खरीद-फरोख्त
- कई तरह की ग्रे-हैट और ब्लैक-हैट SEO रणनीतियाँ
- Google ने manipulative SEO practices को साफ़ करने के लिए Panda, Penguin आदि जैसे कई algorithm updates पेश किए
- यह SEO विशेषज्ञों और Google के बीच 20 साल तक चली रस्साकशी जैसा था
"Content is King" का उदय और पतन
- इंडस्ट्री में "Content is King" का नया सिद्धांत उभरा
- अच्छा कंटेंट स्वाभाविक रूप से links आकर्षित कर सकता है और positive user interaction signals पैदा कर सकता है, जिससे ranking बेहतर हो सकती है
- Google के algorithms मूल रूप से high-quality content को महत्व देंगे और उसे ऊँची ranking देंगे
- सचमुच अच्छा कंटेंट बनाने वाले कई क्रिएटर्स कभी वह ranking हासिल नहीं कर पाए जिसके वे हकदार समझते थे, जिससे यह दिखा कि सिर्फ quality काफ़ी नहीं है
- मूल समस्याओं में से एक यह थी कि Google भी, और कोई भी, algorithmic तरीके से "अच्छे" कंटेंट की पहचान नहीं कर सकता था
AI कंटेंट क्रांति
- 2018 में OpenAI ने GPT-1 जारी किया और कंटेंट निर्माण का भविष्य साफ़ हो गया
- ऐसा AI-generated content सामने आया जिसे इंसान द्वारा लिखे गए टेक्स्ट से अलग करना मुश्किल था
- "Content is King" का युग अब समाप्ति की ओर है
Google का अस्तित्वगत संकट
- Google के नज़रिए से देखें तो वह ऐसे भविष्य का सामना कर रहा है जहाँ AI असीमित मात्रा में इंसान-जैसा कंटेंट बना सकता है
- Google की प्रतिक्रिया दो हिस्सों में थी
- विशेषज्ञता, प्रामाणिकता, विश्वसनीयता (Expertise, Authoritativeness, Trustworthiness) की अवधारणा को धुंधले ढंग से बढ़ावा देना। व्यवहार में इसका अर्थ अक्सर जाने-माने brands और स्थापित websites को प्राथमिकता देना निकला
- सब कुछ इंडेक्स करने के मिशन को छोड़ना और उसकी जगह चयनात्मक होना। बहुत ही चयनात्मक।
नई वास्तविकता: चयनात्मक इंडेक्सिंग
- Google अब पूरे वेब को इंडेक्स करने की कोशिश नहीं करता
- वास्तव में वह बहुत ही चयनात्मक हो गया है और अधिकांश कंटेंट को इंडेक्स करने से इंकार करता है
- ऐसा इसलिए नहीं कि कंटेंट क्रिएटर्स किसी मनमाने quality standard को पूरा नहीं कर पाए, बल्कि इसलिए कि Google ने search engine के रूप में अपनी भूमिका के प्रति अपना दृष्टिकोण मूल रूप से बदल दिया है
- मेरे अनुभव के आधार पर, अब Google मानो "डिफ़ॉल्ट रूप से इंडेक्स नहीं" के सिद्धांत पर काम करता है
- वह केवल तब कंटेंट को index में शामिल करता है जब विभिन्न संकेतों से उसे यह सचमुच ज़रूरी लगता है
- अत्यधिक कंटेंट मौलिकता: सिर्फ ऐसे विषय पर लिखना पर्याप्त नहीं है जिसे व्यापक रूप से कवर न किया गया हो। लगता है Google चाहता है कि कंटेंट वास्तव में नया हो या उसके index में किसी बड़े gap को भरे
- perceived authority: जिन sites को Google किसी niche में उच्च authority वाली मानता है, उनके अधिक कंटेंट के इंडेक्स होने की संभावना होती है, लेकिन यह भी गारंटी नहीं है
- brand recognition: जाने-माने brands का अधिकांश कंटेंट अक्सर इंडेक्स हो जाता है, लेकिन छोटे या कम-ज्ञात bloggers को कहीं अधिक सख़्ती से परखा जाता है
- अस्थायी इंडेक्सिंग और de-indexing: व्यवहार में Google अक्सर breaking news या महत्वपूर्ण updates न छूटें, इसके लिए नए कंटेंट को बहुत तेज़ी से इंडेक्स कर देता है। थोड़े समय बाद वह उस कंटेंट को de-index भी कर सकता है, और उसके बाद वह इंडेक्स से बाहर ही रह सकता है। इसलिए शुरुआत में इंडेक्स हो जाना ज़रूरी नहीं कि Google आपके कंटेंट को मूल्यवान मानता है
- इस बदलाव को सीधे देख रहा हूँ
- पहले अगर कोई नया domain सेट किया जाता था, तो वह 1 घंटे के भीतर, और कभी-कभी कुछ सेकंड में ही इंडेक्स हो जाता था
- यह उन नए domains पर भी लागू होता था जिनका कहीं कोई mention नहीं होता था और कोई backlinks भी नहीं होते थे
- अगर नए ब्लॉग पोस्ट के title या लेख की किसी अनोखी पंक्ति को खोजते थे, तो वह सीधे Google के पहले पेज पर दिख जाता था
- अब हर कंटेंट के लिए Google तय करता है कि वह इंडेक्स होने लायक है या नहीं, और ज्यादातर मामलों में जवाब "नहीं" होता है
- जो कंटेंट मुझे सचमुच अनोखा लगता है, या ऐसे विषय जिन पर लगभग कोई कवरेज नहीं है, वे भी इंडेक्स नहीं हो सकते
- लेकिन अगर आप ऐसे विषय पर लिखते हैं जिसे Google मानता है कि कहीं और पहले से कवर किया जा चुका है, तो उसके इंडेक्स न होने की संभावना बहुत अधिक है
- यह एक सम्मानित लेखक के साथ भी हो सकता है, भले ही उसके पास बड़ा पाठकवर्ग हो
- दिलचस्प बात यह भी देखी कि जब कंटेंट इंडेक्स होने में सफल हो जाता है, तो वह अक्सर हैरान करने वाली ऊँची ranking पा लेता है
- मानो इंडेक्सिंग की बाधा इतनी ऊँची हो गई है कि उसे पार करते ही ranking तक पहुँचने का रास्ता लगभग खुल जाता है
- लेकिन उस बिंदु तक पहुँचना अब घातीय रूप से ज़्यादा कठिन हो गया है
- अहम बात यह है कि यह अतिशय चयनात्मकता सब पर समान रूप से लागू नहीं होती
- बड़े brands का अधिकांश कंटेंट जल्दी इंडेक्स हो जाता है, जबकि छोटे bloggers या niche websites को अक्सर कहीं अधिक कड़े मानदंडों के तहत इंडेक्स में शामिल किया जाता है
- ऐसे छोटे खिलाड़ियों के लिए अब सिर्फ अच्छा कंटेंट बनाना काफ़ी नहीं, बल्कि यह मनवाना ज़रूरी है कि मेरा कंटेंट Google के index के लिए अनिवार्य है
परिणाम
- Google एक व्यापक search engine से बदलकर एक विशिष्ट catalog जैसी चीज़ बनता जा रहा है
- यूज़र्स के लिए इसका मतलब है कि जो जानकारी वे खोज रहे हैं, वह मौजूद हो सकती है, लेकिन Google के ज़रिए मिल नहीं पाएगी
- मुझे यक़ीन है कि बड़ी मात्रा में मूल्यवान कंटेंट नज़रअंदाज़ किया जा रहा है
- ऐसी जानकारी जिसे यूज़र खोज सकते हैं, वह Google search results में दिखाई नहीं दे सकती
- इसलिए नहीं कि वह मौजूद नहीं है, बल्कि इसलिए कि Google ने उसे शामिल न करने का फैसला किया है
- कंटेंट क्रिएटर्स के लिए अब बड़ा सवाल यह है कि अगर Google अधिकांश कंटेंट को इंडेक्स करने से इंकार करता है, तो visibility कैसे हासिल की जाए
10 टिप्पणियां
ऐसा लगता है कि लेखक का यह दावा सही है कि Google चुनिंदा रूप से सर्च रिज़ल्ट में दिखाता है.
Google Search Console में collected के रूप में दर्ज होने के बावजूद, यह सर्च रिज़ल्ट में दिखाई नहीं देता.
मेरे ब्लॉग में कुछ लेख खोजे जा सकते हैं और कुछ नहीं।
कम-से-कम ऐसा लगता है कि Google जिन लेखों को अन्य दस्तावेज़ों के मुकाबले डुप्लिकेट मानता है, या जिनकी मौलिकता या उपयोगिता कम समझता है, उन्हें इंडेक्स में शामिल नहीं करता।
अब ऐसा लगता है कि आगे का समय ऐसा होगा जहां कंटेंट के स्तर पर भी AI से अलग पहचान दिखाते हुए प्रतिस्पर्धा करनी पड़ेगी। भले ही वह मूल लेख सिर्फ एक व्यक्तिगत राय हो, फिर भी अनुमान है कि इतनी बड़ी दिशा में बदलाव आने की संभावना काफी अधिक है।
Hacker News की टिप्पणियों की तरह, यह कंटेंट की प्रकृति और पैमाने पर निर्भर करेगा और सबूत भी कमज़ोर हैं, लेकिन मुझे यह काफ़ी भरोसेमंद लगता है.
इस साल की पहली तिमाही में हमने कंपनी में overall SEO सुधार का काम किया था और तब से अब तक उसकी मॉनिटरिंग कर रहे हैं.
करीब 1 लाख नए URL submit किए गए थे और लगभग 5 महीने मॉनिटर किया, लेकिन नए URL बिना किसी खास error report के
DetectedयाCrawledपर ही अटके रहे और अगले चरण में नहीं गए, और हाल में तो पहले से indexed URL भी दसियों हज़ार की संख्या में बाहर हो गए.मार्च में नई spam policy घोषित की गई थी, और web vitals में भी समस्या है, लेकिन सिर्फ उससे यह समझ में नहीं आ रहा था, इसलिए मैं सोच में था; अब यह एक काफ़ी plausible दावा लग रहा है.
लेखक खुद को SEO विशेषज्ञ और फ्रीलांस डेवलपर बताते हैं—क्या वे बस डर फैलाने वाली मार्केटिंग करना चाहते हैं?
SEO विशेषज्ञों में से 90% ठग हैं
घूम-फिरकर Yahoo~?
Google अब डिफ़ॉल्ट रूप से आपके कंटेंट को इंडेक्स नहीं करता
यह लेखक का निजी दावा है, इसलिए Hacker News टिप्पणी में इस पर काफ़ी बहस हो रही है.
वास्तव में ऐसा है कहने वाले और ऐसा नहीं है कहने वाले आपस में बहस कर रहे हैं.
मेरी निजी राय में, मौजूदा स्थिति में Google के नज़रिए से पहले selective indexing करना और उसके बाद de-indexing करना सही लगता है. स्पैम साइट्स सच में बहुत ज़्यादा बढ़ गई हैं.
खुशी की बात है कि जिन साइट्स को मैं चला रहा हूँ, वे सभी अच्छी तरह index हो रही हैं ^^;
> पहले नए domain सेट करने पर 1 घंटे के भीतर, कभी-कभी कुछ ही सेकंड में indexing हो जाती थी
मैंने भी इस साल की शुरुआत में एक domain खरीदा था, जिसमें अभी भी content कम है और links भी नहीं हैं, फिर भी वह अच्छी तरह index हो रहा है। (इसमें कितना समय लगा, यह मैंने मापा नहीं...)
शायद यह थोड़ा ज़्यादा defensive हो गया हो, लेकिन यह समस्या बनने जितना गंभीर नहीं लगता।