- Google Search उपयोगकर्ताओं को लिंक भेजने वाले तरीके से हटकर प्रोसेस्ड जवाब-केंद्रित मॉडल की ओर बढ़ रहा है, और वेब के ऊपर एक नया, नियंत्रित किया जा सकने वाला लेयर बना रहा है
- AI Overviews के बारे में विश्लेषण है कि लगभग 10% मामलों में यह गलत जवाब देता है, और Search काफी हद तक सूचना स्रोतों तक जाने वाले लिंक देने की पुरानी पद्धति छोड़ रहा है
- “AI” और “agentic” पैकेजिंग के पीछे असली बात यह है कि जानकारी को संदर्भ से अलग करके, स्रोत हटाकर, उसकी जगह LLM जवाब रख दिए जाते हैं
- वेबसाइटें और रचनात्मक कार्य साझा किए जाने वाले सांस्कृतिक उत्पाद से अधिक Google के synthetic text expeller के लिए बिना भुगतान वाला कच्चा माल बनते जा रहे हैं
- जवाबी कदमों में De-googlifying, Chrome से बचना, और वैकल्पिक search engine का उपयोग शामिल है; नहीं तो आप केवल वही जानकारी देख सकते हैं जिसे Google प्रासंगिक मानता है
Google Search वेब के ऊपर जो नया abstraction layer बना रहा है
- Google I/O keynote को वेब के बचे हुए हिस्से पर हमले की तरह पढ़ा जा सकता है, और Google के विवरण में Search को लिंक देने से आगे बढ़ाकर प्रोसेस्ड जवाबों पर और ज़ोर देने की दिशा दिखाई देती है
- Search के मौजूदा AI snippets, AI Overviews, के बारे में यह विश्लेषण है कि यह लगभग 10% मामलों में गलत जवाब देता है, और Google सूचना स्रोतों तक ले जाने वाले लिंक देने वाले पुराने paradigm को काफी हद तक छोड़ रहा है
- “AI” और “agentic” जैसी पैकेजिंग के पीछे असली बात यह है कि जानकारी को संदर्भ से अलग करके, स्रोत लिंक हटाकर, उसकी जगह LLM-जनरेटेड जवाब पेश किए जाते हैं
- Google वेबसाइटों और रचनात्मक कार्यों को ऐसी चीज़ों की तरह नहीं देख रहा जिन्हें उपयोगकर्ता सीधे देखें और साझा करें, बल्कि वेब के ऊपर एक नया, नियंत्रित abstraction layer बना रहा है जो इन्हें Google की सतह के पीछे छिपा देता है
रचनात्मक कार्य सांस्कृतिक उत्पाद नहीं, कच्चा माल बन रहे हैं
- वेबसाइटें, लेखन और कला अब भी कुछ हद तक महत्वपूर्ण हैं, लेकिन उनका मूल्य Google के synthetic text expeller के लिए बिना भुगतान वाले कच्चे माल जैसा अधिक होता जा रहा है
- रचनाकार मुफ्त में काम करते हैं, जबकि Google सूचना के प्रवाह पर और मज़बूत नियंत्रण पा सकता है और लोगों तक पहुँचने वाले जवाबों को अपनी इच्छित दिशा में मोड़ सकता है
- रचनात्मक कार्य ऐसे महत्वपूर्ण सांस्कृतिक उत्पाद नहीं रह जाते जिन्हें दूसरे लोगों के साथ साझा किया जा सके, बल्कि Google द्वारा प्रोसेस और पुनर्संयोजित किए जाने वाले input में बदलते जा रहे हैं
participatory web के ख़िलाफ़ बदलाव
- इस बदलाव को participatory web की ओर क्रांति नहीं, बल्कि participatory web और स्वयं उपयोगकर्ताओं के ख़िलाफ़ एक प्रति-क्रांति के रूप में परिभाषित किया गया है
- लक्ष्य वेब को छीन लेना और लोगों को वेब के ऊपर Google-नियंत्रित और Google-संचालित abstraction layer की ओर मोड़ना है
- इसे सूचना तक पहुँच के एकाधिकार की समस्या कहा गया है, और खुले मानकों तथा अपनी ज़रूरतों और इच्छाओं के अनुसार वेब का एक कोना बनाने की क्षमता से दूर एक वास्तविक Metaverse के रूप में वर्णित किया गया है
- वेब standards पर Google का प्रभाव बहुत मज़बूत होने के कारण, यह दिशा वेब बनाने वाले तकनीकी परिदृश्य के मानक रूप को भी बदल सकती है
“safe web” के नाम पर नियंत्रण की संभावना
- अगले चरण में Google या इसी क्षेत्र की अन्य कंपनियाँ पुराने वेब को गंदा, अनियंत्रित, ख़तरनाक और बुरा बताने के लिए नया अपमानजनक शब्द गढ़ और फैला सकती हैं
- ऐसा नामकरण “Dark Web” की तरह काम कर सकता है और Google की abstracted surface को safe web के रूप में स्थापित कर सकता है
जवाब: Google पर निर्भरता कम करना
- अगर आप इस बात को महत्व देते हैं कि वेब और लोग सिर्फ़ निष्क्रिय उपभोक्ता न रहकर वेब में भाग भी ले सकें, तो इस बदलाव को गंभीरता से लेना चाहिए
- मानसिक ढाँचे से Google को हटाने वाली De-googlifying अब और अधिक तात्कालिक हो गई है
- दूसरे search engine ढूँढने और Chrome browser का उपयोग न करने का सुझाव दिया गया है
- नहीं तो आप ऐसे slopified AOL-जैसे माहौल में जाग सकते हैं जहाँ सूचना तक पहुँच इस बात तक सीमित हो जाती है कि Google का synthetic text expeller क्या प्रासंगिक मानता है
1 टिप्पणियां
Hacker News की राय
ऐसा लगता है कि AI अब उस चरण तक आ गया है जहाँ “अगर कला·कोड·संगीत·लेखन बनाना है, तो आत्मसंतोष के लिए कर लो, लेकिन इससे अब पैसा नहीं कमाया जा सकता”
कंटेंट से पैसा कमाना अब सिर्फ बड़ी कंपनियों के लिए संभव लगता है, और अगर आप कुछ रचनात्मक प्रकाशित करते हैं, तो अंत में वह फिर मशीनों को खिला दिया जाता है और लगातार कॉपी होता रहता है
लगता है दुनिया लगभग दो “समाजों” में बँट रही है: एक तरफ AI + बड़ी कंपनियाँ + बहुत तेज़ innovation और disruption पसंद करने वाले लोग, और दूसरी तरफ हस्तशिल्प जैसा काम + छोटे व्यवसाय + धीमा लेकिन अधिक टिकाऊ innovation पसंद करने वाले लोग
व्यक्तिगत रूप से मैं दूसरे समाज में रहना चाहूँगा, लेकिन मुझे लगता है कि दोनों अपने-अपने तरीके से साथ-साथ मौजूद रह सकते हैं और विकसित हो सकते हैं
बेशक, अलग-अलग समाज अंततः एक-दूसरे के साथ interact करेंगे और असर डालेंगे
होटल उद्योग में मैंने ऐसा ही असर देखा है। होटल, booking.com और Google — सब पैसा कमाना चाहते हैं, लेकिन ग्राहक आमतौर पर “कहीं का होटल” Google पर खोजता है, और Google उस search term पर विज्ञापन बेचकर सबसे ऊँची बोली लगाने वाले को ज़्यादातर मुनाफ़ा दिला देता है
दूसरों की मेहनत से पैदा हुए टेक कंपनियों के अत्यधिक मुनाफ़े पर टैक्स लगना चाहिए, और उस पैसे से जीवित कलाकारों को समर्थन मिलना चाहिए
यह कुछ हद तक उस पुराने blank tape levy जैसा है जो piracy की भरपाई के लिए लगाया जाता था। बस फ़र्क इतना है कि पैसा labels या publishers को नहीं, सीधे असली कलाकारों को जाना चाहिए
ऐसे “ग्राहक” के लिए तो यह Mona Lisa का पोस्टर फ्रेम करके टाँगने से अलग नहीं है
कलाकारों के लिए यह ख़तरे से ज़्यादा, शायद ऐसा भी हो सकता है कि AI की वजह से original artworks और दुर्लभ व आनंददायक बन जाएँ
इसे रोकने के लिए मैंने एक-दो महीने पहले अपनी Amazon Redshift research website का ज़्यादातर हिस्सा basic auth username/password के पीछे कर दिया
वह अभी भी पूरी तरह मुफ़्त है, लेकिन username और password पाने के लिए लोगों को मुझे email करना पड़ता है
मैंने समय लगाकर यह content बनाया, लेकिन अगर OpenAI जैसी कंपनियाँ उसे कॉपी करके LLM के ज़रिए बेचें, और उसके परिणामस्वरूप कोई मेरी साइट पर ही न आए, तो मेरे पास वह content बनाने का कारण ही नहीं बचेगा। फिर OpenAI के पास लेने को कुछ नहीं बचेगा, और दूसरों के पास पढ़ने को भी नहीं — यानी सबका नुकसान
यह परजीवी जैसा है, और ऊपर से देखने पर मेज़बान को मार देने जैसा लगता है। यह लगभग निजी संपत्ति की अवधारणा के ख़ात्मे जैसा महसूस होता है
AI कंपनियाँ मेरी सहमति के बिना मेरी बनाई चीज़ें ले सकती हैं और मुनाफ़े के लिए बेच सकती हैं, और वह मुनाफ़ा ऐसा लगता है जैसे पहले मेरी मेहनत का एक बड़ा हिस्सा मुझे मिलना चाहिए था
मैंने यह पता लगाने की कोशिश की कि AI कंपनियों से अपना content हटाने के लिए कैसे कहा जाए, लेकिन जो तरीके दिए गए हैं वे बस औपचारिकता जैसे हैं और सारा बोझ मुझ पर डालते हैं। ऊपर से मुझे यह भी पता नहीं चल सकता कि content सच में हटाया गया या नहीं। उनका अंदाज़ कुछ ऐसा है: “अगर आप prompt से दिखाएँ कि आपका content निकल रहा है, तो हम कोशिश करेंगे कि वह content न निकले”
username/password barrier लगाने के बाद Google ने साइट की ranking काफ़ी गिरा दी, और अब मुझे लगता है कि search में वह लगभग मिलती ही नहीं
मैं यह भी जानना चाहूँगा कि AI कंपनियों को content हटाने का संकेत देने में क्या वे सेवाएँ भी शामिल हैं जो source attribution और links अच्छी तरह देती हैं। उदाहरण के लिए, Perplexity यह हिस्सा काफ़ी अच्छे से करता है
अगर आप login के बिना content access रोकते हैं, तो आप search engine indexing भी रोक रहे हैं, इसलिए Google में ranking गिरना स्वाभाविक है
आपका अंतिम लक्ष्य क्या है, यह थोड़ा उलझन भरा है। जब आप web पर मुफ़्त content डाल रहे हैं, तो AI indexing रोककर आपको क्या मिलता है, यह स्पष्ट नहीं है। खासकर तब जब AI ही नहीं बल्कि traditional search के ज़रिए आने वाले असली users भी रुक जाएँ
मैं उस झुंझलाहट को समझता हूँ कि AI tools आपका content पचा कर users को साइट से जोड़े बिना दोहरा देते हैं। लेकिन AI से अलग भी लोग हमेशा ऐसा करते आए हैं। वे कुछ पढ़ते हैं, तथ्य सीखते हैं या नए विचार समझते हैं, फिर उस जानकारी को अपने काम में मिला देते हैं बिना स्रोत को ज़रूरी तौर पर मान्यता दिए या याद रखे
AI ने बस उस प्रक्रिया को तेज़ और ज़्यादा दिखाई देने वाला बना दिया है, इसलिए झुंझलाहट का कारण समझ आता है। लेकिन यह उम्मीद कि मेरे काम के downstream में जो कुछ भी हो वह हमेशा मेरे नाम से जुड़ा रहे, शायद शुरू से ही पूरी तरह तर्कसंगत नहीं थी
जैसा आपने कहा, उन्हें भी पता है कि उन्हें अच्छा data चाहिए, इसलिए वे सच में किसी संतुलन बिंदु की तलाश कर सकते हैं
नहीं तो ऐसा भी हो सकता है कि AI labs, LLM को खिलाने के लिए नई मूल्यवान सामग्री खुद अंदर ही बनाने लगें। यह पागलपन जैसा लगता है, लेकिन Netflix भी अपना खुद का content बनाता है
AI labs इतने बड़े हो सकते हैं कि वे सिर्फ LLM inference देने से कहीं अधिक भूमिका निभाएँ। वे आज की कई nation-state governments जितने, या उनसे भी अधिक शक्तिशाली बन सकते हैं
यहाँ endgame समझना कठिन है। वेबसाइटें Google को अपना content crawl करने देती थीं क्योंकि बदले में उन्हें traffic मिलता था
अगर Google उसे पूरी तरह काट दे, तो फिर वेबसाइटों के पास Google crawler को ब्लॉक न करने की क्या प्रेरणा बचेगी?
मैं समझता हूँ कि Google के दूसरे AI products, जो सीधे जवाब देते हैं, उनसे अस्तित्वगत ख़तरा महसूस हो सकता है, लेकिन उसे web के साथ अपने सहजीवी रिश्ते को भी समझना चाहिए
जब Gemini आपके लिए खरीदारी कर सकता है, तो आप किसी random website पर जाकर shopping क्यों करेंगे? Wikipedia पर जानकारी खोजने की क्या ज़रूरत होगी… आप समझ ही रहे हैं
आने वाले कुछ साल web के लिए निर्णायक लगते हैं। Facebook ने भी apps के उभार के समय ऐसा ही कुछ करने की कोशिश की थी, लेकिन आख़िरकार विफल रहा। उम्मीद है Google भी विफल हो
अगर websites अब publish ही न हों या crawl न की जाएँ, तो मशीनें आगे चलकर क्या खाकर चलेंगी?
इसलिए उनके दिमाग़ में कुछ बदला नहीं है, बस पाठक इंसान की जगह bot हो गया है। लिखने वाले के नज़रिए से यह भयानक है
हमने बहुत पहले ही websites पर traffic भेजने का काम Google के हवाले कर दिया था
मुख्यतः इसलिए कि Google यह काम इतना अच्छा करता था कि विकल्प बहुत कम उपयोगी लगते थे
अब जब Google, कहें तो, “self-contained” बनने पर ध्यान दे रहा है, तो हमें websites पर traffic भेजने का बेहतर तरीका ढूँढना होगा। आदर्श रूप से ऐसा तरीका जो किसी एक कंपनी के नियंत्रण में न हो
किसी को StumbleUpon याद आता है?
हालाँकि समस्या की प्रकृति देखते हुए शायद यही स्वाभाविक है, लेकिन पहले तो तरह-तरह की पूरी तरह अनुपयुक्त decentralized चीज़ें भी सामने आ जाती थीं
अच्छे से curated link collections नई websites खोजने में कहीं अधिक उपयोगी होते हैं
website operator के रूप में मैंने views में सचमुच बड़ी बढ़ोतरी देखी है, लेकिन जब AI summary ग़लत हो और मेरे site को source बताया जाए, तो वह बहुत चोट पहुँचाता है
हर चीज़ में AI ठूँसने का यह रुझान आख़िरकार दुनिया की skill level को नीचे ले जाएगा, और मुझे चिंता है कि इसे रोकने का कोई रास्ता नहीं दिखता
आज मैंने एक developer से पूछा कि हमारा product किसी स्थिति को कैसे handle करने के लिए programmed है, तो उसने बस उस internal AI assistant का summary भेज दिया जिसे उसने अभी-अभी इस्तेमाल करना शुरू किया है
पहले वह सच में अच्छे और सोच-समझकर जवाब देता था, अब बस AI जवाब copy/paste करता है
जब बात खुद उनके scrape होने की आती है, तो लगता है वे उसके ख़िलाफ़ हैं: https://serpapi.com/blog/google-v-serpapi-motion-to-dismiss-...
अगर web शुरू से इतना सड़ चुका न होता, तो शायद यह और दुखद लगता
औसतन किसी भी site पर जाएँ तो वह बस आपको ads दिखाने और subscription के लिए परेशान करने वाली जगह बन चुकी है
समझ नहीं आता कि ऐसे modal को popup क्यों नहीं माना जाता
search engines की incentive structure ऐसी है कि वे अच्छे content से ज़्यादा नए content को तरजीह देते हैं, इसलिए हर website लगातार ऐसा कुछ उगलती रहती है जो generated कचरे जैसा लगता है
अब तो search results में पिछले 2 साल के भीतर का timestamp दिखे, तो मैं उसे कचरा मानकर क्लिक ही नहीं करता
शायद जवाब Kagi पर जाना हो सकता है। वहाँ मैं product नहीं, customer हूँ
ईमानदारी से कहूँ तो हर website ऐसी नहीं है, अभी भी अच्छी जगहें हैं। लेकिन search engines आपको वहाँ कभी नहीं ले जाते। वे दिन भर बस गंदगी दिखाते रहते हैं
Google न भी करता तो शायद कोई और करता, लेकिन असल में किया Google ने, और उसने उस कुएँ को ज़हरीला कर दिया जिससे हम सब पानी पीते हैं
लेख के लगभग बीच तक पहुँचते-पहुँचते तीन विशाल banner ads ऊपर, दाएँ और नीचे जगह घेर चुके थे, और वे असली लेख से ज़्यादा जगह खा रहे थे। नीचे दाएँ एक auto-play video ad तैर रही थी जो banner ads में से एक का ज़्यादातर हिस्सा ढक रही थी
लेख के बीच की “dynamic” ad अचानक बड़ी-छोटी होती रहती थी और इतनी laggy थी कि सच में कुछ पढ़ना ही मुश्किल हो गया
आधुनिक blog जैसी चीज़ें पढ़ने में यह तुलनात्मक रूप से बेहतर अनुभवों में से एक था। यह लगभग किसी संदिग्ध porn site के स्तर तक पहुँच चुका है
दुखद और शर्मनाक
इस तरह की घोषणाएँ मुझे अक्सर ज़्यादा समझ नहीं आतीं, क्योंकि वे उस problem model से मेल नहीं खातीं जिससे मैं चीज़ों को देखता हूँ
मैं blog लिखने वाला व्यक्ति हूँ, आज की भाषा में “content producer”, और साथ ही user भी हूँ
user के रूप में मैं चाहता हूँ कि मेरा browser user agent मेरी ओर से webpages render करे, और search agent कई sources से जानकारी निकालकर उचित attribution के साथ उसका synthesis दे
यह कहा जा सकता है कि क्योंकि मेरा content creation शौक है, इसलिए platform द्वारा mediation पर मेरी उदासीनता संभव है। कुछ हद तक यह सही भी है। अगर मेरी आजीविका इसी पर निर्भर होती, तो मैं शायद यह निष्कर्ष निकालता कि मेरी जीविका को चोट पहुँचाने वाला यह व्यवहार “web” के ख़िलाफ़ युद्ध है
लेकिन एक तटस्थ पर्यवेक्षक के रूप में, अगर यह युद्ध है भी, तो इसे आय·प्रतिष्ठा·पारिश्रमिक के उद्देश्य से किए जाने वाले content creation के रूप में web में मेरी भागीदारी पर युद्ध कहना चाहिए
user के रूप में मुझे वास्तव में हर website और उसके creator से बहुत मतलब नहीं है। उनके भीतर की जानकारी उपयोगी है, लेकिन sites की विविधता प्रायः जानकारी तक पहुँचने में बाधा है
अगर search और summary agents इन websites की बातों को सही ढंग से synthesize करके मेरे reality model को और सटीक बना दें, तो मैं कहीं अधिक संतुष्ट रहूँगा
इसलिए मुझे इस दलील से सहमत किया जा सकता है कि Google के बदलाव accurate content बनने की संभावना घटाएँगे और मुझे ज़्यादा बार गुमराह करेंगे। लेकिन यह एक tool है, और मेरा world model तो वास्तविकता द्वारा बार-बार जाँचा जाएगा
अगर search/synthesis machine उपयोगी परिणाम नहीं देगी, तो मुझे पता चल जाएगा, और मुझे अपने ज्ञान के साथ व्यवहार करने का तरीका इस तरह समायोजित करना होगा कि घातक परिणाम न हों। लेकिन ऐसा तो अभी भी है
मुझे यह पता नहीं चल सकता कि Google search results मेरे विचार बदलने के लिए लगाए गए planted results नहीं हैं, या Google Internet Archive के साथ मिलकर किसी कृत्रिम consensus को वास्तविक दिखा नहीं रहा
user के रूप में मुझे पहले से ही बहुत से निर्णय लेने पड़ते हैं, और search results को मेहनत से पढ़कर खुद synthesis करना, agents इस्तेमाल करने की तुलना में बहुत कम उपयोगी है
इसलिए अगर web के ख़िलाफ़ कोई युद्ध है, तो मैं खुशी-खुशी उस युद्ध में शामिल होऊँगा। web के विरोधी पक्ष में
किसी फ़िल्म की plot summary यह तय करने में मदद करती है कि फ़िल्म देखनी है या नहीं, लेकिन वह फ़िल्म देखने का विकल्प नहीं है
“50 usd in eur” या “current weather in Paris” जैसी queries में AI जवाब दे तो ठीक है। उससे जटिल चीज़ों के लिए मैं वास्तविक source links को कहीं ज़्यादा पसंद करूँगा
आशावादी पक्ष यह है कि यह “web” को उसी दिशा में और आगे धकेलने जैसा लगता है, जिस दिशा में वह बहुत पहले से जा रहा था — यानी ऐसी दिशा जहाँ users को ईमानदारी और दक्षता से सही जानकारी पाने, अपनी attention budget और agency बचाए रखने से रोका जाता रहा है
अब तक यह शोर बढ़ाकर monetary incentives साधने का खेल था, और अब यह शोर काटकर monetary incentives साधने का खेल है
आशा की बात यह है कि पहले कोई एकल दुश्मन नहीं था, इसलिए इस बिखरी हुई प्रणाली से लड़ना कठिन था। अब Google हालात को और बिगाड़ते हुए खुद को और कुछ अन्य कंपनियों को स्पष्ट लक्ष्य बना रहा है
उम्मीद है इससे और लोग अपनी सहनशीलता की सीमा पार करेंगे और चीज़ों को Google और ad networks द्वारा बदले जाने से पहले वाले “पुराने web” की ओर मोड़ने, या एक-दूसरे और content तक अधिक स्वतंत्र पहुँच के नए तरीके खोजने की कोशिश करेंगे
यह न छोटी लड़ाई होगी, न आसान। बड़े हिस्से में यह पूँजीवाद की मौजूदा स्थिति के ख़िलाफ़, और हमारे ध्यान·आलोचनात्मक सोच·चयन क्षमता को वापस पाने की लड़ाई है
उन्हें उन website owners को भुगतान करना चाहिए जिनका data वे इस्तेमाल करते हैं
अब तो मुझे यह भी पक्का नहीं लगता कि यह बुरी बात है या नहीं
web इतना SEO कचरे से भर गया है कि शायद Google के हटने से Usenet जैसी सफ़ाई होना ज़रूरी हो
AI features आमतौर पर वही बता देते हैं जो मैं चाहता हूँ, और अगर मैं fact-check करना चाहूँ तो ज़्यादातर source links भी दे देते हैं। traditional link तरीका भी काम करता है
जो लोग कहते हैं कि यह इस्तेमाल लायक नहीं है, वे आमतौर पर ऐसे ठोस उदाहरण नहीं दे पाते कि वे वास्तव में क्या ढूँढ नहीं पाए
मैंने भी कुछ कमजोर क्षेत्र देखे हैं। पुराने और अस्पष्ट materials में ज़्यादातर search engines की सीमाएँ लगती हैं, और piracy से जुड़ी सामग्री के लिए Yandex इस्तेमाल किया जा सकता है