2 पॉइंट द्वारा GN⁺ 2024-01-01 | 1 टिप्पणियां | WhatsApp पर शेयर करें

सर्च रिज़ल्ट्स की गुणवत्ता कितनी खराब है?

  • सर्च रिज़ल्ट्स की गुणवत्ता पर एक प्रयोग प्रस्तावित किया गया है। उदाहरण के लिए, youtube downloader जैसे सामान्य शब्द से yt-dlp जैसे open source प्रोजेक्ट को ढूँढ़ना content farms की वजह से मुश्किल हो जाता है।
  • कई तकनीकी विशेषज्ञ मानते हैं कि Google के सर्च रिज़ल्ट्स 10 साल पहले की तुलना में स्पष्ट रूप से खराब हो गए हैं। वहीं, कुछ लोग अब भी दावा करते हैं कि सर्च रिज़ल्ट्स अच्छे हैं।

सर्च इंजन और ChatGPT की तुलना

  • अलग-अलग सर्च इंजनों और ChatGPT का उपयोग करके तीन प्रकार के सवालों पर सर्च रिज़ल्ट्स की तुलना की गई है।
  • सर्च इंजनों में ad blocker बंद करके सामान्य उपयोगकर्ता के अनुभव को पुनः प्रस्तुत किया गया।
  • सर्च रिज़ल्ट्स की गुणवत्ता का मूल्यांकन व्यक्तिपरक रूप से किया गया, और धोखाधड़ी वाले रिज़ल्ट्स की मौजूदगी के आधार पर अलग-अलग आकलन किया गया।

सर्च रिज़ल्ट्स का मूल्यांकन

  • Marginalia कभी-कभी ठीक-ठाक जवाब देता है, और इसमें धोखाधड़ी वाले रिज़ल्ट्स का अनुपात सबसे कम है।
  • Mwmbl में उपयोगकर्ता सीधे सर्च रिज़ल्ट्स की ranking संपादित कर सकते हैं।
  • Google हाल के YouTube वीडियो लौटाने की प्रवृत्ति दिखाता है, जो अधिकांश उपयोगकर्ताओं के लिए बेकार है।
  • ChatGPT एक मामले में प्रभावशाली प्रदर्शन करता है, जबकि दूसरे मामलों में या तो उपयुक्त काम करता है या सवाल का जवाब देने से इनकार कर देता है।

Google और Bing की समस्याएँ

  • Google और Bing कई तरह के गलत रिज़ल्ट्स लौटाते हैं।
  • पारंपरिक search ecosystem उपयोगकर्ता के लिए सबसे लाभकारी रिज़ल्ट्स देने के बजाय software supply chain के लिए सबसे अधिक लाभकारी चीज़ों को प्राथमिकता देता है।

विज्ञापन-आधारित सर्च की समस्या

  • विज्ञापन-आधारित search engine के प्रोत्साहन अच्छे सर्च रिज़ल्ट्स देने के लक्ष्य से मेल नहीं खाते।
  • Google विज्ञापनों और वास्तविक सर्च रिज़ल्ट्स के बीच अंतर करना कठिन बना देता है, जिससे उपयोगकर्ता भ्रमित हो सकते हैं।

छोटे सर्च इंजनों की संभावना

  • यह सवाल उठाया गया है कि क्या Marginalia जैसे छोटे search engine Google की जगह ले सकते हैं, या कई छोटे search engine मिलकर Google से बेहतर रिज़ल्ट्स दे सकते हैं।
  • Mwmbl के user-curation approach के प्रभावी होने पर भी सवाल है।

GN⁺ की राय

  • सर्च रिज़ल्ट्स की गुणवत्ता पर बहस यह दिखाती है कि उपयोगकर्ता सर्च इंजनों पर कितने निर्भर हैं। Google जैसे बड़े search engine अब भी हावी हैं, लेकिन यह भी संकेत मिलता है कि छोटे search engine niche बाज़ारों में प्रतिस्पर्धी हो सकते हैं।
  • विज्ञापन-आधारित search engine की समस्याएँ इस बात पर ज़ोर देती हैं कि वे उपयोगकर्ताओं के लिए वास्तव में चाही गई जानकारी ढूँढ़ने में बाधा बन सकती हैं। यह उपयोगकर्ता अनुभव सुधारने के लिए वैकल्पिक search engine की आवश्यकता को उजागर करता है।
  • यह लेख समझने में मदद करता है कि तकनीक-समझ रखने वाले उपयोगकर्ता सर्च इंजन की सीमाओं को कैसे पार कर रहे हैं, और सामान्य उपयोगकर्ता किन समस्याओं का सामना कर रहे हैं।

1 टिप्पणियां

 
GN⁺ 2024-01-01
Hacker News राय
  • Marginalia Search के algorithm में सुधार के बावजूद, sample query में किस्मत अच्छी रही हो सकती है। फिर भी मुझे लगता है कि यह दूसरे alternatives की तुलना में अभी भी ज़्यादा hit and miss है। यह दिखाता है कि search quality का आकलन करना कठिन है। एक keyword search engine के रूप में इसमें semantic understanding नहीं है, इसे समझना ज़रूरी है.
  • Kagi के बारे में अपना अनुभव साझा करते हुए, HN पर इसके बारे में सुनने के बाद 100 searches के बाद subscribe किया। random JS और CSS searches में MDN पहला result आता है, और अगर ऐसा न हो तो spam sites को नीचे rank किया जा सकता है.
  • मैं उन लोगों में से एक हूँ जिन्हें लगता है कि Google के search results अभी भी बहुत अच्छे हैं। ad blocker (uBlock Origin) इस्तेमाल करने की बात मानता हूँ, और इसे बंद करने का कोई इरादा नहीं है। non-expert के search experience की नकल करने के लिए ad blocker बंद करने वाले लेखक का नज़रिया समझ आता है, लेकिन ad blocker चालू रखते हुए भी दूसरे tests किए जा सकते हैं। yt-dlp के लिए search result से उम्मीद non-expert experience से मेल नहीं खाती.
  • Kagi के मौजूदा search results की account न रखने वाले लोगों के साथ तुलना करने के लिए कई search terms के links दिए गए हैं.
  • web पर spam बहुत ज़्यादा है, इस बारे में लेखक की राय से सहमत हूँ। Kagi spam को नीचे rank करने में काफ़ी अच्छा काम करता है, और "Small Web" जैसे special search modes के ज़रिए spam को लगभग हटा सकता है.
  • search कठिन है और ऐसा लगता है कि हर कोई search results को manipulate करना जानता है। Kagi या Google के programmable search engine जैसे ऐसे search engine इस्तेमाल करने की सिफारिश है जिनमें sites को प्रभावी ढंग से बदला जा सके। results पर voting feature आकर्षक है, लेकिन उसके manipulate होने की संभावना है। whitelist approach की अपनी कमियाँ हैं, लेकिन नए domains को social media के ज़रिए verify करना अधिक पसंद है.
  • search quality खराब हुई है, यह दावा अक्सर anecdotal evidence पर आधारित होता है, जबकि यह एक verifiable claim होना चाहिए। असली evidence और criteria पेश करने की कोशिश हुई थी, लेकिन सामान्य दावा करने के लिए sample size बहुत छोटा है.
  • समझ नहीं आता कि ChatGPT पर लेख लिखने वाले लोग 3.5 version क्यों इस्तेमाल करते हैं। GPT-4 की तुलना में results काफ़ी अलग हैं.
  • uBlacklist आज़माने की सिफारिश है। यह search results को block करने का tool है, और settings व personal blocklist को Dropbox या Google Drive के साथ sync किया जा सकता है। blocklist subscription feature भी है, लेकिन अभी built-in feeds नहीं हैं.
  • "YouTube वीडियो download" के लिए अच्छे search results से yt-dlp या graphical user interface वाले yt-dlp की अपेक्षा पर सवाल उठाया गया। ज़्यादातर लोगों की programming में रुचि नहीं होती, और इससे एहसास होता है कि search results subjective होते हैं.
  • यह दोहराया नहीं जा सकता कि लेखक को Kagi में खराब results मिले। उन्हीं search terms पर कहीं बेहतर results दिखाई देते हैं। सोचता हूँ कि लेखक को इतने खराब results कैसे मिले.
  • लेखक की यह अपेक्षा अजीब लगती है कि search results सभी एक ही तरह के links लौटाएँ। 10 links अगर सभी एक ही चीज़ की ओर इशारा करें, तो वह खराब search है। search results को दिए गए query के लिए reasonable guesses को cover करना चाहिए। search engine quality metrics में भी यह राय झलकती है.