फ़िलहाल GeekNews में Google search को embed करके इस्तेमाल किया जा रहा है,
और व्यक्तिगत रूप से मुझे इसमें कुछ असुविधा महसूस होती है.
हाल में देखी गई किसी ख़बर के मोटे तौर पर keyword याद रखकर उसे खोजें,
तो उसे नवीनतम क्रम में sort करने का तरीका नहीं होने से ढूँढना मुश्किल हो जाता है.
मैंने vector store को wasm में डालकर implement किए गए उदाहरण भी देखे हैं,
लेकिन search engine मेरा क्षेत्र नहीं है, इसलिए इसकी रूपरेखा बनाना आसान नहीं लग रहा.
अगर frontend स्तर पर fuzzy search जैसी चीज़ें implement करें, तो शायद server पर लोड बढ़ेगा,
यह हल्की-फुल्की चर्चा के लिए है, लेकिन इसे प्रभावी ढंग से implement करने का कोई तरीका हो सकता है क्या?
7 टिप्पणियां
मैं search पसंद करने वाला काफ़ी भारी user हूँ, लेकिन एक दिन में search volume लगभग कितना आता है?
अगर यह कम है, तो मौजूदा search method को मोटे तौर पर बनाए रखते हुए rerank model का इस्तेमाल करके natural language search आज़माया जा सकता है।
यह पहले मेरे द्वारा बनाई गई सेवा की एक मोटी-सी search संरचना है.
मोटे तौर पर, पहले चरण में
esपर query भेजने के बादcohere rerank apiलागू किया जाता है, और फिर natural language के आधार पर rerank score से सबसे बेहतर मेल खाने वाले मूल लेख को आधार बनाकर serve किया जाता है.लेकिन अब सोचता हूँ कि अगर आपने Google को embedding किया है, तो शायद search result item के अंदर के html मूल लेख को लाने का कोई खास तरीका नहीं होगा. फिर भी फिलहाल लिंक छोड़ रहा हूँ.
लिंक : https://dev-wiki.dev/reading/tech/1
मैं बहुत फुर्सत में हूँ और मुझे search पसंद है, इसलिए अगर इस बारे में अभी भी बात करने के लिए कुछ बाकी हो तो कृपया छोड़ दें :)
मेरे मामले में, यह थोड़ा असुविधाजनक लगता है कि सबसे नए परिणाम पहले नहीं आते। पुराने bbs बोर्ड की तरह, साधारण LIKE क्वेरी से खोज करना मेरी ज़रूरतों के लिए शायद ज़्यादा उपयुक्त होगा। हालांकि, गति की वजह से range पर थोड़ा विचार करना पड़ सकता है..
यह असुविधा मुझे भी महसूस होती है। उदाहरण के लिए, जब "AI" खोजते हैं, तो अक्सर 5 साल पुराने लेख पहले पेज पर आ जाते हैं।
लगता है कि embedded Google search के नतीजे JSON के रूप में आउटपुट होते हैं, तो उन्हें लाकर sort कर दीजिए।
https://cse.google.com/cse/element/v1 request को जाँच कर देखें
Google में सीधे search करना कैसा रहेगा?
query: site:news.hada.io duckdb
https://google.com/search/…