- नए browser-आधारित Wikipedia search engine पर लेख, जो offline search को सक्षम बनाता है
- search engine की Wikipedia के 10 लाख पेजों में real-time search करने की क्षमता, mobile device पर हर 10ms में परिणाम लौटाता है
- search engine database का छोटा आकार, बिना किसी विशेष processing के 10 लाख embeddings को support करने वाले casual use case
- sentence transformer का उपयोग करके document embedding, product quantization के जरिए embedding compression, और browser में distance calculation चलाने के लिए pq.js का उपयोग करने वाला search engine
- query के लिए browser के भीतर sentence transformer चलाने हेतु transformers.js का उपयोग करने वाला search engine
- compressed page size के आधार पर embeddings को sort करने वाला search engine, जहाँ अधिक information density वाले पेज पहले analyze होते हैं और top 10 ranking में लौटाए जाते हैं
- high performance के लिए JSON की जगह Arrow का उपयोग करने वाला search engine, Arrow 8-bit integer product quantization arrays को compact रूप में store कर सकता है
- WebAssembly में चलने वाले ONNX model का उपयोग करने वाला search engine, जिसमें अभी GPU acceleration नहीं है
- sentence transformer से पूरी Wikipedia को embed करने, product quantization से embeddings को compress करने, और ONNX को manually लिखने वाला search engine
- embeddings और metadata को store करने के लिए numpy को Arrow में export करने वाला search engine, जो memory और disk दोनों में कहीं अधिक compact है
- product subcategory में real-time search की अनुमति देने वाली faceted search को support करने वाला search engine
- लेखक feedback और improvement suggestions आमंत्रित करते हैं, खासकर अलग quantization levels और अलग embedding dimensions के support पर
1 टिप्पणियां
Hacker News राय