-
Rust + Tantivy आधारित (Rust में बनाया गया Apache Lucene जैसा open source, Korean tokenizer सपोर्ट सहित)
-
बड़े datasets को index करने के लिए डिज़ाइन किया गया
→ Compute और Storage अलग: S3 जैसे storage को searchable बनाया जा सकता है
→ search cluster का आसान प्रबंधन: कुछ ही सेकंड में instances जोड़ना/हटाना संभव
- समर्थित फीचर्स
→ index और cluster management के लिए सरल CLI
→ local/remote index
→ Stateless instances
→ Byte Range queries को सपोर्ट करने वाले किसी भी object storage के साथ उपयोग संभव
→ Full Text search (Phrase Query सहित)
→ built-in time partitioning सपोर्ट
→ Boolean queries सपोर्ट
→ Text, i64, f64, date, bytes, composite types object, array data types सपोर्ट
1 टिप्पणियां
यह कैसे cost-efficient बनाया गया है, यह ब्लॉग में लिखे परिचयात्मक लेख में बताया गया है।
Quickwit: A highly cost-efficient search engine in Rust https://quickwit.io/blog/quickwit-first-release/
Tantivy https://github.com/tantivy-search/tantivy
पहले जब मैंने " Bayard - Rust में कार्यान्वित फुल-टेक्स्ट खोज और इंडेक्सिंग सर्वर https://hi.news.hada.io/topic?id=841 " का परिचय दिया था, तब Tantivy में Korean tokenizer नहीं था, लेकिन अब जोड़ दिया गया है।
https://github.com/lindera-morphology/lindera-ko-dic-builder
Korean tokenizer