12 पॉइंट द्वारा xguru 2021-07-21 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Rust + Tantivy आधारित (Rust में बनाया गया Apache Lucene जैसा open source, Korean tokenizer सपोर्ट सहित)

  • बड़े datasets को index करने के लिए डिज़ाइन किया गया

→ Compute और Storage अलग: S3 जैसे storage को searchable बनाया जा सकता है

→ search cluster का आसान प्रबंधन: कुछ ही सेकंड में instances जोड़ना/हटाना संभव

  • समर्थित फीचर्स

→ index और cluster management के लिए सरल CLI

→ local/remote index

→ Stateless instances

→ Byte Range queries को सपोर्ट करने वाले किसी भी object storage के साथ उपयोग संभव

→ Full Text search (Phrase Query सहित)

→ built-in time partitioning सपोर्ट

→ Boolean queries सपोर्ट

→ Text, i64, f64, date, bytes, composite types object, array data types सपोर्ट

1 टिप्पणियां

 
xguru 2021-07-21

यह कैसे cost-efficient बनाया गया है, यह ब्लॉग में लिखे परिचयात्मक लेख में बताया गया है।

पहले जब मैंने " Bayard - Rust में कार्यान्वित फुल-टेक्स्ट खोज और इंडेक्सिंग सर्वर https://hi.news.hada.io/topic?id=841 " का परिचय दिया था, तब Tantivy में Korean tokenizer नहीं था, लेकिन अब जोड़ दिया गया है।

https://github.com/lindera-morphology/lindera-ko-dic-builder

Korean tokenizer