typesense - ओपन सोर्स सर्च इंजन
(typesense.org)- बहुत तेज़ है, और सर्च क्वेरी से संबंधित परिणाम खोजकर देता है
→ Typo Tolerance (टाइपो सहनशीलता): कुछ हद तक टाइपो को अपने आप पहचानकर प्रोसेस करता है
-
सर्च रैंकिंग को आसानी से समायोजित किया जा सकता है
-
सर्च के समय अलग-अलग फ़ील्ड के आधार पर sorting का समर्थन
-
Facet & Filter नेविगेशन का समर्थन: सर्च परिणामों को खास फ़ील्ड इकाइयों में समूहित करके दिखाता है और फ़िल्टर करता है
-
किसी खास परिणाम तक पहुँचने के लिए API Key की scope restriction सेट की जा सकती है
-
Raft-आधारित clustering
-
Linux/Mac binaries और Docker image उपलब्ध
-
C में लिखा गया ओपन सोर्स
FAQ में
- ElasticSearch से यह कैसे अलग है?
→ ES की installation और management जटिल है, लेकिन TypeSense को "Time-to-Market" के लिए बनाया गया है, इसलिए इसे जल्दी install किया जा सकता है, और बेशक scale भी किया जा सकता है
- Algolia से यह कैसे अलग है?
→ Algolia काफ़ी अच्छा search engine SaaS है, लेकिन महंगा है। TypeSense को self-host भी किया जा सकता है, और इसका SaaS version भी सस्ता है (stored records या searches के आधार पर billing नहीं, बल्कि usage time और bandwidth के आधार पर billing)
→ फ़ीचर के हिसाब से TypeSense, ElasticSearch की तुलना में Algolia से ज़्यादा मिलता-जुलता है
- गति तेज़ है, तो memory footprint कैसा है?
→ बेसिक तौर पर TypeSense server लगभग 30MB memory लेता है, और data indexing शुरू होने पर यह बढ़ता है, लेकिन यह बहुत compact data structure बनाए रखता है
→ Hacker News पोस्ट के 10 लाख शीर्षक JSON में 88MB हैं, और इन्हें Typesense index करके memory में लोड करने पर लगभग 165MB इस्तेमाल होता है
2 टिप्पणियां
अगर आम तौर पर किसी service के भीतर search engine बनाना हो, तो setup से लेकर management तक थोड़ा complex होता है, लेकिन यह एक open source है जिससे इसे जल्दी किया जा सकता है.
हालांकि, अगर Korean भाषा की बात हो तो morphological analysis वगैरह जैसी चीज़ों पर ध्यान देना पड़ेगा.. लेकिन यह character-level पर तेज़ी से खोजकर results दिखाता है, इसलिए इसे consider करने लायक value दिखती है.
इस TypeSense का उपयोग करके डेमो के तौर पर बनाई गई एक साइट है, उसे साथ में देखें तो अच्छा रहेगा