FLAMEHAVEN FileSearch v1.3.1 – ML dependencies हटाईं और semantic search engine का बड़ा पुनर्गठन
(github.com/flamehaven01)FLAMEHAVEN FileSearch एक open source project है, जिसकी शुरुआत इस सवाल से हुई थी:
👉 “क्या document search के लिए RAG को हल्का, reproducible और पूरी तरह self-hosted बनाया जा सकता है?”
फिलहाल ⭐ Star 81 / 🍴 Fork 11 के साथ, यह छोटा लेकिन हर release में लगातार स्पष्ट सुधार करने वाला project है।
यह v1.3.1 release सिर्फ feature addition नहीं है,
👉 यह उस धारणा को तोड़ने वाला update है कि “semantic search = भारी ML stack”.
🔍 project का एक-पंक्ति सार
-
Self-hosted RAG search engine
-
documents (PDF/DOCX/MD/TXT) upload करने पर keyword + semantic + hybrid search
-
external vector DB के बिना local में काम करता है
-
Docker की एक line से 3 मिनट के भीतर चला सकते हैं
✨ v1.3.1 के मुख्य updates (डेवलपर्स को पसंद आने वाले points)
1️⃣ ML dependencies पूरी तरह हटाईं (सबसे बड़ा बदलाव)
-
sentence-transformers / torch पूरी तरह हटाए गए
-
खुद implement किया गया DSP v2.0 (Deterministic Semantic Projection) जोड़ा गया
-
✔️ vector generation < 1ms
-
✔️ initialization delay नहीं (पहले 2 मिनट → अब तुरंत)
-
semantic search है, लेकिन ML framework के बिना deterministic तरीके से काम करता है
2️⃣ memory और performance optimization
-
int8 vector quantization
→ memory usage में 75% कमी -
cosine similarity calculation 30% से अधिक तेज
-
metadata 90% से अधिक compressed (Gravitas-Pack)
-
personal server / internal VM पर भी बिना बोझ के चला सकते हैं
3️⃣ search modes का विस्तार
-
keyword / semantic / hybrid search mode support
-
typo correction + query refinement शामिल
-
existing API के साथ पूरी तरह backward-compatible
4️⃣ stability और reliability
-
test framework को pytest → unittest में बदला गया
-
19/19 tests pass (0.33s)
-
timeout और CI instability हटाई गई
🔐 production features जो अभी भी बरकरार हैं
-
API Key-आधारित authentication और permission management
-
Rate limiting / Audit log
-
Batch search (1~100 queries)
-
Optional Redis cache
-
Prometheus metrics
👀 इनके लिए खास तौर पर उपयुक्त
-
वे teams जिन्हें internal document search के लिए local RAG चाहिए
-
ऐसे environments जहाँ external SaaS (जैसे Pinecone) पर data upload करना मुश्किल है
-
वे developers जो “PoC तो हो गया, लेकिन production operation कैसे करें?” वाले चरण में हैं
-
वे engineers जो reproducibility / cost / control को महत्व देते हैं
🔗 GitHub
👉 https://github.com/flamehaven01/Flamehaven-Filesearch
---अगर इसे इस्तेमाल करके मदद मिली हो, तो ⭐ देकर support करना बहुत मददगार होगा।
राय, feedback और PR सभी का स्वागत है।
अभी कोई टिप्पणी नहीं है.