FLAMEHAVEN FileSearch एक open source project है, जिसकी शुरुआत इस सवाल से हुई थी:
👉 “क्या document search के लिए RAG को हल्का, reproducible और पूरी तरह self-hosted बनाया जा सकता है?”

फिलहाल ⭐ Star 81 / 🍴 Fork 11 के साथ, यह छोटा लेकिन हर release में लगातार स्पष्ट सुधार करने वाला project है।

यह v1.3.1 release सिर्फ feature addition नहीं है,
👉 यह उस धारणा को तोड़ने वाला update है कि “semantic search = भारी ML stack”.


🔍 project का एक-पंक्ति सार

  • Self-hosted RAG search engine

  • documents (PDF/DOCX/MD/TXT) upload करने पर keyword + semantic + hybrid search

  • external vector DB के बिना local में काम करता है

  • Docker की एक line से 3 मिनट के भीतर चला सकते हैं


✨ v1.3.1 के मुख्य updates (डेवलपर्स को पसंद आने वाले points)
1️⃣ ML dependencies पूरी तरह हटाईं (सबसे बड़ा बदलाव)

  • sentence-transformers / torch पूरी तरह हटाए गए

  • खुद implement किया गया DSP v2.0 (Deterministic Semantic Projection) जोड़ा गया

  • ✔️ vector generation < 1ms

  • ✔️ initialization delay नहीं (पहले 2 मिनट → अब तुरंत)

  • semantic search है, लेकिन ML framework के बिना deterministic तरीके से काम करता है


2️⃣ memory और performance optimization

  • int8 vector quantization
    → memory usage में 75% कमी

  • cosine similarity calculation 30% से अधिक तेज

  • metadata 90% से अधिक compressed (Gravitas-Pack)

  • personal server / internal VM पर भी बिना बोझ के चला सकते हैं


3️⃣ search modes का विस्तार

  • keyword / semantic / hybrid search mode support

  • typo correction + query refinement शामिल

  • existing API के साथ पूरी तरह backward-compatible


4️⃣ stability और reliability

  • test framework को pytest → unittest में बदला गया

  • 19/19 tests pass (0.33s)

  • timeout और CI instability हटाई गई


🔐 production features जो अभी भी बरकरार हैं

  • API Key-आधारित authentication और permission management

  • Rate limiting / Audit log

  • Batch search (1~100 queries)

  • Optional Redis cache

  • Prometheus metrics


👀 इनके लिए खास तौर पर उपयुक्त

  • वे teams जिन्हें internal document search के लिए local RAG चाहिए

  • ऐसे environments जहाँ external SaaS (जैसे Pinecone) पर data upload करना मुश्किल है

  • वे developers जो “PoC तो हो गया, लेकिन production operation कैसे करें?” वाले चरण में हैं

  • वे engineers जो reproducibility / cost / control को महत्व देते हैं


🔗 GitHub

👉 https://github.com/flamehaven01/Flamehaven-Filesearch

---अगर इसे इस्तेमाल करके मदद मिली हो, तो ⭐ देकर support करना बहुत मददगार होगा।
राय, feedback और PR सभी का स्वागत है।

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.