OneRAG - चैटबॉट PM द्वारा बनाया गया RAG सोर्स, जिसमें config की सिर्फ एक लाइन से Vector DB/LLM आदि बदले जा सकते हैं
(github.com/notadev-iamaura)एक non-developer होने के नाते, चैटबॉट से जुड़े products पर कई बार काम करते हुए, एक समय के बाद मुझे लगा कि मैं अपने हिसाब से product बनाकर देखना चाहता हूँ.
इसलिए मैंने Kmong पर चैटबॉट development शुरू किया.
इन दिनों Kmong पर non-developer projects काफ़ी हैं, और मैंने भी पिछले साल सितंबर से 5 महीनों में सिर्फ RAG चैटबॉट एक tool के रूप में इस्तेमाल करके लगभग 14 लाख won की कमाई की.
क्लाइंट्स की requirements ज़्यादातर मिलती-जुलती होती हैं, लेकिन थोड़ा-थोड़ा अलग RAG pipeline, Vector DB के इस्तेमाल आदि के अनुसार code modify करना झंझट भरा था, इसलिए मैंने OneRAG बनाया.
मुख्य आइडिया: config file की सिर्फ एक लाइन बदलें और कोई भी component replace करें
समर्थित components:
- Vector DB: Weaviate, Chroma, Pinecone, Qdrant, pgvector, MongoDB
- LLM: Gemini, OpenAI, Claude, OpenRouter
- Reranker: Jina, Cohere, Google, OpenAI, Local
- Cache: Memory, Redis, Semantic
- Extra: GraphRAG, PII Mask, Agent
5 मिनट quickstart:
git clone https://github.com/notadev-iamaura/OneRAG
cd OneRAG && make quickstart
FastAPI आधारित, Docker Compose शामिल है, और Korean NLP का basic support देता है.
(मैं Korean AI services क्षेत्र में काम करता रहा हूँ)
MIT license. अगर आप architecture feedback दें या बताएं कि कौन-सा component जोड़ना अच्छा रहेगा, तो आभारी रहूँगा.
8 टिप्पणियां
हाल ही में मुझे भी धुंधले तौर पर लग रहा था कि ऐसी किसी service की ज़रूरत है। क्या आप zhipu के GLM या kimi जैसे Chinese models को जोड़ने के बारे में सोच रहे हैं?
आपकी राय के लिए धन्यवाद!
अभी भी OpenRouter के आधार पर model calls किए जा सकते हैं, इसलिए यदि आप OpenRouter-आधारित call settings का उपयोग करें तो सिर्फ model name बदलकर आपके बताए गए model को call करना संभव है.
यदि यह ऐसा structure है जिसमें आपने बताए गए model को local में चलाना है, तो हम इसे भविष्य के update में शामिल करना चाहते हैं.
हालाँकि, समय शायद तब होगा जब यह Korean RAG में उपयोग किए जा सकने वाले स्तर का model दिखाई देगा.
उससे पहले, हम एक simplified pipeline जोड़ने की योजना बना रहे हैं ताकि RAG को पहली बार इस्तेमाल करने वाले लोग भी आसानी से experiment कर सकें.
उदाहरण के लिए, हम Grok Collections API का उपयोग करके कम settings के साथ और भी आसानी से RAG करने वाली functionality जैसे फीचर्स पर विचार कर रहे हैं :)
उत्तर के लिए धन्यवाद। क्या आप open router से https://openrouter.ai/ इस सेवा की बात कर रहे हैं? आपने जो कहा कि यह कोरियाई RAG में उपयोग करने लायक स्तर का मॉडल है, उस हिस्से के बारे में मुझे बहुत जानकारी नहीं है, लेकिन मेरे मामले में GLM 4.7 ने मेरी इच्छित prompt पर sonnet 4.5 की तुलना में लगातार बेहतर कोरियाई उत्तर दिए हैं, इसलिए इस पर मेरा भरोसा थोड़ा बढ़ा है। इसलिए अगर आप इसे रुचि से देखें तो अच्छा होगा।
हाँ, सही है! उस लिंक के OpenRouter API के आधार पर model बदलना आसान है.
(हालाँकि, recharge cost पर लगभग 5% अतिरिक्त शुल्क लगता है, इसलिए toy project स्तर पर इसे सुविधाजनक रूप से इस्तेमाल किया जा सकता है.)
GLM4.7 की performance भी वास्तविक इस्तेमाल के दौरान जाँचकर, उसे लागू करने की योजना बनाऊँगा :)
वेबऐप को खूबसूरती से सजाने और चैटबॉट के लिए backend के रूप में इस्तेमाल करने के लिए यह अच्छा लगेगा।
हाँ, पर्सनल प्रोजेक्ट में फ्रंटएंड को अच्छे से सजाकर इस्तेमाल करने के लिए यह बुरा नहीं लगेगा :)
सार्वजनिक रूप से साझा करने के लिए धन्यवाद!
जी हाँ! अगर इससे RAG प्रोडक्ट को आसानी से टेस्ट करने में थोड़ा भी मदद मिले, तो मुझे अच्छा लगेगा!