28 पॉइंट द्वारा rkawkancla 2026-02-09 | 8 टिप्पणियां | WhatsApp पर शेयर करें

एक non-developer होने के नाते, चैटबॉट से जुड़े products पर कई बार काम करते हुए, एक समय के बाद मुझे लगा कि मैं अपने हिसाब से product बनाकर देखना चाहता हूँ.

इसलिए मैंने Kmong पर चैटबॉट development शुरू किया.
इन दिनों Kmong पर non-developer projects काफ़ी हैं, और मैंने भी पिछले साल सितंबर से 5 महीनों में सिर्फ RAG चैटबॉट एक tool के रूप में इस्तेमाल करके लगभग 14 लाख won की कमाई की.

क्लाइंट्स की requirements ज़्यादातर मिलती-जुलती होती हैं, लेकिन थोड़ा-थोड़ा अलग RAG pipeline, Vector DB के इस्तेमाल आदि के अनुसार code modify करना झंझट भरा था, इसलिए मैंने OneRAG बनाया.

मुख्य आइडिया: config file की सिर्फ एक लाइन बदलें और कोई भी component replace करें

समर्थित components:

  • Vector DB: Weaviate, Chroma, Pinecone, Qdrant, pgvector, MongoDB
  • LLM: Gemini, OpenAI, Claude, OpenRouter
  • Reranker: Jina, Cohere, Google, OpenAI, Local
  • Cache: Memory, Redis, Semantic
  • Extra: GraphRAG, PII Mask, Agent

5 मिनट quickstart:
git clone https://github.com/notadev-iamaura/OneRAG
cd OneRAG && make quickstart

FastAPI आधारित, Docker Compose शामिल है, और Korean NLP का basic support देता है.
(मैं Korean AI services क्षेत्र में काम करता रहा हूँ)

MIT license. अगर आप architecture feedback दें या बताएं कि कौन-सा component जोड़ना अच्छा रहेगा, तो आभारी रहूँगा.

8 टिप्पणियां

 
rainystar 2026-02-19

हाल ही में मुझे भी धुंधले तौर पर लग रहा था कि ऐसी किसी service की ज़रूरत है। क्या आप zhipu के GLM या kimi जैसे Chinese models को जोड़ने के बारे में सोच रहे हैं?

 
rkawkancla 2026-02-19

आपकी राय के लिए धन्यवाद!
अभी भी OpenRouter के आधार पर model calls किए जा सकते हैं, इसलिए यदि आप OpenRouter-आधारित call settings का उपयोग करें तो सिर्फ model name बदलकर आपके बताए गए model को call करना संभव है.

यदि यह ऐसा structure है जिसमें आपने बताए गए model को local में चलाना है, तो हम इसे भविष्य के update में शामिल करना चाहते हैं.
हालाँकि, समय शायद तब होगा जब यह Korean RAG में उपयोग किए जा सकने वाले स्तर का model दिखाई देगा.

उससे पहले, हम एक simplified pipeline जोड़ने की योजना बना रहे हैं ताकि RAG को पहली बार इस्तेमाल करने वाले लोग भी आसानी से experiment कर सकें.

उदाहरण के लिए, हम Grok Collections API का उपयोग करके कम settings के साथ और भी आसानी से RAG करने वाली functionality जैसे फीचर्स पर विचार कर रहे हैं :)

 
rainystar 2026-02-20

उत्तर के लिए धन्यवाद। क्या आप open router से https://openrouter.ai/ इस सेवा की बात कर रहे हैं? आपने जो कहा कि यह कोरियाई RAG में उपयोग करने लायक स्तर का मॉडल है, उस हिस्से के बारे में मुझे बहुत जानकारी नहीं है, लेकिन मेरे मामले में GLM 4.7 ने मेरी इच्छित prompt पर sonnet 4.5 की तुलना में लगातार बेहतर कोरियाई उत्तर दिए हैं, इसलिए इस पर मेरा भरोसा थोड़ा बढ़ा है। इसलिए अगर आप इसे रुचि से देखें तो अच्छा होगा।

 
rkawkancla 2026-02-20

हाँ, सही है! उस लिंक के OpenRouter API के आधार पर model बदलना आसान है.
(हालाँकि, recharge cost पर लगभग 5% अतिरिक्त शुल्क लगता है, इसलिए toy project स्तर पर इसे सुविधाजनक रूप से इस्तेमाल किया जा सकता है.)

GLM4.7 की performance भी वास्तविक इस्तेमाल के दौरान जाँचकर, उसे लागू करने की योजना बनाऊँगा :)

 
limhasic 2026-02-10

वेबऐप को खूबसूरती से सजाने और चैटबॉट के लिए backend के रूप में इस्तेमाल करने के लिए यह अच्छा लगेगा।

 
rkawkancla 2026-02-14

हाँ, पर्सनल प्रोजेक्ट में फ्रंटएंड को अच्छे से सजाकर इस्तेमाल करने के लिए यह बुरा नहीं लगेगा :)

 
dkmin 2026-02-10

सार्वजनिक रूप से साझा करने के लिए धन्यवाद!

 
rkawkancla 2026-02-14

जी हाँ! अगर इससे RAG प्रोडक्ट को आसानी से टेस्ट करने में थोड़ा भी मदद मिले, तो मुझे अच्छा लगेगा!