R2R V2 - प्रोडक्शन-रेडी ओपन सोर्स RAG इंजन
(github.com/SciPhi-AI)- लोकल LLM प्रयोगों और प्रोडक्शन-लेवल Retrieval-Augmented Generation (RAG) सिस्टम के बीच की खाई को पाटने के लिए डिज़ाइन किया गया
- डेवलपर्स के लिए RESTful API-केंद्रित, उपयोग में आसान एक व्यापक और आधुनिक RAG सिस्टम प्रदान करता है
मुख्य विशेषताएँ
- मल्टीमोडल सपोर्ट:
.txt,.pdf,.json,.png,.mp3आदि विभिन्न फ़ाइल फ़ॉर्मैट्स का समर्थन। - हाइब्रिड सर्च: semantic और keyword search को मिलाकर प्रासंगिकता में सुधार।
- ग्राफ RAG: संबंधों को स्वतः निकालता है और knowledge graph बनाता है।
- ऐप मैनेजमेंट: दस्तावेज़ों और उपयोगकर्ताओं को कुशलता से प्रबंधित करता है, साथ ही समृद्ध observability और analytics सुविधाएँ देता है।
- क्लाइंट-सर्वर: RESTful API समर्थन।
- कॉन्फ़िगरेबल: सहज configuration files का उपयोग करके applications को provision किया जा सकता है।
- एक्स्टेंसिबल: builder + factory pattern के माध्यम से applications को आसानी से विस्तार दिया जा सकता है।
- डैशबोर्ड: उपयोगकर्ता-अनुकूल इंटरैक्शन के लिए open source React+Next.js app, R2R dashboard प्रदान करता है।
R2R डैशबोर्ड
ओपन सोर्स React+Next.js dashboard का उपयोग करके R2R के साथ इंटरैक्ट किया जा सकता है। शुरुआत करने के लिए dashboard Cookbook देखें।
1 टिप्पणियां
Hacker News राय
डेटा extraction की accuracy और efficiency: RAG सिस्टम में डेटा extraction प्रक्रिया एक महत्वपूर्ण चुनौती है। पारंपरिक OCR approach पर्याप्त नहीं है, इसलिए accuracy और consistency बढ़ाने के लिए multimodal LLM + OCR approach का उपयोग किया गया है.
मिलते-जुलते stack चलाने का अनुभव: 2 साल तक ऐसा ही stack चलाया है, जिसमें Pgvector, HyDe, web search + document search जैसी तकनीकों का उपयोग किया गया। logs और analytics सहित एक अच्छा dashboard भी है.
quick start की कठिनाई: quick start वास्तव में quick नहीं है। Docker Compose और Postgres image सहित setup देना चाहिए। dashboard इस्तेमाल करने के लिए अलग repo clone करना पड़ना असुविधाजनक है.
प्रोजेक्ट की जटिलता: प्रोजेक्ट में बहुत से components हैं, लेकिन इससे development आसान नहीं होता। यह SDK है या apps का collection, यह स्पष्ट नहीं है। ऐसा "1 क्लिक" installation experience होना चाहिए जिससे सभी features का preview किया जा सके.
accuracy verification: जवाबों की accuracy को कैसे verify किया जा सकता है, इस पर सवाल है। यह भी जानना चाहा गया है कि generated answer की प्रक्रिया को trace करने का कोई तरीका है या नहीं.
डेटा ingestion की कठिनाई: कई RAG projects में डेटा ingestion ठीक से solve नहीं किया गया है। बड़ी संख्या में HTML documents को system में bulk में ingest करने के तरीके पर सवाल है.
multimodal डेटा ingestion: multimodal डेटा ingestion प्रक्रिया के बारे में विस्तार से पूछा गया है। R2R अभी किन data types को handle कर सकता है और non-text data types के embeddings कैसे किए जाते हैं, इस पर सवाल है.
डेवलपमेंट टीम optimization: इस प्रक्रिया ने development team के लिए काम को कैसे तेज और optimized बनाया, इस पर स्पष्टीकरण मांगा गया है। इसमें MVP (minimum viable product) development time को तेज करने की बड़ी क्षमता है.
source code के साथ काम: source code को समझ सकने वाला RAG solution खोजा जा रहा है। उदाहरण के लिए, "submit button क्लिक करने पर call होने वाला analytics event" समझने की क्षमता चाहिए.
Neo4j के उपयोग का विरोध: Neo4j का उपयोग नहीं करना चाहते, क्योंकि यह resources बहुत consume करता है.
लोकप्रिय chat frontend के साथ integration: OpenWebUI जैसे लोकप्रिय chat frontend के साथ integration है या नहीं, इस पर सवाल है.