turbo-graph – turbovec पर graph memory/filter cache जोड़ा गया constrained RAG index
(github.com/bigmacfive)नमस्ते। मैंने turbovec/TurboQuant के आधार पर constrained RAG के लिए graph memory layer जोड़कर turbo-graph बनाया है.
turbovec flat top-k या cheap allowlist वाले मामलों में पहले से ही अच्छा है। लेकिन वास्तविक RAG में query अक्सर कुछ ऐसी दिखती है।
tenant ACL ∩ tag ∩ source ∩ time window ∩ graph neighbors ∩ BM25 candidates
हर बार इस संयोजन को Python/SQL/app layer में बनाना, फिर उसे vector search को देना, परिणामों को graph/BM25 के साथ rerank करना, और यह explain करने वाला code कि ऐसा result क्यों आया—ये सब बार-बार दोहराना पड़ता था।
turbo-graph, turbovec-compatible core को बनाए रखते हुए, उसके आसपास की graph/metadata view compilation, cache reuse, graph rerank, और explain telemetry को index layer में ले जाने का एक प्रयोग है।
यह अभी Alpha में है, इसलिए इसे तुरंत production में इस्तेमाल करने के बजाय, मैं इस पर feedback पाना चाहता हूँ कि वास्तविक RAG route में किस तरह के API की ज़रूरत होती है।
अभी कोई टिप्पणी नहीं है.