GPTCache - LLM queries के जवाब cache करने वाली लाइब्रेरी

xguru · 2023-04-24T10:03:05+09:00

LLM के जवाबों को cache करके संगठन की LLM लागत कम करता है और response speed तेज़ बनाता है semantic caching strategy के ज़रिए मिलती-जुलती या संबंधित queries खोजकर cache hit rate बढ़ाता है embedding algorithm के माध्यम से queries को embeddings में बदलता है और vector store के ज़रिए इन embeddings पर similarity search करता है LLM Adapter : OpenAI ChatGPT और LangChain support (Bard/Anthropic/LLaMA आदि के लिए support नियोजित) MultiModal Adapter : OpenAI Image Create, OpenAI Audio Transribe, HuggingFace Stable Diffusion Embedding Generator : OpenAI, ONNX, HuggingFace, Cohere, fastText, SentenceTransformers Cache Storage : SQLite, PostgreSQL, MySQL, SQLServer,.. Vector Store : Mulvus, Zilliz Cloud, FAISS, Hnswlib Cache Manager : LRU, FIFO

(github.com/zilliztech)

13 पॉइंट द्वारा xguru 2023-04-24 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

LLM के जवाबों को cache करके संगठन की LLM लागत कम करता है और response speed तेज़ बनाता है
semantic caching strategy के ज़रिए मिलती-जुलती या संबंधित queries खोजकर cache hit rate बढ़ाता है
- embedding algorithm के माध्यम से queries को embeddings में बदलता है और vector store के ज़रिए इन embeddings पर similarity search करता है
LLM Adapter : OpenAI ChatGPT और LangChain support (Bard/Anthropic/LLaMA आदि के लिए support नियोजित)
MultiModal Adapter : OpenAI Image Create, OpenAI Audio Transribe, HuggingFace Stable Diffusion
Embedding Generator : OpenAI, ONNX, HuggingFace, Cohere, fastText, SentenceTransformers
Cache Storage : SQLite, PostgreSQL, MySQL, SQLServer,..
Vector Store : Mulvus, Zilliz Cloud, FAISS, Hnswlib
Cache Manager : LRU, FIFO

GPTCache - LLM queries के जवाब cache करने वाली लाइब्रेरी

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.