DeepEval - LLM के लिए यूनिट टेस्टिंग

xguru · 2023-08-19T10:03:01+09:00

इसकी मूल दर्शनशैली Pytest for LLM है प्रोडक्शन में ले जाने के लिए, यह LLM पाइपलाइन के लिए offline evaluation चलाने का एक Pythonic तरीका देता है Python unit test लिखने की तरह LLM applications (RAG जैसे) के लिए टेस्ट लिखे जा सकते हैं assert_llm_output के ज़रिए entailment / exact / bertscore जैसे metrics से उत्तरों का मूल्यांकन किया जा सकता है custom metrics सेट करना और मौजूदा metrics को संशोधित करना भी संभव है

(github.com/mr-gpt)

4 पॉइंट द्वारा xguru 2023-08-19 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

इसकी मूल दर्शनशैली Pytest for LLM है
प्रोडक्शन में ले जाने के लिए, यह LLM पाइपलाइन के लिए offline evaluation चलाने का एक Pythonic तरीका देता है
Python unit test लिखने की तरह LLM applications (RAG जैसे) के लिए टेस्ट लिखे जा सकते हैं
assert_llm_output के ज़रिए entailment / exact / bertscore जैसे metrics से उत्तरों का मूल्यांकन किया जा सकता है
custom metrics सेट करना और मौजूदा metrics को संशोधित करना भी संभव है

DeepEval - LLM के लिए यूनिट टेस्टिंग

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.