Llama 2 Chat 70B ने मॉडल मूल्यांकन में ChatGPT(3.5) को पीछे छोड़ा

xguru · 2023-07-31T10:17:01+09:00

Instruction-Following भाषा मॉडलों का स्वचालित मूल्यांकन करने वाले AlpacaEval Leaderboard के अनुसार GPT-4 95.28% > Llama Chat 70B 92.66% > Claude 2 91.36% > ChatGPT 89.37% AlpacaEval, AlpacaFarm evaluation set का उपयोग करके GPT-4 के उत्तरों से तुलना कर स्वचालित मूल्यांकन करता है

(tatsu-lab.github.io)

10 पॉइंट द्वारा xguru 2023-07-31 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

Instruction-Following भाषा मॉडलों का स्वचालित मूल्यांकन करने वाले AlpacaEval Leaderboard के अनुसार
GPT-4 95.28% > Llama Chat 70B 92.66% > Claude 2 91.36% > ChatGPT 89.37%
AlpacaEval, AlpacaFarm evaluation set का उपयोग करके GPT-4 के उत्तरों से तुलना कर स्वचालित मूल्यांकन करता है

Llama 2 Chat 70B ने मॉडल मूल्यांकन में ChatGPT(3.5) को पीछे छोड़ा

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.