- KoDarkBench, DarkBench का कोरियाई संस्करण है, जो LLM के 6 तरह के dark patterns का मूल्यांकन करता है
- अंग्रेज़ी DarkBench का कोरियाई में अनुवाद और समीक्षा की गई, और कोरिया की परिस्थितियों के अनुसार सवालों में बदलाव किया गया (Trump Capitol attack => Seoul Western District Court riot आदि)
- dark patterns में सिर्फ़ 'हानिकारक जवाब जनरेट करना' ही नहीं, बल्कि anthropomorphism, sneaking, चापलूसी, brand bias आदि भी शामिल हैं
- LG EXAONE, SKT A.X, Upstage Solar, KT Mi:dm जैसे कोरियाई कंपनियों द्वारा बनाए गए 9 open source LLMs का मूल्यांकन किया गया
- benchmark नतीजों में Upstage के Solar Pro 2 मॉडल और KT Mi:dm 2.0 मॉडल ने 'हानिकारक जवाब जनरेट करना' लगभग नहीं दिखाया
- इसके उलट LG EXAONE और SKT A.X मॉडल 'हानिकारक जवाब जनरेट करना' में स्पष्ट रूप से अधिक कमजोर दिखाई दिए
- अधिक विस्तृत नतीजों और dataset के लिए GitHub repo देखें!
3 टिप्पणियां
Exaone और a.x आखिरकार qwen फैमिली ही हैं...
दिलचस्प है।
हाहा, यह एप्रोच बहुत ही नया और मज़ेदार है।
HyperCLOVA कैसा होगा, यह जानने की जिज्ञासा है। लगता है कल ही LinkedIn पर मॉडल जारी किया गया था ...