यह NVIDIA द्वारा जारी Nemotron-Personas-Korea dataset का उपयोग करके बनाया गया Korean persona explorer है.

यह dataset 10 लाख Koreans के पैमाने का एक synthetic dataset है, जिसमें उम्र, पेशा, क्षेत्र, पारिवारिक संबंध आदि शामिल हैं. Dataset कैसे बनाया गया और उसके statistical information के बारे में https://hi.news.hada.io/topic?id=28919 पर विस्तार से बताया गया है.

Persona explorer की मुख्य सुविधाएँ इस प्रकार हैं.

  1. आप personas को search कर सकते हैं या मिलते-जुलते personas ढूँढ सकते हैं. Similarity की तुलना के लिए Qwen embedding model का उपयोग किया जाता है.

  2. मानचित्र पर persona की population distribution देखी जा सकती है. इसके लिए dataset में मौजूद location information का उपयोग किया जाता है.

  3. आप persona से बातचीत कर सकते हैं. यह बहुत सरल सवालों के स्तर तक जवाब दे सकता है.

Qwen 0.6 embedding model का उपयोग करके पूरे dataset के लिए 1024-dimensional embeddings निकाले गए और उन्हें Hugging Face dataset के रूप में बनाया गया. *_persona column में नाम बार-बार आने की विशेषता होने के कारण, embeddings के मान नाम की ओर biased हो सकते हैं.

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.