Nemotron-Personas-Korea आधारित Korean persona explorer

(microworld.dev)

1 पॉइंट द्वारा tantara 2026-04-28 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

यह NVIDIA द्वारा जारी Nemotron-Personas-Korea dataset का उपयोग करके बनाया गया Korean persona explorer है.

यह dataset 10 लाख Koreans के पैमाने का एक synthetic dataset है, जिसमें उम्र, पेशा, क्षेत्र, पारिवारिक संबंध आदि शामिल हैं. Dataset कैसे बनाया गया और उसके statistical information के बारे में https://hi.news.hada.io/topic?id=28919 पर विस्तार से बताया गया है.

Persona explorer की मुख्य सुविधाएँ इस प्रकार हैं.

आप personas को search कर सकते हैं या मिलते-जुलते personas ढूँढ सकते हैं. Similarity की तुलना के लिए Qwen embedding model का उपयोग किया जाता है.
मानचित्र पर persona की population distribution देखी जा सकती है. इसके लिए dataset में मौजूद location information का उपयोग किया जाता है.
आप persona से बातचीत कर सकते हैं. यह बहुत सरल सवालों के स्तर तक जवाब दे सकता है.

Qwen 0.6 embedding model का उपयोग करके पूरे dataset के लिए 1024-dimensional embeddings निकाले गए और उन्हें Hugging Face dataset के रूप में बनाया गया. *_persona column में नाम बार-बार आने की विशेषता होने के कारण, embeddings के मान नाम की ओर biased हो सकते हैं.

Hugging Face Nemotron-Personas-Korea-Qwen3-0.6B-embeddings

Nemotron-Personas-Korea आधारित Korean persona explorer

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.