Athena - AI से 5 हज़ार नकली कोरियाइयों से वोट डलवाने का एक प्रयोग (2026 स्थानीय चुनाव, प्रांतीय/महानगरीय प्रमुख)
(github.com/Kimchikilla)Nemotron-Personas-Korea पर LLM जोड़कर 2026 स्थानीय चुनाव के
प्रांतीय/महानगरीय प्रमुखों का सिमुलेशन चलाया गया।
NEC से 8,300 उम्मीदवार crawl किए गए → हर प्रांत/शहर के लिए 300 personas, कुल 5,100 का sampling → Gemma 4 e4b से 4,800 वोटों का simulation (RTX 5060, 3 घंटे)।
परिणाम
दाएगू मेयर: Kim Han-gu (independent) 90.5% / Lee Jae-man (PPP) 8.2% / Kim Boo-kyum (Democratic) 1.4%
पूर्व प्रधानमंत्री + 4 बार के सांसद + दाएगू मूल के होने के बावजूद 1.4%। LLM persona के "worker" लेबल की ओर खिंच गया और वोट independent worker उम्मीदवार की तरफ़ जमा दिए।
समग्र पैटर्न:
- incumbency premium का अतिमूल्यांकन (Gangwon Kim Jin-tae 100%, Gyeongbuk Lee Cheol-woo 99%)
- job label का सरल matching
- जानकारी कम होने पर abstention में विस्फोट (Chungbuk 73%, Incheon 93%)
निष्कर्ष
LLM persona simulation जनमत सर्वेक्षण का विकल्प नहीं बन सकता। अमेरिकी LLM-as-voter शोध को कोरियाई राजनीति पर ज्यों-का-त्यों लागू नहीं किया जा सकता, यह बात मात्रात्मक रूप से
पुष्टि हुई।
4 टिप्पणियां
मैं "साथ में देखने लायक लेख" में मौजूद "ManyPerson" का निर्माता हूँ.
जैसा आपने कहा, LLM persona simulation जनमत सर्वेक्षण का विकल्प नहीं, बल्कि एक "पूरक" है.
बेशक, persona की precision और background information जितनी अधिक डाली जाए, परिणाम उतने ही वास्तविक मानों के करीब जा सकते हैं, लेकिन मूल रूप से मैंने भी इस सेवा को विकल्प के रूप में नहीं, बल्कि पूरक सेवा के रूप में सोचकर बनाया है.
फिर भी, मेरा मानना है कि इसमें पर्याप्त मूल्य है.
मैं सहमत हूँ!!
अब देख रहा हूँ कि थोड़ी देर पहले मैं थोड़ा बिखरा हुआ था, इसलिए जवाब लिखते-लिखते बीच में रुक गया था;;
सबसे पहले, मेरी नज़र में AI persona responses की एक अहम वैल्यू यह है कि...
वे user या author को कहीं अधिक व्यापक नज़रिया देने में सबसे ज़्यादा मदद करते हैं।
मुझे भी यह service बनाते समय ऐसा महसूस हुआ कि, सबसे पहले दुनिया या घटनाओं को देखने का नज़रिया सचमुच थोड़ा व्यापक हुआ।
वह चीज़ को कोई ऐसा क्यों सोचता है? से बढ़कर "अच्छा, ऐसी घटना को कोई इस तरह से भी ग्रहण कर सकता है और इस तरह समझ भी सकता है..."
इस तरह चीज़ों को थोड़ा और व्यापक रूप से देखा जा सकता है।
आपने जिस चुनाव की बात की, उसके मामले में भी शायद यही बात लागू होगी।
मैंने अभी-अभी उसी Daegu को target बनाकर एक बार चलाकर देखा, लेकिन नतीजे वास्तविकता से कुछ अलग ही आए।
manyperson Link
हमने अपनी service में भी इसी तरह test किया था, और नतीजे बिल्कुल... मेरी सोच के मुताबिक तो नहीं आए, लेकिन अलग-अलग नज़रिए देखने को मिले। (बेशक, हाल की information updates की वजह से यह इतना accurate नहीं है, लेकिन मुझे लगता है कि इसे धीरे-धीरे तकनीकी रूप से cover किया जा सकता है।)
असल में, हमारी service के बारे में भी test करते समय हमने यह सोचकर चलाया था कि लोग इसे कैसे देखेंगे... नतीजे काफ़ी positive थे, लेकिन हक़ीक़त में क्या होगा, यह अभी भी ठीक-ठीक नहीं कह सकता ^^;;
चूंकि LLM text token units के आधार पर inference करते हैं, इसलिए जब high-frequency labels सामने आते हैं तो लगता है कि training के दौरान उन labels के साथ मौजूद patterns सक्रिय हो जाते हैं और दूसरी जानकारी पर भारी पड़ने की प्रवृत्ति रखते हैं।
साथ ही, केवल इस वजह से कि persona में detailed labels हैं, उस व्यक्ति का voting behavior किसी ऐसे function से तय नहीं हो जाता जिसे LLM infer कर सके; वास्तविक राजनीतिक व्यवहार पर पिछले voting records, परिवार और सहकर्मियों की समर्थित पार्टी, हाल में देखी गई खबरें, उम्मीदवार के प्रति व्यक्तिगत पसंद जैसे composite persona में न होने वाले बहुत से कारक असर डालते हैं।
यह बात सिर्फ इसी तक सीमित नहीं है; लगता है कि हर तरह की आर्थिक/राजनीतिक (विशिष्ट) स्थितियों/घटनाओं का अनुमान लगाने में भी यही बात एक साथ लागू होती है.