बड़े भाषा मॉडल में semantic entropy का उपयोग करके hallucination detection
सारांश
- बड़े भाषा मॉडल (LLM): ChatGPT और Gemini जैसे LLM सिस्टम शानदार reasoning और question-answering क्षमता दिखाते हैं, लेकिन अक्सर गलत output या बिना आधार वाले जवाब पैदा करने की 'hallucination' समस्या रखते हैं.
- Hallucination समस्या: यह कानूनी मिसालों की गढ़ंत, news articles में गलत जानकारी, और चिकित्सा क्षेत्र में जोखिम जैसी कई समस्याएँ पैदा करती है.
- मौजूदा समाधान की सीमाएँ: supervision या reinforcement learning के माध्यम से truthfulness लाने की कोशिशें केवल आंशिक रूप से सफल रही हैं.
- नई विधि: सांख्यिकी पर आधारित entropy-driven uncertainty estimator प्रस्तावित किया गया है, जो मनमानी और गलत generation (confabulation) का पता लगाता है. यह शब्दों के विशेष क्रम के बजाय अर्थ-स्तर पर uncertainty की गणना करता है.
- लागू होने की क्षमता: यह dataset और task से स्वतंत्र रूप से काम करता है, task के बारे में पूर्व-ज्ञान की आवश्यकता नहीं होती, और नए tasks पर भी मजबूत generalization दिखाता है.
मुख्य बातें
Hallucination समस्या का महत्व
- Hallucination की परिभाषा: जब LLM दिए गए source content के प्रति faithful न रहे या अतार्किक सामग्री उत्पन्न करे.
- Confabulation का उदाहरण: एक ही प्रश्न पर यादृच्छिक रूप से अलग-अलग उत्तर उत्पन्न करना.
- मौजूदा समस्याएँ: गलत data पर training, reward पाने के लिए झूठ बोलना, या reasoning और generalization की प्रणालीगत विफलता.
Semantic entropy का उपयोग करके confabulation detection
- विधि का अवलोकन: यह मात्रात्मक रूप से मापता है कि कब input से मनमाने और बिना आधार वाले उत्तर उत्पन्न होने की संभावना अधिक है.
- Semantic entropy: वाक्य के अर्थ के आधार पर entropy की गणना करके uncertainty का अनुमान लगाया जाता है. उच्च entropy अधिक uncertainty को दर्शाती है.
- Clustering: अर्थ में समान उत्तरों को cluster करके entropy की गणना की जाती है.
मूल्यांकन और परिणाम
- Datasets: TriviaQA, SQuAD, BioASQ, NQ-Open, SVAMP सहित विभिन्न datasets पर मूल्यांकन किया गया.
- Models: LLaMA 2 Chat, Falcon Instruct, Mistral Instruct, GPT-4 सहित कई models पर परीक्षण किया गया.
- प्रदर्शन: semantic entropy ने मौजूदा simple entropy या supervised learning methods की तुलना में बेहतर प्रदर्शन दिखाया.
समग्र प्रदर्शन
- AUROC: यह model की error prediction क्षमता मापने वाला metric है, और semantic entropy ने सबसे ऊँचा score दर्ज किया.
- AURAC: यह उन प्रश्नों को reject करके, जिनमें confabulation की संभावना अधिक हो, बचे हुए प्रश्नों पर accuracy मापने वाला metric है; semantic entropy ने इसमें भी सर्वोत्तम प्रदर्शन दिखाया.
GN⁺ की राय
- व्यावहारिकता: semantic entropy विभिन्न datasets और tasks पर लागू हो सकता है, इसलिए इसकी व्यावहारिक उपयोगिता अधिक है. खासकर यह नए tasks पर भी मजबूत generalization दिखाता है.
- तकनीकी योगदान: यह simple entropy calculation की सीमाओं को पार करता है और अर्थ-स्तर पर uncertainty मापने का नया approach प्रस्तावित करता है.
- भविष्य की संभावना: यह विधि आगे चलकर abstractive summarization या conversational LLM की reliability सुधारने में भी उपयोगी हो सकती है.
- सीमा: यदि सिस्टम ने व्यवस्थित रूप से गलत data सीखा है या उसमें systematic reasoning errors हैं, तो यह उन्हें हल नहीं करता. इसके लिए अलग approach की आवश्यकता होगी.
- प्रतिस्पर्धी तकनीक: अन्य uncertainty estimation methods की तुलना में semantic entropy बेहतर प्रदर्शन दिखाता है, लेकिन कुछ विशेष परिस्थितियों में दूसरी विधियाँ अधिक प्रभावी हो सकती हैं.
1 टिप्पणियां
Hacker News राय
bullshitometerका उपयोग करके prediction किया जा सकता था, इसका उल्लेख है.