-
क्या LLM सच में 'भूलते' हैं
- बड़े भाषा मॉडल (LLM) विशाल टेक्स्ट डेटा पर प्रशिक्षित होते हैं और उत्कृष्ट टेक्स्ट जनरेशन क्षमता दिखाते हैं
- लेकिन ट्रेनिंग डेटा की संवेदनशील प्रकृति के कारण वे अवांछित व्यवहार भी सीख सकते हैं
- machine unlearning ऐसी समस्याओं के समाधान का एक तरीका है, जिसका लक्ष्य मॉडल की उपयोगिता को अधिकतम बनाए रखते हुए विशिष्ट ज्ञान को हटाना है
-
समस्या और शोध की सामग्री
- इस बात पर अभी पर्याप्त शोध नहीं है कि मौजूदा 'unlearning' तरीके वास्तव में ज्ञान को भुलाते हैं या सिर्फ छिपाते हैं
- यह शोध दिखाता है कि quantization लागू करने पर 'भुलाई गई' जानकारी फिर से पुनर्प्राप्त की जा सकती है
- विभिन्न quantization तकनीकों का उपयोग करके कई precision स्तरों पर प्रयोग किए गए
-
प्रयोग के परिणाम
- उपयोगिता-सीमित 'unlearning' तरीकों में, मॉडल full precision पर इच्छित रूप से भुलाए गए ज्ञान का औसतन 21% बनाए रखता है
- 4-bit quantization के बाद यह अनुपात बढ़कर 83% हो जाता है
-
प्रस्तावित रणनीति
- इस घटना को समझाने के लिए सैद्धांतिक व्याख्या दी गई है
- इस जटिल समस्या को कम करने के लिए quantization-रोधी 'unlearning' रणनीति प्रस्तावित की गई है
-
शोध का महत्व
- यह LLM 'unlearning' तरीकों की प्रभावशीलता का मूल्यांकन और सुधार करने में महत्वपूर्ण योगदान देता है
- यह समझने में मदद करता है कि quantization, 'unlearning' को कैसे प्रभावित करता है
1 टिप्पणियां
Hacker News टिप्पणियाँ