प्राकृतिक भाषा AI मॉडल हैक करना

budlebee · 2021-03-14T11:00:03+09:00

Google, Harvard, Stanford, OpenAI और Apple द्वारा संयुक्त रूप से प्रकाशित एक पेपर के अनुसार, बड़े भाषा मॉडलों से सिर्फ सवाल पूछकर ही ट्रेनिंग में इस्तेमाल किए गए विशिष्ट डेटा को निकाला जा सका। GPT-2 पर किए गए हमले ने समाचार हेडलाइन और घर के पते जैसी व्यक्तिगत जानकारी को बहुत उच्च सटीकता के साथ निकाल लिया। यह केवल GPT-2 तक सीमित नहीं है; अन्य भाषा मॉडल भी ऐसे हमलों के प्रति संवेदनशील हो सकते हैं, इसलिए ट्रेनिंग डेटा के प्री-प्रोसेसिंग पर और अधिक ध्यान देना चाहिए।

(arxiv.org)

12 पॉइंट द्वारा budlebee 2021-03-14 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

Google, Harvard, Stanford, OpenAI और Apple द्वारा संयुक्त रूप से प्रकाशित एक पेपर के अनुसार, बड़े भाषा मॉडलों से सिर्फ सवाल पूछकर ही ट्रेनिंग में इस्तेमाल किए गए विशिष्ट डेटा को निकाला जा सका।
GPT-2 पर किए गए हमले ने समाचार हेडलाइन और घर के पते जैसी व्यक्तिगत जानकारी को बहुत उच्च सटीकता के साथ निकाल लिया।
यह केवल GPT-2 तक सीमित नहीं है; अन्य भाषा मॉडल भी ऐसे हमलों के प्रति संवेदनशील हो सकते हैं, इसलिए ट्रेनिंग डेटा के प्री-प्रोसेसिंग पर और अधिक ध्यान देना चाहिए।

प्राकृतिक भाषा AI मॉडल हैक करना

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.