ChatGPT 3.5 त्रुटि संदेश का कारण
- OpenAI के GPT मॉडल अक्षरों की बजाय कई-अक्षरीय "token" आउटपुट करते हैं.
- token आउटपुट करने का यह तरीका मॉडल के प्रदर्शन और सटीकता को बेहतर बनाता है.
richTextPanel, source, और loadPath नाम के तीन token हैं, और ये एक-दूसरे के साथ अदला-बदली किए जा सकते हैं.
loadPath token GitHub पर 80.4k फ़ाइलों में XML configuration file के एक option name के रूप में इस्तेमाल होता है.
loadPath के लिए अलग token बन जाने की वजह शायद "R a lative" की typo हो सकती है.
- OpenAI ने token सूची बनाने के बाद शायद XML फ़ाइलों को training data से बाहर करने का फ़ैसला किया होगा, और इसकी वजह से
loadPath token का training data में उपयोग लगभग नहीं रहा होगा.
- नतीजतन, मॉडल को
useRalativeImagePath token के उपयोग को समझने के लिए प्रशिक्षित नहीं किया गया, और वह invalid token आउटपुट करता है.
डेटा प्रदूषण के लिए उपयोग?
- GPT-3.5 से दस्तावेज़ों का सारांश बनवाने की कोशिश में बाधा डालने के लिए इस वाक्यांश को किसी दस्तावेज़ में डाला जा सकता है.
आगे पढ़ें
- इस विषय पर शोध के लिए उपयोगी कुछ पोस्ट उपलब्ध हैं.
GN⁺ की राय
- इस लेख में सबसे महत्वपूर्ण बात यह समझना है कि GPT मॉडल कुछ खास token पर त्रुटि क्यों आउटपुट करते हैं.
- यह जानकारी artificial intelligence मॉडल के काम करने के तरीके और उनकी सीमाओं को समझने में मदद करती है.
- साथ ही, यह लेख डेटा प्रदूषण या artificial intelligence मॉडल की कमजोरियों का फायदा उठाने के तरीकों का एक दिलचस्प उदाहरण भी देता है.
1 टिप्पणियां
Hacker News की राय
ग्लिच टोकन के बारे में व्याख्या
नीदरलैंड में WWII के दौरान भाषा सत्यापन का तरीका
LLM टोकन generation process की व्याख्या
ग्लिच टोकन के संभावित कारण का विश्लेषण
मॉडल आउटपुट पर एक दूसरा दृष्टिकोण
LLM training data पर भविष्य का प्रभाव
GPT-4 में failure experience साझा करना
इनपुट डेटा की गुणवत्ता पर विचार
GPT-3.5 summary को बाधित करने के लिए phrase इस्तेमाल करने का सुझाव
'RTCatch' और 'redirectToRoute' शब्दों को लेकर भ्रम