Representation Engineering, Mistral-7B में acid trip
-
Control Vector क्या है?
- Control vector एक ऐसे vectors की सूची है (प्रत्येक layer के लिए), जिन्हें inference के दौरान model activations पर लागू करके बिना अतिरिक्त prompt के मॉडल के व्यवहार को नियंत्रित किया जाता है।
- एक ही prompt और मॉडल के साथ, control vector का उपयोग करें या न करें और उसकी intensity बदलने पर अलग परिणाम मिलते हैं।
-
Control Vector बनाना कठिन नहीं है
- PCA का उपयोग करके एक contrasting prompts pair dataset बनाया जाता है, मॉडल चलाकर हर layer की hidden states collect की जाती हैं, और फिर single-component PCA से प्रत्येक layer का control vector निकाला जाता है।
- यह प्रक्रिया केवल कुछ लाइन की code और लगभग 1 मिनट समय लेती है।
-
Control Vector से क्या-क्या कर सकते हैं
- Control vector की मदद से AI मॉडल को 'acid trip' स्थिति, 'आलस्य', 'मेहनतीपन', 'रचनात्मकता' जैसी कई अलग-अलग states में ले जाया जा सकता है।
- प्रत्येक control vector केवल कुछ ही मिनटों में train किया जा सकता है, और GitHub पर उपलब्ध experiment notebook से इसे सीधे आज़मा सकते हैं।
-
Control Vector बनाम Prompt Engineering
- Control vector और prompt engineering अलग approaches हैं, लेकिन कुछ overlap मौजूद है।
- Control vector वे परिणाम दे सकता है जो prompt engineering से भी replicate किए जा सकते हैं, लेकिन intensity को tune करना आसान होता है।
GN⁺ का दृष्टिकोण
- Control Vector की अहमियत: Control vector एक मजबूत तरीका है जिससे AI मॉडल का व्यवहार बहुत सटीक तरीके से adjust किया जा सकता है, और यह prompt engineering की सीमाओं से आगे नए विकल्प देता है।
- Efficiency और Accessibility: Control vectors की मदद से users बिना जटिल prompt सेटअप के भी मॉडल के व्यवहार को आसानी से बदल सकते हैं, जिससे AI की usability काफी बेहतर हो सकती है।
- रचनात्मक उपयोग: Control vector से AI को 'acid trip' mode में डालने जैसे प्रयोग AI research में एक नए प्रयोगात्मक दृष्टिकोण को संभव बनाते हैं।
1 टिप्पणियां
Hacker News टिप्पणी