अगर prompt injection को रोका नहीं जा सकता, तो क्या करें? Meta ने सुझाए 3 design principles
(aisparkup.com)Simon Willison ने prompt injection पर हाल की 2 research papers का विश्लेषण करने वाला एक लेख प्रकाशित किया।
AI prompt injection attacks को मौजूदा defense techniques से पूरी तरह रोकना मुश्किल है। Meta इसे स्वीकार करते हुए, system design principle "Agents Rule of Two" के जरिए जोखिम को न्यूनतम करने का सुझाव देता है।
मुख्य बातें:
- जोखिम और vulnerability: हमलावर AI में malicious instructions डालकर personal data leak करा सकते हैं या phishing को ट्रिगर कर सकते हैं। 12 defense systems में से 90% से अधिक के भेदे जाने वाले research result पर ज़ोर दिया गया है।
- Rule of Two सिद्धांत: AI agent को इस तरह design करें कि वह नीचे दी गई 3 properties (A, B, C) में से एक साथ केवल 2 ही रखे।
- [A] untrusted input को process करना
- [B] sensitive systems/personal data तक access
- [C] state changes या external communication
- उदाहरण: email bot में A (input) + C (communication) हो सकते हैं, लेकिन B (personal data) पर रोक होनी चाहिए।
- व्यावहारिक दृष्टिकोण: perfect defense की जगह design के जरिए risk कम करना।
निष्कर्ष: prompt injection से बचना संभव नहीं है, इसलिए Rule of Two जैसे सिद्धांतों के आधार पर AI systems को फिर से design करें। इसे एक practical alternative के रूप में देखा जा रहा है।
5 टिप्पणियां
आपके अनुवाद को पढ़कर देखता हूँ तो यह निश्चित रूप से prompt injection हुआ ही लगता है.
"AI security expert Simon Willison" <= गलत
Simon Willison, Django बनाने वाले एक प्रसिद्ध web developer हैं, और LLM tools विकसित करते हैं, साथ ही AI पर बहुत लिखते और बोलते भी हैं। यह व्यक्ति AI security में भी गहरी रुचि रखते हैं और इस विषय पर कई लेख भी पोस्ट करते हैं। इसलिए इस लेख के संदर्भ में उन्हें "AI security expert" कहना मुझे बहुत गलत नहीं लगता। मुझे लगता है कि AI security के बारे में उनके पास पर्याप्त ज्ञान और दृष्टि है, इसलिए मैंने जानबूझकर ऐसा लिखा। (तो यह injection नहीं है^^)
संक्षेप में कहें तो, क्या आपका मतलब यह है कि समझाने की सुविधा के लिए आपने ऐसा शीर्षक लगाया? ब्लॉग के about पेज में AI सेक्शन है, लेकिन फिर भी यह बात आसानी से समझ नहीं आती कि उस व्यक्ति की प्रमुख उपलब्धियाँ इतनी हैं कि कोई दूसरा उन्हें AI security expert का शीर्षक दे दे.
फिलहाल, मुख्य बात समझ में आ गई।
अच्छे लेख के लिए धन्यवाद।
अच्छा लेख है, धन्यवाद।
लगता है कि इसे CAP थ्योरी की तरह डिज़ाइन किया गया है।