OpenAI Privacy Filter का परिचय

(openai.com)

6 पॉइंट द्वारा GN⁺ 2026-04-27 | 1 टिप्पणियां | WhatsApp पर शेयर करें

यह unstructured text में व्यक्तिगत पहचान योग्य जानकारी (PII) को detect और mask करने वाला एक open-weight मॉडल है, जिसे local execution के साथ चलाकर filtering से पहले डेटा को डिवाइस से बाहर जाने से रोका जा सकता है
यह bidirectional token classification और span decoding को जोड़ता है, ताकि इनपुट को एक ही बार में label किया जा सके और अधिकतम 128,000-token context में PII span को तेज़ी से restore किया जा सके
फ़ोन नंबर या ईमेल फ़ॉर्मैट पर निर्भर rule-based तरीकों के विपरीत, यह भाषा और context की समझ के आधार पर public information और mask की जाने वाली जानकारी के बीच बेहतर अंतर करता है
इसे public data और synthetic data दोनों के साथ train किया गया है, और PII-Masking-300k पर F1 96% हासिल किया। corrected version में F1 97.43% दर्ज किया गया, जबकि कम डेटा के साथ भी domain adaptation performance 54% से 96% तक बढ़ी
यह anonymization tool या compliance certification का विकल्प नहीं है, और उच्च-संवेदनशील क्षेत्रों में human review, domain-specific evaluation, और अतिरिक्त fine-tuning अब भी महत्वपूर्ण हैं

उत्पाद का अवलोकन और deployment तरीका

यह व्यक्तिगत पहचान योग्य जानकारी की पहचान और masking के लिए विशेष रूप से बनाया गया open-weight मॉडल है, जो text में PII को खोजकर उसे mask या delete कर सकता है
यह local execution को support करता है, जिससे filtering से पहले डेटा डिवाइस से बाहर नहीं जाता और server पर भेजकर de-identification करने की तुलना में exposure risk कम हो सकता है
इसे लंबे input को तेज़ी से process करने के लिए design किया गया है, और एक ही pass में masking का निर्णय लिया जा सकता है
developer इसे अपने environment में चला सकते हैं और अपने use case के अनुसार fine-tune करके training, indexing, logging, और review pipelines में अधिक मजबूत privacy protection जोड़ सकते हैं
इसे Hugging Face और GitHub पर Apache 2.0 license के तहत जारी किया गया है, और इसे experimentation, customization, तथा commercial deployment को ध्यान में रखकर बनाया गया है

मौजूदा तरीकों से यह कैसे अलग है

पारंपरिक PII detection tools अक्सर फ़ोन नंबर या ईमेल address जैसे फ़ॉर्मैट के लिए deterministic rules पर निर्भर करते हैं
ऐसे तरीके सीमित दायरे में अच्छी तरह काम कर सकते हैं, लेकिन अधिक सूक्ष्म निजी जानकारी को miss कर सकते हैं और context को समझने में कमजोर रहते हैं
Privacy Filter गहरी भाषा और context की समझ के आधार पर unstructured text में अधिक विस्तृत प्रकार के PII को detect कर सकता है
इसे इस तरह design किया गया है कि यह public होने के कारण सुरक्षित रखी जाने वाली जानकारी और किसी व्यक्ति से जुड़ी वह जानकारी जिसे mask या delete करना चाहिए, उनके बीच बेहतर अंतर कर सके
इसे मौजूदा स्तर से आगे बढ़कर privacy standards को बेहतर बनाने के उद्देश्य से विकसित किया गया है, और internal privacy-preserving workflows में इसका fine-tuned version भी इस्तेमाल हो रहा है

मॉडल आर्किटेक्चर और detection का दायरा

यह bidirectional token classification model और span decoding के संयोजन वाली संरचना का उपयोग करता है
यह autoregressive pretraining checkpoint से शुरू होता है, फिर इसे एक निश्चित privacy label scheme पर token classifier के रूप में adapt किया जाता है
text को token-by-token generate करने के बजाय, यह पूरे input sequence को एक साथ label करता है और फिर constrained Viterbi procedure से consistent span restore करता है
इस आर्किटेक्चर की वजह से सभी tokens को एक single forward pass में label करने की तेज़ और efficient क्षमता मिलती है
यह आसपास के context का उपयोग करके PII span की पहचान कर सकता है, और public model अधिकतम 128,000 tokens context को support करता है
production environment के अनुसार recall और precision के बीच संतुलन को adjust किया जा सकता है
जारी किए गए मॉडल में कुल 1.5B parameters हैं, जिनमें active parameters 50M हैं
prediction categories कुल 8 हैं: private_person, private_address, private_email, private_phone, private_url, private_date, account_number, secret
account_number का उपयोग credit card number और bank account number सहित विभिन्न account numbers को mask करने के लिए होता है, और secret password तथा API key जैसी चीज़ों को cover करता है
labels को BIOES span tags के रूप में decode किया जाता है, जिससे masking boundaries अधिक साफ़ और consistent बनती हैं

training प्रक्रिया और evaluation परिणाम

पहले एक privacy taxonomy बनाई जाती है, जो उन span types को define करती है जिन्हें मॉडल को detect करना है
- इसमें personal identifiers, contact information, addresses, private dates, credit और banking information सहित कई account numbers, तथा API keys और passwords जैसे secret शामिल हैं
pre-trained language model के language modeling head को token-classification head से बदलने के बाद, इसे supervised classification objective के साथ आगे train किया गया
public data और synthetic data को मिलाकर train किया गया, ताकि वास्तविक text और कठिन privacy patterns दोनों को capture किया जा सके
- public data में जहाँ labels अधूरे थे, वहाँ model-assisted annotation और review के जरिए coverage बढ़ाई गई
- synthetic examples का उपयोग format, context, और privacy subtypes के बीच diversity बढ़ाने के लिए किया गया
inference के समय token-level predictions को constrained sequence decoding के जरिए consistent spans में बदला जाता है
standard benchmarks के साथ-साथ अधिक कठिन context-sensitive cases को लक्षित करने वाले अतिरिक्त synthetic और chat-style evaluations भी किए गए
PII-Masking-300k पर F1 96%, precision 94.04%, और recall 98.04% दर्ज किया गया
dataset annotation issues को review में पहचानकर reflect करने वाले corrected version में F1 97.43%, precision 96.79%, और recall 98.08% दर्ज किया गया
कम डेटा के साथ भी domain adaptation तेज़ी से हुई, और evaluated domain adaptation benchmark में F1 54% से 96% तक बढ़ गया
model card में codebase के secret detection और multilingual, adversarial, तथा context-dependent examples पर stress tests भी शामिल हैं

सीमाएँ और उपयोग के समय सावधानियाँ

यह anonymization tool नहीं है, compliance certification नहीं है, और high-risk environments में policy review का विकल्प भी नहीं है
यह privacy-centered design वाले पूरे system का केवल एक component है
इसका behavior training में इस्तेमाल की गई label taxonomy और decision boundaries से प्रभावित होता है
हर organization की detection और masking policy अलग हो सकती है, इसलिए in-domain evaluation या अतिरिक्त fine-tuning की आवश्यकता हो सकती है
training distribution से अलग भाषाओं, scripts, naming conventions, और domains में performance बदल सकती है
यह दुर्लभ identifiers या अस्पष्ट personal references को miss कर सकता है, और खासकर short sequences जैसे limited context में over-mask या under-mask कर सकता है
legal, medical, और financial जैसे उच्च-संवेदनशील क्षेत्रों में human review, domain-specific evaluation, और fine-tuning अब भी महत्वपूर्ण हैं

जारी करने का उद्देश्य और आगे की दिशा

privacy protection को research, product design, evaluation, और deployment के हर चरण में फैली हुई लगातार चुनौती के रूप में देखा जाता है
यह संकीर्ण रूप से परिभाषित वास्तविक tasks में frontier-level performance देने वाले छोटे और efficient models के महत्व को दर्शाता है
इसे इस लक्ष्य के साथ जारी किया गया है कि privacy-preserving infrastructure को अधिक आसानी से inspect, run, adapt, और improve किया जा सके
यह ऐसे tool के रूप में देखा जाता है जो मॉडल को दुनिया के बारे में सीखने में मदद करे, लेकिन किसी व्यक्ति की निजी जानकारी को न सीखे
यह preview release research और privacy community से feedback लेकर performance को और बेहतर बनाने की दिशा में भी एक कदम है

1 टिप्पणियां

GN⁺ 2026-04-27

Hacker News की राय

इस तरह की सुविधा को कई साल पहले पहले ही लागू करके देखा था, और उसके नतीजे में कुछ बातें साफ़ हुई थीं
PII redaction में UX बनाए रखने के लिए उसे क्लाइंट पर वापस restore करना पड़ता है। उदाहरण के लिए, अगर नाम John है और उसे [NAME] से छिपाया गया है, फिर मॉडल Hi [NAME] जैसा जवाब देता है, तो यूज़र को दिखाने से पहले उसे Hi John में restore करना होगा
आखिरकार यूज़र जिस layer से interact करता है, उसमें reverse substitution mechanism चाहिए
और छिपाया गया PII डेटा ज़्यादातर कामों में लगभग बेकार होता है। मॉडल को काम करने के लिए कुछ हद तक वास्तविक डेटा चाहिए, लेकिन PII में आने वाली चीज़ें इतनी ज़्यादा हैं कि साधारण chat तो चल सकता है, मगर जहाँ यूज़र को LLM के साथ जटिल तरीके से interact करना हो, वहाँ कठिनाई बहुत बढ़ जाती है। या तो कुछ भी ठीक से नहीं हो पाता, या hallucination होने लगते हैं
इसलिए platform स्तर पर इसका support होता है, लेकिन इन सीमाओं की वजह से व्यवहार में इसका ज़्यादा इस्तेमाल नहीं होता
मुझे लगता है कि व्यावहारिक तरीका यह है कि सिर्फ़ high-risk PII के कुछ हिस्से हटाए जाएँ, और ऐसा trusted model इस्तेमाल किया जाए जो PII को जितना जल्दी हो सके discard कर दे। इसके लिए system design भी काफ़ी अलग बनानी पड़ती है
https://github.com/KevinXuxuxu/anon_proxy बना रहा हूँ। यह LLM provider के सामने रखने वाला एक तरह का anonymization proxy टूल है
इसमें model-based detection और regex PII detection दोनों का इस्तेमाल होता है, और API request व response में replacement और restoration दोनों दिशाओं में handle किए जाते हैं। अगर detection model को लोकल पर host करें, तो PII लोकल environment के बाहर नहीं जाता
क़ानूनी, टैक्स, इमिग्रेशन जैसे sensitive documents संभालते समय यह खास तौर पर उपयोगी था
- इस तरीके की अच्छी बात यह है कि इसे किसी भी model के साथ जोड़ा जा सकता है
  लेकिन बातचीत का पूरा context फिर भी मॉडल और operator देख सकते हैं
  इसलिए मुझे Moxie के Confer जैसा https://confer.to/ पूरी तरह encrypted approach ज़्यादा पसंद है, जहाँ end user के अलावा कोई plaintext नहीं देख सकता
- response side की restoration process कैसे होती है, यह जानने की जिज्ञासा है
  अगर document को input में छिपाया गया था, तो LLM output में भी वही छिपी हुई चीज़ें होंगी, उसके बाद आगे कैसे बढ़ते हैं, यह समझ नहीं आ रहा
इस release में तकनीकी रूप से दिलचस्प हिस्से काफ़ी हैं
Privacy Filter एक bidirectional token-classification model है जिसमें span decoding जोड़ी गई है, और कहा गया है कि इसे autoregressive pretraining checkpoint से शुरू करके fixed privacy label taxonomy पर token classifier के रूप में adapt किया गया
टेक्स्ट को token-by-token generate करने के बजाय यह input sequence को एक बार में label करता है, और constrained Viterbi प्रक्रिया से consistent span decode करता है
जारी किया गया मॉडल कुल 1.5B parameters का है, जिनमें active parameters 50M बताए गए हैं
यह भी बताया गया कि pretrained language model के LM head को token-classification head से बदलकर, supervised classification objective के साथ post-training करके इसे बनाया गया
- तो फिर ऐसा लगता है कि इसे दूसरे PII detection तरीकों पर निर्भर हुए बिना unstructured text में sensitive information की location ढूँढने के लिए भी इस्तेमाल किया जा सकता है
  मूल टेक्स्ट को filter से गुज़ारकर span निकाला जाए, और फिर उस span को वापस मूल टेक्स्ट पर map किया जाए, तो अंततः PII location information पूरी मिल जाएगी
OpenAI जितना स्मार्ट नहीं है, लेकिन browser में BERT-based NER से कुछ PII छिपाने वाला https://tools.nicklothian.com/webner/index.html बनाया है
जिन use cases पर मैंने इसे आज़माया, वहाँ यह काफ़ी अच्छा चला
OpenAI का मॉडल काफ़ी छोटा लग रहा है, इसलिए सोच रहा हूँ कि इसे भी अपने टूल में जोड़कर देखूँ
- अभी दस्तावेज़ पर चलाकर देखा, और false positive इतने ज़्यादा थे कि इस्तेमाल करना काफ़ी मुश्किल लगा
  लगभग 100 लाइन के markdown document में matter को frontmatter का हिस्सा होने के बावजूद organization माना, end को frontend का हिस्सा होने के बावजूद organization माना, और MCP को भी organization classify कर दिया
  Following the discussion in , blahblah जैसे व्याकरण की दृष्टि से भी बेअर्थ नतीजे बहुत थे
  बिल्कुल 10 साल पुराने NLP के दौर में लौट आने जैसा लगा, और फिर याद आया कि उस क्षेत्र में spaCy सच में कितना अच्छा project था
यह साफ़ कर देना चाहिए कि इस तरह के मॉडल लगभग हमेशा भोले और बुनियादी होते हैं
Hi, this is Bob. जैसे किसी एकल और neutral message के लिए यह आमतौर पर काफ़ी होगा, लेकिन जैसे ही डेटा जमा होना शुरू होता है, identity leak risk को पूरी तरह ध्यान में रखने वाला PII redaction tool मैंने अभी तक नहीं देखा
लेकिन असली समस्या तब बढ़ती है जब कंपनियाँ यह इस्तेमाल करके मानने लगती हैं कि डेटा anonymized हो गया है। वह anonymization नहीं है
फिर भी अगर डेटा को सीधे publish या share नहीं किया जा रहा, बल्कि moderation, human eval, model training जैसे intermediate processing steps में इस्तेमाल हो रहा है, तो ऐसी filtering काफ़ी उपयोगी हो सकती है
थोड़ा अफ़सोस है कि ज़्यादातर examples ऐसी चीज़ों के हैं जिन्हें regex से भी आसानी से पकड़ा जा सकता है, लेकिन इसे खुले local model के रूप में जारी किया गया, यह अच्छी बात है
- अपने ग्राहकों के लिए मैं private email या phone number वेबसाइट पर न जाएँ, इसके लिए regular expressions से रोक लगाता हूँ
  फिर भी अतिरिक्त आश्वासन के लिए इस तरह का मॉडल साथ में चलाना ठीक लग रहा है
  server पर GPU नहीं है, लेकिन अगर एक बार में 2k tokens से कम हों, तो उम्मीद है कि यह इतना हल्का मॉडल होगा कि CPU-only inference पर भी चल सके
लिंक पर क्लिक करने पर OpenAI साइट के machine-translated version पर redirect हो जाता है, और अर्थ पूरी तरह बिगड़ गया है
redacted को Polish के redagować की तरह अनुवाद किया गया, जबकि उसका मतलब anonymization नहीं, बल्कि टेक्स्ट को edit या refine करना होता है
सोच रहा हूँ कि regex और model को मिलाने वाले Presidio के मुकाबले यह कैसा होगा: https://microsoft.github.io/presidio/
- लगता है इस मॉडल को Presidio के अंदर डालकर भी इस्तेमाल किया जा सकता है
https://peyeeye.ai इस thread में लोग जिन समस्याओं की बात कर रहे हैं, उन्हें शाब्दिक रूप से पूरी तरह हल करता है
- दूसरों का डेटा बिना अनुमति scrape करने वाली कंपनी अगर privacy tool बनाए, तो उससे बड़ा irony क्या होगा
यह release स्वागतयोग्य है
regulated industries के बाहर भी ऐसे models और practices रखने के बहुत कारण हैं, और सिद्धांततः EU AI Act की वजह से भी कुछ मामलों में यह ज़रूरी हो जाएगा
मैंने https://grepture.com में specialized NER model के साथ redaction और rehydration पहले से जोड़ा हुआ है, इसलिए इसे भी pipeline में जोड़ने की सोच रहा हूँ
अगर इसे विकल्प के तौर पर hot path में रखा जाए, ताकि LLM तक request पहुँचने से पहले और बाद के हिस्सों को वास्तव में संभाला जा सके, तो compliance या सीधे user input लेने वाले scenarios में यह काफ़ी उपयोगी होगा

OpenAI Privacy Filter का परिचय

उत्पाद का अवलोकन और deployment तरीका

मौजूदा तरीकों से यह कैसे अलग है

मॉडल आर्किटेक्चर और detection का दायरा

training प्रक्रिया और evaluation परिणाम

सीमाएँ और उपयोग के समय सावधानियाँ

जारी करने का उद्देश्य और आगे की दिशा

संबंधित पढ़ाई

1 टिप्पणियां

Hacker News की राय