- Apple Intelligence के generative models में एम्बेड किए गए safety filters को डिकोड करके सार्वजनिक करने वाला एक open source प्रोजेक्ट
- safety filters हानिकारक या अनुपयुक्त content को ब्लॉक करते हैं और compliance के लिए filtering rules शामिल करते हैं
- safety overrides model context के अनुसार अलग-अलग लागू होते हैं और हर स्थिति के लिए विशिष्ट rule information देते हैं
- डिकोड की गई फाइलें json format में हैं, जिनमें शब्द, वाक्यांश और regex-आधारित rules शामिल हैं
- यह प्रोजेक्ट privacy और reliability verification, model safety analysis आदि के लिए एक उपयोगी resource है
प्रोजेक्ट अवलोकन
- यह repository Apple Intelligence में उपयोग होने वाली generative models की safety override फाइलों को डिकोड करके सार्वजनिक करती है
- डिकोड किए गए overrides फ़ोल्डर के भीतर संरचित रूप से व्यवस्थित हैं और हर मॉडल से जुड़ी safety filtering JSON फाइलों के रूप में उपलब्ध हैं
- इनके जरिए यह ठोस रूप से देखा जा सकता है कि Apple models वास्तव में कौन-सी content filtering policies लागू करते हैं
फ़ोल्डर और फ़ाइल संरचना
decrypted_overrides/
- हर generative model के अनुसार directory-वार safety override फाइलें संग्रहीत हैं
- हर directory में Info.plist (metadata) और AssetData (filter JSON files) शामिल हैं
get_key_lldb.py: application में उपयोग होने वाली encryption key निकालने वाली Python script
decrypt_overrides.py: safety override फाइलों को डिकोड करने वाली Python script
override फाइलों का डिकोड और समझ
- override JSON फाइलों में स्पष्ट safety filtering rules दर्ज हैं
- हर override किसी विशिष्ट model context से मेल खाता है, और अलग-अलग परिस्थितियों के अनुसार filtering का तरीका बदलता है
- उदाहरण JSON में निम्न fields शामिल हैं:
"reject": इनपुट से मेल होने पर force reject किए जाने वाले विशिष्ट वाक्यांशों की सूची
"remove": output result से हटाए जाने वाले वाक्यांश
"replace": किसी विशिष्ट वाक्यांश को दूसरे वाक्यांश से बदलना
"regexReject": regex से match होने पर reject
"regexRemove", "regexReplace": regex के जरिए removal और replacement
प्रोजेक्ट के उपयोग का महत्व
- यह प्रोजेक्ट Apple generative models के वास्तविक filtering rules को देखने और उन models की safety और reliability के मूल्यांकन के लिए संदर्भ सामग्री के रूप में उपयोग किया जा सकता है
- generative models का उपयोग करने वाले developers और security प्रबंधक filter behavior का विश्लेषण करने या custom model filters design करने के संदर्भ में इसे उपयोगी पाएंगे
- Apple Intelligence द्वारा लागू content policies और compliance level को अधिक पारदर्शी ढंग से समझा जा सकता है
1 टिप्पणियां
Hacker News राय
unaliveशब्द शामिल नहीं है। सब लोग उस शब्द का मतलब जानते हैं, लेकिन व्यवहार में कोई सच में परवाह नहीं करता, और सब सिर्फ औपचारिकता निभाते हैं — इस प्रवृत्ति की ओर इशारा파일 실행या정보 전달जैसे command सुझावों तक को block कर देता है