- Microsoft की AI रिसर्च टीम ने GitHub पर open source training data जारी करते समय गलती से 38 टेराबाइट निजी डेटा उजागर कर दिया
- उजागर हुए डेटा में दो कर्मचारियों के workstation disk backup, secrets, private keys, passwords, और 30,000 से अधिक internal Microsoft Teams messages शामिल थे
- यह डेटा SAS token का उपयोग करके साझा किया गया था, जो Azure Storage account में डेटा साझा करने की सुविधा देने वाला Azure फीचर है। लेकिन लिंक पूरे storage account को साझा करने के लिए सेट था, जिससे डेटा उजागर हो गया
- यह घटना दिखाती है कि AI का उपयोग करते समय संगठनों को किन नए जोखिमों का सामना करना पड़ता है, और जैसे-जैसे अधिक engineers बड़े पैमाने के training data को संभालते हैं, अतिरिक्त security checks और safeguards की जरूरत होती है
- Wiz रिसर्च टीम ने इंटरनेट पर गलत तरीके से configure किए गए storage container को खोजते हुए इस exposure का पता लगाया
- उन्हें Microsoft organization के तहत
robust-models-transfer नाम का GitHub repository मिला, जिसे image recognition के लिए open source code और AI models उपलब्ध कराने के लिए बनाया गया था, लेकिन misconfiguration के कारण ऐसा URL संभव हो गया जो open source model से कहीं अधिक चीजों तक पहुंच देता था
- इस्तेमाल किया गया token भी गलत तरीके से
full control permission देने के लिए configure था, जिससे attacker मौजूदा files को देख, delete और overwrite कर सकता था
- यह घटना SAS token के security risk को उजागर करती है, क्योंकि ये storage account पर उच्च स्तर की access देते हैं और expiration से जुड़ी समस्याएं हो सकती हैं। साथ ही इन्हें manage और revoke करना भी कठिन है
- Wiz रिसर्च टीम ने सुझाव दिया कि security और governance की कमी के कारण external sharing के लिए Account SAS के उपयोग से बचना चाहिए, और time-limited sharing के लिए Stored Access Policy या User Delegation SAS का उपयोग करना चाहिए
- टीम ने external sharing के लिए dedicated storage account बनाने और policies को track और enforce करने के लिए CSPM के उपयोग की भी सिफारिश की
- यह घटना security teams को याद दिलाती है कि उन्हें AI development process के हर चरण में मौजूद security risks को समझना चाहिए, जिसमें data oversharing और supply chain attacks का जोखिम भी शामिल है
- Microsoft ने बाद में SAS token को invalidate कर GitHub पर replace कर दिया, और संभावित प्रभाव की internal investigation पूरी कर ली
1 टिप्पणियां
Hacker News राय