संवेदनशील जानकारी का लीक: चैट रिकॉर्ड समेत DeepSeek डेटाबेस एक्सपोज़

(wiz.io)

1 पॉइंट द्वारा GN⁺ 2025-01-30 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

DeepSeek की external attack surface जाँच के दौरान बिना authentication के खुला ClickHouse डेटाबेस मिला, और सूचना मिलने के बाद DeepSeek ने एक्सपोज़र को तुरंत बंद कर दिया
एक्सपोज़र पॉइंट oauth2callback.deepseek.com और dev.deepseek.com के 8123·9000 ports थे, जहाँ से बाहर से पूरे डेटाबेस पर नियंत्रण और internal data तक पहुँच संभव थी
log_stream टेबल में 10 लाख से अधिक logs थे, जिनमें 6 जनवरी 2025 से चैट रिकॉर्ड, API Keys, backend details और operational metadata plain text में शामिल थे
ClickHouse HTTP interface के /play path के ज़रिए browser में मनमानी SQL queries चलाई जा सकती थीं, लेकिन Wiz Research ने ethical research practices के तहत access को केवल enumeration स्तर तक सीमित रखा
AI services को तेज़ी से अपनाने में तत्काल जोखिम सिर्फ मॉडल से नहीं, बल्कि डेटाबेस के अनजाने external exposure जैसी बुनियादी infrastructure security समस्याओं से भी पैदा होता है

बिना authentication के खुला DeepSeek ClickHouse डेटाबेस

Wiz Research ने DeepSeek से जुड़ा publicly accessible ClickHouse डेटाबेस पहचाना
यह डेटाबेस बिना authentication के accessible था, और केवल internal data देखने तक ही नहीं बल्कि database operations पर पूरा control भी संभव था
एक्सपोज़ हुई जानकारी में चैट रिकॉर्ड, API Keys, backend details, log streams और operational details शामिल थे
Wiz Research ने यह समस्या तुरंत DeepSeek को रिपोर्ट की, और DeepSeek ने एक्सपोज़र को तेज़ी से बंद कर दिया

External attack surface जाँच और एक्सपोज़र पॉइंट

DeepSeek एक चीनी AI startup है, जिसे हाल में DeepSeek-R1 reasoning model के कारण काफी ध्यान मिला है
- DeepSeek-R1 को performance के मामले में OpenAI के o1 जैसे leading AI systems का प्रतिस्पर्धी बताया जाता है
- cost efficiency और efficiency इसकी प्रमुख विशेषताओं के रूप में चर्चा में रहे हैं
Wiz Research ने DeepSeek की external attack surface का आकलन करने के लिए public domains की जाँच की
passive और active subdomain enumeration से लगभग 30 internet-exposed subdomains पहचाने गए
- इनमें से अधिकांश chatbot interface, status pages और API docs जैसी चीज़ें थीं, जो शुरुआत में high-risk exposure नहीं लग रही थीं
standard HTTP ports 80/443 से आगे जाँच करने पर 8123 और 9000 ports खुले होने की पुष्टि हुई
- target hosts oauth2callback.deepseek.com और dev.deepseek.com थे

`/play` path के ज़रिए SQL execution

पहचाने गए ports बिना authentication के accessible ClickHouse डेटाबेस तक जाते थे
ClickHouse बड़े datasets पर तेज़ analytical queries के लिए बनाया गया एक open source column-oriented database management system है
- इसे Yandex ने विकसित किया
- यह real-time data processing, log storage और big data analytics में व्यापक रूप से इस्तेमाल होता है
ClickHouse के HTTP interface में /play path का उपयोग करके browser से सीधे मनमानी SQL queries चलाई जा सकती थीं
SHOW TABLES; query ने accessible datasets की सूची लौटाई, जिनमें log_stream टेबल खास तौर पर संवेदनशील logs रख रही थी

`log_stream` में मौजूद संवेदनशील logs

log_stream टेबल में 10 लाख से अधिक log entries शामिल थीं
मुख्य columns और एक्सपोज़ जानकारी इस प्रकार थी
- timestamp: 6 जनवरी 2025 से logs
- span_name: DeepSeek के विभिन्न internal API endpoints का संदर्भ
- string.values: plain text logs, जिनमें चैट रिकॉर्ड, API Keys, backend details और operational metadata शामिल थे
- _service: logs बनाने वाली DeepSeek service को दिखाता है
- _source: log requests का स्रोत उजागर करता है, जिसमें चैट रिकॉर्ड, API Keys, directory structure और chatbot metadata logs शामिल थे
इस स्तर की पहुँच DeepSeek की अपनी security और end users, दोनों के लिए गंभीर जोखिम पैदा कर सकती थी
कोई attacker संवेदनशील logs और वास्तविक plain text chat messages ले जा सकता था, और ClickHouse configuration के अनुसार SELECT * FROM file('filename') जैसी queries से server के plain text passwords, local files और proprietary information को सीधे exfiltrate भी कर सकता था
Wiz Research ने ethical research practices का पालन करते हुए enumeration से आगे बढ़ने वाली intrusive queries नहीं चलाईं

AI adoption की रफ़्तार और infrastructure security risk

AI applications का तत्काल security risk मॉडल से ज़्यादा, उन्हें सहारा देने वाले infrastructure और tools से आ सकता है
जबकि AI security पर चर्चा अक्सर future-oriented threats पर केंद्रित रहती है, डेटाबेस के accidental external exposure जैसे बुनियादी security risks अब भी security teams की सर्वोच्च प्राथमिकता रहने चाहिए
जब organizations अलग-अलग startups और providers के AI tools और services को तेज़ी से अपना रही हैं, तब वे संवेदनशील डेटा इन कंपनियों को सौंपने के मामले में भी बढ़ रही हैं
तेज़ adoption security को नज़रअंदाज़ करा सकता है, इसलिए customer data protection को प्राथमिकता मिलनी चाहिए
security teams को AI engineers के साथ क़रीबी सहयोग करके उपयोग में मौजूद architecture, tools और models पर visibility सुनिश्चित करनी चाहिए, तभी data exposure रोका जा सकता है
AI कंपनियाँ व्यापक adoption के साथ आम तौर पर आने वाले security frameworks के बिना ही तेजी से core infrastructure providers बन रही हैं, इसलिए sensitive data handling के जोखिम के अनुरूप security practices ज़रूरी हैं

संवेदनशील जानकारी का लीक: चैट रिकॉर्ड समेत DeepSeek डेटाबेस एक्सपोज़

बिना authentication के खुला DeepSeek ClickHouse डेटाबेस

External attack surface जाँच और एक्सपोज़र पॉइंट

/play path के ज़रिए SQL execution

log_stream में मौजूद संवेदनशील logs

AI adoption की रफ़्तार और infrastructure security risk

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.

`/play` path के ज़रिए SQL execution

`log_stream` में मौजूद संवेदनशील logs