- अलग-अलग सेवाओं के लिए यूनिक ईमेल पते बनाकर ट्रैकिंग करने पर, BrowserStack-समर्पित पते पर तीसरे पक्ष से भेजे गए ईमेल पहुंचे
- BrowserStack open source program में शामिल होने के बाद, Apollo.io के ज़रिए भेजे गए बाहरी ईमेल उस पते पर प्राप्त हुए
- Apollo.io ने पहले दावा किया कि यह पता सार्वजनिक जानकारी-आधारित एल्गोरिदम से बनाया गया था, लेकिन बाद में जवाब बदलकर कहा कि BrowserStack ने डेटा उपलब्ध कराया था
- BrowserStack से कई बार संपर्क किया गया, लेकिन कोई जवाब नहीं मिला; आंतरिक लीक, third-party service, या कर्मचारी द्वारा बाहर ले जाने जैसी तीन संभावनाएँ सामने रखी गईं
- इस घटना को कंपनियों के बीच निजी डेटा के व्यावसायिक आदान-प्रदान और जवाबदेही की कमी को उजागर करने वाले उदाहरण के रूप में देखा गया
BrowserStack उपयोगकर्ताओं के ईमेल लीक होने का संदेह
- सेवा-विशिष्ट यूनिक ईमेल पते बनाने की विधि से लीक के रास्ते का पता लगाने का मामला
- हर सेवा में साइन अप करते समय अलग ईमेल बनाया और इस्तेमाल किया गया
- यदि किसी खास पते पर spam या बाहरी ईमेल आता है, तो तुरंत पता चल सकता है कि वह किस सेवा से लीक हुआ
-
BrowserStack open source program में शामिल होने के बाद उसी समर्पित ईमेल पर Apollo.io के माध्यम से बाहरी प्रेषक का ईमेल प्राप्त हुआ
- BrowserStack support team के साथ कई बार ईमेल का आदान-प्रदान करने के बाद अकाउंट सेटअप पूरा किया गया
- उसके कुछ ही दिनों बाद BrowserStack से असंबंधित तीसरे पक्ष का ईमेल पहुंचा
- प्रेषक ने साफ़ कहा कि उसके डेटा का स्रोत Apollo.io है
- Apollo.io की शुरुआती सफाई थी कि यह “सार्वजनिक जानकारी पर आधारित उसका अपना एल्गोरिदम” है
- उसने समझाया कि “firstname.lastname@companydomain.com” जैसे सामान्य ईमेल ढांचे का इस्तेमाल किया गया
- लेकिन संबंधित पता केवल BrowserStack के लिए इस्तेमाल किया गया था, इसलिए उसे सार्वजनिक जानकारी से अनुमानित नहीं किया जा सकता था
- इस पर ध्यान दिलाने के बाद Apollo ने जवाब बदलकर कहा कि BrowserStack ने customer contribution network के ज़रिए डेटा उपलब्ध कराया था
- डेटा संग्रह की तारीख 25 फ़रवरी 2026 दर्ज थी
-
BrowserStack की ओर से कई बार पूछने पर भी कोई जवाब नहीं
- “No spam, we promise!” जैसे वाक्य के बावजूद कोई आधिकारिक उत्तर नहीं मिला
- संभावित लीक रास्तों के रूप में तीन परिदृश्य बताए गए
- BrowserStack ने उपयोगकर्ता डेटा सीधे बेचा या उपलब्ध कराया
- BrowserStack द्वारा इस्तेमाल की जाने वाली third-party service से जानकारी लीक हुई
- आंतरिक कर्मचारी या contractor द्वारा बाहरी रूप से डेटा निकाला गया
-
निजी डेटा के व्यावसायीकरण की प्रथा पर सवाल
- यह कहा गया कि दुर्भावनापूर्ण hacking से भी बड़ा मुद्दा कंपनियों के बीच निजी डेटा के आदान-प्रदान का सामान्य हो जाना है
- इसे निजी डेटा सुरक्षा के प्रति कंपनियों के गैर-जिम्मेदार रवैये को दिखाने वाला मामला माना गया
- आगे आने वाली पोस्ट में यह बताया जाएगा कि Apollo ने बड़ी कंपनियों से फोन नंबर हासिल करने के मामलों को कैसे संभाला
1 टिप्पणियां
Hacker News की राय
पहले OSS community forum software में (शायद KDE या Qt था) गलती से users के email addresses HTML tags के अंदर शामिल हो गए थे
web crawlers ने उन्हें इकट्ठा करके spam database बना लिया था
एक दोस्त का unique email address spam में इस्तेमाल होने से यह बात पकड़ में आई, और forum admins ने समस्या को ट्रेस करके ठीक किया
मुझे लगता है कि इस बार भी malicious activity से ज़्यादा ऐसी ही कोई गलती होने की संभावना है
बहुत लोग इसे “data leak” कह रहे हैं, लेकिन असल में यह Apollo के default working model का हिस्सा है
अगर customer साफ़ तौर पर data sharing को opt out नहीं करता, तो जानकारी अपने-आप share हो जाती है
यह ethical है या legal, वह अलग बात है, लेकिन व्यवहार में यह ऐसे ही चलता है
Apollo customer data sharing policy देखें
इस तरह जोड़ी गई जानकारी Apollo के सभी customers के लिए searchable हो जाती है
उदाहरण के लिए, “Example Inc. के decision-maker emails” खोजने पर मेरा email भी आ सकता है
सच कहें तो लगभग हर marketing team ऐसे ही काम करती है
OP ने unique email address इस्तेमाल किया था, इसलिए इस बार यह सामने आ गया
Apollo personal data removal request link भी है, लेकिन ऐसी service देने वाली companies बहुत हैं
सोमवार सुबह inquiries की बाढ़ आ सकती है
sales reps को data enrich करने के लिए credits चाहिए होते हैं, और
ZoomInfo इसमें खास तौर पर aggressive है, और Apollo भी कुछ ऐसा ही करता है
Apollo की data collection explanation में भी इसका ज़िक्र है
Apollo.io खुद को “AI sales platform” बताता है, लेकिन असल में यह CRM system है
संभव है कि sales team में किसी ने पूरी customer list upload कर दी हो
लगता है privacy protection को लेकर जागरूकता की कमी थी
मैं हर service के लिए unique email address बनाकर इस्तेमाल करता हूँ,
लेकिन आजकल कई services ऐसे addresses को “de-aliasing” करके original address पहचान लेती हैं
अगर वह पूरी तरह नया domain-based अलग mailbox न हो, तो इसका असर कम हो जाता है
उस address पर spam आते ही तुरंत पता चल जाता है कि leak कहाँ से हुआ
हर site के लिए random address बनाता हूँ और कहाँ इस्तेमाल किया, उसका रिकॉर्ड रखता हूँ
phishing mail filtering में भी यह काम आता है — जैसे, bank कभी dog food trial वाले address पर mail नहीं भेजेगा
पहले मैं अपने domain पर catch-all mail server चलाता था,
लेकिन spam इतना बढ़ गया कि आखिरकार छोड़ना पड़ा
संभव है BrowserStack ने user data बेचा हो या किसी third party को दिया हो,
या फिर सिर्फ DB hack हुआ हो
BrightData ने भी हाल में customer data leak किया था, और customers को email से बताया था
दोनों companies शायद headless Chrome vulnerability की शिकार हुई हों, या यह सिर्फ संयोग हो
मैं headless browser fingerprinting project चलाता हूँ,
और मैंने देखा कि जिस URL को सिर्फ BrightData के ज़रिए access किया गया था, उसे बाद में Anthropic के Claudebot ने भी access किया
शायद attacker ने Claude का इस्तेमाल data analysis के लिए किया हो
वह “high-quality residential IP” बेचने का दावा करती है, लेकिन असल में यह web scraping proxy network है
UK की Compare The Market में भी यही हुआ था
मैंने दो अलग unique email addresses इस्तेमाल किए थे, और एक ही दिन दोनों पर spam आना शुरू हो गया
शिकायत की, लेकिन यह कहकर नज़रअंदाज़ कर दिया गया कि इसे साबित नहीं किया जा सकता
Apollo के GDPR page पर लिखा है,
“consent स्वतंत्र, specific और unambiguous होना चाहिए”
लेकिन व्यवहार में वह data processing के लिए “Legitimate Interests” को आधार बताता है
समस्या यह है कि customers उस आधार को ठीक से verify नहीं करते
BrowserStack ने बिना किसी legal basis के data share किया,
और Apollo customers से मिले data को verify किए बिना आगे share करता है
नतीजतन, दोनों companies के GDPR violation में शामिल होने की संभावना है
Apollo GDPR guide देखें
यह मुद्दा सामने लाने के लिए OP का धन्यवाद
इससे corporate transparency बढ़ाने में मदद मिलती है
canary email addresses leak के source को अलग करने में उपयोगी होते हैं
अगर सिर्फ किसी एक service वाले address पर spam आए, तो data broker re-sharing की संभावना है,
और अगर कई addresses पर एक साथ आए, तो credential leak की संभावना ज़्यादा होती है
यानी spam का scope ही एक संकेत होता है