- AI ट्रेनिंग के लिए स्मार्ट ग्लासेस कंटेंट की समीक्षा कर रहे केन्या स्थित Sama के मज़दूर Meta के कॉन्ट्रैक्ट खत्म होने के बाद 1,108 कर्मचारियों की छंटनी की आशंका वाले विवाद में फँसे हैं
- कॉन्ट्रैक्ट का अंत उस दावे के दो महीने से भी कम समय बाद हुआ, जिसमें मज़दूरों ने कहा था कि उन्होंने Meta ग्लासेस के वीडियो में उपयोगकर्ताओं के टॉयलेट इस्तेमाल और यौन संबंधों के दृश्य देखे थे
- Meta का कहना है कि Sama उसके ऑपरेशनल स्टैंडर्ड्स पूरे नहीं कर पाया, जबकि Sama ने जवाब दिया कि उसने Meta समेत अपने क्लाइंट्स के काम में ऑपरेशनल, सुरक्षा और गुणवत्ता मानकों को पूरा किया और उसे कभी मानक से नीचे होने की सूचना नहीं मिली
- Meta ने कहा कि उपयोगकर्ता द्वारा Meta AI के साथ साझा किया गया स्मार्ट ग्लासेस कंटेंट कभी-कभी ठेका मज़दूरों द्वारा रिव्यू किया जा सकता है, और उत्पाद प्रदर्शन सुधारने के लिए होने वाली मानव समीक्षा के लिए वह स्पष्ट उपयोगकर्ता सहमति लेता है
- ब्रिटेन की ICO और केन्या के डेटा सुरक्षा आयुक्त ने प्राइवेसी चिंताओं पर प्रतिक्रिया दी, और Sama के पिछले Facebook content moderation कॉन्ट्रैक्ट विवाद के साथ मिलकर इस मामले ने AI डेटा लेबर के जोखिम उजागर किए
Meta और Sama के कॉन्ट्रैक्ट खत्म होने को लेकर मुख्य विवाद
- Meta ने AI ट्रेनिंग में इस्तेमाल हो रहे Sama के साथ अपना बड़ा कॉन्ट्रैक्ट खत्म कर दिया, और Sama का अनुमान है कि इस फैसले से 1,108 लोग नौकरी खो सकते हैं
- कॉन्ट्रैक्ट समाप्ति उस समय से दो महीने से भी कम में हुई जब केन्या स्थित Sama के मज़दूरों ने कहा था कि उन्होंने Meta स्मार्ट ग्लासेस वीडियो में उपयोगकर्ताओं के टॉयलेट इस्तेमाल और यौन संबंधों के दृश्य देखे
- Meta का कहना है कि Sama उसकी ऑपरेशनल आवश्यकताओं को पूरा नहीं कर पाया, इसलिए कॉन्ट्रैक्ट समाप्त किया गया
- Sama ने इसका विरोध करते हुए कहा कि उसने Meta सहित अपने क्लाइंट्स के लिए आवश्यक ऑपरेशनल, सुरक्षा और गुणवत्ता मानकों को लगातार पूरा किया और उसे कभी कमी की सूचना नहीं दी गई
- केन्या के मज़दूर संगठन मानते हैं कि Meta का यह फैसला कर्मचारियों के सार्वजनिक बयानों की वजह से लिया गया, लेकिन Meta ने इस आरोप पर सीधे जवाब नहीं दिया
स्मार्ट ग्लासेस वीडियो समीक्षा और निजी जानकारी का सवाल
- फरवरी के अंत में स्वीडिश मीडिया Svenska Dagbladet और Goteborgs-Posten की जांच में गुमनाम मज़दूरों ने बताया कि उन्होंने Meta ग्लासेस से रिकॉर्ड किए गए वीडियो की समीक्षा की थी
- एक मज़दूर ने कहा, “हम लिविंग रूम से लेकर नग्न शरीर तक सब कुछ देखते हैं,” और उसके अनुसार वीडियो में टॉयलेट इस्तेमाल और यौन संबंधों के दृश्य भी शामिल थे
- Meta ने माना कि उपयोगकर्ता द्वारा Meta AI के साथ साझा किया गया स्मार्ट ग्लासेस कंटेंट कभी-कभी ठेका मज़दूरों द्वारा रिव्यू किया जा सकता है
- Meta का कहना है कि यह समीक्षा कस्टमर एक्सपीरियंस सुधारने के लिए होती है और अन्य कंपनियों में भी यह आम प्रथा है
- BBC को भेजे गए बयान में Meta ने कहा कि फोटो और वीडियो अन्य उपयोगकर्ताओं के लिए निजी रहते हैं, और उत्पाद प्रदर्शन सुधारने के लिए AI कंटेंट की मानव समीक्षा हेतु स्पष्ट उपयोगकर्ता सहमति ली जाती है
नियामक संस्थाएं और प्रोडक्ट इस्तेमाल के जोखिम
- स्वीडिश रिपोर्ट के तुरंत बाद ब्रिटेन की डेटा नियामक संस्था ICO ने इन खबरों को “चिंताजनक” बताया और Meta को पत्र भेजा
- केन्या के डेटा सुरक्षा आयुक्त ने भी स्मार्ट ग्लासेस से उठी प्राइवेसी चिंताओं की जांच शुरू की
- Meta ने सितंबर में Ray-Ban और Oakley के साथ AI आधारित ग्लासेस की अपनी लाइनअप पेश की
- इन फीचर्स में टेक्स्ट अनुवाद और उपयोगकर्ता जो देख रहा है उसके बारे में सवालों के जवाब शामिल हैं, और ये विशेष रूप से दृष्टिबाधित या कम दृष्टि वाले उपयोगकर्ताओं के लिए उपयोगी हो सकते हैं
- डिवाइस की लोकप्रियता बढ़ने के साथ दुरुपयोग की चिंताएं भी बढ़ी हैं, और केन्या में इसे महिलाओं की बिना सहमति रिकॉर्डिंग से भी जोड़ा गया है
- Meta ग्लासेस में रिकॉर्डिंग के दौरान फ्रेम के कोने पर लगा इंडिकेटर लाइट जलता है
डेटा लेबलिंग श्रम और पहले के कॉन्ट्रैक्ट विवाद
- Sama के मज़दूर data annotator के रूप में कंटेंट पर हाथ से लेबल लगाते थे ताकि Meta AI इमेज को समझ सके, और वे AI के साथ हुई इंटरैक्शन transcript की भी समीक्षा करते थे
- एक मज़दूर के अनुसार एक पुरुष के ग्लासेस ने बेडरूम में रिकॉर्डिंग जारी रखी, जिसके बाद एक महिला, जो संभवतः उसकी पत्नी थी, कपड़े उतारती हुई रिकॉर्ड हुई
- Sama अमेरिका मुख्यालय वाली एक outsourcing कंपनी है, जिसकी शुरुआत टेक जॉब्स के ज़रिए रोज़गार बढ़ाने पर केंद्रित एक non-profit संगठन के रूप में हुई थी, और अब यह खुद को “ethical” B-corp के रूप में चलाती है
- Meta और Sama के पुराने Facebook content moderation कॉन्ट्रैक्ट पर भी आलोचना हुई थी और पूर्व कर्मचारियों ने कानूनी कार्रवाई की थी; कुछ कर्मचारियों ने कहा था कि वे अत्यंत स्पष्ट और मानसिक आघात देने वाले कंटेंट के संपर्क में आए
- Sama ने बाद में कहा कि उसे वह काम लेने पर अफसोस है
- Africa Tech Workers Movement के Naftali Wambalo ने कहा कि वह स्मार्ट ग्लासेस कॉन्ट्रैक्ट पर काम करने वाले मज़दूरों से भी संपर्क में रहे हैं, और उनके अनुसार Meta नहीं चाहता था कि स्मार्ट ग्लासेस कंटेंट की मानव समीक्षा का तथ्य सार्वजनिक हो
- Wambalo ने कहा कि Meta जिन मानकों की बात कर रहा है, वे “गोपनीयता बनाए रखने के मानक” के अधिक करीब लगते हैं
- Meta पहले कह चुका है कि उसकी सेवा शर्तों में उपयोगकर्ता मानव समीक्षा की संभावना के बारे में जान सकते थे
- Oversight Lab की Mercy Mutemi का कहना है कि Meta का यह बयान केन्या सरकार के लिए चेतावनी होना चाहिए, और AI इकोसिस्टम में प्रवेश के रास्ते के रूप में पेश की गई बुनियाद बेहद कमजोर है
1 टिप्पणियां
Hacker News की राय
Meta ने आउटसोर्सिंग कंपनी के साथ अपना कॉन्ट्रैक्ट रद्द कर दिया, जिसे स्मार्ट glasses के content classification का काम सौंपा गया था; यह सब तब हुआ जब उस कंपनी के कर्मचारियों ने वर्गीकरण के लिए दिए गए content से जुड़े गंभीर privacy मुद्दों पर whistleblowing की
OpenAI ने उसे CSAM classification का काम दिया था, और Sama ने 2022 में OpenAI के साथ ग्राहक संबंध समाप्त कर दिया था: https://time.com/6247678/openai-chatgpt-kenya-workers/
उसके 4 साल बाद, और उस रिपोर्ट के 3 साल बाद भी, tech कंपनियों के काम करने के तरीके में ज़रा भी सुधार नहीं हुआ
उससे बात न करें या मेलजोल न रखें, और मैं तो यह भी नहीं कहूँगा कि उसके साथ एक ही जगह पर रहें
Meta का कहना था कि Sama उसके standards पर खरी नहीं उतरी, और Sama ने उस आलोचना से इनकार किया
अपराधियों को बचाते हुए whistleblower को बदनाम करना सिर्फ तानाशाही और oligarchy करती हैं
आउटसोर्सिंग कंपनी किस देश में है, इससे फ़र्क नहीं पड़ना चाहिए; अगर अपराध global हो चुके हैं, तो whistleblower protection भी global होनी चाहिए
एक worker ने कहा कि उन्होंने “living room से लेकर nude scenes तक सब कुछ देखा”
Meta ने कहा कि यह customer experience बेहतर बनाने के लिए था और दूसरी कंपनियाँ भी अक्सर ऐसा करती हैं, लेकिन समझ नहीं आता कि क्या मैंने इसे सही पढ़ा है
इंटरनेट पर 20 साल में पढ़ी गई बातों में यह शायद सबसे विचित्र है
समझ नहीं आता कि Meta खुद जो कह रही है, उसे पढ़ भी रही है या नहीं
शायद कहा गया था कि यह issue analysis जैसी चीज़ों के लिए है
जब मैं कहता हूँ कि मैं WhatsApp इस्तेमाल नहीं करता, तो आज भी लोग अजीब प्रतिक्रिया देते हैं, लेकिन Meta की सारी assets दूषित हैं इसलिए मैं उन्हें इस्तेमाल नहीं करता
यहाँ क्या ज़्यादा बुरा है, समझ नहीं आता — Meta का अपने ग्राहकों के smart glasses से वीडियो रिकॉर्ड करना, या इस बारे में बोलने वाले लोगों को नौकरी से निकाल देना
यह सही है कि ऐसी कंपनियों पर दबाव होना चाहिए ताकि वे कूड़े जैसा व्यवहार न करें, लेकिन आखिरकार उन्हें गंदा काम करने के लिए वही data चाहिए जो लोगों ने उन्हें दिया है
Flock जैसे मामले अपवाद हैं, जो “public” surveillance data के साथ गंदा काम करते हैं
मुझे पता है कि संस्कृति इतनी बिगड़ चुकी है कि corporate surveillance goggles पहनकर intimate moments बिताना सामान्य होता जा रहा है, लेकिन समझ नहीं आता कि लोग इस हद तक भरोसा कैसे कर लेते हैं
और व्यापक रूप से देखें तो, Meta जैसा संगठन जिसे वह निश्चित ही monitor करेगा, उससे जुड़ा internet-connected camera कोई क्यों पहनेगा
मेरा मानना है कि smart glasses और दूसरी “personal” technologies के आसपास के कठिन privacy और security issues को एक सावधान, ईमानदार और तेज़ प्रतिक्रिया देने वाली company पर्याप्त रूप से संभाल सकती है
इसलिए मैं Meta के personal devices को कभी हाथ नहीं लगाऊँगा
उनके पूरे DNA में users का मुनाफ़े के लिए शोषण लिख दिया गया है
मेरी नज़र में वे इन समस्याओं को सिर्फ ऐसी चीज़ मानते हैं जो लोगों को शोषण की गहराई से अनजान रखने का काम करे; वे इन्हें सचमुच गंभीरता से समझ ही नहीं सकते, और आगे भी नहीं समझेंगे
मैं जानना चाहता हूँ कि glasses से रिकॉर्ड किया गया वीडियो किन परिस्थितियों में classification के लिए upload होता है
शायद ढाँचा यह होगा कि जब user glasses से देखी जा रही किसी चीज़ के बारे में कुछ पूछता है, तो जवाब बनाने के लिए वीडियो classification हेतु upload हो जाता है
लगता है लोग “यह तो बस AI है” सोचकर privacy की ज़्यादा चिंता नहीं करते
यह headline देखकर याद आया कि “row” उन शब्दों में से एक है जिसका उच्चारण मैं लगभग पूरी ज़िंदगी गलत करता रहा. इसी साल जाकर सही pronunciation पता चली
इस संदर्भ में row का तुक dough से नहीं बल्कि cow से मिलता है
पहले मेरे दिमाग में bow उदाहरण आया था, लेकिन फिर समझ आया कि उस उदाहरण में ही समस्या है
“एक साझा भाषा से बँटे दो देश” वाली बात बिल्कुल फिट बैठती है
https://www.merriam-webster.com/dictionary/row#dictionary-en...
मैं Meta का पूर्व कर्मचारी हूँ. हूटिंग कर सकते हैं
अंदर data classification के 4 levels थे, जहाँ 1 “आसमान नीला है” जैसी public-domain जानकारी थी, और 4 personal user data या ऐसी जानकारी थी जो leak या share होने पर sensitive मानी जाती
मूल रूप से हमें बताया गया था कि सारा user data level 4 है, और बिना सही approval के कुछ भी करने पर तुरंत नौकरी जा सकती थी
bootcamp के दौरान हर महीने कम से कम एक व्यक्ति के user data access करने और कुछ घंटों में building से escort करके बाहर निकाले जाने की कहानियाँ अक्सर सुनने को मिलती थीं
जिस visual research में मैं काम करता था, उसमें public spaces में वीडियो रिकॉर्ड करने की अनुमति पाने के लिए हमें एक साल की legal process से गुजरना पड़ता था
हमें anonymization pipeline, मज़बूत audit trail, जितना संभव हो उतना data deletion, और कुछ गलत होने पर automatic deletion जैसी व्यवस्था बनानी पड़ती थी
data कहाँ store होगा और किसे access मिलेगा, इस पर भी सख्त नियम थे
“wild” videos, जिनमें contract पर sign न करने वाला कोई भी व्यक्ति ज़रा सा भी दिख सकता था, third parties तक जा सकते थे, इसलिए उन्हें annotation work के लिए share नहीं किया जा सकता था
public datasets में शामिल हर traceable व्यक्ति और स्थान के लिए legal waiver sign कराया गया था
लेकिन अब सुन रहा हूँ कि private data बस annotators पर उड़ेल दिया गया और उसे training data की तरह इस्तेमाल किया गया, तो इसका मतलब है कि बुनियादी controls भी नहीं थे
यह सिर्फ दिखाता है कि अगर Zuck या monetization कुछ चाहता है, तो नियम लागू नहीं होते
उम्मीद है कि पूरी industry खुद ही ढह जाए
SWE को केवल user या customer की स्पष्ट सहमति होने पर ही PII access कर पाना चाहिए, जैसे support ticket के मामले में
खासकर अगर कोई bootcamp में हो, तो और भी ज़्यादा; training के दौरान non-anonymized user data access करने की बात ही अजीब है
मेरी पिछली company में भी customer consent होने पर user data access करने के लिए बहुत लंबी process से गुजरना पड़ता था
क्योंकि साफ़ दिखता था कि अंदर की कहानी बिल्कुल अलग चल रही है
smart glasses के बड़े commercial niches में से एक POV porn recording है, इसलिए ऐसा content moderation queue में पहुँचना बहुत चौंकाने वाला नहीं है
project की planning में इस use case को ध्यान में रखा जाना चाहिए था
Oculus Go के समय भी अंदर बहुत से शिष्ट euphemisms इस्तेमाल किए जाते थे, ताकि यह साफ़-साफ़ न कहना पड़े कि “हमारे device को browser के साथ लॉन्च करना होगा ताकि लोग porn देख सकें”
क्या क्योंकि यह server पर stream हुआ, तो वे किसी को भेजेंगे कि जाकर उन्हें sex करने से रोके?
https://archive.ph/ubWba
अगर आप यह और पढ़ना चाहते हैं कि AI training का घिनौना हिस्सा किस तरह तीसरी दुनिया के ग़रीब मज़दूरों पर थोपा जाता है, तो Karen Hao की Empire of AI की सिफ़ारिश है
ये workers अस्थिर नौकरियों में बेहद कम प्रति घंटा मज़दूरी पर भयावह सामग्री के संपर्क में रहते हैं