यूट्यूब पर बिना निर्माता की सहमति के AI से वीडियो बदलना और संभावित रूप से भ्रमित करने वाला सारांश जोड़ना
(ynetnews.com)- यूट्यूब ने यह तथ्य उजागर किया कि उसने कुछ लोकप्रिय चैनल वीडियो पर AI-आधारित सुधार तकनीक लागू की, बिना किसी क्रिएटर या दर्शक को सूचित किए
- संगीत YouTuber Rick Beato और Rhett Shull ने अपनी वीडियो में त्वचा, बालों और कपड़ों की सिलवटों में सूक्ष्म बदलाव देखे और मामला उठाया
- यूट्यूब ने कहा कि यह "कुछ Shorts वीडियो तक सीमित एक प्रयोग" था और पारंपरिक मशीन लर्निंग से वीडियो की स्पष्टता व शोर (noise) बेहतर किए गए
- लेकिन विशेषज्ञों ने कहा कि मशीन लर्निंग भी AI का ही हिस्सा है, इसलिए शब्द चुनकर बचने और पारदर्शिता की कमी की आलोचना की, तथा कंटेंट की विश्वसनीयता पर असर की चिंता जताई
- क्रिएटर की सहमति बिना सामग्री बदलने वाला यह मामला डिजिटल मीडिया की प्रामाणिकता और भरोसे से जुड़े गंभीर प्रश्न उठाता है
यूट्यूब का गुप्त AI वीडियो सुधार प्रयोग
- यूट्यूब ने कुछ लोकप्रिय क्रिएटरों की वीडियो पर AI-आधारित वीडियो सुधार तकनीक को चुपचाप लागू किया
- क्रिएटर या दर्शकों को पहले से कोई पूर्व-सूचना दिए बिना वीडियो के दृश्य तत्व बदल दिए गए
- Beato और Shull ने अपनी वीडियो में त्वचा का टेक्सचर, बाल, कपड़ों की सिलवटें और कान का आकार बदलते हुए देखे
- Beato ने कहा कि “बाल अजीब लग रहे थे और ऐसा लगा जैसे मेकअप कर दिया गया हो।”
- Shull ने कहा कि यह “AI द्वारा बनाया हुआ लगता है,” और जोड़ा कि इससे दर्शकों का भरोसा टूट सकता है।
प्रयोग की पुष्टि और यूट्यूब का स्पष्टीकरण
- यूट्यूब ने स्वीकार किया कि वह कुछ Shorts वीडियो में छोटे स्तर का प्रयोग कर रहा है
- Creator Liaison Rene Ritchie ने X (पूर्व में Twitter) पर बताया कि यह वीडियो की स्पष्टता और शोर कम करने के लिए पारंपरिक मशीन लर्निंग का प्रयोग था
- दावा किया कि यह मोबाइल के auto-enhancement फ़ीचर जैसा ही है
- लेकिन पिट्सबर्ग विश्वविद्यालय के प्रोफेसर Samuel Woolley का कहना था कि मशीन लर्निंग AI का ही एक हिस्सा है, इसलिए यूट्यूब का बयान भ्रामक है।
AI पूर्व-प्रसंस्करण का प्रसार और भरोसे का संकट
- विशेषज्ञों का कहना है कि यह घटना AI द्वारा कंटेंट के पूर्व-प्रोसेसिंग के बढ़ते वैश्विक रुझान का हिस्सा है
- Samsung ने चाँद की तस्वीरों को AI से अधिक स्पष्ट बनाने वाला फीचर इस्तेमाल किया, और Google Pixel का “Best Take” कई चेहरों की अभिव्यक्तियाँ मिलाकर एक परफेक्ट फोटो बनाता है
- Woolley ने इसे “क्रिएटर की सहमति बिना कंटेंट बदलकर प्रकाशित करना” कहा और चेतावनी दी कि इससे दर्शकों और मीडिया के बीच एक अदृश्य मैनिपुलेशन लेयर बन जाती है
- इसने कंटेंट की प्रामाणिकता और पारदर्शिता को लेकर चिंता बढ़ा दी
क्रिएटरों और विशेषज्ञों की प्रतिक्रिया
- Beato ने यूट्यूब के प्रयास पर “नए टूल्स आज़माने वाला प्लेटफॉर्म” कहकर सकारात्मक रवैया दिखाया
- उन्होंने कहा, “YouTube ने मेरी जिंदगी बदल दी,” और सीधे आलोचना से बचने की कोशिश की
- जबकि समीक्षक कह रहे हैं कि बिना पहले से बताए बदलाव करना खतरनाक मिसाल बनाता है
- उन्होंने यह भी कहा कि YouTube सिर्फ मनोरंजन ही नहीं बल्कि न्यूज़, एजुकेशन और इंफो कंटेंट का भी बड़ा प्लेटफॉर्म है, इसलिए सटीकता और वास्तविकता विशेष रूप से अहम हैं
डिजिटल मीडिया का भविष्य
- यह मामला AI द्वारा उपयोगकर्ता की धारणा बनने से पहले ही कंटेंट को पुनर्गठित करने वाले भविष्य की झलक देता है
- यह दिखाता है कि दर्शक प्ले बटन दबाने से पहले ही AI-हस्तक्षेप वाली वीडियो सामने आ सकती है
- पारदर्शी AI उपयोग सूचना और क्रिएटर सहमति प्रक्रिया की आवश्यकता और स्पष्ट हो गई है
1 टिप्पणियां
Hacker News राय
lip makeup वीडियो में होंठ बड़े हो जाते हैं, और eye makeup वीडियो में आंखें बड़ी हो जाती हैं; यानी AI कंटेंट के प्रकार को पहचानकर अपने-आप filter लगा रहा है
संबंधित वीडियो यहाँ देखा जा सकता है। creator के upload को बिना अनुमति modify करना चौंकाने वाला है
influencer non-technical हैं, इसलिए शायद उन्होंने इसे AI filter समझ लिया। स्क्रीन पर तैरते हुए motion blocks high compression की एक typical निशानी हैं
यह अजीब है कि tech forum में ऐसे दावों को ज्यों का त्यों मान लिया जाता है। पूरे वीडियो में detail की कमी है और compression के निशान साफ दिखते हैं
terms of service में अगर platform के पास “जो चाहे कर सकता है” जैसा clause है, तो बाद में इसे “user setting” कहकर justify किया जा सकता है
“जब Meta automatic voice translation करता है, तो audio से lip movement मिलाने के लिए AI filter जोड़ता है, और इस प्रक्रिया में कभी-कभी पूरे चेहरे पर अजीब filter चढ़ जाता है”
यह कहना कि कंटेंट के प्रकार के हिसाब से अलग-अलग filter लगाए जाते हैं, conspiracy theory जैसी हद से ज़्यादा अटकल लगती है
skin ज़रूरत से ज़्यादा smooth दिखती है, बाल wax जैसे लगते हैं, और moving objects के आसपास अजीब ring बनती है
पहले लगा कि यह client upscaling है, लेकिन यह server पर process होता है, इसलिए इसे बंद भी नहीं किया जा सकता
अगर लोग ऐसी quality के आदी हो गए, तो आगे चलकर AI-generated content मिला होने पर भी शायद पहचान नहीं पाएंगे
लोग बस endlessly scroll करते रहेंगे और ads व दिमाग सुन्न कर देने वाले content ही देखते रहेंगे
ffmpeg -i source.mkv -i suspect.mkv -filter_complex "blend=all_mode=difference" diff_output.mkvकमांड इस्तेमाल करता हूँऐसे दावे बहुत हैं, लेकिन वास्तव में comparison video (diff) upload करने वाला अभी तक नहीं देखा। अगर कोई करे तो दिलचस्प होगा
YouTube वीडियो में 0:31 पर Shorts और original को साथ-साथ दिखाया गया है
Patreon पर डाले गए high-quality version में फ़र्क कहीं ज़्यादा साफ दिखता है
आजकल मैं thumbnail का screenshot लेकर ChatGPT से पूछता हूँ, या वीडियो URL को transcript extractor में डालकर Gemini से analysis कराता हूँ
clickbait बनाने वाले अब बस “ChatGPT से पूछे जाने वाले topic के suggester” भर रह गए हैं
creators को बताए बिना इस तरह का “improvement” करना समझदारी नहीं है
ज़्यादा लोगों को बेहतर platforms के साथ experiment करना चाहिए। खासकर उन छोटे creators के लिए, जो झूठे copyright claim से परेशान हैं
एक विकल्प Fediverse का PeerTube जैसे platform हैं
engagement बढ़ाना creators का काम है; अगर platform दखल देगा, तो आखिर में users दूर चले जाएंगे
संबंधित उदाहरण इस लेख में है
lossy compression और adaptive quantization से skin smooth दिखने जैसी चीज़ें हो सकती हैं
scientists, politicians, economists और tech experts को पूरा का पूरा AI से clone करके दिखाया जाता है
संबंधित रिपोर्ट: The Guardian की रिपोर्ट
मुझे नहीं लगता कि Google के पास बाहरी दुनिया को साफ data देने की कोई वजह है
उदाहरण के लिए यह channel असली वीडियो frame की जगह Stable Diffusion से बने लगने वाले summary image का इस्तेमाल करता है
मैंने इसे अपने channel पर भी एक बार देखा था, लेकिन अब वह option गायब है। जिन channels को मैं follow करता हूँ, उनमें से ज़्यादातर इस feature का इस्तेमाल कर रहे हैं
मुझे व्यक्तिगत रूप से यह पसंद नहीं
उदाहरण के लिए वीडियो के नीचे “English को Gaelic में बदलो”, “dad jokes को lorem ipsum से replace करो”, “कुत्ते को alien lifeform में बदलो” जैसे prompt डालने की सुविधा होनी चाहिए
अगर यह browser में locally run हो सके तो बढ़िया होगा, लेकिन तब तक शायद यह कानूनी रूप से प्रतिबंधित भी हो सकता है