1 पॉइंट द्वारा GN⁺ 2025-08-27 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • Will Smith के concert video पर AI से बनाई गई नकली crowd होने का शक किया गया, लेकिन वास्तव में यह मौजूद प्रशंसकों की असली recordings पर आधारित था
  • विवादित video को performance scenes और festival audience की असली photos मिलाकर बनाया गया था, और कुछ crowd shots को image-to-video AI model से animate किया गया था
  • लेकिन YouTube Shorts के post-processing experiment (unblurring·denoise) जुड़ने के बाद, crowd के चेहरे अजीब तरह से विकृत हो गए और signboards भी बिगड़ गए, जिससे यह AI manipulation जैसा दिखने लगा
  • Instagram·Facebook पर पोस्ट किए गए उसी video में विकृति कम थी, जिससे पता चलता है कि YouTube की automatic enhancement ने स्थिति को और बिगाड़ दिया
  • निष्कर्षतः crowd असली थी, लेकिन artist पक्ष की AI enhancement और YouTube filter के एक साथ असर ने असली-नकली की बहस छेड़ दी

विवाद की शुरुआत

  • जैसे ही यह 1 मिनट का video जारी हुआ, Rolling Stone, NME, Mashable जैसे बड़े media outlets ने AI manipulation के शक पर रिपोर्ट किया
  • video में crowd के चेहरों पर AI-विशिष्ट विकृति, कई उंगलियाँ, अजीब निशान जैसे लक्षण दिखे
  • खास तौर पर “From West Philly to West Swizzy” लिखे sign को गलत तरह से पहचान लिए जाने से विवाद और बढ़ गया

असली concert footage की पुष्टि

  • यह video फ्रांस के Orange में Positiv Festival सहित, स्विट्ज़रलैंड के Gurtenfestival·Paléo Festival और बेल्जियम के Ronquieres Festival की audience shots को cross-edit करके बनाया गया था
  • संबंधित concert photos और fans द्वारा रिकॉर्ड किए गए videos में वही लोग और signboards दिखे, जिससे यह साबित हुआ कि crowd असली थी
  • cancer treatment से गुजर रहे एक couple की कहानी वाला sign भी मौजूद है, और Will Smith के Instagram पर उससे जुड़ी कई photos और videos भी हैं

AI manipulation के दो चरण

  1. Will Smith की team ने official concert photos का इस्तेमाल कर AI image-to-video models (Runway, Veo 3 आदि) से छोटे clips तैयार किए
  2. इसके ऊपर YouTube Shorts का automatic post-processing (unblur·denoise) लागू हुआ, जिससे video और ज़्यादा धुंधला और अप्राकृतिक रूप से विकृत हो गया

YouTube Shorts experiment

  • Instagram·Facebook पर अपलोड किए गए versions अपेक्षाकृत साफ़ हैं, लेकिन YouTube ने “AI enhancement technology experiment” लागू किया, जिससे पूरे video में दबा-कुचला, विकृत screen effect दिखाई दिया
  • YouTube ने इसे “traditional machine-learning based sharpening technology” बताया, लेकिन बिना पहले से सूचना दिए इसका लागू होना विवाद का कारण बना
  • बाद में creators के विरोध के बाद कंपनी ने opt-out feature जोड़ने की घोषणा की

निष्कर्ष

  • ज़्यादातर YouTube, Reddit, X users अब भी मान रहे हैं कि यह “AI से बने fake fans वाला video” था
  • वास्तव में इसमें असली crowd दिखाई गई थी, लेकिन Will Smith की team के image-to-video conversion और YouTube के post-processing से इसकी कृत्रिमता बहुत बढ़ गई
  • concert venue photos पर image-to-video model से हल्का animation effect जोड़ने और पूरी तरह काल्पनिक भीड़ बनाने के बीच नैतिक अंतर को स्पष्ट करने की ज़रूरत पर सवाल उठे
  • अंततः इस मामले ने दिखाया कि असली performance भी AI tools की वजह से ‘कम असली’ जैसी दिख सकती है

1 टिप्पणियां

 
GN⁺ 2025-08-27
Hacker News टिप्पणियाँ
  • AI-upscale किए गए वीडियो उतने ही आँखों में चुभते हैं जितना नए TV में frame interpolation बंद करने से पहले की अजीब-सी स्मूदनेस। समझ नहीं आता किसे यह गलत artificial sharpness बेहतर लगती है। मैंने हाल ही में David Bowie & Nine Inch Nails के परफ़ॉर्मेंस का AI-upscaled version देखा, और खासकर 2 मिनट के आसपास ऐसा लगा जैसे reality ही थोड़ी बिगड़ गई हो, जिससे काफ़ी psychological unease हुआ। असली वीडियो low-resolution है, लेकिन वही उसके mood और intended feel को कहीं बेहतर रखता है। आज हमारे पास शानदार camera और lens हैं, तो AI से ज़बरदस्ती image quality बढ़ाने की ज़रूरत ही नहीं है
    • हैरानी की बात यह है कि लोगों को शायद सच में ऐसी image quality पसंद आती है। कल मेरी partner नया smartphone चुन रही थी, और camera quality उसके लिए अहम थी; zoom करने पर sharp दिख रहा था, तो उसे अच्छा लगा। लेकिन zoom के बाद थोड़ी delay के साथ जो artificially reconstructed image आई, वह पुराने console game emulator के upscale filter जैसी distorted लग रही थी। यह देखकर थोड़ा दुख हुआ कि जिसे मैं बहुत प्यार करता हूँ, वह natural, realistic photo की बजाय ऐसे selfie को ज़्यादा पसंद करती है जिसमें चेहरा बस मुलायम-सा दिखे और background पर fake bokeh लगा हो
    • यह image वाकई बहुत मज़ेदार है
    • पहले जब मैंने अपने parents के नए TV पर अपना पसंदीदा drama देखा था, तो सब कुछ अजीब लग रहा था—जैसे low-budget हो गया हो, actors की acting भी awkward लगे, dialogues भी कमज़ोर लगें। बहुत बाद में पता चला कि वजह उस TV की auto smoothing थी। इसे Soap Opera Effect कहते हैं
    • जिन technologies को consumers नहीं चाहते, उन्हें लगातार ठेलना कुछ ऐसा है: stock price बनाए रखने का pressure -> market share बढ़ाने का management pressure -> PMs पर नए features जोड़ने का दबाव -> developers नई technology आज़माना चाहते हैं -> और नतीजा होता है AI chatbot, AI summary, कारों के touchscreen, AI upscaling जैसी चीज़ें, जिन्हें हम नहीं चाहते
    • ज़्यादातर लोग शायद इन फ़र्कों को ठीक से नोटिस ही नहीं करते। मेरे घर पर TV नहीं है, लेकिन दोस्तों के घर जाते ही मैं Soap Opera Effect पहचान लेता हूँ। अब तक दो बार मैंने उनसे वह setting बंद करने को कहा, और बाद में उन्होंने भी सहमति जताई और दोबारा उसे चालू नहीं किया। लेकिन सच यह है कि शायद उन्होंने बस मेरी बात मान ली; मुझे यक़ीन नहीं कि वे सच में फ़र्क समझ पाए थे। अगर आप यह feature बंद करना चाहते हैं, तो “TV brand name soap opera effect” सर्च करें, setting ढूँढने का तरीका मिल जाएगा। ध्यान रहे, manufacturers अक्सर इसके लिए अजीब नाम इस्तेमाल करते हैं। 2 मिनट 6 सेकंड पर चेहरा खास तौर पर बदलता दिखता है, जबकि original उस हिस्से में काफ़ी blurry है। AI version camera effects को बिल्कुल नहीं समझता। AI-upscaled version और original की तुलना करें तो बात बिलकुल साफ़ हो जाती है। दोनों वीडियो लिंक देने के लिए शुक्रिया, तुलना करना आसान हो गया
  • बहुत-सी टिप्पणियाँ YouTube की बात कर रही हैं, लेकिन लेख के मुताबिक़ ज़्यादातर AI काम Will की team ने किया था, जहाँ still photos को video में बदलने के लिए AI इस्तेमाल हुआ। असल में YouTube तो बस final result को थोड़ा कम blurry बनाता है; जो सच में awkward AI artifacts दिख रहे हैं, वे ज़्यादातर video production stage में ही बनते हैं। और यह सिर्फ Shorts पर लागू होता है। तुलना वाला वीडियो देखें
    • उस वीडियो में फ़र्क ठीक से दिखाई नहीं देता
  • सोचता हूँ अगर Coldplay ने इस गर्मी में ऐसी technology इस्तेमाल की होती तो क्या होता। गंभीरता से कहूँ तो, हर जगह AI ठूँसने का trend काफ़ी चिंताजनक है। पहले Spotify Discover Weekly से नया music मिलना सच में मज़ेदार होता था, लेकिन अब AI-generated tracks इतने ज़्यादा हो गए हैं कि immersion टूट जाता है
    • मन करता है Spotify छोड़कर किसी local music shop से CD खरीदूँ और USB CD reader से अपना music collection खुद बनाऊँ। लगातार latest tracks के पीछे भागने और “हर गाना यहीं है” वाली सोच में शायद वह भावनात्मक तत्व खो गया है जिसमें असली लोग music share करते हैं
    • हो सकता है। Music recommendation में अचानक कोई hidden gem मिल जाना ही असली मज़ा है, और अगर उसमें AI-generated tracks मिल जाएँ तो वह magic खत्म हो जाता है। Spotify ने आधिकारिक रूप से यह नहीं कहा कि वह जानबूझकर ज़्यादा AI tracks recommend करता है, लेकिन पिछले एक साल में पूरे streaming ecosystem में AI music बहुत बढ़ा है। Spotify का algorithm भी अक्सर human और AI tracks में फर्क किए बिना recommend कर देता है, खासकर ambient, lo-fi, EDM और generic pop जैसे genres में जिन्हें AI आसानी से imitate कर सकता है। आख़िरकार, जहाँ human curation या artistic judgment होना चाहिए, वहाँ AI के घुस आने से बहुत लोग असहज हैं। अगर आप चाहें तो मैं यह भी ढूँढ सकता हूँ कि अलग-अलग services में AI music filter करने या सिर्फ human-made tracks की recommendation पाने का कोई तरीका है या नहीं
  • यहाँ असली मुद्दा <i>सहमति</i> है। मान लिया कि venue में घुसते समय लोग photo और video recording के लिए सहमति दे रहे हैं, लेकिन क्या किसी ने साफ़ तौर पर इस बात की सहमति दी थी कि artist की team AI से उनके चेहरे को fake video में बदल दे? मुझे सच में जानना है कि अलग-अलग देशों में यह क़ानूनी भी है या नहीं
    • संभव है कि ticket purchase page की terms या venue entrance पर लगे notice में “अंदर आते ही recording के लिए सहमति” जैसी language रही हो। नैतिक रूप से यह अच्छा नहीं लगता, लेकिन क़ानूनी रूप से शायद काफ़ी हद तक cover किया गया मामला होगा
  • अगर मैं marketer होता, तो असली image को ही ऐसा बनाता कि वह AI-generated लगे, ताकि मुफ्त viral effect मिल सके। गलती या compositing controversy जैसा ध्यान कुछ और नहीं खींचता। अगर चीज़ असल में नकली न हो, तो artist या team का कोई नुकसान भी नहीं। मैंने एक बड़े brand के social media manager से बात की थी; उसने कहा कि वे जानबूझकर spelling mistakes वाली posts डालते हैं ताकि ज़्यादा comments और reactions मिलें
    • इसे ragebait कहते हैं। Marketing industry में यह पहले से आम tactic है
    • नई Naked Gun फ़िल्म के poster में जानबूझकर ज़्यादा उंगलियाँ दिखाना भी ऐसा ही मामला है
  • पता नहीं मेरी hardware/software setup में दिक्कत है या मेरी आँखों में, लेकिन YouTube और Instagram को साथ रखकर देखने पर भी मुझे कोई बड़ा फ़र्क नहीं दिखता। अगर मेरी नज़र में दिक्कत नहीं है, तो मुझे क्या जाँचना चाहिए? क्या monitor upgrade करना चाहिए? GPU ठीक-ठाक है, लेकिन मैं HDMI-VGA converter भी इस्तेमाल कर रहा हूँ। हालाँकि photos तो सच में बहुत अजीब लग रही थीं। मुझे लगता है videos में भी शायद उसी तरह का बहुत artificial distortion होगा
    • वीडियो में फर्क ज़्यादा subtle होता है। हर frame में साफ़ नहीं दिखता, लेकिन background अचानक focus में आना और फिर blur होना, लोगों के बाल और गर्दन पर अजीब texture आना, और चेहरे की outline sharp रहते हुए skin का अस्वाभाविक रूप से बहुत smooth दिखना—यह सब बहुत आम है। थोड़ा Max Headroom जैसा एहसास होता है
  • मेरे आसपास सच में कोई भी ऐसा नहीं है जो यह feature चाहता हो। समझ नहीं आता कि इतनी जटिल और अनावश्यक चीज़ें बार-बार क्यों लाई जा रही हैं
    • जैसे कुछ देश अपने हथियारों को असली हालात में test करके अनुभव जमा करते हैं, वैसे ही कभी-कभी लगता है कि शायद Google भी उस दिन की तैयारी में अपनी organizational capability बना रहा है जब वह AI का पूरा इस्तेमाल करना चाहेगा
    • जटिलता ज़रूरी चीज़ों में भी होती है, लेकिन अगर उससे मुनाफ़ा नहीं बनता, तो उसे आगे बढ़ाने की वजह भी नहीं होती
  • Youtube PM: “चलो AI-generated video और real video में फर्क करना और मुश्किल बना दें, ताकि users को सब natural लगे!”
    • मुझे नहीं लगता कि इतनी योजनाबद्ध बुरी नीयत भी है। जो लोग सच में AI के दीवाने हैं, वे हर product में AI डालना चाहते हैं, और ऊपर से कोई कह दे “AI कमाल की चीज़ है, इसे जोड़ो”, तो वे हर जगह इसे छिड़क देते हैं। Meetings का focus भी “user problem X कैसे solve करें” पर नहीं, बल्कि “product में कहाँ-कहाँ AI लगाया जा सकता है” पर चला जाता है
    • बुरी नीयत से ज़्यादा गलत incentives ज़्यादा यथार्थवादी वजह हैं। किसी का KPI अगर AI feature adoption पर टिका है, तो ऐसी वजहों से YouTube के पुराने sharpen + Denoise filter की जगह “AI enhancement” आ जाता है
    • YouTube की AI transformation explanation guide वास्तव में मौजूद है
    • ऐसा approach उल्टा असली news video को भी AI fake समझे जाने की तरफ धकेल सकता है, जिससे भरोसा और घटेगा। लोग और सतर्क होंगे, और शायद कम विश्वास करेंगे
    • आने वाली पीढ़ियाँ पहले की पीढ़ियों से बिल्कुल अलग media environment में बड़ी होंगी
  • “AI को useful बनाते हैं” वाली कोशिशों में यह feature आख़िर किसके दिमाग़ की उपज है, यह समझ नहीं आता। जब HD original मौजूद है, तो पैसे खर्च करके upscaling देने की ज़रूरत ही क्या है? और अगर यह सिर्फ low-quality video पर लागू होता है, तब भी यह reality distortion के कारण और ज़्यादा परेशान करने वाला है
    • Google के लिए reality मायने नहीं रखती। उसे ads और engagement की चिंता है
  • अगर “AI glitch” लिखी हुई T-shirt बेची जाए, और हर photo में ऐसा effect आ जाए, तो शायद असली और नकली में फ़र्क करना मुश्किल हो जाए
    • समय के साथ ऐसी T-shirts शायद sixth-finger prop (generative AI की मशहूर गड़बड़ी) या 5-glasses mask (facial recognition से बचने वाला आइटम) की तरह एक trend बनकर गायब हो जाएँगी
    • ऐसी T-shirts पहले से मौजूद हैं, और कई बार ChatGPT से निकला text बिना किसी verification के सीधा print भी कर दिया जाता है