1 पॉइंट द्वारा GN⁺ 2026-01-19 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • A$AP Rocky के नए ‘Helicopter’ म्यूज़िक वीडियो में लगभग सभी किरदारों की परफॉर्मेंस को volumetric capture और Gaussian Splatting से बनाया गया है
  • शूटिंग में Evercoast के 56 RGB-D कैमरों के array का उपयोग कर वास्तविक परफॉर्मेंस को 3D में रिकॉर्ड किया गया, और पोस्ट-प्रोडक्शन में Houdini·OctaneRender से रेंडरिंग की गई
  • CG Nomads GSOPs और WildCapture के internal tooling के जरिए splat डेटा की sequencing, lighting adjustment, और physical interaction को प्रोसेस किया गया
  • वीडियो के surreal एहसास के बावजूद, हर सीन वास्तविक अभिनेताओं की physical performance पर आधारित है
  • यह प्रोजेक्ट लोकप्रिय संगीत वीडियो में dynamic Gaussian Splatting के व्यावहारिक उपयोग का एक उदाहरण है, जो आगे real-time 3D वीडियो प्रोडक्शन की संभावनाएँ दिखाता है

Helicopter म्यूज़िक वीडियो का प्रोडक्शन ओवरव्यू

  • A$AP Rocky का ‘Helicopter’ एक Radiance Fields तकनीक पर आधारित म्यूज़िक वीडियो है, जिसमें लगभग सभी किरदारों की परफॉर्मेंस को volumetric तरीके से capture किया गया
    • वीडियो की खासियत इसकी chaotic movement और शुरुआती MTV-style energy है
    • किरदारों को Dynamic Splat के रूप में render किया गया, जिससे spatial depth का एहसास मिलता है
  • इस प्रोजेक्ट में Evercoast, Grin Machine, WildCapture, Fitsū.ai आदि शामिल थे
    • Evercoast ने performance capture संभाला, और Grin Machine के Chris Rutledge ने CG supervisor के रूप में काम किया
    • WildCapture के Wilfred Driscoll ने temporal consistency और motion transition के लिए तकनीकी सहायता दी

Volumetric शूटिंग और तकनीकी संरचना

  • शूटिंग अगस्त 2025 में Los Angeles में हुई, जहाँ Evercoast के 56 RGB-D कैमरे और दो Dell workstations को sync करके इस्तेमाल किया गया
    • अभिनेता wires पर लटककर या ceiling bar से झूलकर physical stunts कर रहे थे
    • helicopter blade या props के लिए असली लकड़ी की संरचनाओं का इस्तेमाल किया गया, ताकि realistic setting में शूटिंग हो सके
  • कुल 10TB raw data एकत्र किया गया, जिसे लगभग 30 मिनट के splat footage के रूप में render किया गया
    • अंतिम output लगभग 1TB के PLY sequence के पैमाने पर निकला

पोस्ट-प्रोडक्शन पाइपलाइन

  • पोस्ट-प्रोडक्शन का काम Houdini में किया गया, जहाँ CG Nomads GSOPs से splat डेटा की manipulation और sequencing की गई
    • OTOY के OctaneRender का उपयोग final rendering और relighting के लिए किया गया
    • Houdini के साथ Octane का integration अब इतना mature हो चुका है कि shadow और volumetric depth की अभिव्यक्ति संभव हो गई
  • Blender का उपयोग layout और previs चरण में किया गया
    • splat sequence को lightweight proxy cache में बदलकर scene planning में उपयोग किया गया
    • WildCapture के internal tools से pose-estimation skeleton तैयार किए गए, जिससे collision और physics simulation में मदद मिली

Real-time preview और प्रोडक्शन दक्षता

  • Evercoast सिस्टम शूटिंग लोकेशन पर real-time spatial feedback देता है
    • निर्देशक शूटिंग के तुरंत बाद mesh-based preview देख सकते थे, और बाद में web player से पूरा splat rendering review कर सकते थे
    • बड़े डेटा को डाउनलोड करने से पहले, केवल ज़रूरी सीन चुनकर post-processing की जाती थी
  • यह workflow पारंपरिक वीडियो प्रोडक्शन की तुलना में simulation के अधिक करीब है, जिससे तेज़ और cost-effective क्रिएशन संभव होता है

वास्तविक परफॉर्मेंस और विज़ुअल भ्रम

  • कुछ दर्शकों ने इस वीडियो को AI-generated समझ लिया, लेकिन हर सीन वास्तविक अभिनेताओं की physical performance पर आधारित है
    • stunt, jump, fall जैसे सभी मूवमेंट वास्तविक स्पेस में किए गए
    • volumetric capture की वजह से camera framing को दोबारा व्यवस्थित करना और spatial continuity को तोड़ना आसान हो गया, जिससे artificial एहसास पैदा हुआ
  • Radiance Field तकनीक वास्तविकता को बदलती नहीं, बल्कि वास्तविक movement और space को preserve करती है

A$AP Rocky और Radiance Fields के पिछले सहयोग

  • A$AP Rocky ने 2023 के ‘Shittin’ Me’ म्यूज़िक वीडियो में भी NeRF और Instant-NGP GUI का उपयोग किया था
    • इस बार का ‘Helicopter’ उसी दिशा का विस्तार है, और इसे dynamic Gaussian Splatting के बड़े पैमाने पर व्यावहारिक उपयोग के उदाहरण के रूप में देखा जा रहा है

1 टिप्पणियां

 
GN⁺ 2026-01-19
Hacker News की राय
  • मुझे लगता है कि 2023 में Nial Ashley (Llainwire) ने अकेले यह काम किया और विज़ुअल्स भी खुद बनाए, यह सच में कमाल की बात है
    YouTube वीडियो लिंक
    अफसोस की बात है कि इस व्यक्ति को ज़्यादा ध्यान नहीं मिला। Discord के मुताबिक, इतने सारे कलाकारों ने सिर्फ इसी स्टाइल के म्यूज़िक वीडियो बनवाने के लिए संपर्क किया कि आखिरकार उसने म्यूज़िक कोलैबोरेशन की बजाय इस प्रोजेक्ट को छोड़ दिया
  • मैं CG Nomads का co-founder David Rhodes हूँ। मैंने SideFX Houdini के लिए GSOPs (Gaussian Splatting Operators) विकसित किया है
    यह म्यूज़िक वीडियो GSOPs और OTOY OctaneRender को मिलाकर बनाया गया था
    अगर तकनीक में दिलचस्पी है, तो official site या GitHub repository देख सकते हैं
    • इस तकनीक का aesthetic पहलू बहुत दिलचस्प है। पुराने वर्ज़न में यह पूरी तरह glitchy 3D noise cloud जैसा दिखता था, तो मैं सोच रहा हूँ कि क्या जानबूझकर गलत input या alignment errors का इस्तेमाल करके इसे रचनात्मक तरीके से ‘misuse’ करने के बारे में कोई विचार है
    • David, क्या आपने Mesh Splatting जैसी 3DGS alternative techniques भी देखी हैं? कहा जा रहा है कि वे तेज़ training और बेहतर results दे सकती हैं
    • क्या DaVinci Resolve के लिए ऐसा plugin संभव है जो दो iPhone से शूट किए गए spatial data को जोड़कर एक 3D scene में merge कर दे? लगता है M4 chip के साथ यह संभव होना चाहिए
    • आपने “high-quality 3D content” कहा, लेकिन वीडियो में वह कुछ कम लगा
  • मैंने नहीं सोचा था कि HN पर A$AP से जुड़ी पोस्ट देखूंगा। यह community वाकई मज़ेदार है
    • मैं भी पूरे दिन सोच रहा था कि Helicopter म्यूज़िक वीडियो को HN पर कैसे पोस्ट करूँ, इसलिए अच्छा लगा कि किसी ने Gaussian एंगल से इसे पोस्ट कर दिया
    • क्या वीडियो में वह hair curlers (rollers) लगाए हुए है?
    • लगभग ऐसा हो गया था कि Carti से जुड़ी पोस्ट HN के टॉप पर पहुँच जाती
    • मैंने भी एक पल के लिए दोबारा देखा, सच में अप्रत्याशित था
    • लेकिन मुझे समझ नहीं आता कि उसे “cool” क्यों माना जाता है
  • क्या कोई आसान भाषा में समझा सकता है कि Gaussian splatting असल में क्या है, और लेख में “अब यह काफी mature हो चुका है” से क्या मतलब है?
    • इसमें scene से एक point cloud बनाया जाता है, फिर हर point को फैले हुए ellipsoid से replace किया जाता है, और फिर इसे differentiable renderer के साथ train किया जाता है। इससे असली तस्वीरों से लगभग मेल खाने वाला 3D scene reconstruct किया जा सकता है
    • यह कई angles से शूट किए गए वीडियो को मिलाकर 3D space का radiance field estimate करने का तरीका है। इससे उन camera angles को भी simulate किया जा सकता है जो वास्तव में मौजूद नहीं थे।
      Houdini जैसे tools में इस तकनीक का इस्तेमाल करने पर artist virtual camera को आज़ादी से घुमा सकता है
    • हर point एक semi-transparent blob की तरह होता है, और देखने की दिशा के हिसाब से उसका रंग बदलता है। इससे reflections और specular effects दिखाए जा सकते हैं
    • यह 2 मिनट का वीडियो शुरुआत के लिए अच्छा resource है।
      2023 के मुख्य paper और GPU तथा differentiable programming में प्रगति की वजह से अब यह practical use के लायक लगने लगा है
    • visual demos इस blog post और इस site पर देखे जा सकते हैं
  • वीडियो बहुत शानदार था। लेख का आधे से ज़्यादा हिस्सा मैं नहीं समझ पाया, लेकिन ऐसे technical jargon से भरे वाक्य पढ़ना उल्टा मज़ेदार लगा
    “डेटा को Houdini में import किया, GSOPs से manipulate किया, और OctaneRender से final render किया” वाला हिस्सा खास तौर पर प्रभावशाली लगा
    • मैं Houdini के लिए GSOPs बनाने वालों में से एक हूँ। Gaussian splats वास्तविक दुनिया को बहुत सारे 3D ellipsoids से replicate करने का तरीका हैं। Houdini ऐसे large-scale point data को संभालने में मज़बूत है, और Octane जैसे renderers इन्हें पारंपरिक CG elements के साथ integrate कर सकते हैं
    • मैं ही उस लेख का लेखक हूँ। Gaussian splatting सामान्य 2D images या वीडियो को input के रूप में लेकर realistic 3D reconstruction संभव बनाता है। यह NeRF और Plenoxel जैसी radiance-field-based techniques की ही एक किस्म है
    • Corridor Crew ने Gaussian splat का इस्तेमाल करके बहुत शानदार काम किया है। यह वीडियो सुझाता हूँ
    • इस लेखन शैली से मुझे किसी वजह से Kurtwood Smith का 『The Patriot』 में पाइप बेचने वाला दृश्य याद आ गया
  • मैं Gaussian splatting को photographic art medium के रूप में प्रयोग कर रहा हूँ। जब data कम होता है, तो जो expressionistic results निकलते हैं वे बेहद आकर्षक लगते हैं
    मेरा काम संग्रह
    • काम बहुत शानदार है! क्या कहीं creation process के बारे में और विस्तार से बताया गया है?
    • aesthetic सच में बहुत अलग और शानदार है
  • सच कहूँ तो वीडियो पुराने Unreal Engine rendering जैसा लग रहा था। हो सकता है कि यह जानबूझकर चुना गया aesthetic हो, लेकिन मैं जानना चाहता हूँ कि Gaussian splatting से कितना realistic result निकाला जा सकता है
    अगर lighting या shadows को फिर से सेट किया जाए, या scene के कुछ हिस्सों में बदलाव किया जाए, तो क्या मूल realism बना रह सकता है?
    आजकल फ़िल्म निर्माण जिस तरह multi-angle shooting और post-editing की ओर बढ़ रहा है, उससे लगता है कि शायद एक समय आए जब इंसानों को Gaussian splat के रूप में और background को greenscreen से संभाला जाएगा
    • इस वीडियो का aesthetic जानबूझकर Gaussian splatting artifacts को बनाए रखने का नतीजा है। खासकर 4DGS में temporal inconsistency आती है, और relighting के दौरान वह और उभरकर दिखती है।
      फिर भी तकनीक तेज़ी से आगे बढ़ रही है, और volumetric capture का भविष्य काफ़ी पक्का लगता है।
      static environments में इस example की तरह quality बहुत ऊँची हो सकती है
    • कलाकार की प्रवृत्ति को देखते हुए, यह budget से ज़्यादा तकनीक की नईपन और creative freedom के लिए किया गया चुनाव लगता है
    • मुझे यह Teardown नाम के voxel-based game का high-resolution वर्ज़न लगा। lighting और camera movement से वही एहसास आया
    • सही data दिया जाए तो अभी भी IMAX-grade 3D quality संभव लगती है
    • A$AP के दूसरे वीडियो भी अक्सर जानबूझकर lo-fi और retro vibe इस्तेमाल करते हैं। उदाहरण के लिए Yamborghini High में MPEG corruption effect की नकल की गई थी
  • यह वीडियो खुद ज़रूर देखना चाहिए। surreal effects और human performance के बीच संतुलन बहुत अच्छा है
    अगर संगीत आपकी पसंद का नहीं है, तो mute करके भी देखा जा सकता है
    • A$AP Rocky के दूसरे गाने Taylor Swif का म्यूज़िक वीडियो भी इसी तरह surreal और अजीब माहौल वाला है। उसका Eastern European-शैली का प्रस्तुतीकरण जानबूझकर थीम से मेल खाता है
      वीडियो लिंक
    • अगर वीडियो अंत तक देखें, तो आख़िरी splat Gaussian नहीं है
  • म्यूज़िक वीडियो का सीधा लिंक: https://www.youtube.com/watch?v=g1-46Nu3HxQ
    • अच्छा विचार है। मैं वह लिंक मुख्य लेख के ऊपर भी जोड़ दूँगा
  • अफसोस, लगभग 30 सेकंड देखने के बाद मुझे motion sickness होने लगी और मुझे रोकना पड़ा। फिर भी तकनीक बहुत शानदार है। क्या किसी और को भी ऐसा लगा?
    • मुझे वीडियो बहुत पसंद आया। मुझे बिल्कुल motion sickness नहीं हुई
    • मेरी पत्नी की भी यही प्रतिक्रिया थी, लेकिन intro के बाद यह काफी बेहतर हो जाता है