1 पॉइंट द्वारा GN⁺ 2024-06-20 | 1 टिप्पणियां | WhatsApp पर शेयर करें

3D Gaussian Splatting को Markov Chain Monte Carlo में बदलना

अवलोकन

  • 3D Gaussian Splatting neural rendering में लोकप्रिय हो रहा है.
  • मौजूदा तरीके Gaussian को प्लेस करने के लिए जटिल cloning और splitting रणनीतियों पर निर्भर करते हैं.
  • इन तरीकों में initialization के आधार पर गुणवत्ता घट सकती है.

नया दृष्टिकोण

  • 3D Gaussian को scene के physical representation का वर्णन करने वाले probability distribution से निकाले गए random samples के रूप में माना गया है.
  • इसके माध्यम से 3D Gaussian updates को केवल noise जोड़कर stochastic gradient descent (SGLD) update में बदला जाता है.
  • मौजूदा densification और pruning रणनीतियों को MCMC samples के deterministic state transitions के रूप में फिर से लिखा गया है.

मुख्य तकनीकें

  • Gaussian के 'cloning' को sample probability को मोटे तौर पर बनाए रखने वाली पुनर्स्थापन विधि के रूप में संशोधित किया गया है.
  • उपयोग में न आने वाले Gaussian को हटाने के लिए regularization जोड़ा गया है, जिससे Gaussian का अधिक कुशल उपयोग प्रोत्साहित होता है.

परिणाम

  • विभिन्न मानक evaluation scenes में बेहतर rendering quality प्रदान करता है.
  • Gaussian की संख्या को आसानी से नियंत्रित किया जा सकता है.
  • initialization के प्रति robustness दिखाता है.

GN⁺ की राय

  • यह लेख 3D Gaussian Splatting के लिए एक नया दृष्टिकोण प्रस्तुत करता है, जो initialization पर निर्भरता कम करता है और गुणवत्ता में सुधार लाता है.
  • Markov Chain Monte Carlo (MCMC) और stochastic gradient descent (SGLD) का उपयोग विशेष रूप से दिलचस्प है.
  • यह तकनीक neural rendering क्षेत्र में बेहतर गुणवत्ता वाली इमेज बनाने में मदद कर सकती है.
  • initialization के प्रति robustness देकर यह व्यावहारिक अनुप्रयोग की संभावना बढ़ाती है.
  • अन्य neural rendering तकनीकों की तुलना में इसके फायदे और सीमाओं का विश्लेषण करना उपयोगी होगा.

1 टिप्पणियां

 
GN⁺ 2024-06-20
Hacker News टिप्पणियाँ
  • यह अच्छी बात है कि मूल 3DGS तकनीक को पारंपरिक COLMAP प्रोसेस से जनरेट किए गए point cloud के साथ initialize किया जाता है।
  • पेपर के नतीजे अच्छे हैं, और splat positions चुनने के तरीके के लिए बेहतर formal basis पसंद आया, लेकिन ऊपर की image क्या दिखाती है यह समझ नहीं आया।
  • Gaussian splatting एक बेहद प्रभावशाली तकनीक है, और इस समय VR में photorealistic scenes दिखाने का सबसे अच्छा तरीका लगती है। उम्मीद है कि इसके और व्यावहारिक use cases सामने आएँगे।
  • मैं स्पष्ट करना चाहता हूँ कि क्या इस पेपर का मुख्य अंतर हर update में थोड़ी मात्रा में noise जोड़ना है। मैंने पूरा पेपर पढ़ा, लेकिन फिर भी पूरी तरह आश्वस्त नहीं हूँ।
  • सोच रहा हूँ कि 3D splatting के "consumer" applications क्या हैं। यह बहुत शानदार दिखता है, लेकिन समझ नहीं आता कि क्या यह end-user technology बनेगी।
  • यह थोड़ा निराशाजनक है कि PDF में hyperref का उपयोग नहीं किया गया। links पर क्लिक करके cited references तक जाना ज्यादा सुविधाजनक होता।
  • यह Inria (non-commercial license) method पर आधारित एक और पेपर है, और इसके कई open source alternatives मौजूद हैं।
  • मैं टेक्स्ट समझ नहीं पाया।
  • मौजूदा 3D Gaussian splatting approaches के विपरीत, हम Gaussian को place और optimize करने की training process को एक sampling process के रूप में व्याख्यायित करते हैं। मैं जानना चाहता हूँ कि व्यावहारिक अंतर वास्तव में क्या है। MCMC खुद higher probability पर sample करता है, तो क्या यह बस distribution के lower end से ज्यादा sampling कर रहा है, या फिर यह पहले के algorithm को formalize करके अलग-अलग parameters के साथ काम करना आसान बनाता है?