- Strawberry danylyon द्वारा SuperSplat पर पोस्ट किया गया डाउनलोड किया जा सकने वाला स्ट्रॉबेरी 3D सीन है, और इसका लाइसेंस CC BY 4.0 के रूप में दिखाया गया है
- सीन डेटा में 46,530 आइटम और 22.94 MB फ़ाइल आकार दिखाया गया है, और पोस्ट किए जाने का समय 13 घंटे पहले के रूप में दिखता है
- शूटिंग 90 व्यूपॉइंट्स से की गई थी, और हर व्यूपॉइंट पर 88 focus stack इमेज का उपयोग हुआ
- उपकरण में Nikon Z8 full-frame, f/7.1, 1/160 सेकंड, ISO 100, Laowa 180mm macro lens, LED light, और blue screen बैकग्राउंड शामिल हैं
- ट्रेनिंग slang-splat में की गई थी, और COLMAP तथा COLMAP dataset साथ में उपलब्ध कराए गए हैं
सीन अवलोकन
- Strawberry SuperSplat पर पोस्ट किया गया एक 3D स्ट्रॉबेरी सीन है, और पोस्ट करने वाले danylyon हैं
- सीन डेटा में 46,530 आइटम दिखाए गए हैं, और फ़ाइल आकार 22.94 MB है
- पोस्ट किए जाने का समय 13 घंटे पहले दिखाया गया है, और इसे डाउनलोड किया जा सकता है
- लाइसेंस CC BY 4.0 के रूप में दिखाया गया है
शूटिंग की शर्तें
- स्ट्रॉबेरी सीन को 90 व्यूपॉइंट्स से शूट किया गया था, और हर व्यूपॉइंट पर 88 focus stack इमेज का उपयोग हुआ
- शूटिंग उपकरण और सेटिंग्स Nikon Z8, full-frame, f/7.1, 1/160 सेकंड, ISO 100, और Laowa 180mm macro lens हैं
- लाइटिंग LED light से की गई थी, और बैकग्राउंड blue screen था
ट्रेनिंग और डेटा
- ट्रेनिंग slang-splat में की गई थी
- उपयोग किए गए सॉफ़्टवेयर के रूप में COLMAP दिखाया गया है
- COLMAP dataset भी उपलब्ध है, और Patreon पर मुफ़्त में इस्तेमाल किया जा सकता है
उपयोग की शर्तें
- सीन को CC BY लाइसेंस के तहत डाउनलोड किया जा सकता है
- स्पष्ट रूप से कहा गया है कि attribution कोई अनिवार्य शर्त नहीं है, बल्कि आभार के रूप में सुझाया गया है
- यह भी बताया गया है कि इस काम का उपयोग attribution के बिना भी किया जा सकता है
1 टिप्पणियां
Hacker News की राय
2011 में वीडियो गेम चलाने के लिए PlayCanvas बनाया था, और 2026 में स्ट्रॉबेरी चला रहे हैं
वाह, समय का पता ही नहीं चला. आखिर यहाँ तक पहुँचा, और यह खूबसूरत है: https://superspl.at/scene/ff1d0393
फिर भी जब पता चला कि सीढ़ियाँ चढ़कर ऊपर जा सकते हैं, तो काफ़ी हैरानी हुई. दौड़ने के लिए Shift चाहिए
scene की boundaries पर clipping बहुत ज़रूरी है. Scaniverse जैसी app इस्तेमाल करें तो boundary box जोड़कर दूर के, आम तौर पर खराब reconstruct हुए points को हटाया जा सकता है
अगर आपके पास LiDAR scanner वाला नया iPhone है, तो ज़ोरदार सिफारिश है. आप अपने घर या बगीचे को dollhouse की तरह render कर सकते हैं, और दीवारों या structures की planning और measurement में यह उम्मीद से ज़्यादा काम का है
घूम-फिर सकने के साथ resolution भी काफ़ी अच्छा है, सच में शानदार scene है
[1] पढ़ लिया, लेकिन अब भी ठीक-ठीक समझ नहीं आ रहा कि मैं क्या देख रहा हूँ. अंदाज़ा है कि यह बहुत सारी high-resolution photos से reconstruct किया गया 3D model है
[1] https://en.wikipedia.org/wiki/Gaussian_splatting
इसमें कोई mesh या model नहीं है. स्ट्रॉबेरी की visual surface असली physical positions में surface जैसी दिखने वाली जगह पर न होकर, एक-दूसरे से दूर blobs से बनी हो सकती है
इसलिए इन्हें radiance fields कहा जाता है. क्योंकि यह geometry नहीं, बल्कि प्रकाश को model करते हैं
हक़ीक़त में blobs की position और rotation पर constraints लगाकर इसे स्ट्रॉबेरी की geometry से बेहतर मिलाया जा सकता है
अहम बात यह है कि इसमें कोई defined geometric surface, यानी mesh, नहीं है. और अच्छा splat बनाने के लिए बहुत सारे angles से बहुत बड़ी संख्या में photos लेनी पड़ती हैं, इसलिए यह बहुत कठिन है, जबकि खराब splat बनाना बहुत आसान है. लेकिन सही बन जाए तो कमाल है
सुंदरता
Gaussian splats में जो बात मुझे पसंद है, वह है इनका degrade होने का तरीका. अचानक टूटने, detail level बदलने, या sphere के cube बन जाने की जगह, यह धीरे-धीरे ज़्यादा “dreamlike” हो जाते हैं. बुनियादी shape बनी रहती है और बस detail कम होती जाती है
उदाहरण के लिए यह scene: https://superspl.at/scene/e721ea7c
जब आप पेड़ के पास जाते हैं, तो आसपास की चीज़ें धुंधली होने लगती हैं, जैसे हक़ीक़त का कपड़ा उधड़ रहा हो
https://bayardrandel.com/gaussographs
हाल के काम Instagram पर हैं
https://www.instagram.com/bayardrandel/
zoom करने पर जो अतिरिक्त “fake detail” देखने की उम्मीद होती है, वह नहीं दिखती; बल्कि ऐसा लगता है कि आप त्वचा को पार करके कल्पित अंदरूनी हिस्से में जा रहे हैं
consistency जितनी कम होती है, exploration उतना ही मुश्किल और कम predictable हो जाता है
सामान्य 3D models की तुलना में, यह दिमाग के spatial information को store और process करने के तरीके के कहीं ज़्यादा करीब लगता है
अगर सिर्फ धुंधली image दिख रही है और कुछ load या काम नहीं कर रहा, तो JavaScript console में "WebGL not supported" दिख रहा है या नहीं, यह जाँच लें
यह भी दिलचस्प है: https://github.com/apple/ml-sharp
यह single image से Gaussian splats बनाने वाला Apple model है. M1 Pro पर लगभग 30 सेकंड लगता है
बहुत ज़्यादा हिलने पर यह टूट जाता है, लेकिन हल्का-सा left-right sway या VR में दूसरे eye viewpoint के लिए यह शानदार है. यह उस पुराने तरीके से कहीं बेहतर दिखता है जो मैं https://github.com/combatwombat/tiefling में इस्तेमाल करता हूँ: depth map + vertex shader
बस ml-sharp के weights 2.6GB हैं, इसलिए browser में चलाने के लिए यह थोड़ा बड़ा है
अब यह iDevice और Mac पर 30 सेकंड से काफ़ी तेज़ लगता है
कुछ हफ़्ते पहले Gaussian splatting के बारे में जाना, और शायद यह मज़ाकिया, भोला या बेवकूफ़ी भरा सवाल हो सकता है. क्या dynamic lighting पर कोई प्रगति है, या कम-से-कम सैद्धांतिक रूप से इसकी संभावना है?
लेकिन diffuse reflection से अधिक जटिल मामलों में सही materials पाना मुश्किल है
AI-आधारित relighting शायद जल्द ही अच्छी तरह काम करने लगेगी
यह कुछ वैसा लग सकता है जैसे काफ़ी modern assets पर पुराने game engine की real-time lighting चढ़ा दी गई हो. Quake 2~3 दौर की तरह
या शायद splats से sparse voxel volume बनाकर, हर voxel को प्रकाश absorb करने वाला voxel opacity value देकर कोई “occlusion pre-pass” किया जा सकता है. यह आजकल की precomputed global illumination से बहुत अलग नहीं होगा
वैसे मैं rendering expert नहीं हूँ, बस एक सनकी आदमी हूँ जिसने पहले OpenGL में तरह-तरह की चीज़ें की थीं
बस वाह!
वेबसाइट देखते-देखते इस scene पर और ज़्यादा हैरानी हुई: https://superspl.at/scene/c67edb74
comments में linked कुछ और scenes को explore और use कर पाया था, इसलिए अजीब है
अगर मैंने Chrome को सही पढ़ा है, तो website और data मिलाकर 171MB है
अगर गणना सही है, तो Netflix की highest transfer rate के हिसाब से यह लगभग 40 सेकंड के bandwidth के बराबर है
आप कितने अजीब इंसान हैं, इस पर निर्भर करता है कि यह Quasimodo जैसा लगता है या भगवान बनने जैसा
इसे देखते-देखते मैं rabbit hole में उतर गया और उस कंपनी तक पहुँच गया जो Gaussian splat video बनाती है: https://www.4dv.ai/. दिलचस्प है
यह एक खूबसूरत छोटे miniature जैसा लगता है. किसी बड़े scene की बजाय detailed छोटी object पर Gaussian splatting लागू होते देखना अच्छा है
इस स्ट्रॉबेरी का शायद सबसे उबाऊ पहलू, यानी license, मुझे दिलचस्प लगा. इसमें लिखा है, “CC BY license के तहत download किया जा सकता है, लेकिन attribution ज़रूरी नहीं है, बस करेंगे तो अच्छा लगेगा,” और मैं वकील नहीं हूँ, लेकिन CC-BY के तहत license देकर उसकी BY requirement को description में माफ़ कर देना सही नहीं लगता
अगर attribution को optional बनाना है, तो क्या CC0 जैसी ज़्यादा permissive license लेकर attribution सिर्फ request नहीं करना चाहिए?
कुछ हद तक. फ्रांस जैसे देशों में attribution right मूल रूप से non-transferable है, इसलिए लेखक स्थायी रूप से attribution का अधिकार छोड़ देने के बाद भी कभी भी उसे माँग सकता है
लेकिन अमेरिका में contract clause से लाभ पाने वाला पक्ष आम तौर पर उस clause को नज़रअंदाज़ या waive कर सकता है. इसे तब भी “CC BY” कहा जा सकता है या नहीं, इस पर बहस हो सकती है, क्योंकि attribution उसकी मूल बात है
फिर भी CC BY के तहत license देकर तुरंत उस requirement को waive कर देना वैध लगता है