- एक single image से सिर्फ 0.5 सेकंड में high-quality 3D assets जनरेट करता है
- TripoSR पर आधारित है। इसमें बड़े architectural improvements और enhanced features हैं
- यह सिर्फ game और virtual reality developers के लिए ही नहीं, बल्कि retail, architecture, design और अन्य graphics-intensive professions के professionals के लिए भी उपयोगी है
- मॉडल Hugging Face पर उपलब्ध है और Stability AI Community License के तहत जारी किया गया है
- Stability AI API और Stable Assistant chatbot में मॉडल को आसानी से access किया जा सकता है, और 3D viewer के जरिए 3D creations को share करके augmented reality में इस्तेमाल करके देखा जा सकता है
- free trial के साथ इसे आज़माया जा सकता है
यह कैसे काम करता है
- उपयोगकर्ता किसी object की एक single image upload करके शुरुआत करता है
- Stable Fast 3D, UV unwrapped mesh, material parameters, कम की गई lighting वाला albedo color आदि सहित एक पूरा 3D asset तेज़ी से जनरेट करता है
- विकल्प के तौर पर quad या triangle reconstruction किया जा सकता है, जिससे processing time में केवल 100-200ms अतिरिक्त जुड़ता है
उपयोग के मामले
- pre-production के दौरान, जहाँ experimentation महत्वपूर्ण होता है, वहाँ fast inference time का लाभ
- games के लिए static assets (background objects, clutter, furniture)
- e-commerce के लिए 3D models
- AR/VR के लिए तेज़ model generation
जब speed और quality मिलते हैं
- कई प्रमुख क्षेत्रों में प्रतिस्पर्धियों की तुलना में बेहतर performance
- 7GB VRAM वाले GPU पर प्रति 3D asset generation केवल 0.5 सेकंड की तेज़ गति
- high-quality UV unwrapped mesh और material parameters
- texture में lighting entanglement कम
- अतिरिक्त material parameters और normal map generation संभव
अनुसंधान और विकास
- TripoSR पर आधारित है, लेकिन इसमें पूरी तरह retrained model और महत्वपूर्ण architectural changes शामिल हैं
- सुधारों में explicit mesh generation और fast textured mesh generation के लिए नई techniques शामिल हैं
- technical report में बताया गया है कि कम baked lighting और material parameters के साथ तेज़ inference speed कैसे हासिल की गई
उपलब्धता
- Stable Fast 3D मॉडल code Github और Hugging Face पर उपलब्ध है
- Stability AI Community License के तहत non-commercial use और सालाना अधिकतम $1M revenue तक commercial use की अनुमति है
- API और Stable Assistant के जरिए मॉडल को access किया जा सकता है
GN⁺ की राय
- यह 3D model generation technology एक दिलचस्प तकनीक है, क्योंकि इसका उपयोग game, virtual/augmented reality, design, architecture आदि कई क्षेत्रों में किया जा सकता है। खासकर एक single image से high-quality 3D assets को तेज़ी से जनरेट करना productivity बढ़ाने में मददगार हो सकता है।
- हालांकि, ऐसे AI-based models के सक्रिय होने से graphic designers या modelers जैसे skilled professionals की नौकरियों पर असर पड़ सकता है। इसकी वजह यह है कि पहले हाथ से बनाए जाने वाले 3D assets अब automated हो सकते हैं। AI के लिए इंसानों को पूरी तरह replace करना मुश्किल है, लेकिन कुछ भूमिकाओं का दायरा कम होना लगभग तय लगता है।
- इसके अलावा, जनरेट किए गए 3D models के copyright मुद्दों पर भी विचार होना चाहिए। training में इस्तेमाल की गई images के लिए उचित compensation या credit दिया जाना चाहिए। AI-generated content के लिए कानूनी regulation और guidelines की ज़रूरत दिखती है।
- इसी तरह की technologies में Nvidia Instant Nerf और Epic Games की RealityScan शामिल हैं। ये photo या scan के जरिए 3D models जनरेट करने की सुविधा देते हैं। game engines के साथ उच्च compatibility इनकी ताकत है। हालांकि Stable Fast 3D की तरह एक single image से high-quality परिणाम देने की speed अभी इनके पास कम लगती है।
- कुल मिलाकर, Stable Fast 3D अपनी तेज़ speed और quality के बल पर game, XR और 3D graphics क्षेत्रों में productivity बढ़ाने में योगदान देता दिखता है। हालांकि, ethical और legal issues पर सामाजिक सहमति बनाने की प्रक्रिया साथ-साथ चलनी चाहिए।
1 टिप्पणियां
Hacker News की राय
LLMs को लेकर बहुत उम्मीदों के बावजूद, image generation और graphic assets फिलहाल AI के दीर्घकालिक विजेता बनने की सबसे अधिक संभावना रखते हैं
तीसरी test image में, सभी 3D AI ऐसे लगे जैसे वे 3D model की 2D rendering हों
अभी पूरी तरह perfect नहीं है, लेकिन काफ़ी शानदार है
इस तकनीक के बेहतर होने का इंतज़ार नहीं हो रहा
7GB VRAM के साथ GPU पर 3D assets बनाने में 0.5 सेकंड लगते हैं
उम्मीद है कि यह क्षेत्र सचमुच अच्छे परिणाम देगा
मैं इस तकनीक से बहुत सी मज़ेदार चीज़ें 3D print करने की योजना बना रहा हूँ
लगता है कि तुलना वाले image को desaturate करके उसे बेहतर दिखाने वाली classic infomercial tactic का इस्तेमाल किया गया है
project page पर model के साथ interact किया जा सकता है
यह miniature painting के लिए मेरे उत्साह को जगा देता है