- बड़े पैमाने के diffusion model का उपयोग करके एक single RGB image से camera viewpoint को नियंत्रित करने वाला framework
- synthetic dataset पर प्रशिक्षित मॉडल होने के बावजूद, real images या impressionist paintings पर भी बिना pre-training के zero-shot में अच्छी तरह काम करता है
- इस viewpoint-control diffusion तरीके का उपयोग करके, एक ही image से 3D reconstruction का काम भी संभव है
- internet-scale pre-training के जरिए, अन्य मॉडलों की तुलना में कहीं बेहतर प्रदर्शन देने के गुणात्मक/मात्रात्मक प्रयोग परिणाम सामने आए हैं
1 टिप्पणियां
पिछले साल तक तो मुझे लगता था कि यह अभी बहुत दूर की बात है,
लेकिन आजकल हर दूसरे दिन कोई नई तकनीक और उसके नतीजे सामने आ रहे हैं..