- Google Research और Cornell University द्वारा विकसित image completion के लिए एक नया generative approach
- RealFill का लक्ष्य image के गायब हिस्सों को उस सामग्री से भरना है जो मूल रूप से वहां होनी चाहिए, ताकि अधिक वास्तविक image बनाई जा सके
- मॉडल को personalize करने के लिए कुछ reference images का उपयोग किया जाता है, जिन्हें target image से बिल्कुल मेल खाना जरूरी नहीं है और जो viewpoint, lighting condition, camera aperture या image style में अलग-अलग हो सकती हैं
- RealFill ने एक नए image completion benchmark में, जो विविध और चुनौतीपूर्ण scenarios को कवर करता है, मौजूदा approaches को बड़े अंतर से पीछे छोड़ा
- इस प्रक्रिया में reference और target images के लिए pre-trained inpainting diffusion model को fine-tune करना शामिल है, जिससे यह input image के scene की content, lighting और style सीखता है
- fine-tuned model का उपयोग फिर standard diffusion sampling process के जरिए target image के गायब क्षेत्रों को भरने के लिए किया जाता है
- RealFill reference और target के बीच बड़े अंतर होने पर भी मूल scene के प्रति वफादार और visually appealing high-quality images बनाता है
- RealFill की सीमाओं में तुलनात्मक रूप से धीमी gradient-based fine-tuning process और reference व target images के बीच viewpoint परिवर्तन बहुत बड़ा होने पर 3D scene को recover करने में कठिनाई शामिल है
- RealFill, Stable Diffusion जैसे base pre-trained models के लिए, चुनौतीपूर्ण मामलों में अब भी कठिनाई का सामना करता है
1 टिप्पणियां
Hacker News की राय