SnapFusion - मोबाइल डिवाइस पर 2 सेकंड में जनरेट होने वाला Text-to-Image diffusion मॉडल

xguru · 2023-06-14T11:17:02+09:00

कुशल network architecture और step-by-step distillation में सुधार के जरिए हासिल किया गया मूल मॉडल की redundancy की पहचान करके, data distillation के माध्यम से image decoder की computation घटाने वाला एक कुशल UNet प्रस्तुत किया गया MS-COCO पर प्रयोगों के नतीजों में, सिर्फ 8 denoising steps वाला SnapFusion मॉडल 50 steps वाले Stable Diffusion v.15 से बेहतर FID और CLIP स्कोर हासिल करता है

(snap-research.github.io)

9 पॉइंट द्वारा xguru 2023-06-14 | 1 टिप्पणियां | WhatsApp पर शेयर करें

कुशल network architecture और step-by-step distillation में सुधार के जरिए हासिल किया गया
मूल मॉडल की redundancy की पहचान करके, data distillation के माध्यम से image decoder की computation घटाने वाला एक कुशल UNet प्रस्तुत किया गया
MS-COCO पर प्रयोगों के नतीजों में, सिर्फ 8 denoising steps वाला SnapFusion मॉडल 50 steps वाले Stable Diffusion v.15 से बेहतर FID और CLIP स्कोर हासिल करता है

1 टिप्पणियां

xguru 2023-06-14

यह Snapchat द्वारा प्रकाशित पेपर है, लेकिन अभी तक कोड रिलीज़ नहीं हुआ है.. सच में यह संभव है क्या? इस पर बहस करते हुए कमेंट्स दिख रहे हैं
https://news.ycombinator.com/item?id=36304716
फिलहाल डेमो वीडियो Airplane mode में चल रहा है।

SnapFusion - मोबाइल डिवाइस पर 2 सेकंड में जनरेट होने वाला Text-to-Image diffusion मॉडल

संबंधित पढ़ाई

1 टिप्पणियां