SnapFusion - मोबाइल डिवाइस पर 2 सेकंड में जनरेट होने वाला Text-to-Image diffusion मॉडल
(snap-research.github.io)- कुशल network architecture और step-by-step distillation में सुधार के जरिए हासिल किया गया
- मूल मॉडल की redundancy की पहचान करके, data distillation के माध्यम से image decoder की computation घटाने वाला एक कुशल UNet प्रस्तुत किया गया
- MS-COCO पर प्रयोगों के नतीजों में, सिर्फ 8 denoising steps वाला SnapFusion मॉडल 50 steps वाले Stable Diffusion v.15 से बेहतर FID और CLIP स्कोर हासिल करता है
1 टिप्पणियां
यह Snapchat द्वारा प्रकाशित पेपर है, लेकिन अभी तक कोड रिलीज़ नहीं हुआ है.. सच में यह संभव है क्या? इस पर बहस करते हुए कमेंट्स दिख रहे हैं
https://news.ycombinator.com/item?id=36304716
फिलहाल डेमो वीडियो Airplane mode में चल रहा है।