DeepFloyd IF - ओपन सोर्स Text-to-Image मॉडल
(github.com/deep-floyd)- Stability AI का नया इमेज मॉडल
- मौजूदा मॉडलों की तुलना में बेहतर भाषा समझ, और photorealistic इमेज जनरेट करता है
- T5 Transformer-आधारित Frozen टेक्स्ट एन्कोडर और 3-स्टेज पिक्सेल diffusion मॉड्यूल का संयोजन
- 64x64, 256x256, 1024x1024px
- Zero-shot FID स्कोर 6.66 (COCO dataset)
अभी कोई टिप्पणी नहीं है.