DeepFloyd IF - ओपन सोर्स Text-to-Image मॉडल

xguru · 2023-04-30T10:03:02+09:00

Stability AI का नया इमेज मॉडल मौजूदा मॉडलों की तुलना में बेहतर भाषा समझ, और photorealistic इमेज जनरेट करता है T5 Transformer-आधारित Frozen टेक्स्ट एन्कोडर और 3-स्टेज पिक्सेल diffusion मॉड्यूल का संयोजन 64x64, 256x256, 1024x1024px Zero-shot FID स्कोर 6.66 (COCO dataset)

(github.com/deep-floyd)

14 पॉइंट द्वारा xguru 2023-04-30 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

Stability AI का नया इमेज मॉडल
मौजूदा मॉडलों की तुलना में बेहतर भाषा समझ, और photorealistic इमेज जनरेट करता है
T5 Transformer-आधारित Frozen टेक्स्ट एन्कोडर और 3-स्टेज पिक्सेल diffusion मॉड्यूल का संयोजन
- 64x64, 256x256, 1024x1024px
Zero-shot FID स्कोर 6.66 (COCO dataset)

DeepFloyd IF - ओपन सोर्स Text-to-Image मॉडल

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.