• Stability AI का नया इमेज मॉडल
  • मौजूदा मॉडलों की तुलना में बेहतर भाषा समझ, और photorealistic इमेज जनरेट करता है
  • T5 Transformer-आधारित Frozen टेक्स्ट एन्कोडर और 3-स्टेज पिक्सेल diffusion मॉड्यूल का संयोजन
    • 64x64, 256x256, 1024x1024px
  • Zero-shot FID स्कोर 6.66 (COCO dataset)

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.