Stable Diffusion - DALL-E जैसा Text-To-Image ओपन सोर्स
(github.com/CompVis)- Latent Diffusion मॉडल को LAION-5B डेटाबेस की 512x512 इमेजों पर प्रशिक्षित किया गया
- Google के Imagen की तरह CLIP ViT-L/14 टेक्स्ट एन्कोडर का उपयोग
- हल्का होने के कारण 10GB से अधिक VRAM वाले सिर्फ 1 GPU पर भी चल सकता है
- Stability AI और LAION के शोधकर्ताओं का सहयोग और समर्थन
अभी कोई टिप्पणी नहीं है.