• SD-XL 0.9-base
    • 1024x1024 इमेज के लिए विभिन्न ratio पर ट्रेन किया गया
    • टेक्स्ट encoding के लिए OpenCLIP-ViT/G और CLIP-ViT/L का उपयोग (refiner केवल OpenCLIP मॉडल का उपयोग करता है)
  • SD-XL 0.9-refiner
    • उच्च-गुणवत्ता वाले डेटा के छोटे noise level को हटाने के लिए train किया गया, इसलिए यह Text-to-Image मॉडल की तरह काम नहीं करता
    • केवल Image-to-Image मॉडल के रूप में काम करता है

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.