Imagen - Google का text-to-image diffusion model

xguru · 2022-05-25T09:32:41+09:00

भाषा को गहराई से समझकर यथार्थवादी इमेज बनाने वाला AI मॉडल लोगों पर आधारित मूल्यांकन में OpenAI के DALL-E 2 की तुलना में अधिक पसंद की जाने वाली इमेज तैयार करता है → गुणवत्ता और image-text alignment के संदर्भ में केवल शोध-पत्र और उदाहरण इमेज ही सार्वजनिक किए गए हैं → नैतिक मुद्दों आदि के कारण बाहरी उपयोग के लिए उपलब्ध demo version जारी नहीं करने का निर्णय

(imagen.research.google)

10 पॉइंट द्वारा xguru 2022-05-25 | 2 टिप्पणियां | WhatsApp पर शेयर करें

भाषा को गहराई से समझकर यथार्थवादी इमेज बनाने वाला AI मॉडल
लोगों पर आधारित मूल्यांकन में OpenAI के DALL-E 2 की तुलना में अधिक पसंद की जाने वाली इमेज तैयार करता है
→ गुणवत्ता और image-text alignment के संदर्भ में
केवल शोध-पत्र और उदाहरण इमेज ही सार्वजनिक किए गए हैं
→ नैतिक मुद्दों आदि के कारण बाहरी उपयोग के लिए उपलब्ध demo version जारी नहीं करने का निर्णय

2 टिप्पणियां

kunggom 2022-05-25

मैंने कल एक बुकस्टोर में 『Alice in Wonderland』 की ऐसी किताब देखी जिसमें Disney animation के still cuts को illustrations के रूप में डाला गया था, और मुझे जिज्ञासा है कि अगर ऐसे मॉडल में 『Alice in Wonderland』 के हर दृश्य को इनपुट किया जाए, तो किस तरह का परिणाम निकलेगा।

xguru 2022-05-25

DALL·E 2 का अनावरण
DALL-E 2 कैसे काम करता है?

Imagen - Google का text-to-image diffusion model

संबंधित पढ़ाई

2 टिप्पणियां