Imagen - Google का text-to-image diffusion model
(imagen.research.google)- भाषा को गहराई से समझकर यथार्थवादी इमेज बनाने वाला AI मॉडल
- लोगों पर आधारित मूल्यांकन में OpenAI के DALL-E 2 की तुलना में अधिक पसंद की जाने वाली इमेज तैयार करता है
→ गुणवत्ता और image-text alignment के संदर्भ में - केवल शोध-पत्र और उदाहरण इमेज ही सार्वजनिक किए गए हैं
→ नैतिक मुद्दों आदि के कारण बाहरी उपयोग के लिए उपलब्ध demo version जारी नहीं करने का निर्णय
2 टिप्पणियां
मैंने कल एक बुकस्टोर में 『Alice in Wonderland』 की ऐसी किताब देखी जिसमें Disney animation के still cuts को illustrations के रूप में डाला गया था, और मुझे जिज्ञासा है कि अगर ऐसे मॉडल में 『Alice in Wonderland』 के हर दृश्य को इनपुट किया जाए, तो किस तरह का परिणाम निकलेगा।
DALL·E 2 का अनावरण
DALL-E 2 कैसे काम करता है?