Stable Diffusion अब तक आए AI Art मॉडलों में सबसे महत्वपूर्ण है
(thealgorithmicbridge.substack.com)- गुणवत्ता DALL·E 2 या MidJourney जैसी है, लेकिन यह 'open source' है
- इसे पहले ही Google Colabs में चलाया जा चुका है और Figma plugins भी बनाए जा चुके हैं
- MidJourney ने Stable Diffusion के साथ इसे जोड़ने की कोशिश भी की है
- पहले आए DALL·E Mini या Disco Diffusion जैसे open source मॉडलों की तुलना में इसकी गुणवत्ता कहीं बेहतर है
- Dreamstudio के जरिए आसानी से इमेज बनाई जा सकती है: 200 इमेज तक मुफ्त, उसके बाद प्रति इमेज £0.01 (DALL·E में $0.03)
- जल्द ही किसी दूसरी इमेज में prompt जोड़कर नई इमेज बनाने की सुविधा भी जोड़ी जाएगी
- open source होने के फ़ायदे से इसका इस्तेमाल कई जगहों पर शुरू हो चुका है
- Outpainting + Inpainting collage
- मैगज़ीन कवर डिज़ाइन, कॉमिक्स बनाना, एनीमेशन बनाना
- Img2Img
- Stable Diffusion बना रही Stability.AI के Emad Mostaque ने यह कहा
जैसे-जैसे हम और तेज़, बेहतर और अधिक specific models जारी करेंगे, गुणवत्ता लगातार बेहतर होती जाएगी
सिर्फ इमेज ही नहीं, अगले महीने audio, और उसके बाद 3D और video जारी करने की योजना है
भाषा, code आदि के लिए भी और अधिक models को train किया जा रहा है
2 टिप्पणियां
डेमो मॉडल की स्पीड काफ़ी तेज़ है। अगर वास्तविक उपयोग में भी यही स्तर की स्पीड मिले, तो इसका उपयोग दायरा काफ़ी बड़ा हो सकता है।
मैंने Korean में भी टेस्ट करके देखा, लेकिन लोगों के चेहरे बिगड़ गए, जो थोड़ा डरावना लगा।
Stable Diffusion - DALL-E जैसा Text-To-Image ओपन सोर्स
Lexica - 50 लाख से अधिक Stable Diffusion से जनरेट की गई इमेजों की खोज