- SD 2.0 रिलीज़ के बाद यह आकलन सामने आया कि पहले की तुलना में image generation quality खराब हो गई है
- संभवतः इसकी वजह नया text encoder OpenCLIP है
- पहले के prompt hacking तरीके अब काम नहीं करते, और "negative prompt" ज़्यादा बेहतर काम करने लगा है
Negative Prompting क्या है
- नतीजे की image में जिन चीज़ों को आप नहीं देखना चाहते, उन्हें बाहर करना
- SD के technical नज़रिए से देखें तो negative prompt diffusion process से दूर जाने वाले high-dimensional anchor की तरह काम करता है
- अगर आप "cyberpunk forest by Salvador Dali; negative prompt: trees, green" लिखें, तो परिणाम से "पेड़" और "हरा रंग" हटा दिया जाता है
- लोकप्रिय tricks में से एक है "blurry" और "pixelated" जैसी चीज़ों को negative में डालकर image quality बेहतर करना।
लेकिन क्या यह "4k hd", "trending on artstation" जैसे पुराने CLIPText image-quality सुधार prompts से भी बेहतर है?
- टेस्ट नतीजों को देखें तो negative prompt बेहद अच्छे results दिखाता है
निष्कर्ष
- AI image generation में negative prompt आगे चलकर कहीं अधिक महत्वपूर्ण tool बनने वाला है
- पुरानी prompt engineering strategies पर अड़े रहना बड़ी गलती होगी
1 टिप्पणियां
https://twitter.com/emostaque/status/1596864150134984705
अच्छी क्वालिटी की human images पाने के लिए कहा जा रहा है कि ऐसे शब्दों को negative में जोड़ना चाहिए.
"ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, mutation, mutated, extra limbs, extra legs, extra arms, disfigured, deformed, cross-eye, body out of frame, blurry, bad art, bad anatomy, blurred, text, watermark, grainy"