1 पॉइंट द्वारा GN⁺ 2023-11-28 | 1 टिप्पणियां | WhatsApp पर शेयर करें

DALL·E इमेज ट्रांसफॉर्मेशन पार्टी

  • DALL·E इमेज ट्रांसफॉर्मेशन के लिए एक पार्टी प्रदान करता है.
  • यूज़र्स को पसंद आने वाले इमेज थीम्स में 'gnome', 'बुज़ुर्ग साइबेरियाई', और 'अजीब बिल्लियाँ' जैसी चीज़ें शामिल हैं.
  • OpenAI API key का उपयोग करके शुरुआती prompt के आधार पर इमेज generation शुरू किया जा सकता है.

उन्नत सेटिंग्स

  • iteration count जैसी उन्नत settings के ज़रिए यूज़र इमेज generation process को समायोजित कर सकते हैं.
  • GPT-4 vision prompt का उपयोग करके base prompt को बदला जा सकता है, या उसे और मज़ेदार, और विचित्र, और अनोखा बनाया जा सकता है, या हर चीज़ को बिल्ली में बदला जा सकता है.

GN⁺ की राय

  • इस लेख की सबसे महत्वपूर्ण बात यह है कि DALL·E का उपयोग करके विभिन्न इमेजेज़ बनाई जा सकती हैं और उन्हें यूज़र की इच्छानुसार बदला जा सकता है.
  • रचनात्मक और व्यक्तिगत इमेज generation की क्षमता लोगों को एक दिलचस्प अनुभव देती है और इसे तकनीकी प्रगति तथा artificial intelligence की संभावनाओं को दिखाने वाले उदाहरण के रूप में देखा जा सकता है.

1 टिप्पणियां

 
GN⁺ 2023-11-28
Hacker News राय
  • प्रॉम्प्ट्स के साथ खेलते हुए और इमेजों की एक श्रृंखला के ज़रिए यह देखना काफ़ी मज़ेदार है कि क्या बनाया जा सकता है। हाल की एक Twitter पोस्ट से प्रेरित होकर, मैंने हर प्रॉम्प्ट के लिए "इंटेंसिटी" बढ़ाने वाली सेटिंग आज़माई। विषय मेरे बच्चे के सुझाव से शुरू हुआ था, और एक साधारण बकरी की शरारत को ब्रह्मांड के अंत वाले cosmic horror में बदलते देखना विस्मयकारी लगा। लिंक: dalle.party
  • एक कस्टम प्रॉम्प्ट जो मुझे व्यक्तिगत रूप से पसंद आया: इमेज के हर विवरण पर गहराई से विचार करते हुए style, color, lighting सहित उसकी अवधारणा बनाना। आख़िरी चरण में इसे एक पैराग्राफ़ में समेटकर सबसे उभरती हुई विशेषताओं और बेहद सटीक भाषा का उपयोग करते हुए विचार को संक्षेपित करना। लिंक: dalle.party
  • विरोधी कॉन्सेप्ट्स के साथ खेलना भी मज़ेदार है। यह एक साधारण बिल्ली से शुरू होकर आराम से लेटे हुए खीरे में बदलता है, और अंत में एक उलटी दुनिया में पहुँच जाता है। लिंक: dalle.party
  • यह मुझे 'Telestrations' नाम के एक पार्टी गेम की याद दिलाता है। इसमें प्रतिभागी बारी-बारी से चित्र बनाते हैं और जो देखते हैं उसे लिखते हैं; नतीजे देखना और यह अंदाज़ा लगाना कि अगला चित्र क्या होगा, काफ़ी आनंददायक है। अगर कोई वैकल्पिक viewing mode हो जो इमेज और अगला प्रॉम्प्ट दिखाए, तो अच्छा होगा। आप mobile mode पर स्विच करके या विंडो का आकार बदलकर पहले प्रॉम्प्ट पढ़ सकते हैं और फिर इमेज देख सकते हैं।
  • मैंने तकनीकी गिरावट की बजाय क्रमिक तकनीकी विकास की उम्मीद की थी, लेकिन वास्तव में यह जल्दी ही surreal क्षेत्र में भटक गया। शुरुआती प्रॉम्प्ट: "भविष्यवादी steam locomotive और Da Vinci flying machine का hybrid"। परिणाम: dalle.party
  • इमेज-टेक्स्ट मॉडल्स को शायद वास्तव में यह बिल्कुल पता नहीं होता कि किसी तस्वीर में क्या है। ऐसा लगता है जैसे वे training data में मौजूद patterns को match कर रहे हों। इससे यह आभास होता है कि जब मॉडल टेक्स्ट से इमेज render करता है तो मानो वह अपनी इच्छा को "समझता" हो, लेकिन उलटी दिशा में यह "समझ" से काफ़ी दूर है।
  • मैंने अभी तक इसे आज़माया नहीं है, लेकिन मेरा अनुमान है कि यह Scrawl नाम के एक commercially sold game जैसा है। इसमें प्रतिभागी कागज़ आगे बढ़ाते हैं और पड़ोसी के लिखे को चित्र में, या चित्र को लिखित रूप में बदलते हैं, फिर उसे आगे पास करते हैं। लिंक: boardgamegeek.com
  • "AI अपनी ही तस्वीर बना रहा है" इस शुरुआती प्रॉम्प्ट के साथ जो परिणाम मिले, उनमें लगातार रोबोट को कैनवास पर पेंटिंग बनाते हुए दिखाया गया। पहले 4 रोबोट की पेंटिंग्स हैं, अगले 3 galaxies हैं, और आख़िरी 2 landscape paintings हैं। लिंक: dalle.party
  • यह देखना दिलचस्प है कि कुछ विशेष प्रॉम्प्ट्स और थीम्स अपेक्षाकृत स्थिर बने रहते हैं। उदाहरण के लिए, "gnome example" स्थिर है, लेकिन "बिल्ली चूहे को lecture दे रही है" वाला उदाहरण जल्दी ही अजीब surreal क्षेत्र में निकल जाता है।
  • नतीजे कुछ ज़्यादा noisy होने की वजह से निराशा होती है, लेकिन यह कॉन्सेप्ट अपने आप में आकर्षक है। लिंक: dalle.party