डिवाइस पर ऑफलाइन इस्तेमाल के लिए उपलब्ध Easy Stable Diffusion XL

(noiselith.com)

2 पॉइंट द्वारा GN⁺ 2023-12-03 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Noiselith ऐप परिचय

ऑफलाइन इमेज जनरेशन टूल: Noiselith आपको cloud के बिना अपने डिवाइस पर स्वतंत्र रूप से इमेज जनरेट करने देता है.
प्राइवेसी सुरक्षा: सभी जनरेशन काम लोकल में होते हैं और कोई जानकारी cloud पर भेजी नहीं जाती.
अनलिमिटेड जनरेशन: दिन में 100, 200, यहाँ तक कि 1000 इमेज तक बनाने की सुविधा देने वाला अनलिमिटेड जनरेशन फीचर प्रदान करता है.
स्पीड: server resources का इंतज़ार किए बिना डिवाइस पर तुरंत इमेज जनरेट की जा सकती हैं.

सिस्टम आवश्यकताएँ

Windows: Windows 10 या 11, NVIDIA RTX 20 series या उससे ऊपर का GPU (8GB या अधिक VRAM), 16GB या अधिक RAM, 20GB या अधिक storage space आवश्यक.
macOS: macOS 12.3 या उससे ऊपर, Apple Silicon, 32GB या अधिक RAM, 20GB या अधिक storage space आवश्यक.

उपयोगकर्ता अनुभव

आसान इंस्टॉलेशन: कुछ ही क्लिक में Noiselith इस्तेमाल के लिए तैयार हो जाता है.
सहज उपयोग: तकनीकी विवरणों की चिंता किए बिना आइडिया को दृश्य रूप में बदलने के लिए एक intuitive interface प्रदान करता है.
मॉडल प्रबंधन: मॉडल को आसानी से डाउनलोड, हटाया और अपडेट किया जा सकता है, और जनरेट की गई इमेज को सुरुचिपूर्ण ढंग से व्यवस्थित करने के लिए gallery भी मिलती है.

डेवलपमेंट रोडमैप

विभिन्न फीचर सपोर्ट: SDXL models, SDXL LoRA, history management, project management, model management आदि के सपोर्ट की योजना है.
कम्युनिटी और विस्तारक्षमता: user community, SD 1.5 और 2.1 model support, model database, upscaler, smart prompt जैसी सुविधाएँ शामिल होंगी.
Noiselith ऐप स्टोर: cloud GPU और remote collaboration फीचर वाले app store को विकसित करने की योजना है.

GN⁺ की राय

इस लेख की सबसे महत्वपूर्ण बात यह है कि Noiselith ऐप एक नया टूल है जो उपयोगकर्ता के डिवाइस पर cloud की मदद के बिना, प्राइवेसी सुरक्षित रखते हुए, अनलिमिटेड इमेज जनरेट कर सकता है.
यह ऐप software installation और उपयोग की जटिलता को कम करता है, और एक intuitive interface के जरिए किसी को भी आसानी से इमेज जनरेशन शुरू करने देता है, जिससे लोग रचनात्मक काम पर अधिक ध्यान दे सकते हैं.

1 टिप्पणियां

GN⁺ 2023-12-03

Hacker News की राय

अभी-अभी इंस्टॉल करके देखा, काफ़ी शानदार है। लोकल AI वही भविष्य है जो मैं चाहता हूँ, और मैं भी उसी दिशा में काम कर रहा हूँ
फायदे यह हैं कि यह काफ़ी स्वतंत्र रूप से काम करता है, बिल्ट-इन model installer अच्छी तरह बना है इसलिए CivitAI से कुछ भी डाउनलोड करना आसान है (https://civitai.com/models/183354/sdxl-ms-paint-portraits इंस्टॉल करके देखा), image generation की गुणवत्ता ऊँची और स्थिर है, और यह generation के बीच के चरण दिखाता है
कमी यह है कि 6.94GB SDXL model file को बिना पूछे, location या size दिखाए बिना कहीं डाउनलोड कर देता है, हालांकि बाद में पता चला कि settings में location ढूँढकर बदली जा सकती है। पहला generation model loading की वजह से बहुत धीमा है, और generation time दर्ज नहीं होता, लेकिन M1 Max MacBook 64GB पर कुछ मिनट लगते लगते हैं
feedback modules कई हैं, इसलिए बाएँ नीचे वाला chat बहुत परेशान करने वाला है और मुझे नहीं लगता कि कभी इस्तेमाल करूँगा; ऊपर दाएँ भी beta feedback request है। प्रतिस्पर्धी products के उलट यह open source नहीं है, 7 processes चलती हैं और idle state में करीब 1GB RAM इस्तेमाल करता है। macOS native UX नहीं है, और अपेक्षित shortcuts या help menu गायब हैं, इसलिए Electron app जैसा लगता है। कुल मिलाकर 4/5, और इसे फिर खोलने का मन है
- macOS पर Draw Things भी देखने लायक है। 8GiB macOS device पर भी SDXL काफ़ी अच्छी तरह चलता है
- अगर tech stack जानना हो, तो यहाँ है: https://noiselith.notion.site/License-61290d5ed7ab4c918402fd2510533a9b
  तो हाँ, सही है। यह Electron app है और Svelte, headless-ui, tailwindcss वगैरह इस्तेमाल करता है
- download location पूछने का विकल्प देना ज़रूरी है
- एक और कमी यह है कि यह सिर्फ Apple Silicon Mac पर चलता है
- जिज्ञासा है कि वह 1GB idle memory प्रति process है या सभी 7 processes का कुल योग
लोकल inference options पहले से ही काफ़ी हैं, और अहम बात यह है कि वे open source हैं और features भी ज़्यादा मजबूत हैं
यहाँ अगर कोई यह कहकर बचाव करे कि “लेकिन Auto1111 या Comfy की UI user-friendly नहीं है,” तो वह भी पहले ही हल हो चुका है: https://github.com/invoke-ai/InvokeAI
- मैं InvokeAI पर शिफ्ट हो गया हूँ और लगता नहीं कि basic a1111 webui पर वापस जाऊँगा। इसका overall layout पसंद है, workflow feature है, और image बनाते समय इस्तेमाल किए गए prompt, model, LoRA जैसी सभी properties आसानी से फिर से load की जा सकती हैं
  इन्हें boards में organize भी कर सकते हैं, और boards, images, metadata सब एक अच्छी तरह design किए गए SQLite database में stored होते हैं, जिसे DataGrip से access किया जा सकता है
- Krita में diffusion AI plugin लगाकर इस्तेमाल करने का तरीका भी है: https://github.com/Acly/krita-ai-diffusion
- “Stable Diffusion को local पर चलाएँ” वाला promotional line थोड़ा अजीब है। सच कहें तो यह ऐसी चीज़ है जो पहले से आसानी से की जा सकती है
- UI user-friendly है या नहीं, पता नहीं, लेकिन सिर्फ InvokeAI installation process ही दुनिया के 99.9% लोगों के लिए पहले से बाधा है। इसका मतलब यह नहीं कि Noiselith open source नहीं हो सकता, लेकिन यह साफ़ तौर पर InvokeAI से कुछ अलग दे रहा है
जिसने अभी तक नहीं आज़माया है, उसे Fooocus की ज़ोरदार सिफारिश करता हूँ: https://github.com/lllyasviel/Fooocus
local Stable Diffusion pipelines बहुत ज़्यादा हैं, लेकिन यह छोटे prompts से ही default output quality में जबरदस्त बेहतर है। सच में प्रभावशाली है
वजह यह है कि इसने कई SDXL enhancement features integrate किए हैं जिन्हें दूसरी UIs लागू नहीं करतीं या default में चालू नहीं रखतीं। मैं Stable Diffusion 1.5 के समय से इसे इस्तेमाल कर रहा हूँ और इस क्षेत्र को काफ़ी follow करता आया हूँ, लेकिन ComfyUI तो छोड़िए, diffusers में भी equivalent pipeline set up करना मुश्किल काम लगेगा। यह SDXL के लिए “हिट features का collection और optimal defaults” जैसा लगता है
- Python setup से डर लग रहा था, जबकि मैं Python developer हूँ। फिर भी virtual environment बनाकर dependencies install करते ही काम हो गया। वाकई कमाल है, और generated images सीधे सुंदर आती हैं
  हालांकि बगल वाली comment में जैसा कहा गया है, GTM को bundle करना अच्छा नहीं लगता
  samples:
  https://imgz.org/i9oicVqo/
  https://imgz.org/i8Ur3WjW/
  https://imgz.org/i5j6r6TZ/
- Fooocus की self-hosted install वाली web UI users को Google Tag Manager के हवाले करती हुई लगती है
  काश हमारी पूरी industry समझे कि ऐसी surveillance चलाना खराब choice है और बस रुक जाए
- Mac पर इसे खुद build करना पड़ता है, और Python projects build करना कितना “मज़ेदार” होता है, यह सब जानते हैं
- अगर आपको best local generation results चाहिए, तो Fooocus कहीं बेहतर है। Lvmin खूबसूरत images बनाने में पूरी energy लगा रहा है। GPL license होना भी मेरे लिए plus है
- जिज्ञासा है कि बहुत ज़्यादा RAM वाले CPU-only system पर भी यह काम लायक होगा या नहीं
दिलचस्प है। पिछले कुछ महीनों से मज़े के लिए इस्तेमाल कर रहे https://diffusionbee.com से तुलना करके देखूँगा
- दोनों देखे, और Noiselith बहुत, बहुत बेहतर results देता है
मार्केटिंग के लिए यह अच्छा हो सकता है, लेकिन on-device execution और offline को मुख्य differentiator के तौर पर पेश करना अजीब है। क्योंकि ज़्यादातर लोग शायद Stable Diffusion को पहले से ही इसी तरह इस्तेमाल कर रहे होंगे
बेहतर होगा कि installation और use में आसानी पर ज़्यादा focus किया जाए। यह हिस्सा अभी भी ठीक से solve नहीं हुआ है। मेरे हिसाब से ControlNet, upscaling, face detailer टाइप चीज़ें, और हो सके तो regional prompting न हो तो मैं इस्तेमाल नहीं करता
यह भी लगता है कि जो लोग अपना SD generator बनाना चाहते हैं, वे पहले से मौजूद open source projects में से किसी एक में contribute करें तो अच्छा होगा
App Store एक अच्छा idea हो सकता है, लेकिन Auto1111 और उसके ढेरों extensions वाली दुनिया में Stable Diffusion community में इसे अच्छी प्रतिक्रिया नहीं मिलेगी लगता है
- “मार्केटिंग के लिए अच्छा” वाली बात ही मुख्य है। इसे और आगे बढ़ाना चाहिए। जो चीज़ अजीब दिख रही है, वही बताती है कि इस product का target कौन है। यह पहले से SD इस्तेमाल करने वालों के लिए नहीं, बल्कि Dall-E जैसी online-only services इस्तेमाल करने वालों को switch कराने के लिए है
- मुझे लगता है काफ़ी लोग A1111 जैसी चीज़ें इस्तेमाल नहीं करते होंगे। वजह है इसका जटिल installation model: इसे download करो तो वह कुछ और download करता है, फिर वह किसी और चीज़ को download करता है, और फिर आपको यह file और वह file manually download करनी पड़ती है
  मौजूदा users को भले आकर्षक न लगे, लेकिन ज़्यादा simple product new users को अच्छी तरह appeal कर सकता है
- मैंने देखा है कि Stable Diffusion के cloud wrappers अजीब तरह से बहुत ज़्यादा हैं। इसलिए शुरुआत में ही साफ़-साफ़ on-device/offline कहना मुझे अच्छा लगता है
  जब मैंने पहली बार SD try किया था, तो बस कुछ files download करके run करने के बजाय कई packages ऐसे थे जो बहुत ज़्यादा phone home करते थे या VM जैसी चीज़ें इस्तेमाल करते थे, जो अजीब लगा
- मैंने device पर SD इस्तेमाल किया है, लेकिन hosted version के लिए पैसे देना worthwhile लगा। क्योंकि वह काफ़ी तेज़ है
Sales prompt में लिखा है: “घुंघराले सुनहरे बालों वाली एक युवा महिला, fantasy world background के सामने seductive नज़र के साथ, पैर फैलाकर बैठी है और white shirt तथा denim hot pants पहने हुए है”
सच में, क्या यही ठीक है?
- अगर prompt कुछ हद तक sexual, controversial या uncomfortable न होता, तो यह सीधे “फिर भी midjourney/dall-e/imagen जितना अच्छा नहीं” वाले chorus के सामने आ जाता। restrictions से freedom इसके प्रमुख selling points में से एक है
- मैं सचमुच जानना चाहता हूँ कि open source community में कितने लोग पसीना और खून बहाकर ऐसे projects बना रहे हैं, जबकि अंत में इसका नतीजा यह होता है कि पुरुष अपने MacBook को Instagram pornbook में बदल सकें
- अच्छा है कि सिर्फ़ मुझे ही यह inappropriate नहीं लगा। यह काफ़ी dog whistle जैसा महसूस होता है
- वह सच में creepy है
Installation के बाद Windows machine पर run करने के लिए public और private network access permissions देनी पड़ीं। “offline” कहने के बाद यह थोड़ा अटका
- मुझे भी कुछ ऐसा ही अनुभव हुआ
  पहली run पर इसने लगभग 30GB data download किया। बाद की runs में offline काम करेगा या नहीं, पता नहीं। मेरे case में उसके बाद यह लगातार crash होता रहा और दोबारा run नहीं हुआ
  Uninstall करते समय भी इसने सारा data छोड़ दिया। user data नहीं, बल्कि executable खुद, Python virtual environment, updater और सभी models बचे रहे। uninstall तो असल में बस Start Menu shortcut हटाने जैसा था
- जानना चाहता हूँ कि internet पूरी तरह बंद करने पर भी यह चलता रहा या नहीं
  अगर run करने के लिए active internet connection चाहिए, तो इसे “offline” बताकर advertise करना पूरी तरह गलत है
ज़्यादा local clients आना निश्चित रूप से अच्छा है। जैसा कि दूसरे comments में कहा गया है, पहले से कुछ बेहतरीन विकल्प मौजूद हैं। मैंने automatic1111 try किया है—यह तेज़ है और ज़्यादा tuning की ज़रूरत नहीं पड़ती, लेकिन फिर भी knobs और options बहुत हैं, इसलिए शुरुआत में मुश्किल लगता है। Fooocus बहुत तेज़ है, लेकिन स्वाभाविक रूप से customization कम है
और फिर ComfyUI है। यह complexity की holy grail जैसा है, लेकिन उसी complexity की वजह से आप वाकई बहुत कुछ कर सकते हैं। Node-based app होने के कारण custom workflows बना सकते हैं, और image generate होने के बाद उस “node” को कहीं और भेजकर upscaling जैसी post-processing कर सकते हैं
देखना चाहूँगा कि Noiselith या दूसरे tools SDXLTurbo को support करेंगे या नहीं। इसे आए बस कुछ दिन हुए हैं, लेकिन मेरे हिसाब से यह पूरी तरह game changer है। Consumer GPU पर 512x512 image लगभग 0.5 seconds में बना सकता है। Quality बहुत जबरदस्त नहीं है, लेकिन “जंगल में लोमड़ी” type करके तुरंत देखना, फिर “टोपी पहने हुए” जोड़कर फिर तुरंत generate करना—यह क्षमता बहुत valuable है। पहले एक image के लिए 12 seconds इंतज़ार करना पड़ता था। सुनने में बड़ी बात नहीं लगती, लेकिन इतनी तेजी से iterate कर पाना local image generation को कहीं ज़्यादा मज़ेदार बनाता है
अभी test नहीं कर पाया हूँ, लेकिन Comfy में CoreML इस्तेमाल कर रहा हूँ, इसलिए सोच रहा हूँ कि अगर ज़्यादा useful front-end आए तो क्या इन platforms के backend optimization और performance work भी और बढ़ेंगे
512 image पर 1~4it/s बहुत disappointing है, और 1024 पर 2~3s/it भी आज के standards के हिसाब से बहुत slow है। ऊपर से ANE भी MacBook Pro M3 पर SD 1024x1024 image नहीं चला पाता, यह अफ़सोसजनक है

डिवाइस पर ऑफलाइन इस्तेमाल के लिए उपलब्ध Easy Stable Diffusion XL

Noiselith ऐप परिचय

सिस्टम आवश्यकताएँ

उपयोगकर्ता अनुभव

डेवलपमेंट रोडमैप

GN⁺ की राय

संबंधित पढ़ाई

1 टिप्पणियां

Hacker News की राय