डिवाइस पर ऑफलाइन इस्तेमाल के लिए उपलब्ध Easy Stable Diffusion XL
(noiselith.com)Noiselith ऐप परिचय
- ऑफलाइन इमेज जनरेशन टूल: Noiselith आपको cloud के बिना अपने डिवाइस पर स्वतंत्र रूप से इमेज जनरेट करने देता है.
- प्राइवेसी सुरक्षा: सभी जनरेशन काम लोकल में होते हैं और कोई जानकारी cloud पर भेजी नहीं जाती.
- अनलिमिटेड जनरेशन: दिन में 100, 200, यहाँ तक कि 1000 इमेज तक बनाने की सुविधा देने वाला अनलिमिटेड जनरेशन फीचर प्रदान करता है.
- स्पीड: server resources का इंतज़ार किए बिना डिवाइस पर तुरंत इमेज जनरेट की जा सकती हैं.
सिस्टम आवश्यकताएँ
- Windows: Windows 10 या 11, NVIDIA RTX 20 series या उससे ऊपर का GPU (8GB या अधिक VRAM), 16GB या अधिक RAM, 20GB या अधिक storage space आवश्यक.
- macOS: macOS 12.3 या उससे ऊपर, Apple Silicon, 32GB या अधिक RAM, 20GB या अधिक storage space आवश्यक.
उपयोगकर्ता अनुभव
- आसान इंस्टॉलेशन: कुछ ही क्लिक में Noiselith इस्तेमाल के लिए तैयार हो जाता है.
- सहज उपयोग: तकनीकी विवरणों की चिंता किए बिना आइडिया को दृश्य रूप में बदलने के लिए एक intuitive interface प्रदान करता है.
- मॉडल प्रबंधन: मॉडल को आसानी से डाउनलोड, हटाया और अपडेट किया जा सकता है, और जनरेट की गई इमेज को सुरुचिपूर्ण ढंग से व्यवस्थित करने के लिए gallery भी मिलती है.
डेवलपमेंट रोडमैप
- विभिन्न फीचर सपोर्ट: SDXL models, SDXL LoRA, history management, project management, model management आदि के सपोर्ट की योजना है.
- कम्युनिटी और विस्तारक्षमता: user community, SD 1.5 और 2.1 model support, model database, upscaler, smart prompt जैसी सुविधाएँ शामिल होंगी.
- Noiselith ऐप स्टोर: cloud GPU और remote collaboration फीचर वाले app store को विकसित करने की योजना है.
GN⁺ की राय
- इस लेख की सबसे महत्वपूर्ण बात यह है कि Noiselith ऐप एक नया टूल है जो उपयोगकर्ता के डिवाइस पर cloud की मदद के बिना, प्राइवेसी सुरक्षित रखते हुए, अनलिमिटेड इमेज जनरेट कर सकता है.
- यह ऐप software installation और उपयोग की जटिलता को कम करता है, और एक intuitive interface के जरिए किसी को भी आसानी से इमेज जनरेशन शुरू करने देता है, जिससे लोग रचनात्मक काम पर अधिक ध्यान दे सकते हैं.
1 टिप्पणियां
Hacker News की राय
अभी-अभी इंस्टॉल करके देखा, काफ़ी शानदार है। लोकल AI वही भविष्य है जो मैं चाहता हूँ, और मैं भी उसी दिशा में काम कर रहा हूँ
फायदे यह हैं कि यह काफ़ी स्वतंत्र रूप से काम करता है, बिल्ट-इन model installer अच्छी तरह बना है इसलिए CivitAI से कुछ भी डाउनलोड करना आसान है (https://civitai.com/models/183354/sdxl-ms-paint-portraits इंस्टॉल करके देखा), image generation की गुणवत्ता ऊँची और स्थिर है, और यह generation के बीच के चरण दिखाता है
कमी यह है कि 6.94GB SDXL model file को बिना पूछे, location या size दिखाए बिना कहीं डाउनलोड कर देता है, हालांकि बाद में पता चला कि settings में location ढूँढकर बदली जा सकती है। पहला generation model loading की वजह से बहुत धीमा है, और generation time दर्ज नहीं होता, लेकिन M1 Max MacBook 64GB पर कुछ मिनट लगते लगते हैं
feedback modules कई हैं, इसलिए बाएँ नीचे वाला chat बहुत परेशान करने वाला है और मुझे नहीं लगता कि कभी इस्तेमाल करूँगा; ऊपर दाएँ भी beta feedback request है। प्रतिस्पर्धी products के उलट यह open source नहीं है, 7 processes चलती हैं और idle state में करीब 1GB RAM इस्तेमाल करता है। macOS native UX नहीं है, और अपेक्षित shortcuts या help menu गायब हैं, इसलिए Electron app जैसा लगता है। कुल मिलाकर 4/5, और इसे फिर खोलने का मन है
तो हाँ, सही है। यह Electron app है और Svelte, headless-ui, tailwindcss वगैरह इस्तेमाल करता है
लोकल inference options पहले से ही काफ़ी हैं, और अहम बात यह है कि वे open source हैं और features भी ज़्यादा मजबूत हैं
यहाँ अगर कोई यह कहकर बचाव करे कि “लेकिन Auto1111 या Comfy की UI user-friendly नहीं है,” तो वह भी पहले ही हल हो चुका है: https://github.com/invoke-ai/InvokeAI
इन्हें boards में organize भी कर सकते हैं, और boards, images, metadata सब एक अच्छी तरह design किए गए SQLite database में stored होते हैं, जिसे DataGrip से access किया जा सकता है
जिसने अभी तक नहीं आज़माया है, उसे Fooocus की ज़ोरदार सिफारिश करता हूँ: https://github.com/lllyasviel/Fooocus
local Stable Diffusion pipelines बहुत ज़्यादा हैं, लेकिन यह छोटे prompts से ही default output quality में जबरदस्त बेहतर है। सच में प्रभावशाली है
वजह यह है कि इसने कई SDXL enhancement features integrate किए हैं जिन्हें दूसरी UIs लागू नहीं करतीं या default में चालू नहीं रखतीं। मैं Stable Diffusion 1.5 के समय से इसे इस्तेमाल कर रहा हूँ और इस क्षेत्र को काफ़ी follow करता आया हूँ, लेकिन ComfyUI तो छोड़िए, diffusers में भी equivalent pipeline set up करना मुश्किल काम लगेगा। यह SDXL के लिए “हिट features का collection और optimal defaults” जैसा लगता है
हालांकि बगल वाली comment में जैसा कहा गया है, GTM को bundle करना अच्छा नहीं लगता
samples:
https://imgz.org/i9oicVqo/
https://imgz.org/i8Ur3WjW/
https://imgz.org/i5j6r6TZ/
काश हमारी पूरी industry समझे कि ऐसी surveillance चलाना खराब choice है और बस रुक जाए
दिलचस्प है। पिछले कुछ महीनों से मज़े के लिए इस्तेमाल कर रहे https://diffusionbee.com से तुलना करके देखूँगा
मार्केटिंग के लिए यह अच्छा हो सकता है, लेकिन on-device execution और offline को मुख्य differentiator के तौर पर पेश करना अजीब है। क्योंकि ज़्यादातर लोग शायद Stable Diffusion को पहले से ही इसी तरह इस्तेमाल कर रहे होंगे
बेहतर होगा कि installation और use में आसानी पर ज़्यादा focus किया जाए। यह हिस्सा अभी भी ठीक से solve नहीं हुआ है। मेरे हिसाब से ControlNet, upscaling, face detailer टाइप चीज़ें, और हो सके तो regional prompting न हो तो मैं इस्तेमाल नहीं करता
यह भी लगता है कि जो लोग अपना SD generator बनाना चाहते हैं, वे पहले से मौजूद open source projects में से किसी एक में contribute करें तो अच्छा होगा
App Store एक अच्छा idea हो सकता है, लेकिन Auto1111 और उसके ढेरों extensions वाली दुनिया में Stable Diffusion community में इसे अच्छी प्रतिक्रिया नहीं मिलेगी लगता है
मौजूदा users को भले आकर्षक न लगे, लेकिन ज़्यादा simple product new users को अच्छी तरह appeal कर सकता है
जब मैंने पहली बार SD try किया था, तो बस कुछ files download करके run करने के बजाय कई packages ऐसे थे जो बहुत ज़्यादा phone home करते थे या VM जैसी चीज़ें इस्तेमाल करते थे, जो अजीब लगा
Sales prompt में लिखा है: “घुंघराले सुनहरे बालों वाली एक युवा महिला, fantasy world background के सामने seductive नज़र के साथ, पैर फैलाकर बैठी है और white shirt तथा denim hot pants पहने हुए है”
सच में, क्या यही ठीक है?
Installation के बाद Windows machine पर run करने के लिए public और private network access permissions देनी पड़ीं। “offline” कहने के बाद यह थोड़ा अटका
पहली run पर इसने लगभग 30GB data download किया। बाद की runs में offline काम करेगा या नहीं, पता नहीं। मेरे case में उसके बाद यह लगातार crash होता रहा और दोबारा run नहीं हुआ
Uninstall करते समय भी इसने सारा data छोड़ दिया। user data नहीं, बल्कि executable खुद, Python virtual environment, updater और सभी models बचे रहे। uninstall तो असल में बस Start Menu shortcut हटाने जैसा था
अगर run करने के लिए active internet connection चाहिए, तो इसे “offline” बताकर advertise करना पूरी तरह गलत है
ज़्यादा local clients आना निश्चित रूप से अच्छा है। जैसा कि दूसरे comments में कहा गया है, पहले से कुछ बेहतरीन विकल्प मौजूद हैं। मैंने automatic1111 try किया है—यह तेज़ है और ज़्यादा tuning की ज़रूरत नहीं पड़ती, लेकिन फिर भी knobs और options बहुत हैं, इसलिए शुरुआत में मुश्किल लगता है। Fooocus बहुत तेज़ है, लेकिन स्वाभाविक रूप से customization कम है
और फिर ComfyUI है। यह complexity की holy grail जैसा है, लेकिन उसी complexity की वजह से आप वाकई बहुत कुछ कर सकते हैं। Node-based app होने के कारण custom workflows बना सकते हैं, और image generate होने के बाद उस “node” को कहीं और भेजकर upscaling जैसी post-processing कर सकते हैं
देखना चाहूँगा कि Noiselith या दूसरे tools SDXLTurbo को support करेंगे या नहीं। इसे आए बस कुछ दिन हुए हैं, लेकिन मेरे हिसाब से यह पूरी तरह game changer है। Consumer GPU पर 512x512 image लगभग 0.5 seconds में बना सकता है। Quality बहुत जबरदस्त नहीं है, लेकिन “जंगल में लोमड़ी” type करके तुरंत देखना, फिर “टोपी पहने हुए” जोड़कर फिर तुरंत generate करना—यह क्षमता बहुत valuable है। पहले एक image के लिए 12 seconds इंतज़ार करना पड़ता था। सुनने में बड़ी बात नहीं लगती, लेकिन इतनी तेजी से iterate कर पाना local image generation को कहीं ज़्यादा मज़ेदार बनाता है
अभी test नहीं कर पाया हूँ, लेकिन Comfy में CoreML इस्तेमाल कर रहा हूँ, इसलिए सोच रहा हूँ कि अगर ज़्यादा useful front-end आए तो क्या इन platforms के backend optimization और performance work भी और बढ़ेंगे
512 image पर 1~4it/s बहुत disappointing है, और 1024 पर 2~3s/it भी आज के standards के हिसाब से बहुत slow है। ऊपर से ANE भी MacBook Pro M3 पर SD 1024x1024 image नहीं चला पाता, यह अफ़सोसजनक है