28 पॉइंट द्वारा xguru 2023-06-09 | 9 टिप्पणियां | WhatsApp पर शेयर करें
  • Reddit यूज़र nhciao ने ControlNet + LoRA का उपयोग करके वास्तव में काम करने वाले anime स्टाइल QR code जनरेट किए
  • यह QR code में पहले से मौजूद Error Correction फ़ीचर की वजह से संभव है
  • इसे Chinese traditional patterns, ukiyo-e, 2D animation, ink wash painting, watercolor, 3D, abstract, PCB आदि जैसे कई तरीकों में इस्तेमाल किया जा सकता है
  • विस्तृत जानकारी Chinese में लिखी गई मूल पोस्ट में देखी जा सकती है

9 टिप्पणियां

 
yinn27 2023-06-10

कमाल है, यह सोच ही…

 
qkreoaksn 2023-06-09

दुनिया में.....

 
popup 2023-06-09

QR पहचान सच में हो जाती है। काफ़ी दिलचस्प है।

 
kuroneko 2023-06-09

सिद्धांत रूप में यह संभव है, यह बात कुछ हद तक समझ में आती है, लेकिन फिर भी यह सचमुच स्कैन हो जाता है, इस बात पर बिल्कुल यकीन नहीं हो रहा। बेहद हैरान करने वाला है।

 
xguru 2023-06-09

चीनी ब्लॉग पोस्ट: https://mp.weixin.qq.com/s/i4WR5ULH1ZZYl8Watf3EPw

 
kuroneko 2023-06-09

मैंने मूल लेख को summarizer में डाला तो यह इस तरह निकला।

  • यह लेख एक नए ControlNet मॉडल पर चर्चा करता है जो scan किए जा सकने वाले QR code images बना सकता है। ControlNet ऐसी images में छिपी जानकारी encode कर सकता है जो मानव आँखों को सामान्य दिखती हैं।
  • लेखक और उसके साथियों ने पहले parameterized QR code generator बनाया था, लेकिन उसे लगातार update नहीं किया। मौजूदा idea उन्हें Stable Diffusion जारी होने के बाद आया।
  • शुरुआती ControlNet प्रयास चीनी पारंपरिक patterns को सीखने के लिए था। लेखक ने उल्लेख किया है कि उन्होंने training के लिए AIGC All in One दस्तावेज़ और HuggingFace JAX/Diffusers का उपयोग किया।
  • ControlNet को train करने के लिए बहुत बड़ी मात्रा में data और computing power की ज़रूरत होती है। शोध में अधिकतम 300,000 images और 600 A100 GPU hours का उपयोग किया गया। लेखक ने बड़े learning rate के साथ 100,000-image version को train किया।
  • training के बाद, लेखक ने विभिन्न Checkpoint + LoRA + QR Code ControlNet combinations का परीक्षण किया और चीनी पारंपरिक patterns, ukiyo-e, 2D, ink, perspective, abstract और PCB styles जैसे कई styles के scan किए जा सकने वाले QR codes बनाए।
  • बनाए गए QR codes में चीनी पारंपरिक pattern, ukiyo-e style, animation, illustration, ink, watercolor, 3D और abstract styles शामिल हैं।
  • यह project कुछ साथियों के सहयोग और lab के GPU resources पर निर्भर था। Google TPU servers ने भी training speed बढ़ाने में मदद की।
  • लेखक आगे WeChat official account और website पर model और technical documents सार्वजनिक करने की योजना बना रहा है।
  • यह लेख उल्लेख करता है कि AI generation models तेज़ी से आगे बढ़ रहे हैं, और लेखक ने फिर से university जाने की इच्छा व्यक्त की है।
  • लेखक TPU servers उपलब्ध कराने के लिए Google और HuggingFace को धन्यवाद देते हुए कहता है कि वह "अच्छा समय बिता सका"।
 
lunamoth 2023-06-09

क्या आप बता सकते हैं कि आपने सारांश के लिए कौन-सी सेवा इस्तेमाल की थी?

 
kuroneko 2023-06-11

मैं Kagi का Universal Summarizer इस्तेमाल कर रहा हूँ.

 
lunamoth 2023-06-11

बताने के लिए धन्यवाद