4 पॉइंट द्वारा GN⁺ 2023-10-05 | 2 टिप्पणियां | WhatsApp पर शेयर करें
  • फ़ॉन्ट जनरेशन के लिए FontoGen नाम का एक generative machine learning (ML) मॉडल बनाया गया
  • यह मॉडल फ़ॉन्ट का विवरण इनपुट के रूप में लेकर आउटपुट में फ़ॉन्ट फ़ाइल देता है
  • लेखक को 2023 में AI के उभार से प्रेरणा मिली और उन्होंने text से SVG generation की खोज शुरू की, जिससे फ़ॉन्ट जनरेशन का विचार मिला
  • मॉडल को IconShop2 पेपर के आधार पर बनाया गया, और पाया गया कि SVG generation की तरह ही फ़ॉन्ट generation भी संभव है
  • यह मॉडल एक sequence-to-sequence मॉडल है, जिसे text embedding के बाद font embedding आने वाले sequence पर train किया गया
  • text embedding एक pre-trained BERT encoder model से बनाया गया, और font embedding फ़ॉन्ट को token sequence में बदलकर तैयार किया गया
  • यह मॉडल 16 layers और 8 blocks वाले एक autoregressive encoder-only transformer से बना है, जिसमें कुल 73.7 million parameters हैं
  • लेखक ने BigBird3 attention का उपयोग किया ताकि मॉडल शुरुआती prompt पर ध्यान दे सके और पिछले N tokens को देखकर कई पिछले glyphs की style पकड़ सके
  • मॉडल को 71k unique fonts के dataset पर train किया गया, जिसमें GPT-3.5 का उपयोग करके अलग-अलग प्रकार के descriptions को कुछ keywords में संक्षेपित किया गया
  • training process में 127 घंटे लगे, और validation loss में लगभग कोई सुधार न होने पर इसे रोका गया
  • लेखक ने preprocessing चरण में जितना संभव हो उतना काम पहले से स्थानांतरित करके performance को तीन गुना बेहतर किया
  • लेखक ने भविष्य के संभावित उपयोग भी सुझाए, जैसे मॉडल को मौजूदा font editor में जोड़कर designer द्वारा बनाए गए एक single glyph के आधार पर बाकी सभी glyphs जनरेट करना

2 टिप्पणियां

 
dbgus2028 2023-10-06

मेरे लिए एक प्यारा फ़ॉन्ट बना दो

 
GN⁺ 2023-10-05
Hacker News राय
  • gpt-4 code interpreter ग्लिफ़ के black-and-white png को svg में बदल सकता है, और इसे image generation model के साथ जोड़कर फ़ॉन्ट बनाने में इस्तेमाल किया जा सकता है.
  • Godel Escher Bach के लेखक Douglas Hofstader का मानना था कि general AI के बिना फ़ॉन्ट जनरेशन संभव नहीं है.
  • Letter Spirit प्रोजेक्ट का लक्ष्य ग्रिड तक सीमित "gridfonts" नाम की एक शैली में एकरूप स्टाइल वाले टाइपफ़ेस डिज़ाइन करके कलात्मक रचनात्मकता को मॉडल करना है.
  • ML model द्वारा जनरेट किए गए फ़ॉन्ट की precision को लेकर चिंता है; जैसे, रेखाएँ पूरी तरह parallel नहीं होतीं और कोने बिल्कुल 90 degree के नहीं होते.
  • pixels को 150x150 अलग bin के रूप में दर्शाने का तरीका आदर्श नहीं माना जाता; इसके बजाय convnet का उपयोग करने और output को trace करने का सुझाव दिया गया है.
  • इस तरह के approach से नए फ़ॉन्ट, खासकर बहुत ज़्यादा stylized फ़ॉन्ट, बनाना और अधिक व्यावहारिक हो सकता है.
  • मॉडल safetensor नहीं बल्कि ckpt है, और इससे कुछ उपयोगकर्ताओं के इसे आज़माने या न आज़माने के फैसले पर असर पड़ सकता है.
  • हालाँकि diffusion models को text ड्रॉ करने में कठिनाई होती है, यह तरीका इस application में अच्छी तरह काम करता है.