- Unicode character set को विज़ुअली एक्सप्लोर करते हुए, हर कैरेक्टर के glyph, script, symbol, और form को देखा जा सकने वाला टूल
- कैरेक्टरों के बीच visual similarity का विश्लेषण करने के लिए SigLIP 2 embedding का उपयोग कर glyphs को vector space में compare करता है
- उपयोगकर्ता कैरेक्टरों के morphological relationships को सहज रूप से समझ सकते हैं और Unicode संरचना को एक्सप्लोर कर सकते हैं
- इंटरफ़ेस visual-first exploration experience देता है, ताकि जटिल character systems को आसानी से समझा जा सके
- प्रोजेक्ट लगातार विकसित किया जा रहा है और इसे उपयोगकर्ताओं के feedback और donation support मिल रहे हैं
Charcuterie परिचय
- यह एक Unicode visual explorer है, जो character sets को एक्सप्लोर करने और उनसे जुड़े glyph, script, symbol, और form देखने की सुविधा देता है
- हर कैरेक्टर की visual similarity का विश्लेषण करने के लिए SigLIP 2 से rendered glyphs को embed करके उन्हें vector space में compare किया जाता है
- उपयोगकर्ता कैरेक्टरों के बीच के morphological relationships को सहज रूप से एक्सप्लोर कर Unicode standard की संरचना को समझ सकते हैं
- प्रोजेक्ट लगातार विकसित किया जा रहा है और इसे उपयोगकर्ताओं के feedback और donation के ज़रिए support मिल रहा है
1 टिप्पणियां
Hacker News टिप्पणियाँ
मैं समझता हूँ कि input field को अपने-आप trim करना आम तौर पर एक उपयोगी default है, लेकिन इस मामले में इससे space खुद search नहीं किया जा सकता, जो असुविधाजनक है
इसलिए
if (trim(str)=="") return strजैसी exception handling जोड़ना अच्छा रहेगामुझे शुरुआत में पता नहीं चला, लेकिन pencil icon पर click करने से text की जगह सीधे shape बनाकर search किया जा सकता है
यह सच में बहुत शानदार concept और implementation है
बस “spotlight” UI concept थोड़ा confusing है। किसी character पर click करने से उसके आसपास का area highlight होता है, और उस character के आसपास का similar character terrain फिर से load होता है। इस तरह similarity terrain को explore किया जा सकता है, लेकिन लगता है कि मैं इस visual metaphor का कोई हिस्सा miss कर रहा हूँ
यह इतना शानदार लगा कि मैंने तुरंत bookmark कर लिया। पहले मैं vector-based emoji search के लिए EmojiDB इस्तेमाल करता था, अब इसे उसके साथ इस्तेमाल करने का सोच रहा हूँ
मेरी site है unicode-atlas.vercel.app
इतने सारे ‘X’ characters देखकर हँसी आ गई
charcuterie.elastiq.ch/#1100B लिंक देखने पर समझ नहीं आता कि इसका मतलब “Aegean Check Mark” है या “Old North Arabian letter Teh”
यह वाकई शानदार है। मैं जहाँ संभव हो, image की जगह Unicode characters इस्तेमाल करना पसंद करता हूँ। उदाहरण के लिए arrows, लेकिन सही character ढूँढना हमेशा मुश्किल रहा है
लेकिन यहाँ तो सीधे ‼ बनाकर अपनी पसंद की चीज़ को narrow down किया जा सकता है। बिल्कुल perfect। UX भी intuitive है, इसलिए तुरंत bookmark कर लिया
मुझे तो यह भी नहीं पता था कि ऐसा character है: Hangul Jamo Yeorinhieuh
मेरी site है unicode-atlas.vercel.app
लगता है कि यह सिर्फ visual similarity से ज़्यादा चीज़ों को ध्यान में रखता है। नहीं तो “@” और “U+1F582 (BACK OF ENVELOPE)” इतने पास होने की वजह नहीं होती
और मैं कई सालों से, बल्कि दशकों से चाहता था कि Word में ऐसा feature हो। symbols को शब्दों में describe तो किया जा सकता है, लेकिन UI इतना असुविधाजनक है कि उन्हें सीधे ढूँढना मुश्किल होता है। अभी तक “Insert Symbol” window में search feature न होना यकीन से बाहर है
मेरी site है unicode-atlas.vercel.app
जापानी kanji search काम नहीं करता
https://unicodeplus.com/U+2F8F काम करता है, लेकिन
https://unicodeplus.com/U+884C काम नहीं करता
ऊपर बाईं ओर character को सीधे बनाकर मिलते-जुलते characters ढूँढ पाने की बात प्रभावशाली है। इससे पता चलता है कि यह सिर्फ एक simple lookup table से बढ़कर है
मेरी site है unicode-atlas.vercel.app
Unicode standard code points के लिए visual form define नहीं करता (कुछ emoji जैसे उदाहरणों को छोड़कर)
इसलिए यह tool बस एक खास font (जिसका न ज़िक्र है और न बदलने का विकल्प) की glyph similarity visualization है, Unicode code points की “visual exploration” से अलग