तुर्की i
(en.wikipedia.org)सॉफ़्टवेयर internationalization को संभालते समय सबसे मुश्किल बात अक्सर यह होती है कि सब कुछ लगभग सभी भाषाओं में काम करता है, लेकिन कुछ चुनिंदा — शायद सिर्फ एक — भाषा में नहीं। तुर्की और अज़रबैजानी में मिलने वाले i के दो प्रकार इसका प्रतिनिधि उदाहरण हैं। लैटिन लिपि में आम तौर पर सिर्फ बिंदु वाला छोटा i और बिना बिंदु वाला बड़ा I होता है, लेकिन इन भाषाओं में बिना बिंदु वाले ı/I और बिंदु वाले i/İ अलग-अलग जोड़ी बनाते हैं। उदाहरण के लिए, "इस्तांबुलİstanbul" का पहला अक्षर बिंदु वाला बड़ा İ है.
Unicode में तुर्की·अज़रबैजानी के i/I को अलग से encode नहीं किया गया है (क्योंकि वे वही लैटिन अक्षर हैं), इसलिए जो सॉफ़्टवेयर इन भाषाओं को ध्यान में नहीं रखते उनमें अक्सर समस्या आ जाती है, और कभी-कभी इसकी वजह से जानलेवा घटनाएँ भी हुई हैं। [1] इसे सही तरह से संभालने के लिए ऐसी Unicode लाइब्रेरी इस्तेमाल करनी चाहिए जो cultural information (locale) को ध्यान में रखती हो। Java या C# जैसी भाषाओं/एनवायरनमेंट में, जहाँ locale handling मौजूद है, यह बड़ी समस्या नहीं होती; बाकी जगहों पर ICU जैसी अलग लाइब्रेरी की ज़रूरत पड़ती है.
[1] https://gizmodo.com/a-cellphones-missing-dot-kills-two-people-puts-thr…
1 टिप्पणियां
तुर्की... शब्दों में अक्षरों की संख्या ज़्यादा होने की वजह से label/button की चौड़ाई को लेकर काफ़ी जूझना पड़ा था, यह याद है...