Pandoc-आधारित Arae-a Hangeul कन्वर्टर - md, html, docx को hwpx में बदलने वाले ओपन सोर्स टूल का परिचय
(github.com/msjang)सरकारी अनुसंधान संस्थान में काम करते हुए 9 साल हो गए हैं, और HWP दस्तावेज़ कार्य की असुविधाओं को हल करने के लिए इसे विकसित किया।
विकास पृष्ठभूमि
- 2018: Python सीखने की शुरुआती अवधि में, regex-आधारित HML/HWPML कन्वर्टर का प्रयास - https://github.com/msjang/md2hml
- जनवरी 2025: hwpfy विकास
- रीयल-टाइम collaborative editing wiki के आधार पर लगभग 20 लोगों की साप्ताहिक कार्य-रिपोर्टों का संकलन
- wiki → DOCX export → सरकारी फ़ॉर्मेट लागू किया हुआ DOCX में रूपांतरण (hwpfy) → Hangeul app में खोलकर HWPX के रूप में save → संस्थान के वरिष्ठ विभाग के साथ HWPX के रूप में साझा
- दिसंबर 2025: pypandoc-hwpx
- अब लगा कि पर्याप्त अनुभव जमा हो गया है, इसलिए गंभीरता से समय लगाकर इसे विकसित किया।
विकास विधि
- DOCX को इच्छित फ़ॉर्मेट में बनाया और उसे HWPX के रूप में save किया।
- बने हुए DOCX और HWPX को unzip करके XML देखा, अनावश्यक properties हटाईं और उसे परिष्कृत किया। फिर यह भी जाँचा कि वह Word और Hangeul app में सही से खुलता है या नहीं।
- md, html, docx, hwpx फ़ॉर्मेट की तुलना करने वाला एक दस्तावेज़ बनाया। - https://github.com/msjang/pypandoc-hwpx/…
- मूल रूप से ऊपर दिए गए
format_comparison.mdको देखकर LLM से coding करवाने का इरादा था, लेकिन फिर समझ आया कि मेरे पास पहले से ही सही उत्तर वाला HWPX मौजूद है। - Antigravity (Gemini Pro 3) के साथ कई बार feedback लेते हुए इसे बनाया। मनचाहा फ़ॉर्मेट नहीं निकल रहा था, इसलिए XML को बारीकी से खोलकर देखते हुए feedback दिया। फ़ॉर्मेट तुलना दस्तावेज़ का सीधे उल्लेख नहीं किया, लेकिन उसकी सामग्री को समझ लेना review करने में बहुत मददगार रहा।
आगे का काम
Pypandoc से Python हटाकर Haskell में coding करना चाहता हूँ और Pandoc में HWPX writer का योगदान देना चाहता हूँ.
अभी कोई टिप्पणी नहीं है.