9 पॉइंट द्वारा mrchypark 2022-04-03 | 1 टिप्पणियां | WhatsApp पर शेयर करें

elbird, मेरे द्वारा पहले सार्वजनिक किए गए kiwigo के अंतिम लक्ष्य वाला पैकेज है।

R में कई morphological analysis packages मौजूद हैं, जिनमें KoNLP (Java आधारित, फिलहाल * CRAN से हट चुका है) और RcppMecab (mecab आधारित, तेज़, लेकिन मूल पाठ को restore नहीं करता) प्रमुख रूप से इस्तेमाल होते रहे हैं, और इनके अलावा भी कुछ पैकेज हैं।

जब KoNLP मुख्यधारा में था, तब JDK install करना कठिन होने और अब उसके CRAN पर न होने की स्थिति साथ आई। इसी वजह से मैं ऐसा नया morphological analysis package CRAN पर लाने की कोशिश करता रहा, जिसे install करना आसान हो और जिसका maintenance लगातार होता रहे।

इसी दौरान मुझे kiwi के बारे में पता चला, जिसे बेहतरीन portability वाले C++ में विकसित किया जा रहा है।

काफी समय बाद आखिरकार मैं उसके C++ functions को wrap करके R package बना सका और उसे CRAN पर register भी कर सका।

फिलहाल 0.1.1 version registered है, और जल्द ही इसे 0.1.2 में update करने की योजना है।
अभी implement की गई functionalities बुनियादी उपयोग के स्तर तक उपलब्ध हैं, और मेरा इरादा kiwi की सभी features को implement करने के बाद उसे kiwi version के साथ align करने का है।

README में बुनियादी उपयोग के code examples हैं, और R ecosystem के प्रसिद्ध text analysis package tidytext के साथ इस्तेमाल के लिए features पर भी विचार किया गया है।

कृपया इसमें रुचि और समर्थन दें।

* CRAN: R का आधिकारिक package repository. यह एक managed repository है जहाँ automatic tests और administrator review होते हैं, और यह evergreen policy (test fail होने पर registration रद्द) अपनाता है, इसलिए लगातार maintenance की आवश्यकता होती है।

1 टिप्पणियां

 
mrchypark 2022-04-03

मुझे cpp development और compilation का कम अनुभव है, इसलिए इस बारे में काफी मदद की ज़रूरत है.
अगर कोई सलाह दे सकते हैं, तो कृपया issue tab देखें.