- ओपन सोर्स grammar checker। मशहूर commercial service Grammarly के बजाय इस्तेमाल किया जा सकने वाला प्रोडक्ट
- इसे कोई भी मुफ्त में इस्तेमाल कर सकता है, और इसका code व algorithm पारदर्शी रूप से सार्वजनिक हैं
- यह अंग्रेज़ी टेक्स्ट में grammar, style, spelling issues को अपने-आप पहचानने और सुधारने की सुविधा देता है
- developers, writers, students जैसे अलग-अलग user groups के लिए उपयुक्त है और इसमें स्वतंत्र customization की संभावना है
- server self-hosting और local execution संभव होने से privacy और data protection के मामले में फायदे मिलते हैं
Harper परिचय
- Harper, Grammarly जैसी सुविधाएँ देने वाला open source grammar और style checker है
- यह पूरी तरह मुफ्त उपलब्ध है, और कोई भी इसके source code को स्वतंत्र रूप से देख व उपयोग कर सकता है
- यह spelling check, grammar error detection, style improvement suggestions जैसी अंग्रेज़ी टेक्स्ट proofreading सुविधाएँ प्रदान करता है
- उपयोगकर्ता Harper को local server या अपनी infrastructure पर install करके data privacy को बेहतर बना सकते हैं
- इसकी scalability और customization बेहतरीन है, इसलिए अपनी ज़रूरत के अनुसार algorithm modification और feature addition करना आसान है
मुख्य सुविधाएँ और फायदे
- यह open source project होने के कारण service dependency के बिना internal ideas को manage और improve किया जा सकता है
- यह अंग्रेज़ी के लिए optimized है, लेकिन आगे चलकर multilingual support के विस्तार की संभावना भी रखता है
- community support सक्रिय है, इसलिए feedback और feature improvement पर लगातार काम हो रहा है
- server-based या direct installation तरीके से यह उच्च flexibility प्रदान करता है
उपयोग के लिए उपयुक्त लोग और लागू करने के उदाहरण
- software engineers, technical writers, students जैसे अंग्रेज़ी लेखन की गुणवत्ता सुधारने में रुचि रखने वाले उपयोगकर्ताओं के लिए उपयुक्त
- उन संगठनों के लिए फायदेमंद जो personal data को external services के सामने उजागर किए बिना अपना document proofreading process बनाना चाहते हैं
- custom rules, workflow integration जैसी advanced customization की ज़रूरत वाले environments में प्रभावी
2 टिप्पणियां
Hacker News टिप्पणियाँ
ज़्यादातर दस्तावेज़ों के लिए Harper 10ms के भीतर सुझाव दे सकता है; 10l या 10kg जैसी इकाइयाँ तो सहज लगती हैं, लेकिन 10ms अजीब क्यों लगता है, यह जिज्ञासा
व्याकरण नियमों का open source प्रोग्राम में hardcode होना और उन्हें खुद बदल सकना, prompt tuning या LLM के training data में अप्रत्यक्ष रूप से hardcode होने की तुलना में कहीं ज़्यादा पसंद आता है Neovim के लिए LSP सेटअप काफ़ी अच्छा दिखता है Neovim एकीकरण दस्तावेज़ लगता है, ऐसे ही टूल भविष्य हैं सुझाव कि Automattic को अपनी होमपेज पर इस बात को ज़ोर देकर बताना चाहिए
व्यक्तिगत रूप से, इसमें LLM का इस्तेमाल न होना एक बड़ा फ़ायदा लगता है Grammarly में AI फीचर जुड़ने के बाद वह लगातार अस्थिर हुआ है; एक घंटे पहले कॉमा हटाने को कहता है, फिर उसके बाद वापस लगाने को कहता है, यानी एकरूपता नहीं रहती
LLM-आधारित सामान्य मॉडल वास्तव में punctuation में अक्सर उलझ जाते हैं; यह कितनी स्पष्ट कमी है, इसका अनुभव हुआ है, और हैरानी होती है कि Grammarly जैसी सेवाएँ इसे यूँ ही छोड़ देती हैं
पिछले एक साल में Grammarly और gboard की prediction quality बहुत ख़राब हो गई है
जिज्ञासा कि क्या LLM-आधारित ऐसा कोई मिलता-जुलता टूल है LLM हमेशा बेहतर नहीं होता, लेकिन दोनों तरीकों का फ़र्क तुलना करके देखना दिलचस्प होगा
punctuation से जुड़े सुझावों का हर पल बदलना अंग्रेज़ी शिक्षकों जैसा है, इस पर मज़ाकिया प्रतिक्रिया
LanguageTool (Grammarly का प्रतिस्पर्धी) भी open source है और उसे लोकल में सीधे चलाया जा सकता है GitHub, Docker image मैं मुख्य रूप से Docker कंटेनर में LanguageTool को लोकल पर चलाता हूँ Harper को विस्तार से इस्तेमाल नहीं किया, लेकिन उसके बारे में पहले से जानता था; विकल्पों की विविधता अच्छी लगती है इच्छा कि Harper की वेबसाइट पर यह बात साफ़ तौर पर लिखी हो कि प्रतिस्पर्धी टूल्स में से एक लोकल पर भी चल सकता है
“Me and Jennifer went to have seen the ducks cousin.” में कोई error बिल्कुल detect नहीं होता इशारा कि Grammarly के स्तर तक पहुँचने के लिए ऐसे नियमों में और काफ़ी सुधार चाहिए होगा
शुरुआत में प्रभावशाली लगा, लेकिन कई टेस्ट के बाद निष्कर्ष कि यह काफ़ी बुनियादी गलतियाँ भी नहीं पकड़ पाता, इसलिए प्रदर्शन असंगत है
इसी तरह “My name John. What your name? What day today?” को भी grammar error के रूप में नहीं पकड़ा जाता
सवाल कि ऐसे टेस्ट वाक्य आखिर क्या साबित करते हैं
राय कि डाउनलोड या extension install करने से पहले डेमो या टेस्ट करने वाली वेबसाइट हो तो बहुत उपयोगी होगा Firefox extension इस पेज पर ले जाता है, लेकिन लंबा टेक्स्ट paste करने पर highlighting ठीक से काम नहीं करती
जिज्ञासा कि language learning टूल्स में LLM का इस्तेमाल क्यों नहीं किया जाता लगता है कि language-related समस्याएँ LLM को 100% सौंपी जा सकती हैं सवाल कि क्या किसी ने ChatGPT को अंग्रेज़ी में गलती करते नहीं देखा है
Grammarly में AI फीचर मज़बूत होने के बाद, उसने “wasn't” को तोड़कर “was trulyn't” जैसी अजीब सिफ़ारिशें भी दी हैं संबंधित छवि
LLM की गलतियाँ काफ़ी बार देखी गई हैं, और कभी-कभी बहुत अजीब सुझाव भी मिलते हैं बेशक ज़्यादातर समय यह बहुत अच्छा काम करता है, लेकिन कभी भी पूरी तरह “भरोसेमंद” स्तर तक नहीं पहुँचता, बल्कि कई बार उपयोगकर्ता की गलती को ही दोहरा देता है
यह भी इशारा कि ऐसे language learning टूल्स का इस्तेमाल अक्सर असल में भाषा “सीखने” से बचने के लिए किया जाता है
जिज्ञासा कि Grammarly का target market कौन है क्या इसका लक्ष्य अंग्रेज़ी को दूसरी भाषा के रूप में इस्तेमाल करने वाले पेशेवर लोग हैं
परिचय कि यह code comments की grammar checking तक संभालने वाला एक शानदार LSP server देता है LSP दस्तावेज़
चूँकि यह Automattic का बनाया हुआ प्रोडक्ट है, इसलिए सफल होने पर Matt इसे मुनाफ़े के लिए बिगाड़ देगा—इस चिंता से इस्तेमाल करने में हिचक
जवाब कि चूँकि यह open source (FOSS) है, अगर सबसे बुरा भी हुआ तो community आख़िरी अच्छे version को fork करके विकास जारी रख सकती है
यही तथ्य (कि यह Automattic का प्रोडक्ट है) इस्तेमाल न करने के लिए काफ़ी है, ऐसा सख़्त रुख़
आह, 10l नहीं 10L!