vvrite — ओपन सोर्स macOS on-device AI वॉइस टाइपिंग ऐप
(github.com/shaircast)नमस्ते, मैं पहले से superwhisper या spokenly जैसे मौजूदा वॉइस टाइपिंग टूल्स को 8bitdo micro गेमपैड से कनेक्ट करके इस्तेमाल कर रहा था। लेकिन किसी वजह से नेटवर्क latency खटकती रहती थी.
इसलिए मैं लोकल मॉडल्स को लगातार टेस्ट कर रहा था, और इस बार Qwen3-ASR मॉडल इस्तेमाल करके लगा कि बस यही है। यह काफी तेज है और performance भी cloud models से कम नहीं लगती, इसलिए इसी को लोकल में चलाकर वही ux देने के लिए मैंने vvrite बनाया। डिवाइस की performance पर निर्भर करता है, लेकिन यह काफी तेज चलता है और memory भी ज्यादा नहीं लेता।
vvrite एक ऐसा ऐप है जो macOS menu bar में hotkey (डिफ़ॉल्ट Option+Space) दबाते ही तुरंत रिकॉर्डिंग शुरू कर देता है, और दोबारा दबाने पर on-device AI से आवाज़ पहचानकर उसे मौजूदा input field में अपने-आप paste कर देता है। यह macOS 13 या उससे ऊपर के Apple Silicon Mac को सपोर्ट करता है। इसे GitHub Releases से signed/notarized DMG के रूप में सीधे इंस्टॉल किया जा सकता है.
13 टिप्पणियां
मैं handy आज़माने वाला था, लेकिन अगर यह Korean को बेहतर support करता है तो मुझे इसे इस्तेमाल करके देखना चाहिए। धन्यवाद
मैं जो Korean speech recognition tool इस्तेमाल कर रहा था, वह थोड़ा खटक रहा था
फिर grok ने open source चीज़ों में यह recommend किया
(आखिर में बहुत छोटे अक्षरों में recommend किया था) तो मैंने इसे इस्तेमाल करके देखा
अच्छा लगा, इसलिए इसे customize करके इस्तेमाल कर रहा हूँ
तीन model और भी जोड़ दिए
notification sound बहुत तेज़ था, इसलिए sound control भी डाल दिया...
कुछ bugs भी थोड़े fix किए..
फिलहाल कुछ समय तक तो इसी के साथ
voice coding मज़े से करूँगा
कोड खोलकर देखा तो लगा कि यह project
किसी non-developer व्यक्ति द्वारा चलाया जा रहा है
इसलिए और भी support करने का मन होता है~~
जो लोग (मैं..) हमेशा सिर्फ सोचते रहते हैं
और टालते रहते हैं, उनसे तो सौ गुना बेहतर हैं 😂
यह देखकर भी कि superpowers के निशान बचे हुए हैं
सोचा, "अच्छा, लोग ऐसे भी काम करते हैं.."
ऐसा भी लगा~
वाह, इसे इस्तेमाल करके देखा तो यह तेज़ है और अच्छा लगा। इसे अच्छे से इस्तेमाल करूंगा।
धन्यवाद!
मैं Android के लिए एक voice command ऐप बना रहा हूँ, और qwen वाकई काफ़ी अच्छा लगा। लेकिन अभी तक optimization नहीं कर पाया हूँ, इसलिए अभी whisper base को Korean dataset पर fine-tune करके इस्तेमाल कर रहा हूँ.
क्या यह Whisper large v3 turbo से बेहतर है? मैं अभी भी वही इस्तेमाल कर रहा हूँ, इसलिए जानना चाहता हूँ कि क्या आपने इसकी तुलना की है। Moonshine भी यहीं देखकर सोचा था कि इस्तेमाल करके देखूँ, लेकिन देखते-देखते 3 हफ्ते बीत गए haha
कोरियन के लिए यह Whisper से निश्चित रूप से बेहतर है!
Moonshine में parakeet के मुकाबले कोई बड़ा अंतर नहीं था.
handy से क्या फ़र्क है?
इस तरह के ऐप्स का UX लगभग एक जैसा ही होता है। vvrite भी बहुत अलग नहीं है। आखिरकार बात model performance की ही है।
अगर आप सिर्फ अंग्रेज़ी इस्तेमाल करेंगे, तो handy में सपोर्ट होने वाला parakeet काफ़ी है,
लेकिन कोरियाई सपोर्ट के लिए, मेरे अनुभव में Qwen3-ASR सबसे अच्छा विकल्प लगा।
लेकिन इसे सपोर्ट करने वाली कोई जगह नहीं थी, इसलिए मैंने खुद बना लिया।
वाह, यह तो शानदार टूल है।
मेरे हिसाब से अगर ऐसा UI भी जोड़ दिया जाए जहाँ उपयोग निर्देश (मैनुअल) दोबारा देखे जा सकें, तो और अच्छा होगा। शुरुआत में इंस्टॉल करते समय मैंने बस यूँ ही सब दबा दिया, इसलिए इसे कैसे इस्तेमाल करना है, यह थोड़ा कन्फ्यूजिंग लगा, हाहा
इस टूल का नाम कैसे पढ़ा जाता है? क्या यह "राइट" है?
राय के लिए धन्यवाद! इसे अगली रिलीज़ में शामिल करूँगा.
इसे "Light" के इरादे से रखा था… लेकिन मुझे भी ठीक से नहीं पता कि इसे कैसे पढ़ना बेहतर होगा।
ब्राइट कैसा है?
vvrite - vwrite - bright, इन तीनों अर्थों को साथ में समेटे हुए...