24 पॉइंट द्वारा rayinclay 2026-03-22 | 13 टिप्पणियां | WhatsApp पर शेयर करें

नमस्ते, मैं पहले से superwhisper या spokenly जैसे मौजूदा वॉइस टाइपिंग टूल्स को 8bitdo micro गेमपैड से कनेक्ट करके इस्तेमाल कर रहा था। लेकिन किसी वजह से नेटवर्क latency खटकती रहती थी.

इसलिए मैं लोकल मॉडल्स को लगातार टेस्ट कर रहा था, और इस बार Qwen3-ASR मॉडल इस्तेमाल करके लगा कि बस यही है। यह काफी तेज है और performance भी cloud models से कम नहीं लगती, इसलिए इसी को लोकल में चलाकर वही ux देने के लिए मैंने vvrite बनाया। डिवाइस की performance पर निर्भर करता है, लेकिन यह काफी तेज चलता है और memory भी ज्यादा नहीं लेता।

vvrite एक ऐसा ऐप है जो macOS menu bar में hotkey (डिफ़ॉल्ट Option+Space) दबाते ही तुरंत रिकॉर्डिंग शुरू कर देता है, और दोबारा दबाने पर on-device AI से आवाज़ पहचानकर उसे मौजूदा input field में अपने-आप paste कर देता है। यह macOS 13 या उससे ऊपर के Apple Silicon Mac को सपोर्ट करता है। इसे GitHub Releases से signed/notarized DMG के रूप में सीधे इंस्टॉल किया जा सकता है.

13 टिप्पणियां

 
toida 2026-03-24

मैं handy आज़माने वाला था, लेकिन अगर यह Korean को बेहतर support करता है तो मुझे इसे इस्तेमाल करके देखना चाहिए। धन्यवाद

 
0xvicky 2026-03-23

मैं जो Korean speech recognition tool इस्तेमाल कर रहा था, वह थोड़ा खटक रहा था

फिर grok ने open source चीज़ों में यह recommend किया
(आखिर में बहुत छोटे अक्षरों में recommend किया था) तो मैंने इसे इस्तेमाल करके देखा

अच्छा लगा, इसलिए इसे customize करके इस्तेमाल कर रहा हूँ

तीन model और भी जोड़ दिए
notification sound बहुत तेज़ था, इसलिए sound control भी डाल दिया...
कुछ bugs भी थोड़े fix किए..

फिलहाल कुछ समय तक तो इसी के साथ
voice coding मज़े से करूँगा

कोड खोलकर देखा तो लगा कि यह project
किसी non-developer व्यक्ति द्वारा चलाया जा रहा है
इसलिए और भी support करने का मन होता है~~

जो लोग (मैं..) हमेशा सिर्फ सोचते रहते हैं
और टालते रहते हैं, उनसे तो सौ गुना बेहतर हैं 😂

यह देखकर भी कि superpowers के निशान बचे हुए हैं
सोचा, "अच्छा, लोग ऐसे भी काम करते हैं.."
ऐसा भी लगा~

 
xguru 2026-03-23

वाह, इसे इस्तेमाल करके देखा तो यह तेज़ है और अच्छा लगा। इसे अच्छे से इस्तेमाल करूंगा।

 
rayinclay 2026-03-24

धन्यवाद!

 
wedding 2026-03-23

मैं Android के लिए एक voice command ऐप बना रहा हूँ, और qwen वाकई काफ़ी अच्छा लगा। लेकिन अभी तक optimization नहीं कर पाया हूँ, इसलिए अभी whisper base को Korean dataset पर fine-tune करके इस्तेमाल कर रहा हूँ.

 
jwseo 2026-03-22

क्या यह Whisper large v3 turbo से बेहतर है? मैं अभी भी वही इस्तेमाल कर रहा हूँ, इसलिए जानना चाहता हूँ कि क्या आपने इसकी तुलना की है। Moonshine भी यहीं देखकर सोचा था कि इस्तेमाल करके देखूँ, लेकिन देखते-देखते 3 हफ्ते बीत गए haha

 
rayinclay 2026-03-22

कोरियन के लिए यह Whisper से निश्चित रूप से बेहतर है!
Moonshine में parakeet के मुकाबले कोई बड़ा अंतर नहीं था.

 
hoonix 2026-03-22

handy से क्या फ़र्क है?

 
rayinclay 2026-03-22

इस तरह के ऐप्स का UX लगभग एक जैसा ही होता है। vvrite भी बहुत अलग नहीं है। आखिरकार बात model performance की ही है।
अगर आप सिर्फ अंग्रेज़ी इस्तेमाल करेंगे, तो handy में सपोर्ट होने वाला parakeet काफ़ी है,
लेकिन कोरियाई सपोर्ट के लिए, मेरे अनुभव में Qwen3-ASR सबसे अच्छा विकल्प लगा।
लेकिन इसे सपोर्ट करने वाली कोई जगह नहीं थी, इसलिए मैंने खुद बना लिया।

 
jhk0530 2026-03-22

वाह, यह तो शानदार टूल है।
मेरे हिसाब से अगर ऐसा UI भी जोड़ दिया जाए जहाँ उपयोग निर्देश (मैनुअल) दोबारा देखे जा सकें, तो और अच्छा होगा। शुरुआत में इंस्टॉल करते समय मैंने बस यूँ ही सब दबा दिया, इसलिए इसे कैसे इस्तेमाल करना है, यह थोड़ा कन्फ्यूजिंग लगा, हाहा

 
jhk0530 2026-03-22

इस टूल का नाम कैसे पढ़ा जाता है? क्या यह "राइट" है?

 
rayinclay 2026-03-22

राय के लिए धन्यवाद! इसे अगली रिलीज़ में शामिल करूँगा.
इसे "Light" के इरादे से रखा था… लेकिन मुझे भी ठीक से नहीं पता कि इसे कैसे पढ़ना बेहतर होगा।

 
nemorize 2026-03-22

ब्राइट कैसा है?
vvrite - vwrite - bright, इन तीनों अर्थों को साथ में समेटे हुए...