- वॉइस रिकग्निशन और प्राकृतिक भाषा कमांड्स को जोड़ने वाला आवाज़-आधारित दस्तावेज़ एडिटर
- उपयोगकर्ता अगर कहे, "इसे सूची में बदल दो" या "इस किताब के पेज 86 पर inline citation जोड़ दो", तो यह संबंधित कमांड चलाता है
- वॉइस रिकग्निशन सॉफ़्टवेयर अब भी असुविधाजनक और नाज़ुक अनुभव प्रदान करता है
- सॉफ़्टवेयर सटीकता की प्रतिस्पर्धा करते हैं, लेकिन जनरेट किए गए टेक्स्ट की नाज़ुक प्रकृति को नहीं संभालते
- विशेष कमांड्स सीखने पड़ते हैं, और यह कीबोर्ड के विकल्प के रूप में पर्याप्त नहीं है
- Aqua Voice का समाधान
- Aqua उपयोगकर्ता की बात को ज्यों का त्यों लिख सकता है, कमांड चला सकता है, या कही गई बात को इच्छित लेखन के रूप में परिष्कृत करके सुधार सकता है
- अगर बोलते समय अटकन हो या वाक्य कई बार कहा जाए, तो Aqua केवल अंतिम संस्करण चुनकर उसे टेक्स्ट में बदलता है
- Aqua Voice की विज़न और तकनीक
- अधिक प्राकृतिक वॉइस रिकग्निशन अनुभव और सहयोगी AI लेखन अनुभव देने का लक्ष्य
- रियल-टाइम में मॉडल से लगातार जुड़े रहने वाली streaming-आधारित सेवा प्रदान करता है
- 6 मॉडल मिलकर इरादे के अनुसार दस्तावेज़ को ट्रांसक्राइब, इंटरप्रेट और री-राइट करते हैं
- रियल-टाइम सटीकता बेहतर करने के लिए MoE(Mixture of Experts) transcription का उपयोग
1 टिप्पणियां
Hacker News की राय
मैं patient letters आदि dictate करने के लिए इसका उपयोग करना चाहूँगा। local models/HIPAA compliance अभी बहुत दूर है क्या?
मैं, एक ऐसा neurodivergent व्यक्ति जो voice की तुलना में text के साथ कहीं बेहतर काम करता है, इस idea को बिल्कुल पसंद करता हूँ। मेरा एकमात्र फ़ीडबैक है... मैं इसे ज़्यादा control के साथ चलाना चाहूँगा। मैं पहले से ही LLMs को locally चला रहा हूँ (जैसे LM Studio), और whisper जैसी चीज़ें भी चला सकता हूँ। मैं समझता हूँ कि इसे open source करना (या source code उपलब्ध कराना) commercialize करने की कोशिशों के खिलाफ़ हो सकता है। फिर भी Red Hat जैसे कुछ विकल्प हो सकते हैं, जहाँ business use के लिए शुल्क लिया जाए और personal use के लिए local runs मुफ्त रखे जाएँ।
एक तरफ़ आपके पास उस क्षेत्र में मज़बूत first-mover advantage है जहाँ बहुत से लोगों को लाभ हो सकता है और वे इसका उपयोग कर सकते हैं, लेकिन दूसरी तरफ़ कोई व्यक्ति कई LLM outputs की कई layers को जोड़कर प्रतिस्पर्धा दे सकता है (ऐसे projects अक्सर open source होते हैं, हालाँकि कभी-कभी कम 'polished' होते हैं)। अगर आप अच्छा सौदा पेश करें, तो बड़ी सफलता का मौका हो सकता है। शुभकामनाएँ!