OpenVoice v2 - बहुमुखी इंस्टेंट वॉइस क्लोनिंग

xguru · 2024-04-29T09:31:01+09:00

v2 जारी होने के साथ बेहतर ऑडियो क्वालिटी, कोरियाई सहित बहुभाषी सपोर्ट, और commercial use भी मुफ्त वक्ता की सिर्फ एक छोटी audio clip से आवाज़ क्लोन की जा सकती है और कई भाषाओं में speech generate की जा सकती है यह सिर्फ reference speaker की voice tone की नकल नहीं करता, बल्कि emotion, intonation, rhythm, pauses और stress जैसे speech style को बारीकी से नियंत्रित भी कर सकता है training set में शामिल न होने वाली भाषाओं के लिए भी zero-shot cross-lingual voice cloning संभव commercially available API की तुलना में दर्जनों गुना कम compute cost पर बेहतरीन performance देता है V1 की सभी सुविधाओं के साथ V2 में हुए बदलाव (जारी: 2024/04) बेहतर ऑडियो क्वालिटी: V2 ने बेहतर ऑडियो क्वालिटी देने वाली अलग training strategy अपनाई है मूल बहुभाषी सपोर्ट: English, Spanish, French, Chinese, Japanese और Korean को OpenVoice V2 में मूल रूप से सपोर्ट किया जाता है मुफ्त commercial use: अप्रैल 2024 से V2 और V1 दोनों MIT license के तहत जारी किए गए हैं, इसलिए commercial use भी मुफ्त है

(github.com/myshell-ai)

34 पॉइंट द्वारा xguru 2024-04-29 | 1 टिप्पणियां | WhatsApp पर शेयर करें

v2 जारी होने के साथ बेहतर ऑडियो क्वालिटी, कोरियाई सहित बहुभाषी सपोर्ट, और commercial use भी मुफ्त
वक्ता की सिर्फ एक छोटी audio clip से आवाज़ क्लोन की जा सकती है और कई भाषाओं में speech generate की जा सकती है
यह सिर्फ reference speaker की voice tone की नकल नहीं करता, बल्कि emotion, intonation, rhythm, pauses और stress जैसे speech style को बारीकी से नियंत्रित भी कर सकता है
training set में शामिल न होने वाली भाषाओं के लिए भी zero-shot cross-lingual voice cloning संभव
commercially available API की तुलना में दर्जनों गुना कम compute cost पर बेहतरीन performance देता है
V1 की सभी सुविधाओं के साथ V2 में हुए बदलाव (जारी: 2024/04)
- बेहतर ऑडियो क्वालिटी: V2 ने बेहतर ऑडियो क्वालिटी देने वाली अलग training strategy अपनाई है
- मूल बहुभाषी सपोर्ट: English, Spanish, French, Chinese, Japanese और Korean को OpenVoice V2 में मूल रूप से सपोर्ट किया जाता है
- मुफ्त commercial use: अप्रैल 2024 से V2 और V1 दोनों MIT license के तहत जारी किए गए हैं, इसलिए commercial use भी मुफ्त है

1 टिप्पणियां

xguru 2024-04-29

GN⁺: OpenVoice : बहुमुखी इंस्टेंट वॉइस क्लोनिंग तकनीक
GN⁺: OpenVoice - बहुमुखी इंस्टेंट वॉइस क्लोनिंग तकनीक

यह GN+ पर कुछ बार पोस्ट हो चुका है, और इस बार V2 आने के साथ multilingual support जोड़ा गया है, जिसमें Korean भी शामिल है.

OpenVoice v2 - बहुमुखी इंस्टेंट वॉइस क्लोनिंग

संबंधित पढ़ाई

1 टिप्पणियां