- v2 जारी होने के साथ बेहतर ऑडियो क्वालिटी, कोरियाई सहित बहुभाषी सपोर्ट, और commercial use भी मुफ्त
- वक्ता की सिर्फ एक छोटी audio clip से आवाज़ क्लोन की जा सकती है और कई भाषाओं में speech generate की जा सकती है
- यह सिर्फ reference speaker की voice tone की नकल नहीं करता, बल्कि emotion, intonation, rhythm, pauses और stress जैसे speech style को बारीकी से नियंत्रित भी कर सकता है
- training set में शामिल न होने वाली भाषाओं के लिए भी zero-shot cross-lingual voice cloning संभव
- commercially available API की तुलना में दर्जनों गुना कम compute cost पर बेहतरीन performance देता है
- V1 की सभी सुविधाओं के साथ V2 में हुए बदलाव (जारी: 2024/04)
- बेहतर ऑडियो क्वालिटी: V2 ने बेहतर ऑडियो क्वालिटी देने वाली अलग training strategy अपनाई है
- मूल बहुभाषी सपोर्ट: English, Spanish, French, Chinese, Japanese और Korean को OpenVoice V2 में मूल रूप से सपोर्ट किया जाता है
- मुफ्त commercial use: अप्रैल 2024 से V2 और V1 दोनों MIT license के तहत जारी किए गए हैं, इसलिए commercial use भी मुफ्त है
1 टिप्पणियां
GN⁺: OpenVoice : बहुमुखी इंस्टेंट वॉइस क्लोनिंग तकनीक
GN⁺: OpenVoice - बहुमुखी इंस्टेंट वॉइस क्लोनिंग तकनीक
यह GN+ पर कुछ बार पोस्ट हो चुका है, और इस बार V2 आने के साथ multilingual support जोड़ा गया है, जिसमें Korean भी शामिल है.