34 पॉइंट द्वारा xguru 2024-04-29 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • v2 जारी होने के साथ बेहतर ऑडियो क्वालिटी, कोरियाई सहित बहुभाषी सपोर्ट, और commercial use भी मुफ्त
  • वक्ता की सिर्फ एक छोटी audio clip से आवाज़ क्लोन की जा सकती है और कई भाषाओं में speech generate की जा सकती है
  • यह सिर्फ reference speaker की voice tone की नकल नहीं करता, बल्कि emotion, intonation, rhythm, pauses और stress जैसे speech style को बारीकी से नियंत्रित भी कर सकता है
  • training set में शामिल न होने वाली भाषाओं के लिए भी zero-shot cross-lingual voice cloning संभव
  • commercially available API की तुलना में दर्जनों गुना कम compute cost पर बेहतरीन performance देता है
  • V1 की सभी सुविधाओं के साथ V2 में हुए बदलाव (जारी: 2024/04)
    • बेहतर ऑडियो क्वालिटी: V2 ने बेहतर ऑडियो क्वालिटी देने वाली अलग training strategy अपनाई है
    • मूल बहुभाषी सपोर्ट: English, Spanish, French, Chinese, Japanese और Korean को OpenVoice V2 में मूल रूप से सपोर्ट किया जाता है
    • मुफ्त commercial use: अप्रैल 2024 से V2 और V1 दोनों MIT license के तहत जारी किए गए हैं, इसलिए commercial use भी मुफ्त है

1 टिप्पणियां

 
xguru 2024-04-29

GN⁺: OpenVoice : बहुमुखी इंस्टेंट वॉइस क्लोनिंग तकनीक
GN⁺: OpenVoice - बहुमुखी इंस्टेंट वॉइस क्लोनिंग तकनीक

यह GN+ पर कुछ बार पोस्ट हो चुका है, और इस बार V2 आने के साथ multilingual support जोड़ा गया है, जिसमें Korean भी शामिल है.