सिर्फ 5 सेकंड की आवाज़ से किसी खास व्यक्ति की आवाज़ को रियल-टाइम में क्लोन करने वाला ओपन सोर्स

(github.com)

3 पॉइंट द्वारा xguru 2019-11-05 | 2 टिप्पणियां | WhatsApp पर शेयर करें

Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis (SV2TTS) पेपर का इम्प्लिमेंटेशन।

2 टिप्पणियां

sduck4 2019-11-05

अगर चेहरे और आवाज़ के synthesis की तकनीक आगे बढ़ती है, तो लगता है कि आखिरकार बाहरी रूप और आवाज़ के मायने बदल जाएंगे। बाहरी या भौतिक चीज़ों के आधार पर किसी व्यक्ति की पहचान करना अब संभव नहीं रहेगा। लगता है कि ऐसा दौर आएगा जहाँ इंसान के मन और उसके मूल स्वभाव पर ज़्यादा ध्यान दिया जाएगा।

xguru 2019-11-05

YouTube डेमो वीडियो: https://www.youtube.com/watch?v=-O_hYhToKoA

सिर्फ 5 सेकंड की आवाज़ से किसी खास व्यक्ति की आवाज़ को रियल-टाइम में क्लोन करने वाला ओपन सोर्स

संबंधित पढ़ाई

2 टिप्पणियां