सिर्फ 5 सेकंड की आवाज़ से किसी खास व्यक्ति की आवाज़ को रियल-टाइम में क्लोन करने वाला ओपन सोर्स
(github.com)Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis (SV2TTS) पेपर का इम्प्लिमेंटेशन।
Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis (SV2TTS) पेपर का इम्प्लिमेंटेशन।
2 टिप्पणियां
अगर चेहरे और आवाज़ के synthesis की तकनीक आगे बढ़ती है, तो लगता है कि आखिरकार बाहरी रूप और आवाज़ के मायने बदल जाएंगे। बाहरी या भौतिक चीज़ों के आधार पर किसी व्यक्ति की पहचान करना अब संभव नहीं रहेगा। लगता है कि ऐसा दौर आएगा जहाँ इंसान के मन और उसके मूल स्वभाव पर ज़्यादा ध्यान दिया जाएगा।
YouTube डेमो वीडियो: https://www.youtube.com/watch?v=-O_hYhToKoA