- इमेज/टेक्स्ट जनरेशन AI की तरह, यह विभिन्न स्टाइल में उच्च-गुणवत्ता वाले ऑडियो क्लिप बना सकता है
- दिए गए ऑडियो सैंपल को संशोधित भी कर सकता है
- 6 भाषाओं में स्पीच synthesize करने के साथ-साथ, noise removal, content editing, style transfer, और विविध सैंपल जनरेशन भी संभव
- मौजूदा वॉइस जनरेशन AI को हर टास्क के लिए सावधानी से तैयार किए गए training data की आवश्यकता होती थी। Voicebox एक नई विधि का उपयोग करके raw audio और transcription data पर train किया गया है
- इसे अंग्रेज़ी, फ़्रेंच, स्पैनिश, जर्मन, पोलिश और पुर्तगाली की public domain audiobooks के 50,000 घंटे से अधिक डेटा पर train किया गया
2 टिप्पणियां
पता नहीं, क्या इसे गानों से सिर्फ vocals हटाकर high-quality MR बनाने में इस्तेमाल किया जा सकता है।
उसके लिए पहले से ही इस्तेमाल लायक open source मौजूद है:
https://github.com/Anjok07/ultimatevocalremovergui