Meta ने वॉइस के लिए Generative AI मॉडल Voicebox पेश किया

xguru · 2023-06-21T11:06:02+09:00

इमेज/टेक्स्ट जनरेशन AI की तरह, यह विभिन्न स्टाइल में उच्च-गुणवत्ता वाले ऑडियो क्लिप बना सकता है दिए गए ऑडियो सैंपल को संशोधित भी कर सकता है 6 भाषाओं में स्पीच synthesize करने के साथ-साथ, noise removal, content editing, style transfer, और विविध सैंपल जनरेशन भी संभव मौजूदा वॉइस जनरेशन AI को हर टास्क के लिए सावधानी से तैयार किए गए training data की आवश्यकता होती थी। Voicebox एक नई विधि का उपयोग करके raw audio और transcription data पर train किया गया है इसे अंग्रेज़ी, फ़्रेंच, स्पैनिश, जर्मन, पोलिश और पुर्तगाली की public domain audiobooks के 50,000 घंटे से अधिक डेटा पर train किया गया

(ai.facebook.com)

15 पॉइंट द्वारा xguru 2023-06-21 | 2 टिप्पणियां | WhatsApp पर शेयर करें

इमेज/टेक्स्ट जनरेशन AI की तरह, यह विभिन्न स्टाइल में उच्च-गुणवत्ता वाले ऑडियो क्लिप बना सकता है
दिए गए ऑडियो सैंपल को संशोधित भी कर सकता है
6 भाषाओं में स्पीच synthesize करने के साथ-साथ, noise removal, content editing, style transfer, और विविध सैंपल जनरेशन भी संभव
मौजूदा वॉइस जनरेशन AI को हर टास्क के लिए सावधानी से तैयार किए गए training data की आवश्यकता होती थी। Voicebox एक नई विधि का उपयोग करके raw audio और transcription data पर train किया गया है
इसे अंग्रेज़ी, फ़्रेंच, स्पैनिश, जर्मन, पोलिश और पुर्तगाली की public domain audiobooks के 50,000 घंटे से अधिक डेटा पर train किया गया

2 टिप्पणियां

zer0ne 2023-06-21

पता नहीं, क्या इसे गानों से सिर्फ vocals हटाकर high-quality MR बनाने में इस्तेमाल किया जा सकता है।

cosine20 2023-06-22

उसके लिए पहले से ही इस्तेमाल लायक open source मौजूद है:
https://github.com/Anjok07/ultimatevocalremovergui

Meta ने वॉइस के लिए Generative AI मॉडल Voicebox पेश किया

संबंधित पढ़ाई

2 टिप्पणियां