AudioGen : स्थिति बताने वाले टेक्स्ट का उपयोग करके ऑडियो जनरेशन

xguru · 2022-10-04T10:28:48+09:00

"कुत्ता पार्क में भौंक रहा है", "हवा चल रही है और सीटी जैसी आवाज़ आ रही है", "बहुत से लोगों की जयकार के सामने एक आदमी भाषण दे रहा है" जैसी आवाज़ें जनरेट की जा सकती हैं ऑडियो जनरेशन में कई तरह की चुनौतियाँ होती हैं आवाज़ पैदा करने वाली वस्तुओं को अलग करना कठिन है, और वास्तविक वातावरण की विविध रिकॉर्डिंग स्थितियों के कारण यह और जटिल हो जाता है, साथ ही ऐसी परिस्थितियों के लिए annotations की कमी होने से मॉडल को प्रशिक्षित करना मुश्किल होता है इन समस्याओं को कम करने के लिए विभिन्न ऑडियो samples को मिलाने और मॉडल को कई sources को अलग करने की तकनीक आंतरिक रूप से सीखने देने वाली augmentation technique का प्रस्ताव किया गया है

(felixkreuk.github.io)

12 पॉइंट द्वारा xguru 2022-10-04 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

"कुत्ता पार्क में भौंक रहा है", "हवा चल रही है और सीटी जैसी आवाज़ आ रही है", "बहुत से लोगों की जयकार के सामने एक आदमी भाषण दे रहा है" जैसी आवाज़ें जनरेट की जा सकती हैं
ऑडियो जनरेशन में कई तरह की चुनौतियाँ होती हैं
- आवाज़ पैदा करने वाली वस्तुओं को अलग करना कठिन है, और वास्तविक वातावरण की विविध रिकॉर्डिंग स्थितियों के कारण यह और जटिल हो जाता है, साथ ही ऐसी परिस्थितियों के लिए annotations की कमी होने से मॉडल को प्रशिक्षित करना मुश्किल होता है
इन समस्याओं को कम करने के लिए विभिन्न ऑडियो samples को मिलाने और मॉडल को कई sources को अलग करने की तकनीक आंतरिक रूप से सीखने देने वाली augmentation technique का प्रस्ताव किया गया है

AudioGen : स्थिति बताने वाले टेक्स्ट का उपयोग करके ऑडियो जनरेशन

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.