Google ने End-to-End neural audio codec SoundStream पेश किया

xguru · 2021-08-16T09:22:01+09:00

speech और music, दोनों पर लागू होने वाला पहला neural network codec → इसे real time में smartphone CPU पर चलाया जा सकता है → यह high-quality audio के साथ साफ speech, शोर और reverberation वाली speech, music, और environmental sounds सहित विभिन्न sound types को encode कर सकता है दोनों endpoints पर neural network का उपयोग करके train किया गया है, इसलिए यह compression और audio quality enhancement एक साथ करता है और high-quality audio प्रदान करता है → SoundStream 3kbps पर Opus 12 kbps से बेहतर है, और EVS 9.6bps के करीब quality देता है → यह 3.2x-4x कम bits का उपयोग करता है, इसलिए transmission data को काफी कम किया जा सकता है → बेहतरीन स्तर का noise removal संभव इसे इस साल की शुरुआत में पेश किए गए low-bitrate speech codec Lyra में integrate करने की योजना है

(ai.googleblog.com)

12 पॉइंट द्वारा xguru 2021-08-16 | 1 टिप्पणियां | WhatsApp पर शेयर करें

speech और music, दोनों पर लागू होने वाला पहला neural network codec

→ इसे real time में smartphone CPU पर चलाया जा सकता है

→ यह high-quality audio के साथ साफ speech, शोर और reverberation वाली speech, music, और environmental sounds सहित विभिन्न sound types को encode कर सकता है

दोनों endpoints पर neural network का उपयोग करके train किया गया है, इसलिए यह compression और audio quality enhancement एक साथ करता है और high-quality audio प्रदान करता है

→ SoundStream 3kbps पर Opus 12 kbps से बेहतर है, और EVS 9.6bps के करीब quality देता है

→ यह 3.2x-4x कम bits का उपयोग करता है, इसलिए transmission data को काफी कम किया जा सकता है

→ बेहतरीन स्तर का noise removal संभव

इसे इस साल की शुरुआत में पेश किए गए low-bitrate speech codec Lyra में integrate करने की योजना है

1 टिप्पणियां

alstjr7375 2021-08-17

Opus भी काफ़ी अच्छा होने के लिए मशहूर है

वाकई कमाल है

Google ने End-to-End neural audio codec SoundStream पेश किया

संबंधित पढ़ाई

1 टिप्पणियां