Google ने End-to-End neural audio codec SoundStream पेश किया
(ai.googleblog.com)- speech और music, दोनों पर लागू होने वाला पहला neural network codec
→ इसे real time में smartphone CPU पर चलाया जा सकता है
→ यह high-quality audio के साथ साफ speech, शोर और reverberation वाली speech, music, और environmental sounds सहित विभिन्न sound types को encode कर सकता है
- दोनों endpoints पर neural network का उपयोग करके train किया गया है, इसलिए यह compression और audio quality enhancement एक साथ करता है और high-quality audio प्रदान करता है
→ SoundStream 3kbps पर Opus 12 kbps से बेहतर है, और EVS 9.6bps के करीब quality देता है
→ यह 3.2x-4x कम bits का उपयोग करता है, इसलिए transmission data को काफी कम किया जा सकता है
→ बेहतरीन स्तर का noise removal संभव
- इसे इस साल की शुरुआत में पेश किए गए low-bitrate speech codec Lyra में integrate करने की योजना है
1 टिप्पणियां
Opus भी काफ़ी अच्छा होने के लिए मशहूर है
वाकई कमाल है