wav2vec-U : Supervision के बिना उच्च-प्रदर्शन speech recognition

xguru · 2021-05-24T09:20:05+09:00

Facebook AI टीम द्वारा बनाया गया speech recognition framework transcribed speech data के बिना विभिन्न भाषाओं की recognition को support करता है → लगभग 1000 घंटे के speech पर प्रशिक्षित supervised learning मॉडल के समान प्रदर्शन → Swahili और Tatar जैसी भाषाओं पर परीक्षण, जहाँ transcribed speech data बहुत अधिक नहीं है unlabelled audio की संरचना को सीखने का तरीका → speech recordings को उन speech units में विभाजित किया जाता है जो ढीले तौर पर अलग-अलग sounds से मेल खाते हैं → cat में “/K/”, “/AE/”, “/T/” ये तीन sounds शामिल हैं → generator और discriminator से बने GAN के रूप में प्रशिक्षण code और research paper सार्वजनिक किए गए

(ai.facebook.com)

4 पॉइंट द्वारा xguru 2021-05-24 | अभी कोई टिप्पणी नहीं है. | WhatsApp पर शेयर करें

Facebook AI टीम द्वारा बनाया गया speech recognition framework
transcribed speech data के बिना विभिन्न भाषाओं की recognition को support करता है

→ लगभग 1000 घंटे के speech पर प्रशिक्षित supervised learning मॉडल के समान प्रदर्शन

→ Swahili और Tatar जैसी भाषाओं पर परीक्षण, जहाँ transcribed speech data बहुत अधिक नहीं है

unlabelled audio की संरचना को सीखने का तरीका

→ speech recordings को उन speech units में विभाजित किया जाता है जो ढीले तौर पर अलग-अलग sounds से मेल खाते हैं

→ cat में “/K/”, “/AE/”, “/T/” ये तीन sounds शामिल हैं

→ generator और discriminator से बने GAN के रूप में प्रशिक्षण

code और research paper सार्वजनिक किए गए

wav2vec-U : Supervision के बिना उच्च-प्रदर्शन speech recognition

संबंधित पढ़ाई

अभी कोई टिप्पणी नहीं है.