(यह SHOW के लिए ज़्यादा उपयुक्त लगता है, लेकिन यह मैंने नहीं बनाया है, इसलिए SHOW की जगह NEWS में पोस्ट कर रहा हूँ.)

====

यह एक repository है जो कोरियन speech recognition को आज़माने के लिए उपलब्ध developer-site APIs के आधार पर AI-Hub द्वारा सार्वजनिक किए गए विभिन्न test sets की error rate (Character Error Rate) को अलग-अलग speech recognition APIs के अनुसार मापती है. यह repository निम्नलिखित विषयों को कवर करती है.

  • Return Zero, Google, OpenAI Whisper, ETRI, Naver आदि विभिन्न speech recognition APIs का उपयोग करके AI Hub test sets पर error rate (Character Error Rate) का मापन
  • कोरियन speech recognition evaluation methods का परिचय

====

यह project विभिन्न speech recognition APIs के performance का वस्तुनिष्ठ मूल्यांकन करने के लिए सार्वजनिक किया गया है. इसका उद्देश्य वर्तमान बाज़ार में उपलब्ध विभिन्न speech recognition services के performance differences का विश्लेषण करना है, ताकि users और developers को बेहतर accessibility मिल सके.

आम तौर पर paper के रूप में प्रकाशित सामग्री केवल English के लिए performance evaluation करती है और WER (Word Error Rate) को paperswithcode पर प्रकाशित करती है. लेकिन कोरियन speech recognition का मूल्यांकन WER नहीं बल्कि CER (Character Error Rate) से किया जाना अधिक उपयुक्त है, और ऐसा कोई सुव्यवस्थित leaderboard मिलना मुश्किल था.

KsponSpeech पहली बार 2018 में सार्वजनिक किया गया था, लेकिन AI-Hub तक केवल देश के नागरिकों की पहुँच होने और speech recognition पर research और development करने वाले कोरियाई लोगों की संख्या कम होने के कारण, यह विभिन्न resources के रूप में व्यापक रूप से उपलब्ध नहीं हो सका.

Return Zero ने speech recognition पर स्वयं research और development करते हुए, ताकि अधिक लोग ऐसे resources तक पहुँच सकें, speechbrain में योगदान देकर KsponSpeech को speech recognition क्षेत्र में व्यापक रूप से उपयोग किए जाने वाले framework में शामिल कराया, जिससे इसे वर्तमान latest recipe में इस्तेमाल किया जा सकता है, और huggingface पर भी उपलब्ध कराया गया है.

हाल ही में AI-Hub पर कई प्रकार के speech data सार्वजनिक किए गए हैं, और हमें लगा कि इन विविध datasets पर यह आकलन करना और साझा करना कि कोरियन speech recognition engines कितनी प्रगति कर चुके हैं, कोरियन speech recognition के विकास में मददगार होगा.

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.