1 पॉइंट द्वारा GN⁺ 2023-12-08 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Mozilla Common Voice प्रोजेक्ट का परिचय

  • Mozilla Common Voice एक ऐसा प्रोजेक्ट है जो मशीनों को यह सीखने में मदद करता है कि वास्तविक लोग कैसे बोलते हैं.
  • वॉइस तकनीक को उपयोगी बनाने के लिए डेवलपर्स को बड़ी मात्रा में वॉइस डेटा की आवश्यकता होती है.
  • अधिकांश डेटा बड़ी कंपनियों द्वारा उपयोग किया जाता है और ज़्यादातर लोगों के लिए सुलभ नहीं होता, जिससे उनके अनुसार innovation में बाधा आती है.

वॉइस डेटा रिकॉर्डिंग और वैलिडेशन की स्थिति

  • अब तक 29,000 घंटे की आवाज़ रिकॉर्ड की जा चुकी है, जिनमें से 18,000 घंटे वैलिडेट किए जा चुके हैं.

विभिन्न भाषाओं का समर्थन

  • Common Voice प्रोजेक्ट दुनिया भर की विभिन्न भाषाओं का समर्थन करता है, और उपयोगकर्ता अपनी भाषा में योगदान दे सकते हैं.

उच्च-गुणवत्ता वाले ओपन डेटासेट के निर्माण में सहायता

  • प्रोफ़ाइल बनाए बिना भी योगदान किया जा सकता है, लेकिन anonymous demographic डेटा देकर सबमिट किए गए डेटा को और समृद्ध बनाया जा सकता है.
  • प्रोफ़ाइल जानकारी का उपयोग speech recognition की accuracy को ट्रेन करने में इस्तेमाल होने वाले audio डेटा की गुणवत्ता सुधारने के लिए किया जाता है.
  • उपयोगकर्ता कई भाषाओं में अपनी प्रगति और मेट्रिक्स को ट्रैक कर सकते हैं.
  • दुनिया भर के अन्य contributors के साथ अपनी प्रगति की तुलना कर सकते हैं.
  • व्यक्तिगत और प्रोजेक्ट लक्ष्यों के लिए प्रगति देख सकते हैं.
  • यदि चाहें, तो प्रोजेक्ट अपडेट और नई जानकारी के लिए ईमेल सूची में वैकल्पिक रूप से शामिल हो सकते हैं.

GN⁺ की राय

इस लेख की सबसे महत्वपूर्ण बात यह है कि Mozilla ने speech recognition तकनीक विकसित करना चाहने वाले डेवलपर्स को आवश्यक बड़े पैमाने का वॉइस डेटा उपलब्ध कराने के लिए Common Voice प्रोजेक्ट शुरू किया. यह प्रोजेक्ट तकनीकी innovation को बढ़ावा देने के Mozilla के प्रयास को दिखाता है, और दुनिया भर की विभिन्न भाषाओं का समर्थन करके कई लोगों को तकनीकी प्रगति में योगदान देने का अवसर देता है. यह तकनीक के लोकतंत्रीकरण की दिशा में Mozilla के दर्शन को दर्शाता है और बहुत से लोगों के लिए एक दिलचस्प और आकर्षक initiative हो सकता है.

1 टिप्पणियां

 
GN⁺ 2023-12-08
Hacker News टिप्पणियाँ
    • FF का TTS उन लोगों के लिए एक महत्वपूर्ण प्रोजेक्ट है जो उपयोग में आसान text-to-speech सिस्टम चाहते हैं। यह browser में built-in है, इसलिए console में simple code चलाकर TTS के विभिन्न उदाहरण सुने जा सकते हैं। कुछ browser में यह offline भी काम करता है, जबकि अन्य browser cloud-based TTS सिस्टम का उपयोग करते हैं.
    • Common Voice Android उन लोगों के लिए उपयोगी app है जो प्रोजेक्ट में योगदान देना चाहते हैं। उपयोगकर्ता अपनी बोली जाने वाली भाषा में आवाज़ रिकॉर्ड कर सकते हैं और अन्य उपयोगकर्ताओं के योगदान को verify कर सकते हैं। इसका design आधिकारिक website version की तुलना में अधिक user-friendly है.
    • यदि अदालत यह तय करती है कि OpenAI जैसी कंपनियों की गतिविधियाँ fair use के अंतर्गत नहीं आतीं, तो crowdsourced dataset foundation model बनाने का एकमात्र तरीका बन सकते हैं। मुझे नहीं लगता कि ऐसा परिदृश्य होने की संभावना बहुत कम है.
    • यह dataset उन हालिया speech models की training में इस्तेमाल हुए datasets की तुलना में बहुत छोटा है, लेकिन यह self-supervised learning की बजाय supervised learning के लिए है, और किसी विशेष भाषा में model performance सुधारने के लिए fine-tuning में अब भी उपयोगी है.
    • AI और deepfake तकनीक से जुड़ी हाल की घटनाओं को देखते हुए, इस तरह के प्रोजेक्ट में 'मेरी आवाज़ दान करें' पर सहमत होने से पहले कुछ गारंटी चाहिए। यह स्पष्ट नहीं है कि प्रोजेक्ट speech recognition के लिए है या generation के लिए.
    • क्या Mozilla ने कभी संबंधित speech-to-text software को बंद किया था या उसे किसी दूसरी कंपनी को ट्रांसफर किया था? या फिर वह कुछ और था?
    • Linux Firefox के reader mode में text-to-speech फीचर इतना खराब क्यों है? यह Stephen Hawking के text-to-speech से भी कहीं खराब है.
    • उम्मीद थी कि OpenAI सच में open होगा, लेकिन अब वह Microsoft की कठपुतली बनकर corporate profit goals का पीछा कर रहा है। यह और HuggingFace जैसे प्रोजेक्ट अच्छे लगते हैं, और उम्मीद है कि HuggingFace को GitHub की तरह Microsoft अधिग्रहित नहीं करेगा.
    • यहाँ कितने लोगों की 'पढ़ने वाली आवाज़' और सामान्य बातचीत की आवाज़ अलग होती है? अगर ज़्यादातर training data 'स्क्रिप्ट पढ़ने' जैसा सुनाई देता है, तो क्या conversational model को train किया जा सकता है?
    • संबंधित news links भी दिए गए हैं, जो Mozilla Common Voice प्रोजेक्ट की प्रगति और speech dataset के विस्तार के बारे में जानकारी देते हैं.