8 पॉइंट द्वारा xguru 2023-03-10 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • पिछले साल नवंबर में शुरू की गई "1,000 Languages Initiative (1,000 भाषाओं को सपोर्ट करने वाला machine learning model बनाना)" पर काम जारी है
  • फिलहाल USM को 2B (2 अरब) parameters के साथ 300 से अधिक भाषाओं, 1.2 करोड़ घंटे के speech, और 28 अरब वाक्यों पर train किया गया है
  • YouTube में subtitles बनाने के लिए उपयोग किया जा रहा है। यह सिर्फ English/Chinese ही नहीं, बल्कि Amharic, Cebuano, Assamese, Azerbaijani जैसी भाषाओं को भी सपोर्ट करता है
  • लक्ष्य हासिल करने के लिए दो महत्वपूर्ण चुनौतियाँ
    • मौजूदा supervised learning methods में scalability की कमी है
    • भाषाओं की संख्या बढ़ाने के लिए models को कुशलतापूर्वक तैयार करना
  • approach: Self-supervised learning with fine-tuning (fine-tuning के जरिए self-supervised learning)
  • paper और API (केवल researchers आवेदन कर सकते हैं) सार्वजनिक

1 टिप्पणियां

 
wedding 2023-03-10

मुझे लगता है कि यह ऐसी बेहतरीन तकनीक है जो लुप्त होती भाषाओं और बोलियों को आने वाली पीढ़ियों के लिए भी उपयोग में बने रहने में मदद कर सकती है।