- पिछले साल नवंबर में शुरू की गई "1,000 Languages Initiative (1,000 भाषाओं को सपोर्ट करने वाला machine learning model बनाना)" पर काम जारी है
- फिलहाल USM को 2B (2 अरब) parameters के साथ 300 से अधिक भाषाओं, 1.2 करोड़ घंटे के speech, और 28 अरब वाक्यों पर train किया गया है
- YouTube में subtitles बनाने के लिए उपयोग किया जा रहा है। यह सिर्फ English/Chinese ही नहीं, बल्कि Amharic, Cebuano, Assamese, Azerbaijani जैसी भाषाओं को भी सपोर्ट करता है
- लक्ष्य हासिल करने के लिए दो महत्वपूर्ण चुनौतियाँ
- मौजूदा supervised learning methods में scalability की कमी है
- भाषाओं की संख्या बढ़ाने के लिए models को कुशलतापूर्वक तैयार करना
- approach: Self-supervised learning with fine-tuning (fine-tuning के जरिए self-supervised learning)
- paper और API (केवल researchers आवेदन कर सकते हैं) सार्वजनिक
1 टिप्पणियां
मुझे लगता है कि यह ऐसी बेहतरीन तकनीक है जो लुप्त होती भाषाओं और बोलियों को आने वाली पीढ़ियों के लिए भी उपयोग में बने रहने में मदद कर सकती है।