- कोरियन सहित 31 भाषाओं का समर्थन
- emotion tags का नया समर्थन: <laugh>, <breath>, <scream> आदि 10 तरह के tags को टेक्स्ट में डालकर भावनात्मक अभिव्यक्ति संभव
- गुणवत्ता में सुधार: उच्चारण की सटीकता बेहतर, शब्दों की पुनरावृत्ति/छूट की विफलताएं कम, voice cloning प्रदर्शन में सुधार
- मॉडल आकार: 99M Parameters
- ऑन-डिवाइस TTS: पूरी privacy की गारंटी, network latency नहीं
- डिप्लॉयमेंट में आसानी: ब्राउज़र, PC, मोबाइल, Raspberry Pi आदि पर चलाया जा सकता है
- 10 preset voices प्रदान
- open model: व्यावसायिक उपयोग संभव (OpenRAIL-M)
3 टिप्पणियां
दूसरे हल्के मॉडलों की तुलना में यह काफ़ी स्थिर लगता है।
ओह, इसे Pi 5 पर टेस्ट करके देखना होगा
मैं home agent में supertonic इस्तेमाल कर रहा था, पुराना वाला भी बुरा नहीं था, लेकिन लगता है इसे अपडेट किया गया है। अब इसे टेस्ट करके देखना होगा।