• Kitten TTS एक ओपन सोर्स TTS (text-to-speech) मॉडल है, जिसका लक्ष्य हल्केपन और उच्च ऑडियो गुणवत्ता को एक साथ हासिल करना है
  • यह सिर्फ 1.5 करोड़ parameters का उपयोग करता है, जिससे मॉडल का आकार 25MB से कम रहता है
    • अन्य बड़े TTS मॉडलों के विपरीत, इसकी बड़ी खासियत यह है कि इसे मोबाइल, embedded सहित लगभग हर environment में चलाया जा सकता है
  • GPU के बिना भी हर डिवाइस पर उच्च-गुणवत्ता वाली speech synthesis संभव है
  • विभिन्न premium voice विकल्पों के साथ, वास्तविक आवाज़ जैसी उच्च-गुणवत्ता वाली speech synthesis को सपोर्ट करता है
  • तेज़ speech inference संभव होने से यह real-time synthesis के लिए optimized है
  • डेवलपर प्रीव्यू मॉडल जारी कर दिया गया है, और आगे चलकर पूरा trained model weights, mobile SDK, web version आदि चरणबद्ध तरीके से जारी किए जाएंगे

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.