9 पॉइंट द्वारा vulcanidic 2024-12-08 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Voice-Pro एक Gradio WebUI है जो speech recognition, translation और speech synthesis को सपोर्ट करता है.

मुख्य फीचर्स:

  • zero-shot voice cloning. इसके लिए सिर्फ 15 सेकंड का voice sample चाहिए. 50 से अधिक celebrity voices उपलब्ध
  • YouTube audio download
  • vocal separation
  • multilingual text-to-speech conversion (Edge-TTS, F5-TTS)
  • multilingual translation
  • कई Whisper engines का सपोर्ट (Whisper, Faster-Whisper, Whisper-Timestamped)

वीडियो डेमो:

GitHub:
https://github.com/abus-aikorea/voice-pro

1 टिप्पणियां

 
yangeok 2024-12-16

लगता है यह किसी कोरियाई व्यक्ति ने बनाया है।