Voice-Pro – speech recognition, translation और speech synthesis को सपोर्ट करने वाला Gradio WebUI
(github.com/abus-aikorea)Voice-Pro एक Gradio WebUI है जो speech recognition, translation और speech synthesis को सपोर्ट करता है.
मुख्य फीचर्स:
- zero-shot voice cloning. इसके लिए सिर्फ 15 सेकंड का voice sample चाहिए. 50 से अधिक celebrity voices उपलब्ध
- YouTube audio download
- vocal separation
- multilingual text-to-speech conversion (Edge-TTS, F5-TTS)
- multilingual translation
- कई Whisper engines का सपोर्ट (Whisper, Faster-Whisper, Whisper-Timestamped)
वीडियो डेमो:
-
Voice-Pro उपयोग ट्यूटोरियल: https://youtu.be/z8g8LMhoh_o
-
Voice-Cloning podcast production demo: https://youtu.be/Wfo7vQCD4no
-
डेमो और sample videos: https://youtube.com/playlist/?list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq
1 टिप्पणियां
लगता है यह किसी कोरियाई व्यक्ति ने बनाया है।