Voice-Pro – speech recognition, translation और speech synthesis को सपोर्ट करने वाला Gradio WebUI

(github.com/abus-aikorea)

9 पॉइंट द्वारा vulcanidic 2024-12-08 | 1 टिप्पणियां | WhatsApp पर शेयर करें

Voice-Pro एक Gradio WebUI है जो speech recognition, translation और speech synthesis को सपोर्ट करता है.

मुख्य फीचर्स:

zero-shot voice cloning. इसके लिए सिर्फ 15 सेकंड का voice sample चाहिए. 50 से अधिक celebrity voices उपलब्ध
YouTube audio download
vocal separation
multilingual text-to-speech conversion (Edge-TTS, F5-TTS)
multilingual translation
कई Whisper engines का सपोर्ट (Whisper, Faster-Whisper, Whisper-Timestamped)

वीडियो डेमो:

Voice-Pro उपयोग ट्यूटोरियल: https://youtu.be/z8g8LMhoh_o
Voice-Cloning podcast production demo: https://youtu.be/Wfo7vQCD4no
डेमो और sample videos: https://youtube.com/playlist/?list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq

1 टिप्पणियां

yangeok 2024-12-16

लगता है यह किसी कोरियाई व्यक्ति ने बनाया है।