• voice cloning, text-to-speech conversion, document narration और audiobook creation features एकीकृत रूप में प्रदान करता है
  • MLX-आधारित Metal acceleration का उपयोग कर macOS environment में native performance देता है (Windows support बाद में)
  • 3-second sample से voice cloning संभव करने वाले Qwen3-TTS और Chatterbox engines को एकीकृत किया गया है
    • हिंदी सहित बहुभाषी (23 भाषाएँ) voice cloning और emotion expression support
  • Kokoro TTS, Supertonic-2, और CosyVoice3 ONNX जैसे नवीनतम speech synthesis models शामिल
  • document narration reader feature: PDF, DOCX, EPUB, Markdown, TXT files को sentence-by-sentence पढ़ने का support
  • audiobook generator: पूरे document को WAV/MP3/M4B format में convert करता है. chapter-level queue management, progress tracking, voice preset reuse
  • Agentic Voice Cloning Server के रूप में काम करता है, और advanced task queue orchestration के माध्यम से parallel processing support करता है
  • UI, API, CLI सभी प्रदान करता है, जिससे local automation और external integration संभव है, साथ ही MCP server भी built-in है
  • shared voice library उपलब्ध है, इसलिए uploaded voices को सभी engines में reuse किया जा सकता है
  • model manager built-in: HuggingFace models download और status check संभव
  • Multi-LLM integration (Claude, OpenAI, Ollama आदि) support
  • FastAPI backend और Flutter desktop UI से बना लगभग 18,600-line codebase
    • Python backend लगभग 8,500 lines, Dart UI लगभग 10,100 lines
  • macOS-only binary उपलब्ध, Windows/Linux के लिए केवल code compatibility support (build बाद में)
  • Business Source License 1.1 (BSL-1.1) आधारित source release, binaries पर अलग distribution license लागू

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.