8 पॉइंट द्वारा xguru 2025-02-19 | 2 टिप्पणियां | WhatsApp पर शेयर करें

Audiblez क्या है?

  • .epub ई-बुक्स को .m4b ऑडियोबुक में बदलने का टूल
  • Kokoro-82M आधारित उच्च-गुणवत्ता वाले वॉइस सिंथेसिस का उपयोग
  • Apache लाइसेंस के तहत उपलब्ध, और 100 घंटे से कम ऑडियो डेटा पर प्रशिक्षित
  • Google Colab के T4 GPU पर "प्रति सेकंड 600 अक्षर कन्वर्ज़न स्पीड" के साथ "Animal Farm" को लगभग 5 मिनट में कन्वर्ट किया जा सकता है
  • M2 MacBook Pro (CPU मोड) पर "प्रति सेकंड 60 अक्षर की स्पीड से लगभग 1 घंटा लगता है"
    • Apple Silicon (M1, M2) पर फिलहाल CUDA सपोर्ट नहीं है (MLX सपोर्ट का इंतज़ार है)

Audiblez 4.2 के प्रमुख अपडेट

  • wxWidgets आधारित मल्टी-प्लेटफ़ॉर्म GUI सपोर्ट (Mac, Windows, Linux)
  • कई भाषाओं का समर्थन (अंग्रेज़ी, स्पैनिश, फ़्रेंच, हिंदी, इतालवी, जापानी, पुर्तगाली, चीनी)
  • ONNX से kokoro पैकेज का उपयोग करने वाले Torch-आधारित सिस्टम में बदलाव
  • CUDA acceleration सपोर्ट (लेकिन Apple Silicon पर CPU मोड में चलता है)
  • ऑडियोबुक में कवर इमेज और चैप्टर टाइमस्टैम्प शामिल
  • Windows सपोर्ट में सुधार

2 टिप्पणियां

 
xguru 2025-02-19

Kokoro-82M मॉडल के साथ ईबुक को ऑडियोबुक में बदलना
यह उसी पर आधारित है, लेकिन उसमें शामिल कोरियन Audiblez में नहीं है (हालांकि टिप्पणियों में यह बात कही गई है कि Kokoro की कोरियन गुणवत्ता खास अच्छी नहीं है)

 
inosphe 2025-02-19

kokoro प्रोजेक्ट के पुराने रिकॉर्ड्स देखें तो स्पष्ट है कि Korean voice मौजूद थी, लेकिन Discord की चर्चाओं को देखें तो लगता है कि Korea AIHub के विदेशी डेटा निर्यात-प्रतिबंध प्रावधान के कारण वितरण में कठिनाइयाँ आ रही हैं…