WaaS - Whisper as a Service
(github.com/schibsted)- OpenAI Whisper (वॉइस रिकग्निशन मॉडल) के लिए लोकल में आसानी से उपयोग करने हेतु GUI और API ओपन सोर्स
transcribe/detect/downloadजैसी सुविधाएँ REST API के रूप में प्रदान करता है- वेबपेज पर ऑडियो/वीडियो फ़ाइल अपलोड करके काम शुरू किया जा सकता है
docker-composeसे चलाकर उपयोग किया जा सकता है (redis/api/workerआदि 3 Docker कंटेनर चलते हैं)- सबसे छोटा मॉडल
tinyलगभग 1GB VRAM की आवश्यकता रखता है (सबसे बड़ाlarge10GB)
1 टिप्पणियां
Whisper - OpenAI द्वारा open source के रूप में जारी किया गया बहुभाषी speech recognition system (ASR)
OpenAI, Whisper v2 मॉडल जारी