WaaS - Whisper as a Service
(github.com/schibsted)- OpenAI Whisper(音声認識モデル)をローカルで手軽に活用するための GUI および API のオープンソース
transcribe/detect/downloadなどの機能を REST API として提供- Web ページ上で音声/動画ファイルをアップロードして処理を開始可能
docker-composeで起動して利用可能(redis/api/workerなど 3 つの Docker コンテナを実行)- 最小モデルの
tinyは約 1GB の VRAM を必要とする(最大のlargeは 10GB)
1件のコメント
Whisper - OpenAIがオープンソースとして公開した多言語音声認識システム(ASR)
OpenAI、Whisper v2モデルを公開