WaaS - Whisper as a Service

xguru · 2023-02-15T10:47:02+09:00

OpenAI Whisper（音声認識モデル）をローカルで手軽に活用するための GUI および API のオープンソース transcribe / detect / download などの機能を REST API として提供 Web ページ上で音声／動画ファイルをアップロードして処理を開始可能 docker-compose で起動して利用可能（redis / api / worker など 3 つの Docker コンテナを実行）最小モデルの tiny は約 1GB の VRAM を必要とする（最大の large は 10GB）

(github.com/schibsted)

11 ポイント投稿者 xguru 2023-02-15 | 1件のコメント | WhatsAppで共有

OpenAI Whisper（音声認識モデル）をローカルで手軽に活用するための GUI および API のオープンソース
transcribe / detect / download などの機能を REST API として提供
Web ページ上で音声／動画ファイルをアップロードして処理を開始可能
docker-compose で起動して利用可能（redis / api / worker など 3 つの Docker コンテナを実行）
最小モデルの tiny は約 1GB の VRAM を必要とする（最大の large は 10GB）

1件のコメント

xguru 2023-02-15

Whisper - OpenAIがオープンソースとして公開した多言語音声認識システム（ASR）
OpenAI、Whisper v2モデルを公開

WaaS - Whisper as a Service

関連記事

1件のコメント