WhisperFusion - AIチャットボットと短い待ち時間で対話する
(github.com/collabora)- WhisperLiveおよびWhisperSpeechの機能をベースに、Mistral LLMと連携してAIとのスムーズな対話を提供
- WhisperLive : OpenAIのWhisperをほぼリアルタイムで動作するよう実装し、音声をテキストに変換
- WhisperSpeech : Whisperを反転させる形で構築したTTSシステム
- LLMとWhisperはどちらもTensorRTエンジンで効率的に実行できるよう最適化されており、性能とリアルタイム処理能力を最大化。WhiperSpeechは
torch.compileで最適化
3件のコメント
リアルタイム翻訳ができれば、速くて良さそうですね。
WhisperSpeech – Whisperを逆に構築したオープンソースの音声合成システム
Hacker Newsのコメント
examplesディレクトリで配布していることに疑問を呈している。huggingface_cliについては、すでに名前で何かをダウンロードする方法(PyPIインデックスなど)があり、それをモデルにも適用したほうがよいかもしれないと述べている。