Whisper.cpp 1.4.0 リリース

xguru · 2023-05-02T10:36:09+09:00

整数量子化（integer quantization）をサポート: ggml Whisperモデルで、デフォルトの16bit浮動小数点重みを4、6、8bit整数重みに変換可能ディスクサイズとメモリ使用量を削減し、一部アーキテクチャでより高速に実行可能 llama.cppプロジェクトに貢献されたコードによって実現 cuBLASを利用したNVIDIA GPUサポート

(github.com/ggerganov)

13 ポイント投稿者 xguru 2023-05-02 | 1件のコメント | WhatsAppで共有

整数量子化（integer quantization）をサポート: ggml Whisperモデルで、デフォルトの16bit浮動小数点重みを4、6、8bit整数重みに変換可能
- ディスクサイズとメモリ使用量を削減し、一部アーキテクチャでより高速に実行可能
- llama.cppプロジェクトに貢献されたコードによって実現
cuBLASを利用したNVIDIA GPUサポート

1件のコメント

xguru 2023-05-02

Whisper.cpp - OpenAI Whisperの高性能なC/C++実装

Whisper.cpp 1.4.0 リリース

関連記事

1件のコメント