OpenAI、Whisper v2モデルを公開
(github.com/openai)- GitHubへのコミットでひっそりと公開
- 正規化とともに、より多くのEpochs*を経て学習されており、以前のモデルと比べて性能が向上
- アーキテクチャは従来と同じ
load_model("large")を呼び出すと、large-v2モデルがロードされる- このモデルに関する論文もまもなく公開予定
- Epoch: 学習データセットに含まれるすべてのデータが1回ずつモデルを通過すること(Forward Pass/Backward Pass)。つまり、データセット全体を1回学習する単位
1件のコメント
Whisper - OpenAIがオープンソースとして公開した多言語音声認識システム(ASR)