SeamlessM4T: Meta AIが公開した、翻訳のためのマルチモーダル基盤モデル
(ai.meta.com)- Meta AIは、音声とテキストの間でシームレスに翻訳および文字起こしを行う、基本的な多言語・マルチタスクモデルであるSeamlessM4Tを公開
- さまざまな言語に対する自動音声認識、音声-テキスト翻訳、音声-音声翻訳、テキスト-テキスト翻訳、およびテキスト-音声翻訳をサポート
- 100以上の言語に対する自動音声認識
- 100以上の入出力言語に対する音声-テキスト翻訳
- 100以上の入力言語と35言語(+英語)の出力言語をサポートする音声-音声翻訳
- 100以上の言語に対するテキスト-テキスト翻訳
- テキスト音声変換、100以上の入力言語と35言語(+英語)の出力言語をサポート
- SeamlessM4Tモデルは研究者と開発者向けにCC BY-NC 4.0で公開
- 27時間分のマルチモーダル翻訳データセットSeamlessAlignもあわせて公開
1件のコメント
さらに読む