13 ポイント 投稿者 ninebow 2023-08-23 | 1件のコメント | WhatsAppで共有
  • Meta AIは、音声とテキストの間でシームレスに翻訳および文字起こしを行う、基本的な多言語・マルチタスクモデルであるSeamlessM4Tを公開
  • さまざまな言語に対する自動音声認識、音声-テキスト翻訳、音声-音声翻訳、テキスト-テキスト翻訳、およびテキスト-音声翻訳をサポート
    • 100以上の言語に対する自動音声認識
    • 100以上の入出力言語に対する音声-テキスト翻訳
    • 100以上の入力言語と35言語(+英語)の出力言語をサポートする音声-音声翻訳
    • 100以上の言語に対するテキスト-テキスト翻訳
    • テキスト音声変換、100以上の入力言語と35言語(+英語)の出力言語をサポート
  • SeamlessM4Tモデルは研究者と開発者向けにCC BY-NC 4.0で公開
  • 27時間分のマルチモーダル翻訳データセットSeamlessAlignもあわせて公開