Facebook、英語に依存せず100言語を翻訳できるモデルをオープンソースで公開
(about.fb.com)M2M-100 は MMT(Multilingual Machine Translation)モデルで、
初めて英語データに依存せず、100の言語ペア間で相互翻訳が可能。
多くの翻訳は学習データが豊富な英語を経由するが、このモデルは直接翻訳することで意味をよりよく保持できる。
BLEU(Bilingual Evaluation Understudy)スコアで 10%以上優れた結果を示した。
合計 2200 の言語方向で学習されており、従来の最高水準の英語中心多言語モデルより 10 倍多い。
M2M-100 を使うことで、リソースの少ない言語を使う人々の翻訳品質が向上する。
この記事では、MMT 学習データセットおよびモデル構築方法の詳細を共有し、
他の研究者がより優れた多言語モデルを再現・発展できるよう、モデル、学習、評価方法なども共有している。
120億パラメータで学習されたモデルファイルをダウンロード可能(136GB)
まだコメントはありません。