9 ポイント 投稿者 xguru 2020-10-24 | まだコメントはありません。 | WhatsAppで共有

M2M-100 は MMT(Multilingual Machine Translation)モデルで、

初めて英語データに依存せず、100の言語ペア間で相互翻訳が可能。

多くの翻訳は学習データが豊富な英語を経由するが、このモデルは直接翻訳することで意味をよりよく保持できる。

BLEU(Bilingual Evaluation Understudy)スコアで 10%以上優れた結果を示した。

合計 2200 の言語方向で学習されており、従来の最高水準の英語中心多言語モデルより 10 倍多い。

M2M-100 を使うことで、リソースの少ない言語を使う人々の翻訳品質が向上する。

この記事では、MMT 学習データセットおよびモデル構築方法の詳細を共有し、

他の研究者がより優れた多言語モデルを再現・発展できるよう、モデル、学習、評価方法なども共有している。

120億パラメータで学習されたモデルファイルをダウンロード可能(136GB)

まだコメントはありません。

まだコメントはありません。