ONE-PEACE: 無制限マルチモダリティのための汎用表現モデル

xguru · 2023-05-24T10:47:01+09:00

ビジョン、オーディオ、言語モダリティをすべて包含する General Representation Model 事前学習済みモデルなしでも、統合されたタスクで優れた結果を示す強力な Emergent Zero-shot Retrieval により、学習データ内でペアリングされていないモダリティ同士のアラインメントが可能 Audio-to-Image, Audio+Text-to-Image, Audio+Image-to-Image

(github.com/OFA-Sys)

11 ポイント投稿者 xguru 2023-05-24 | 1件のコメント | WhatsAppで共有

ビジョン、オーディオ、言語モダリティをすべて包含する General Representation Model
事前学習済みモデルなしでも、統合されたタスクで優れた結果を示す
強力な Emergent Zero-shot Retrieval により、学習データ内でペアリングされていないモダリティ同士のアラインメントが可能
Audio-to-Image, Audio+Text-to-Image, Audio+Image-to-Image

1件のコメント

dbs0829 2023-05-24

かなり多くのタスクでSOTAを塗り替えたようですね

ONE-PEACE: 無制限マルチモダリティのための汎用表現モデル

関連記事

1件のコメント