3 ポイント 投稿者 xguru 2023-05-31 | 3件のコメント | WhatsAppで共有
  • ビジョン、オーディオ、言語モダリティをすべて包含する汎用表現モデル
  • 事前学習済みモデルがなくても、統合されたタスクで優れた結果を示す
  • 強力な Emergent Zero-shot Retrieval により、学習データ内でペア化されていないモダリティをアライン可能
  • Audio-to-Image、Audio+Text-to-Image、Audio+Image-to-Image

3件のコメント

 
ninebow 2023-05-31

あっ、先週投稿してくださったものと同じもののようです。+_+
https://ja.news.hada.io/topic?id=9249

 
xguru 2023-05-31

おっと、変なものをコピーしてしまいましたね…… Slackでも共有されているので、そのままにしておきます。
(大事なことなので2回ご覧いただくということで……)

 
ninebow 2023-05-31

はい、ありがとうございます! 🙇🏼‍♂️
(おかげで、xguruさんが直接投稿されることを知りましたね! 🤣)