OpenFlamingo - 大規模マルチモーダルモデル（LMM）を訓練・評価するためのオープンソースフレームワーク

xguru · 2023-03-31T10:15:01+09:00

GPT-4のように画像とテキストの入力をあわせて処理できるマルチモーダルシステムの開発を目標とするそのために、画像・動画・テキストを処理して推論するLMM（Large Multimodal Model）であるDeepMindのFlamingoモデルをオープンソースで実装最初のリリースに含まれるもの FlamingoスタイルのLMMを訓練するためのPythonフレームワーク画像とテキストがインターリーブされた大規模マルチモーダルデータセット視覚・言語タスク向けのインコンテキスト学習評価ベンチマーク LLaMAベースのOpenFlamingo-9Bモデル Flamingoの訓練データセットは公開されていないため、LAION-2BのMultimodal C4データセットと、1,000万サンプルから500万サンプルを抽出して訓練

(laion.ai)

11 ポイント投稿者 xguru 2023-03-31 | 1件のコメント | WhatsAppで共有

GPT-4のように画像とテキストの入力をあわせて処理できるマルチモーダルシステムの開発を目標とする
そのために、画像・動画・テキストを処理して推論するLMM（Large Multimodal Model）であるDeepMindのFlamingoモデルをオープンソースで実装
最初のリリースに含まれるもの
- FlamingoスタイルのLMMを訓練するためのPythonフレームワーク
- 画像とテキストがインターリーブされた大規模マルチモーダルデータセット
- 視覚・言語タスク向けのインコンテキスト学習評価ベンチマーク
- LLaMAベースのOpenFlamingo-9Bモデル
Flamingoの訓練データセットは公開されていないため、LAION-2BのMultimodal C4データセットと、1,000万サンプルから500万サンプルを抽出して訓練

1件のコメント

xguru 2023-03-31

Flamingo: Few-Shot Learningのための視覚言語モデル

OpenFlamingo - 大規模マルチモーダルモデル（LMM）を訓練・評価するためのオープンソースフレームワーク

関連記事

1件のコメント