7 ポイント 投稿者 xguru 2023-07-03 | 1件のコメント | WhatsAppで共有
  • DeepMindのFlamingoモデルをオープンソースで実装したもの
  • 3B、4B、9Bモデルを公開
    • MPT-1B/7B と RedPajama-3B ベース
  • 同じFlamingoモデル性能の80%以上を達成
  • 学習および評価コードを改善
    • Fully Sharded Data Parallel (FSDP) をサポート
    • 新しいデータセット(TextVQA、VizWiz、HatefulMemes、Flickr30k)を評価スイートに追加