6 ポイント 投稿者 xguru 2023-05-11 | 1件のコメント | WhatsAppで共有
  • モデルをアップロードすると、ユーザーが評価する世界初のオープンコミュニティチャレンジ
  • 6月10日にシーズン1 エピソード1が始まり、12週間で賞金25万ドル
  • 競争方式
    • 1億7,000万件のユーザー生成シグナルで直接学習した Chai Reward Model(GPT-2)をオープンソースとして公開
    • このモデルをオフライン評価に使用するか、RLHFパイプラインの一部として統合可能
    • 言語モデルの訓練にはコストがかかるため、誰でも大会に参加できるよう、さまざまなベースモデルを実験予定
    • アップロードされたモデルについて、内部 AI Safety Classifier でデプロイ可能か確認し、ユーザーA/Bテストのために公開
    • 約100万人以上の実際のユーザーが評価

1件のコメント

 
xguru 2023-05-11

超サイヤ人とフュージョンしたようなLlamaの画像が印象的ですね