Guanaco - 100万ドル(約1.3億円)のLLMファインチューニング大会
(chai-research.com)- モデルをアップロードすると、ユーザーが評価する世界初のオープンコミュニティチャレンジ
- 6月10日にシーズン1 エピソード1が始まり、12週間で賞金25万ドル
- 競争方式
- 1億7,000万件のユーザー生成シグナルで直接学習した Chai Reward Model(GPT-2)をオープンソースとして公開
- このモデルをオフライン評価に使用するか、RLHFパイプラインの一部として統合可能
- 言語モデルの訓練にはコストがかかるため、誰でも大会に参加できるよう、さまざまなベースモデルを実験予定
- アップロードされたモデルについて、内部 AI Safety Classifier でデプロイ可能か確認し、ユーザーA/Bテストのために公開
- 約100万人以上の実際のユーザーが評価
1件のコメント
超サイヤ人とフュージョンしたようなLlamaの画像が印象的ですね