13 ポイント 投稿者 xguru 2023-04-03 | まだコメントはありません。 | WhatsAppで共有
  • 幅広い金融データで学習した500億(50B)パラメータの言語モデル
  • ブルームバーグのデータソースに基づく3630億トークンのデータセットを構築し、3450億の一般データセットで補強
  • 一般的なLLMベンチマークで性能低下はなく、金融業務では既存モデルよりはるかに優れた性能を示す
  • モデリングの選択、学習プロセス、評価方法論についても説明
  • 次のステップとして、BloombergGPTのトレーニング経験を詳しく扱ったトレーニングログ(クロニクル)を公開する計画

まだコメントはありません。

まだコメントはありません。