16 ポイント 投稿者 xguru 2023-03-13 | まだコメントはありません。 | WhatsAppで共有
  • ソースコード、モデル重み、学習データセット全体をApache-2.0で公開
  • 4つの主要コンポーネント
    • GPT-NEOX-20Bを4,300万件の命令セットでファインチューニングしたInstruction-Tuned LLM
    • 自身の作業に合わせてファインチューニング可能なCustomization Recipe
    • ドキュメントRepo、APIおよび推論時点でリアルタイムに更新可能なソースから情報を取得して応答を補強できるExtensible Retrieval System
    • GPT-JT-6Bをファインチューニングし、ボットが応答する質問をフィルタリングするよう設計されたModeration Model
  • LAIONとOntocordの協業 : 4,300万件の命令を含むOIGデータセット(別途公開)

まだコメントはありません。

まだコメントはありません。