- 研究および商用利用の両方が可能なオープンソース大規模言語モデル
- Llama 1 と比べて 40% 多い 2 兆トークンのデータで学習
- 2 倍のコンテキスト長: 4096
- 3 つのサイズのモデル: 7B、13B、70B
- 推論、コーディング、熟練度、知識テストなど多くのベンチマークで、他のオープンソース言語モデルより優れた性能(MPT、Falcon、Llama-1)
- 公開されたデータソースで学習されており、ファインチューニングされた Llama-2-chat も公開された命令セットと 100 万件を超える人手による注釈を活用
- Reinforcement Learning from Human Feedback (RLHF) を利用。Rejection Sampling および Proximal policy optimization (PPO) を含む
- ダウンロードに含まれるもの
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card
1件のコメント
Hacker Newsの意見