Meta、次世代言語モデル Llama 2 を公開

(ai.meta.com)

5 ポイント投稿者 GN⁺ 2023-07-19 | 1件のコメント | WhatsAppで共有

研究および商用利用の両方が可能なオープンソース大規模言語モデル
Llama 1 と比べて 40% 多い 2 兆トークンのデータで学習
2 倍のコンテキスト長: 4096
3 つのサイズのモデル: 7B、13B、70B
推論、コーディング、熟練度、知識テストなど多くのベンチマークで、他のオープンソース言語モデルより優れた性能（MPT、Falcon、Llama-1）
公開されたデータソースで学習されており、ファインチューニングされた Llama-2-chat も公開された命令セットと 100 万件を超える人手による注釈を活用
- Reinforcement Learning from Human Feedback (RLHF) を利用。Rejection Sampling および Proximal policy optimization (PPO) を含む
ダウンロードに含まれるもの
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card

1件のコメント

GN⁺ 2023-07-19