Meta、次世代言語モデル Llama 2 を公開
(ai.meta.com)- 研究用途と商用用途の両方で利用可能なオープンソースの大規模言語モデル
- Llama 1 と比べて 40% 多い 2 兆トークンのデータで学習
- 2 倍のコンテキスト長: 4096
- 3 つのモデルサイズ: 7B、13B、70B
- 推論、コーディング、熟練度、知識テストなど多くのベンチマークで、他のオープンソース言語モデル(MPT、Falcon、Llama-1)より優れた性能
- 公開データソースで学習されており、ファインチューニングされた Llama-2-chat も公開された命令セットと 100 万件を超える人手アノテーションを活用
- ダウンロードに含まれるもの
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card
3件のコメント
今回も誰かが「公益」のためにトレントのマグネットリンクを公開してしまうのでしょうか?
今回はその必要なく、すぐに公開
分野ごとに差はありますが、ほぼ GPT-3.5 に近いか、それを上回るという評価が出ていますね
完全にオープンのように見えますが、重要な制約が1つあります。"MAU 7億を超えるサービス" であれば Meta にライセンスを申請する必要があり、Meta が拒否できることです。
"Google、TikTok お前らは使うな!" という感じですね。
Microsoft は素早く Llama 2 を Azure で利用できるよう公開しました。
https://blogs.microsoft.com/blog/2023/…
Microsoft は OpenAI もそうですし、Meta とも良好な関係を維持しているようですね