Meta、次世代言語モデル Llama 2 を公開

xguru · 2023-07-19T10:02:01+09:00

研究用途と商用用途の両方で利用可能なオープンソースの大規模言語モデル Llama 1 と比べて 40% 多い 2 兆トークンのデータで学習 2 倍のコンテキスト長: 4096 3 つのモデルサイズ: 7B、13B、70B 推論、コーディング、熟練度、知識テストなど多くのベンチマークで、他のオープンソース言語モデル（MPT、Falcon、Llama-1）より優れた性能公開データソースで学習されており、ファインチューニングされた Llama-2-chat も公開された命令セットと 100 万件を超える人手アノテーションを活用ダウンロードに含まれるもの Model code Model Weights README (User Guide) Responsible Use Guide License Acceptable Use Policy Model Card

(ai.meta.com)

19 ポイント投稿者 xguru 2023-07-19 | 3件のコメント | WhatsAppで共有

研究用途と商用用途の両方で利用可能なオープンソースの大規模言語モデル
Llama 1 と比べて 40% 多い 2 兆トークンのデータで学習
2 倍のコンテキスト長: 4096
3 つのモデルサイズ: 7B、13B、70B
推論、コーディング、熟練度、知識テストなど多くのベンチマークで、他のオープンソース言語モデル（MPT、Falcon、Llama-1）より優れた性能
公開データソースで学習されており、ファインチューニングされた Llama-2-chat も公開された命令セットと 100 万件を超える人手アノテーションを活用
ダウンロードに含まれるもの
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card

3件のコメント

kuroneko 2023-07-19

今回も誰かが「公益」のためにトレントのマグネットリンクを公開してしまうのでしょうか？

tpdns90321 2023-07-19

今回はその必要なく、すぐに公開

xguru 2023-07-19

分野ごとに差はありますが、ほぼ GPT-3.5 に近いか、それを上回るという評価が出ていますね

完全にオープンのように見えますが、重要な制約が1つあります。"MAU 7億を超えるサービス" であれば Meta にライセンスを申請する必要があり、Meta が拒否できることです。

"Google、TikTok お前らは使うな！" という感じですね。

Microsoft は素早く Llama 2 を Azure で利用できるよう公開しました。
https://blogs.microsoft.com/blog/2023/…

Microsoft は OpenAI もそうですし、Meta とも良好な関係を維持しているようですね

Meta、次世代言語モデル Llama 2 を公開

関連記事

3件のコメント