19 ポイント 投稿者 xguru 2023-07-19 | 3件のコメント | WhatsAppで共有
  • 研究用途と商用用途の両方で利用可能なオープンソースの大規模言語モデル
  • Llama 1 と比べて 40% 多い 2 兆トークンのデータで学習
  • 2 倍のコンテキスト長: 4096
  • 3 つのモデルサイズ: 7B、13B、70B
  • 推論、コーディング、熟練度、知識テストなど多くのベンチマークで、他のオープンソース言語モデル(MPT、Falcon、Llama-1)より優れた性能
  • 公開データソースで学習されており、ファインチューニングされた Llama-2-chat も公開された命令セットと 100 万件を超える人手アノテーションを活用
  • ダウンロードに含まれるもの
    • Model code
    • Model Weights
    • README (User Guide)
    • Responsible Use Guide
    • License
    • Acceptable Use Policy
    • Model Card

3件のコメント

 
kuroneko 2023-07-19

今回も誰かが「公益」のためにトレントのマグネットリンクを公開してしまうのでしょうか?

 
tpdns90321 2023-07-19

今回はその必要なく、すぐに公開

 
xguru 2023-07-19

分野ごとに差はありますが、ほぼ GPT-3.5 に近いか、それを上回るという評価が出ていますね

完全にオープンのように見えますが、重要な制約が1つあります。"MAU 7億を超えるサービス" であれば Meta にライセンスを申請する必要があり、Meta が拒否できることです。

"Google、TikTok お前らは使うな!" という感じですね。

Microsoft は素早く Llama 2 を Azure で利用できるよう公開しました。
https://blogs.microsoft.com/blog/2023/…

Microsoft は OpenAI もそうですし、Meta とも良好な関係を維持しているようですね