Meta Llama 3発表後、最初の1週間で起きたこと

xguru · 2024-04-29T09:46:01+09:00

4月18日のLlama 3モデル公開以降、開発者コミュニティの反応は非常に大きかったモデルは120万回以上ダウンロードされ、Hugging Faceでは開発者が600件以上の派生モデルを共有した Llama 3のGitHubリポジトリは17,000件以上のスターを獲得した LMSYS Chatbot Arenaのリーダーボードで、Llama 3 70B Instructモデルが英語限定評価で1位を獲得し、総合では6位となり、公開モデルとしては最上位にランクインした（クローズドな独占モデルに次ぐ） Llama 3の初期導入事例シリコン、ハードウェア、クラウド提供事業者のパートナーが、Llama 3のユーザー向け展開を開始したイェール大学医学部は、EPFLコンピュータ・通信科学学部とともに、Llama 3公開から24時間以内にLlama 3をファインチューニングし、医療分野初のLlama 3 8BモデルであるLlama-3[8B]-MeditronV1.0を公開したこの新モデルは、MedQA、MedMCQAなどの標準ベンチマークで、同一パラメータ規模の最新オープンモデルをすべて上回ったイェール大学とEPFLがLlama 2を基盤としてMeditronの最初のバージョンを構築した方法の詳細は、該当リンクで確認できる Llama 3の今後の計画今後数か月の間に、マルチモーダル、多言語対話、より長いコンテキストウィンドウ、全体的な機能向上などの新機能を備えたモデルを公開する予定まもなくさらに多くの内容を共有し、コミュニティ主導のイノベーションの次の波が見られることを期待している

(ai.meta.com)

13 ポイント投稿者 xguru 2024-04-29 | 3件のコメント | WhatsAppで共有

4月18日のLlama 3モデル公開以降、開発者コミュニティの反応は非常に大きかった
- モデルは120万回以上ダウンロードされ、Hugging Faceでは開発者が600件以上の派生モデルを共有した
- Llama 3のGitHubリポジトリは17,000件以上のスターを獲得した
- LMSYS Chatbot Arenaのリーダーボードで、Llama 3 70B Instructモデルが英語限定評価で1位を獲得し、総合では6位となり、公開モデルとしては最上位にランクインした（クローズドな独占モデルに次ぐ）

Llama 3の初期導入事例

シリコン、ハードウェア、クラウド提供事業者のパートナーが、Llama 3のユーザー向け展開を開始した
イェール大学医学部は、EPFLコンピュータ・通信科学学部とともに、Llama 3公開から24時間以内にLlama 3をファインチューニングし、医療分野初のLlama 3 8BモデルであるLlama-3[8B]-MeditronV1.0を公開した
- この新モデルは、MedQA、MedMCQAなどの標準ベンチマークで、同一パラメータ規模の最新オープンモデルをすべて上回った
- イェール大学とEPFLがLlama 2を基盤としてMeditronの最初のバージョンを構築した方法の詳細は、該当リンクで確認できる

Llama 3の今後の計画

今後数か月の間に、マルチモーダル、多言語対話、より長いコンテキストウィンドウ、全体的な機能向上などの新機能を備えたモデルを公開する予定
まもなくさらに多くの内容を共有し、コミュニティ主導のイノベーションの次の波が見られることを期待している

3件のコメント

gcback 2024-04-29

国内の大企業LLMはますます競争力を失っていっていますね。クローズド型が戦略なら性能面で十分な競争力を持つべきですし、性能が劣っていても活用先の拡大が戦略なら韓国語中心を売りにしないべきなのに、まさに正反対のことをしている状況ですから。

cosine20 2024-04-30

韓国語のリーダーボードでは意味のない重みの競争ばかりして、それをニュースにして株価防衛までしているんだから、ほんと笑えるｗ

2024-04-30

[このコメントは非表示になっています。]

Meta Llama 3発表後、最初の1週間で起きたこと

Llama 3の初期導入事例

Llama 3の今後の計画

関連記事

3件のコメント