13 ポイント 投稿者 xguru 2024-04-29 | 3件のコメント | WhatsAppで共有
  • 4月18日のLlama 3モデル公開以降、開発者コミュニティの反応は非常に大きかった
    • モデルは120万回以上ダウンロードされ、Hugging Faceでは開発者が600件以上の派生モデルを共有した
    • Llama 3のGitHubリポジトリは17,000件以上のスターを獲得した
    • LMSYS Chatbot Arenaのリーダーボードで、Llama 3 70B Instructモデルが英語限定評価で1位を獲得し、総合では6位となり、公開モデルとしては最上位にランクインした(クローズドな独占モデルに次ぐ)

Llama 3の初期導入事例

  • シリコン、ハードウェア、クラウド提供事業者のパートナーが、Llama 3のユーザー向け展開を開始した
  • イェール大学医学部は、EPFLコンピュータ・通信科学学部とともに、Llama 3公開から24時間以内にLlama 3をファインチューニングし、医療分野初のLlama 3 8BモデルであるLlama-3[8B]-MeditronV1.0を公開した
    • この新モデルは、MedQA、MedMCQAなどの標準ベンチマークで、同一パラメータ規模の最新オープンモデルをすべて上回った
    • イェール大学とEPFLがLlama 2を基盤としてMeditronの最初のバージョンを構築した方法の詳細は、該当リンクで確認できる

Llama 3の今後の計画

  • 今後数か月の間に、マルチモーダル、多言語対話、より長いコンテキストウィンドウ、全体的な機能向上などの新機能を備えたモデルを公開する予定
  • まもなくさらに多くの内容を共有し、コミュニティ主導のイノベーションの次の波が見られることを期待している

3件のコメント

 
gcback 2024-04-29

国内の大企業LLMはますます競争力を失っていっていますね。クローズド型が戦略なら性能面で十分な競争力を持つべきですし、性能が劣っていても活用先の拡大が戦略なら韓国語中心を売りにしないべきなのに、まさに正反対のことをしている状況ですから。

 
cosine20 2024-04-30

韓国語のリーダーボードでは意味のない重みの競争ばかりして、それをニュースにして株価防衛までしているんだから、ほんと笑えるw

 
[このコメントは非表示になっています。]