Meta、Llama 3.2をリリース - オープンなカスタムモデルでエッジAIとビジョンを革新する技術
(ai.meta.com)-
Meta、Llama 3.2をリリース
- 小型・中型のビジョンLLM(11Bおよび90B)と、軽量なテキスト専用モデル(1Bおよび3B)を含む
- QualcommおよびMediaTekのハードウェアで利用可能で、Armプロセッサ向けに最適化
- 要約、指示追従、リライト作業に適したモデル
-
Llama 3.2モデルの特徴
- 11Bおよび90Bのビジョンモデルは、画像理解タスクで優れた性能を発揮
torchtuneを使って、カスタムアプリケーション向けにファインチューニング可能torchchatを使ったローカル配備が可能- Meta AIスマートアシスタントを通じて利用可能
-
Llama Stackの展開
- 単一ノード、オンプレミス、クラウド、オンデバイス環境でのLlamaモデル活用を簡素化
- AWS、Databricks、Dell Technologies、Fireworks、Infosys、Together AIと協力して展開
-
Llama 3.2モデルのダウンロード
- llama.comおよびHugging Faceからダウンロード可能
- AMD、AWS、Databricks、Dell、Google Cloud、Groq、IBM、Intel、Microsoft Azure、NVIDIA、Oracle Cloud、Snowflakeなどのパートナープラットフォーム上ですぐに開発可能
-
Llama 3.2の性能
- 11Bおよび90Bモデルは、文書レベルの理解、画像キャプション生成、視覚ベースのタスクに適している
- 1Bおよび3Bモデルは、多言語テキスト生成とツール呼び出し機能を提供
- ローカル実行時には即時応答と高いプライバシーを維持
-
モデル評価
- 150を超えるベンチマークデータセットで性能を評価
- Claude 3 HaikuおよびGPT4o-miniと競争可能な性能
-
ビジョンモデル
- 画像入力をサポートするための新しいモデルアーキテクチャを導入
- テキスト専用機能を維持しつつ、画像とテキストのプロンプトを組み合わせて、より深い理解と推論が可能
-
軽量モデル
- プルーニングおよび知識蒸留手法を用いて1Bおよび3Bモデルを開発
- ローカルで効率的に実行可能
-
Llama Stackの展開
- Llama Stack APIを通じて標準化されたインターフェースを提供
- 多様な環境でのLlamaモデル活用を簡素化
-
システムレベルの安全性
- Llama Guard 3 11B Visionをリリース
- Llama Guard 3 1Bモデルは展開コストを大幅に削減
-
Llama 3.2の活用
- 開発者に必要なツールとリソースを提供
- Llama 3.2とLlama Stackを使って革新的なアプリケーションを開発可能
GN⁺の要約
- Llama 3.2は、エッジおよびモバイルデバイスで実行可能な軽量モデルを含む、多様なビジョンモデルとテキストモデルを提供
- Qualcomm、MediaTek、Armなどとの協力により、多様なハードウェアで最適化された性能を提供
- Llama Stackの展開により、開発者がさまざまな環境で容易にLlamaモデルを利用できるよう支援
- Llama 3.2は高いプライバシーと即時応答を提供し、ローカルアプリケーション開発に適している
- Claude 3 HaikuおよびGPT4o-miniと競える性能を備え、多様なベンチマークで優れた結果を示している
1件のコメント
Hacker Newsの意見
新しい1Bモデルの性能に驚いた。ダウンロードサイズは1.3GB
"The Llama jumped over the ______!" の例では、1-hotエンコーディングだと "wall" が100%の確率で正解になる
MetaのLlamaチームのオープンさに感心した。モデルへのアクセスだけでなく、構築方法も公開している
初心者の質問: ソフトウェアエンジニアの能力を10倍にしたようなモデルが必要で、人間の知識は不要。そういうモデルがあるのか気になる
Ollamaで3Bモデルを使ってみた。光学、生物学、Rustについての質問に対して、速くて知識量も多い
Ollamaのブログ記事: リンク
llama3.2:3b-instruct-q8_0 モデルは 3.1 8b-q4 より性能が良い。MacBook Pro M1でより速く、結果も良い
Ollama向けのWeb UIクライアントをおすすめしてもらえるか質問している
最新のLLMベンチマークがあるリーダーボードはないか質問している
3Bモデルはマルチモーダル(ノルウェー語)ではかなり良かったが、ときどき意味のない回答をたくさん返す。8Bより敏感だが、Gemma 2 2Bよりは実用的