AlpacaとオンデバイスLLM開発の加速

xguru · 2023-03-15T11:19:23+09:00

「SD Momentが来る」の記事以降、3日間で起きた変化 llama.cppで4GBのRaspberry Pi上で実行。トークンあたり10秒 Dalai により簡単に実行可能に llama.cppでPixel 6ではトークンあたり26秒だったものを、Pixel 5でトークンあたり1秒まで改善スタンフォードがLLaMA 7Bをファインチューニングした Alpacaをリリース Stanford's Alpaca LLaMAモデルの大きな弱点は、質問応答のための「命令チューニング」が不足していること OpenAIの大きな革新の1つは、GPT-3に命令チューニングを追加したことスタンフォードはここに52,000件の学習例を提供し、100ドルで学習可能にした最小の7Bモデルは今やRaspberry Piやモバイルフォンでも動作し、非常に印象的な結果を出しているただし、まだ商用利用は不可（3つの理由で不可能。LLaMAのライセンス / 命令セットのデータをOpenAIモデルから生成 / 安全対策を設計していない）これが意味することは？ LLaMAのライセンスモデルは私にはあまり関係ない LLaMAは、GPT-3クラスの言語モデルを一般に利用可能なリソースで学習できることを示した llama.cpp は、LLMを4GB級のコンシューマーハードウェアで実行可能であることを示した Alpacaは、52Kの例と100ドルのコストだけで、7Bモデル（4bit量子化で4GBに縮小）をファインチューニングでき、最新の text-davinci-003 に近い結果を出せることを示した比較に使われたのは7Bフルモデル（13.48GB、16bit浮動小数点）であり、4bitに縮小した4GBモデルではないが、両者の品質差を明確に比較した資料はまだ見ていない

(simonwillison.net)

11 ポイント投稿者 xguru 2023-03-15 | まだコメントはありません。 | WhatsAppで共有

「SD Momentが来る」の記事以降、3日間で起きた変化
- llama.cppで4GBのRaspberry Pi上で実行。トークンあたり10秒
- Dalai により簡単に実行可能に
- llama.cppでPixel 6ではトークンあたり26秒だったものを、Pixel 5でトークンあたり1秒まで改善
- スタンフォードがLLaMA 7Bをファインチューニングした Alpacaをリリース

Stanford's Alpaca

LLaMAモデルの大きな弱点は、質問応答のための「命令チューニング」が不足していること
OpenAIの大きな革新の1つは、GPT-3に命令チューニングを追加したこと
スタンフォードはここに52,000件の学習例を提供し、100ドルで学習可能にした
最小の7Bモデルは今やRaspberry Piやモバイルフォンでも動作し、非常に印象的な結果を出している
ただし、まだ商用利用は不可（3つの理由で不可能。LLaMAのライセンス / 命令セットのデータをOpenAIモデルから生成 / 安全対策を設計していない）

これが意味することは？

LLaMAのライセンスモデルは私にはあまり関係ない
LLaMAは、GPT-3クラスの言語モデルを一般に利用可能なリソースで学習できることを示した
llama.cpp は、LLMを4GB級のコンシューマーハードウェアで実行可能であることを示した
Alpacaは、52Kの例と100ドルのコストだけで、7Bモデル（4bit量子化で4GBに縮小）をファインチューニングでき、最新の text-davinci-003 に近い結果を出せることを示した
- 比較に使われたのは7Bフルモデル（13.48GB、16bit浮動小数点）であり、4bitに縮小した4GBモデルではないが、両者の品質差を明確に比較した資料はまだ見ていない

AlpacaとオンデバイスLLM開発の加速

Stanford's Alpaca

これが意味することは？

関連記事

まだコメントはありません。