LLaMA-CPU - CPUでLLaMAを実行するフォーク

(github.com/markasoftware)

4 ポイント投稿者 xguru 2023-03-09 | まだコメントはありません。 | WhatsAppで共有

MetaのLLaMAモデルをCPUで実行
設定はほぼ同じ
7Bモデルでテストしたところ、読み込みには32GiB RAMでもスワップ/zramが必要
実際の推論時に使用するRAMは約20GiB以下
Ryzen 7900Xでは7Bモデルで1秒あたり数語の推論が可能

まだコメントはありません。

まだコメントはありません。