4 ポイント 投稿者 xguru 2023-03-09 | まだコメントはありません。 | WhatsAppで共有
  • MetaのLLaMAモデルをCPUで実行
  • 設定はほぼ同じ
  • 7Bモデルでテストしたところ、読み込みには32GiB RAMでもスワップ/zramが必要
  • 実際の推論時に使用するRAMは約20GiB以下
  • Ryzen 7900Xでは7Bモデルで1秒あたり数語の推論が可能

まだコメントはありません。

まだコメントはありません。