22 ポイント 投稿者 xguru 2023-03-30 | まだコメントはありません。 | WhatsAppで共有
  • 最新のLLMをコンシューマ向けNvidia GPUで実行するためのミニマルなシステム
  • 複数のLLM(LLAMA、BLOOM、OPT)を最大170B規模までサポート
  • さまざまな種類のNvidia GPUをサポート
  • Python製の小さく使いやすいコード
  • 内部的に3-bit圧縮のためにGPTQアルゴリズムを使用し、GPUメモリ使用量を最小化

まだコメントはありません。

まだコメントはありません。