10 ポイント 投稿者 xguru 2023-03-17 | 1件のコメント | WhatsAppで共有
  • llama.cpp をRustに移植したプロジェクト
  • f16 または 4-bit quantized バージョンのモデルをサポート
  • オリジナルと同様に ggml テンソルライブラリをそのまま利用し、オリジナルと同等のパフォーマンス

1件のコメント