llama.cpp - FacebookのLLaMAモデルを純粋なC/C++で推論 (github.com/ggerganov) 16 ポイント 投稿者 xguru 2023-03-13 | 1件のコメント | WhatsAppで共有 MacBookでLLaMAモデルを4-bit量子化して実行することを目標 依存関係のない純粋なC/C++実装 Arm Neon/Accelerateフレームワーク向けに最適化(Apple Silicon) x86向けAVX2対応 混合F16/F32精度 4-bit quntization対応 CPUで実行 現在はMac/Linuxのみ対応。Windows対応予定 関連記事 Alpaca.cpp - ChatGPTのようなモデルを個人のノートPCで実行する 38 ポイント · 6件のコメント · 2023-03-21 Gemma.cpp: Gemmaモデル向けの軽量&スタンドアロンC++推論エンジン 11 ポイント · 1件のコメント · 2024-02-24 LLaMA.cppはなぜ可能なのか? 18 ポイント · 3件のコメント · 2023-08-16 GGML・llama.cpp、Hugging Faceに合流 2 ポイント · 0件のコメント · 2026-02-24 ローカルでLlama 2を実行する方法ガイド 5 ポイント · 2件のコメント · 2023-07-26 1件のコメント laeyoung 2023-03-14 7Bモデルを動かしてみたけど、思ったよりうまく動きますね
1件のコメント
7Bモデルを動かしてみたけど、思ったよりうまく動きますね