ANEMLL - Apple Neural EngineでLLMを動かすためのオープンソースプロジェクト
(github.com/Anemll)- Apple Neural Engine(ANE) 上で実行可能な LLM推論パイプライン を提供
- Hugging Faceモデルをベースに、Swift/C++ベースのアプリやiOS/macOSアプリで オンデバイス推論を可能 にする
- 最新の 0.3.0 Alpha には、Hugging FaceモデルをCoreML形式に変換するツール、Swiftベースの推論CLI実装、iOS/macOSアプリのサンプル、Pythonテストコード、ベンチマークツールが含まれる
- LLaMA 3.2 (1B / 8B) モデルおよび Distilled DeepSeek R1 8B、DeepHermes 3B と 8B をサポートし、今後さらに多様なモデルアーキテクチャへ拡張予定
- Hugging FaceモデルをANE向けに変換できる 柔軟で使いやすいフレームワーク の提供を目指す
1件のコメント
Hacker Newsの意見
AppleがANE最適化モデルについて「最大10倍高速、メモリ消費は14分の1」と主張していた件に、その後の進展があったのか気になる
Snapdragon XノートPCの発売時、NPUがLLMに使われるという主張があった
ニューラルエンジンは無駄なシリコンだと感じていた
主な利点は消費電力が大幅に低いこと
READMEに最も重要な情報がない
この技術の肝が何なのか知りたい
Appleのユニファイドメモリは、通常なら複数GPUが必要な大規模モデルを動かせるだけの十分なRAMを提供する
coremlがANEを活用しているのか気になる
MシリーズMacBookで推論速度に性能上の利点があるのか気になる
AppleによるANEへの厳格な統制は驚き