- Rustベースの数値計算、モデル推論、学習のための高性能テンソルライブラリおよびディープラーニングフレームワーク
- 静的グラフフレームワーク級の最適化性能を維持しつつ、動的な柔軟性も確保
- GPU/CPUバックエンドを複数サポート
- GPU: CUDA, ROCm, Metal, Vulkan, WebGPU, LibTorch, Candle など
- CPU: CubeCL, NdArray, Candle, LibTorch ベース
- Wasm および no_std 環境でも動作可能
- Backend traitを中心に設計されており、さまざまなハードウェアおよびランタイム環境で差し替え可能なバックエンド構造を実現
- Autodiff バックエンドデコレータ: すべてのバックエンドに自動微分機能を追加
- Fusion バックエンドデコレータ: カーネル融合機能
- Router バックエンド: CPU や GPU など複数ハードウェア間での演算分散をサポート
- Remote バックエンド: ネットワーク経由での分散演算およびリモート実行が可能
- 学習から推論までの全工程を統合サポート
- Ratatui ベースのターミナルダッシュボードでリアルタイムの学習監視
- 組み込みデバイスから大規模 GPU クラスタまで同一コードでデプロイ可能
- PyTorch, Safetensors, ONNX モデルのインポート機能により既存モデルの再利用をサポート
- WebAssembly および WebGPU ベースのブラウザ推論
- no_std 環境をサポートしており、OS のない組み込みデバイスでも実行可能
- MIT/Apache 2.0 デュアルライセンスで配布
2件のコメント
PyTorch と比べて性能がどうなのか気になりますね。
Rust、Wasm、WebGPU、どれも嬉しい名前ですね。