DeepSpeed - MSが公開したディープラーニング最適化ライブラリ
(github.com)-
PyTorch上の軽量ラッパー
-
最小限のコード変更で、10倍以上大きなモデル、5倍以上の速度
-
Zero Redundancy Optimizer (ZeRO) の適用により、学習時に使用するメモリを最小化 (4x)
PyTorch上の軽量ラッパー
最小限のコード変更で、10倍以上大きなモデル、5倍以上の速度
Zero Redundancy Optimizer (ZeRO) の適用により、学習時に使用するメモリを最小化 (4x)
まだコメントはありません。