Meta、次世代の学習・推論アクセラレータ MTIAv2 を公開
(ai.meta.com)Metaは昨年公開した自社開発のAI推論アクセラレータ MTIA(Meta Training and Inference Accelerator)v1 の次世代版である MTIAv2 を公開しました。MTIA は Meta の AI ワークロード、とりわけ製品全体にわたるさまざまな体験を改善するディープラーニング推薦モデル向けに設計されたチップです。AI ワークロードが Meta の製品やサービスにおいてますます重要になるなか、MTIA の効率向上は、世界中のユーザーに最良の体験を提供する能力の改善につながるとみられます。
この次世代 MTIAv2 チップは、4つの主要モデルにおいて、すでに第1世代チップ比で3倍の性能向上を示しています。プラットフォームレベルでは、デバイス数を2倍にし、強力な2ソケット CPU を採用することで、第1世代 MTIA システム比で6倍のモデルサービングスループットと1.5倍の性能/ワット向上を達成しました。商用 GPU と比較しても、Meta 固有のワークロードに対して最適な性能と効率を提供するうえで、MTIA が非常に相補的な役割を果たすことが実証されつつあります。
MTIAv2 の主な特徴
MTIAv2 の主な特徴は次のとおりです:
- 前世代比で計算性能とメモリ帯域幅が2倍以上向上
- ランキングおよび推薦モデルを効率的に処理できるよう設計
- 8x8 グリッドの処理要素(PE)で構成され、密な計算性能は3.5倍、疎な計算性能は7倍に改善
- ローカル PE ストレージは3倍、オンチップ SRAM は2倍、帯域幅は3.5倍に増加し、LPDDR5 容量は2倍
- 改良された NoC(Network on Chip)アーキテクチャにより帯域幅が2倍となり、低遅延で PE 間の調整が可能
⚠️広告⚠️ PyTorch 韓国語コミュニティで同じ記事を見る
まだコメントはありません。