Meta、次世代の学習・推論アクセラレータ MTIAv2 を公開

(ai.meta.com)

1 ポイント投稿者 ninebow 2024-04-11 | まだコメントはありません。 | WhatsAppで共有

Metaは昨年公開した自社開発のAI推論アクセラレータ MTIA（Meta Training and Inference Accelerator）v1 の次世代版である MTIAv2 を公開しました。MTIA は Meta の AI ワークロード、とりわけ製品全体にわたるさまざまな体験を改善するディープラーニング推薦モデル向けに設計されたチップです。AI ワークロードが Meta の製品やサービスにおいてますます重要になるなか、MTIA の効率向上は、世界中のユーザーに最良の体験を提供する能力の改善につながるとみられます。

この次世代 MTIAv2 チップは、4つの主要モデルにおいて、すでに第1世代チップ比で3倍の性能向上を示しています。プラットフォームレベルでは、デバイス数を2倍にし、強力な2ソケット CPU を採用することで、第1世代 MTIA システム比で6倍のモデルサービングスループットと1.5倍の性能/ワット向上を達成しました。商用 GPU と比較しても、Meta 固有のワークロードに対して最適な性能と効率を提供するうえで、MTIA が非常に相補的な役割を果たすことが実証されつつあります。

MTIAv2 の主な特徴

MTIAv2 の主な特徴は次のとおりです:

前世代比で計算性能とメモリ帯域幅が2倍以上向上
ランキングおよび推薦モデルを効率的に処理できるよう設計
8x8 グリッドの処理要素（PE）で構成され、密な計算性能は3.5倍、疎な計算性能は7倍に改善
ローカル PE ストレージは3倍、オンチップ SRAM は2倍、帯域幅は3.5倍に増加し、LPDDR5 容量は2倍
改良された NoC（Network on Chip）アーキテクチャにより帯域幅が2倍となり、低遅延で PE 間の調整が可能

⚠️広告⚠️ PyTorch 韓国語コミュニティで同じ記事を見る

https://discuss.pytorch.kr/t/meta-mtiav2/4042

Meta、次世代の学習・推論アクセラレータ MTIAv2 を公開

MTIAv2 の主な特徴

関連記事

まだコメントはありません。