AMDのTurin:第5世代EPYCを発表
- 5GHzサーバーCPU
- AMDの新しいサーバーCPUであるEPYC 9575Fの紹介で、以前のGranite Rapidsとは異なり、直接のハンズオン経験に基づいて書かれた記事。
- Zen 5コアのモバイル版およびデスクトップ版の違いはすでに扱っているため、今回はTurinのメモリサブシステムの変化に焦点を当てている。
メモリ帯域幅
- 9575Fは、メモリ読み取り帯域幅約52GB/s、書き込み帯域幅48GB/s、読み取り-修正-書き込み帯域幅95GB/sを記録。
- 単一CCDでのメモリ帯域幅使用量を見ると、単一コアでCCD全体のメモリ読み取り帯域幅の半分以下、書き込み帯域幅の約55%、読み取り-修正-書き込み帯域幅の3分の2以上を使用できる。
- 9575Fはデスクトップ向けZen 5部品と比べてCCDあたりの帯域幅がかなり高く、これはGMI3-Wを介してIOダイに2本のGMIリンクを提供しているため。
- TurinはDDR5-6400MT/sまでサポートし、特定のシステムでのみ1 DIMM per channelとして利用可能。大半のシステムは6000MT/sをサポートし、2 DIMM per channel構成では4400 MT/sまで低下する。
メモリレイテンシ
- Turinの無負荷時メモリレイテンシはGenoaと似ている。
- 負荷時のメモリレイテンシを測定した結果、単一CCDに負荷がかかった場合は無負荷時より約39ナノ秒増加し、システム全体に負荷がかかった場合は約31ナノ秒増加した。
- CCD内レイテンシは約45ns、CCD間レイテンシは約150ns、ソケット間レイテンシは約260nsで、Genoaと比べてレイテンシが増加している。
クロック速度
- 9575Fの64コアすべてがシングルスレッドテストで最大5GHzに到達可能で、メモリ帯域幅テストでは8コアが5GHzで動作する。
- Cinebench 2024で128スレッドが動作する際、9575Fは約4.3GHzを維持し、Webサーバー/TLSトランザクションのワークロードでは約4.9GHzを記録した。
結論
- AMDのTurinは予想どおりの世代更新であり、高コア数SKUと低コア数の高周波数SKUを提供することで、さまざまな市場の要求を満たしている。
- TurinはNaplesからRomeへの革新的な変化というより、MilanからGenoaへの進化に近く、メモリ帯域幅の増加、コア数の増加、コアの更新を含んでいる。
- この世代は競争力のあるエコシステムの中で大きな価値を提供し、多くの人にとって興味深いものとなるだろう。
GN⁺のまとめ
- AMDのTurinはサーバーCPU市場で重要な進展を遂げており、特にメモリ帯域幅とコア性能の向上が注目に値する。
- この記事はAMDの最新技術を理解したい人にとって有益であり、サーバー性能の最適化に関心のあるエンジニアの助けになるだろう。
- Turinと類似した機能を持つ製品としてはIntelのXeonシリーズがあり、AMDとの比較を通じて各製品の長所と短所を把握できる。
1件のコメント
Hacker News のコメント
AMD EPYC 9175F は、16コアで 512MB の L3 キャッシュを備えた風変わりな製品。これは「コア単位」のライセンス費用を最小化したい顧客向けのように見える。Oracle が今でもこうしたライセンス方式を使っているのか気になる
Phoronix は 196 コアの Turin Dense と 192 コアの AmpereOne を比較レビューしている
$5.5K で、AmpereOne 192 コア CPU(274w)または Turin Dense 48 コア CPU(300w)を購入できる
Qualcomm の Nuvia ベースのサーバーチップの性能にとても関心がある
今はサーバー CPU の黄金時代かもしれない
Hetzner で AMD Turin ベアメタルサーバーが展開されるのが楽しみ
20 年前は CPU あたり 1〜2 コアしかなく、デュアルソケットサーバーで 4 コアあるだけでも恵まれていた
Substack への移行が嫌な人向けに、代替サイトがある
12 年ものの Dell PowerEdge をデュアル Xeon で運用している
ChipsAndCheese は新しい技術系出版物の 1 つで、特に深いベンチマークに関して優れた知見を持っている
Factorio 2.0 に合わせたちょうどよいタイミングでの発売
9965 が実際に動いているところを見てみたい
動画の 1:11 に TDP のチャートがある