3 ポイント 投稿者 GN⁺ 2024-10-13 | 1件のコメント | WhatsAppで共有

AMDのTurin:第5世代EPYCを発表

  • 5GHzサーバーCPU
    • AMDの新しいサーバーCPUであるEPYC 9575Fの紹介で、以前のGranite Rapidsとは異なり、直接のハンズオン経験に基づいて書かれた記事。
    • Zen 5コアのモバイル版およびデスクトップ版の違いはすでに扱っているため、今回はTurinのメモリサブシステムの変化に焦点を当てている。

メモリ帯域幅

  • 9575Fは、メモリ読み取り帯域幅約52GB/s、書き込み帯域幅48GB/s、読み取り-修正-書き込み帯域幅95GB/sを記録。
  • 単一CCDでのメモリ帯域幅使用量を見ると、単一コアでCCD全体のメモリ読み取り帯域幅の半分以下、書き込み帯域幅の約55%、読み取り-修正-書き込み帯域幅の3分の2以上を使用できる。
  • 9575Fはデスクトップ向けZen 5部品と比べてCCDあたりの帯域幅がかなり高く、これはGMI3-Wを介してIOダイに2本のGMIリンクを提供しているため。
  • TurinはDDR5-6400MT/sまでサポートし、特定のシステムでのみ1 DIMM per channelとして利用可能。大半のシステムは6000MT/sをサポートし、2 DIMM per channel構成では4400 MT/sまで低下する。

メモリレイテンシ

  • Turinの無負荷時メモリレイテンシはGenoaと似ている。
  • 負荷時のメモリレイテンシを測定した結果、単一CCDに負荷がかかった場合は無負荷時より約39ナノ秒増加し、システム全体に負荷がかかった場合は約31ナノ秒増加した。
  • CCD内レイテンシは約45ns、CCD間レイテンシは約150ns、ソケット間レイテンシは約260nsで、Genoaと比べてレイテンシが増加している。

クロック速度

  • 9575Fの64コアすべてがシングルスレッドテストで最大5GHzに到達可能で、メモリ帯域幅テストでは8コアが5GHzで動作する。
  • Cinebench 2024で128スレッドが動作する際、9575Fは約4.3GHzを維持し、Webサーバー/TLSトランザクションのワークロードでは約4.9GHzを記録した。

結論

  • AMDのTurinは予想どおりの世代更新であり、高コア数SKUと低コア数の高周波数SKUを提供することで、さまざまな市場の要求を満たしている。
  • TurinはNaplesからRomeへの革新的な変化というより、MilanからGenoaへの進化に近く、メモリ帯域幅の増加、コア数の増加、コアの更新を含んでいる。
  • この世代は競争力のあるエコシステムの中で大きな価値を提供し、多くの人にとって興味深いものとなるだろう。

GN⁺のまとめ

  • AMDのTurinはサーバーCPU市場で重要な進展を遂げており、特にメモリ帯域幅とコア性能の向上が注目に値する。
  • この記事はAMDの最新技術を理解したい人にとって有益であり、サーバー性能の最適化に関心のあるエンジニアの助けになるだろう。
  • Turinと類似した機能を持つ製品としてはIntelのXeonシリーズがあり、AMDとの比較を通じて各製品の長所と短所を把握できる。

1件のコメント

 
GN⁺ 2024-10-13
Hacker News のコメント
  • AMD EPYC 9175F は、16コアで 512MB の L3 キャッシュを備えた風変わりな製品。これは「コア単位」のライセンス費用を最小化したい顧客向けのように見える。Oracle が今でもこうしたライセンス方式を使っているのか気になる

    • HFT のような特定用途では、L3 にアルゴリズム全体を載せて最小遅延を狙うこともできるかもしれない
    • しかし主には、ソフトウェアライセンスに関連する話である可能性が高い
  • Phoronix は 196 コアの Turin Dense と 192 コアの AmpereOne を比較レビューしている

    • Ampere の MSRP は $5.5K、EPYC は $15K
    • Turin 196 は性能が 1.6 倍高い
    • Ampere は消費電力効率が 1.2 倍高い
    • 実際の $/性能 という観点では、Ampere 192 コアは Turin Dense 196 コアより 1.7 倍優れている
  • $5.5K で、AmpereOne 192 コア CPU(274w)または Turin Dense 48 コア CPU(300w)を購入できる

    • Ampere は来年、256 コア、3nm、12 メモリチャネルの製品を投入予定で、Turin Dense や Sierra Forest との性能競争において、より有力な挑戦者になる可能性がある
    • 現時点では、$/性能 が彼らのバリュープロポジションだ
  • Qualcomm の Nuvia ベースのサーバーチップの性能にとても関心がある

    • ARM のクライアント向けコアの改善が何らかの指標になるなら、AWS Graviton、Google Axion、Microsoft Cobalt、Nvidia Grace、Alibaba Yitian のような独自チップが、より優れた Neoverse コアとどう競うのか非常に気になる
    • Nuvia vs ARM vs AmpereOne の競争が楽しみだ
  • 今はサーバー CPU の黄金時代かもしれない

    • 7 年前は Intel の Xeon しかなかった
    • 今では多様な選択肢がある
  • Hetzner で AMD Turin ベアメタルサーバーが展開されるのが楽しみ

    • 以前の世代もすでに優れたコストパフォーマンスを提供していたが、今回はさらに一段進んだように見える
  • 20 年前は CPU あたり 1〜2 コアしかなく、デュアルソケットサーバーで 4 コアあるだけでも恵まれていた

    • 今では単一サーバーでほぼ 400 コアを持てる
    • ARM の方がコア数は多いかもしれないが、現時点ではこれらほど高性能ではない
  • Substack への移行が嫌な人向けに、代替サイトがある

  • 12 年ものの Dell PowerEdge をデュアル Xeon で運用している

    • 第 1 世代の Epyc サーバーが eBay で安く出回るのを楽しみにしている
  • ChipsAndCheese は新しい技術系出版物の 1 つで、特に深いベンチマークに関して優れた知見を持っている

    • Anandtech、TechReport、HardCOP などの古い技術サイトが消えていく中で、こうしたスタイルを維持できる新しい出版元があるのはありがたい
  • Factorio 2.0 に合わせたちょうどよいタイミングでの発売

  • 9965 が実際に動いているところを見てみたい

    • こういう部品は驚異的だ
    • この世代のマシンを購入する予定
  • 動画の 1:11 に TDP のチャートがある

    • 125〜500W で、かなり高温で動作する