1 ポイント 投稿者 GN⁺ 2025-10-20 | 1件のコメント | WhatsAppで共有
  • Strix HaloはAMDが発表した最大規模のクライアント向けチップレットAPUで、高性能CPUとGPU処理を統合して処理するよう設計されています
  • 16コアのZen 5と40基のRDNA 3.5 iGPUコンピュートユニットを搭載し、デスクトップ級CPUおよびミッドレンジ外付けGPUに匹敵する性能を提供する
  • LPDDR5X-8000メモリバスと32MBのInfinity Cacheを採用し、高帯域幅と低レイテンシの環境を実現している
  • iGPU性能は従来のモバイルAPUを凌駕し、一部の環境ではミッドレンジ外付けGPUとも競合可能である
  • ML(機械学習)性能はROCmサポート待ちで、将来の拡張性と発展の可能性が期待される

概要と製品紹介

  • Strix HaloはAMDがCES 2025で発表した初のコンシューマ向けチップレットAPUです
  • モバイルプロセッサでありながらデスクトップ級の高性能を追求し、55W〜120WのTDP範囲をサポートし、独立した外付けグラフィックスなしでも高性能を実現
  • 16コアZen 5アーキテクチャ(デュアル8コアCCD)で、デスクトップ製品と同一の512b FPUを活用している
  • 最大5.1GHzのブーストクロック(デスクトップRyzen 9 9950Xより600MHz低い)をサポート
  • メインGPUとしてのRDNA 3.5 iGPU: 40コンピュートユニット、32MB Infinity Cache、2.9GHzブーストクロック → RX 7600 XT〜RX 7700レベルの計算性能
  • 256b LPDDR5X-8000メモリバス(最大256GB/s、全コンポーネント共用; RX 7600 XTの288GB/sよりわずかに低いが、既存APUに比べて抜群)を採用

テスト環境とデバイス

  • **Asus ROG Flow Z13(2025)HP ZBook Ultra G1a 14”**を用いて実利用性能を測定
  • ROG Flow Z13はゲーム中心のテスト、ZBook Ultra G1aはマイクロベンチマークに使用

CPU視点のメモリサブシステム

  • メモリレイテンシ: Strix Point(~128ns)に対しStrix Halo(~123ns)はほぼ差がない
  • CPUはIOダイ内の32MB Infinity Cacheに直接アクセスできず、インタビューを通じて公式に確認済み
  • **デスクトップCPU(9950X)**は75〜80nsで、モバイルよりはるかに低いレイテンシ
  • メモリ帯域幅: 16コアが純粋な読み取り-修正-加算演算で175GB/s以上を達成し、読み取りは最大124GB/s
    • 単一CCDの帯域幅は64GB/s(読み取り)、43GB/s(書き込み)で、実質合計103GB/sレベル
    • デスクトップと同様にCCD-IOダイ間リンクは2000MHz、サイクルあたり32バイト

CPU性能

  • Strix Halo CPUは前世代デスクトップフラッグシップ(7950X)と同等の整数演算性能を確保しており、クロックスピードは11.7%低下
  • 浮動小数点性能は現行フラッグシップ(9950X)に近く、一部のサブテストでは逆転が発生
  • SPEC CPU 2017 Integer/FPサブテストでStrix Haloは9950Xに匹敵するか、一部項目では上回るが、LPDDR5Xバスのより高いレイテンシで僅差が生じる

GPU視点のメモリ構造

  • Strix Halo GPUのメモリ帯域幅は、あらゆるモバイルSoC中で圧倒的に高い
  • 一方、RTX 5070 Mobileに比べるとメモリ帯域幅は50%低い
  • Infinity Cache(MALL)性能は5070MのL2より40%高く、容量も33%大きい。4MB L2キャッシュは2.5TB/sの帯域幅を提供
  • Strix HaloのL2キャッシュレイテンシは5070MのL2より低く、32MB MALLのレイテンシは5070M L2と同等
  • 全体のメモリレイテンシは5070M比で35%低い

GPU演算スループット(Throughput)

  • 浮動小数点演算スループット: Strix Pointの約2.5倍、5070Mと同等または上回る
    • FP16結果では5070Mを下回るのみ(ベンチマーク上の特異事例の可能性)
  • 整数演算スループット: 5070MがRadeon 8060Sより高い

GPU性能とゲーミング

  • iGPUとしてのStrix Haloは、従来のIntel/AMD iGPUと比較して圧倒的な性能を示し、外付けGPUとも接近した競争力を持つ
  • 大きな差が出るゲーム(Cyberpunk 2077)テストでは:
    • バッテリー環境: Radeon 8060Sが同条件の5070Mに対して7.5%高い1080p性能を示す
    • AC電源環境: 1080pではRadeon 8060Sが2.5%先行、1440pでは5070Mが8.3%先行
    • 詳細な設定/電力条件で、両者とも競争力を維持し、iGPUが外付けGPUと実質的に同等の性能を示す
  • Fluid X3Dと計算型ワークロードではRadeon 8060SがIntel/AMD従来iGPUを完全に凌駕

結論

  • Strix Haloは高性能CPU-GPU統合SoCを目指し、多様な利用シーンで優れた性能を発揮
  • デスクトップZen 5 CPUとミッドレンジ外付けGPUとでも競争し、モバイル/デスクトップの両方に対応
  • **効率性と統合性(iGPUの利点)**を維持しつつ、高性能を保有
  • 高性能専用外付けGPUを上回るわけではないが、小型デバイスと統合環境で最適な柔軟性と性能を提供
  • ML性能はROCmサポートの遅延で次回分析が必要。将来的な拡張性や大容量メモリバス設計(Apple Max/Ultraのような)への可能性も示唆
  • Strix Haloの成功した設計アプローチは、今後のAMD高性能APUラインアップ拡大の基盤になると見られている

1件のコメント

 
GN⁺ 2025-10-20
Hacker Newsの意見
  • この製品を搭載したミニPCをぜひ使ってみたいが、ヨーロッパではものすごく高いか、そもそも購入自体が不可能だ。中国から直輸入するのも、アフターサービスの問題があるので慎重になってしまう。ROCm 7 はすでに大半の Linux ディストリビューションで動いているので、これをワークステーションや、自宅で LLM や Ollama、そのほかのサービス向けのホーム推論サーバーとして使えたら本当に良さそうだ

    • ドイツから発送で、価格も比較的手ごろな製品を見つけた: BOSGAME M5 AI Mini Desktop 参考までに

    • Corsair AI Workstation 300 Desktop PC を見たか気になる。選ぶモデルによって 2000〜2700ユーロで、付加価値税を考えると米ドル建ての価格(1700〜2300USD)とだいたい同じ感覚だ Corsair AI Workstations

    • framework desktop 395 128GB版を 1900ユーロ弱で注文した。追加構成も含めて送料込みで 2000ユーロを少し超えたが、高いとは感じなかった

    • 価格が高い主な理由はハイバンド幅メモリのせいだと理解している(ただし、実際の高性能GPUと比べるとメモリ帯域幅が極端に高いわけではない)

    • ROCm はかなり進歩しているが、RX9070XT デスクトップで多少問題もあったので、AI用途なら当面は Nvidia か Apple のソリューションを勧める。ただ、いずれ追いつくと思う。コストパフォーマンスで最高の AI システムは、今でも RTX 3090 を2枚挿したデスクトップを自作して使う構成だ(もちろんデュアルカード対応のボードが必要)。あとはクローゼットに入れて回しておけばいい

  • モバイル dGPU、そして(ついに現実になった)DGX Spark 製品と比べると、この市場はまだ完成形ではなく、伸びしろのあるセグメントのように感じる。DGX Spark がなぜ長く遅れたのかは分からないが、そのおかげで AMD には先にシェアを取るチャンスがあった。ディスクリート GPU(モバイルを含む)の利点はメモリ帯域幅で、欠点は高い消費電力とメモリ容量だ(CUDA はひとまず脇に置くが、もちろん非常に大きな要素ではある)。DGX Spark の小型デスクトップを追加すれば、200Gb のシングル、または 100Gb のデュアルネットワークポートで複数デバイスに RDMA を使えるので、同数の Strix Halo 395 より高い活用度が出るかもしれない。ただ、実務では DGX Spark を4台並べるより、GPU サーバーか Threadripper GPU ワークステーションを使う気がする。そして DGX Spark はノートPCには入らない点も Strix Halo に有利だ。結論として、これは新しいニッチ市場だと思うし、今後何世代かをかけてどんな形で定着するのか楽しみだ

    • 次世代では AMD から Medusa Halo が出る予定で、384ビットの LPDDR6 バスを搭載すると言われている。この場合、Strix Halo より2倍のメモリと 1.7倍の帯域幅を実現できる可能性がある。Strix Halo は推論プラットフォームとして成功しつつあるので、この市場セグメントは今後も成長しそうだ

    • ちなみに 200Gb デュアルではなく、200Gb シングルまたは 100Gb デュアルだ

    • “dGPU” は普通ディスクリート GPU の意味だ。もしかして “iGPU”(統合グラフィックス)のことを言いたかったのだろうか。Strix Halo 製品はゲーム向けとしてもマーケティングされているが、実際の性能を見ると少しちぐはぐに感じる。CPU は過剰なくらい速いのに、iGPU の性能は相対的に物足りない。ただ、行列積(matmul)性能は確かに強力そうだ

    • DGX Spark の主な目的は、ローカル AI モデルの開発やテストのように見える。Strix Halo は amd64 ベースの iGPU なので、従来の PC 作業にも使え、ローカル AI 向けターゲットデバイスとしても十分だ。自分としては、Strix Halo はノートPCにおけるディスクリート GPU 時代の終わりを告げる始まりのように思う。Nvidia もそれを認識して、Intel と組んで iGPU ソリューションを作ろうとしているようだ

  • 残念なのは、発売から半年たっているのに使えるノートPCが2機種しかなく、そのうち高性能モデルは Z13 だけだという点だ。Framework の製品もあるが、多くの国では購入できず、かなり限られた顧客層向けだと思う。Z13 は本当に気に入っているが、これも明らかにニッチだ。チップ製造に問題があるのかも分からないし、Apple が生産量を全部持っていっているのかも気になる

    • HP ZBook Ultra の米国価格は非常に高かったが、ヨーロッパでは普通のノートPCと同程度で、妥当に感じられた。自分が惜しいと思っているのは、発売初日に注文してしまって 128GB 版を待てなかったことだ。ただ、バッテリーや性能については、これまで扱ってきたどんな重作業でも対抗できる競合がなかった。そしてノートPC以外でも、Beelink のようなメーカーが妥当な価格の NUC を作っている。供給不足のせいで商機の見極めが難しくなった、という点には同意する

    • HP ZBook Ultra G1a は最大 128GB RAM 構成が可能なので、良い選択肢だ

    • Beelink、GMKtec、Minisforum、Corsair といったブランドも製品を出している

    • ヨーロッパの大半では、Z13 を 32GB 超の RAM 構成で買えず、2〜3年保証も一般的には付かないのが残念だ。結果として、RAM/CPU/GPU がより弱い Framework 13 を買うことになるかもしれず、不満がある

  • High Yield がシリコンレベルで 395 チップを深く分析した動画を上げているので、参考になると思う High Yield - 395 Chip Deep Dive

  • framework desktop では TDP(電力制限)をもっと高く設定できるのか気になる。このデスクトップは同じチップを使ったノートPCより冷却がはるかに良さそうなので、実際に性能差があるかもしれない

    • 140W 持続、160W バースト(約10秒)まで設定可能だ

    • 消費電力は測っていないが、Framework のメインボードをより大きい ITX ケースに入れて冷却を改善して使っている。自分のメインPCである 7950X3D と Strix ユニットはコア数/スレッド数が同じで、ベンチマークでも差がほとんどない。つまり、ノートPCでデスクトップ級の計算性能が出せるという事実に驚かされる

  • どこかで読んだ話では、この APU が Apple 製品ほどエネルギー効率が高くない主な理由は、Epyc アーキテクチャと共有するための設計判断にあるらしい。その結果、低電力時の効率が落ちるというトレードオフを受け入れた、という主張だったが、誰か検証できるだろうか

    • Hardware Canucks のレビューで、M4 Pro(第2世代 3nm)と 395+(4nm)を 50W でテストした結果があるが、性能はかなり近く、3nm と 4nm のプロセス差で説明できそうだ YouTubeレビュー

    • APU も悪くないが、m3 ultra のようなメモリ帯域幅には到底及ばない。ただし価格ははるかに安い。自分は古いデスクトップの置き換えを考えているが、外付け GPU(A6000 など)を会社から一時的に借りられて、セットアップにあまり時間がかからないことが重要だ

  • framework desktop を買ってテストしているが、小さいのに本当に印象的なマシンだ。今後こうした製品が、より多くのエンジニアコミュニティの関心と参加を引きつけてほしい。vulkan や rocm がしっかりサポートされるエコシステムは、みんなにとって良いはずだ

  • 関連した質問だが、デスクトップ向け Zen 5 CPU + RX 7600 XT + メモリを組み合わせれば、Strix Halo や Apple Silicon のようにシステムメモリと GPU がメモリ帯域幅を共有する形を安く作れるのだろうか。そして妥当な価格で大規模 LLM もローカルで動かせるのだろうか。さらに、よく分かっていないのだが、メモリ共有は APU だけで、ディスクリート GPU ではできないと理解している。それで合っているだろうか

    • 物理的に分離された GPU のメモリは "unified" ではない。その場合は PCIe バス経由でアクセスすることになり、かなり大きな帯域幅のボトルネックが発生する。PCIe 5.0 x16 の最大は 64GB/s で、しかもすべての GPU がそれをサポートしているわけではない
  • グラフィックス性能は 5070M と競えるレベルなのか気になる。価格と消費電力が妥当なら、かなり魅力的に見える

    • 消費電力は約 75W だ。手動で引き上げることもできるが、どんな場合でも 100W 未満に収まる(Z13 を調べたときに得た情報だ)。このチップ自体はもっと高い電力にも耐えられるし、ASUS は通常ノートPCに 130W 以上与える会社なので、75W という数値は少し意外だった
  • GPU 性能が m シリーズ Mac に載っている GPU と比べてどうなのか気になる