4 ポイント 投稿者 GN⁺ 2025-08-26 | まだコメントはありません。 | WhatsAppで共有
  • 液体冷却は、データセンターにおける高電力チップの発熱問題を解決するため急速に広がっている
  • 空気より約4,000倍高い熱伝導率を持ち、特にAIブームによるTPU冷却需要に対応するため、Googleが積極的に導入している
  • GoogleはCDU(Coolant Distribution Unit) ベースのラック単位の液体冷却ループを運用し、保守性と拡張性を高めている
  • Split-flowコールドプレートベアダイ冷却(TPUv4) など、高性能PC市場の手法をデータセンタースケールに適用している
  • 液体冷却はファンと比べて消費電力が5%以下と効率的であり、漏水・微生物増殖といった問題に備えて、Googleは徹底した検証、通知システム、予防保守を併用している
  • NVIDIA、Rebellions AIなども液体冷却を採用し、データセンター冷却の標準化の流れが加速している

液体冷却の必要性と背景

  • 液体冷却はPC愛好家の間ではなじみ深く、企業向けコンピューティング環境でも長い歴史を持つ
  • 近年、AIおよび機械学習ワークロードの電力消費増加により、データセンターでの液体冷却の重要性が大きく高まっている
  • Google水の熱伝導率が空気に比べて約4,000倍高い点に注目し、最新チップの高発熱への対策として採用した
  • Hot Chips 2025でGoogleは、TPU(機械学習アクセラレータ)の冷却に関連するデータセンター規模の液体冷却方式を紹介した

Googleの液体冷却システム構成

  • Googleは2018年からTPUに液体冷却を適用し、さまざまな実験と改善を重ねてきた
  • 最新の冷却ソリューションはサーバー内に限定されずラック全体に液体冷却ループを適用している
  • 1つの冷却ラックは6基のCDU(Coolant Distribution Unit) で構成され、これはPCのラジエーター+ポンプ一体型に近い役割を果たす
  • 柔軟なホースクイックディスコネクトカップリングを導入し、保守のしやすさと設置許容差を改善している
  • 6基のうち5基だけを稼働させても十分な冷却が可能で、1基を保守する際にも全体停止は不要である

熱交換とチップレイアウト

  • CDUは内部冷却水とデータセンターの外部供給水の間で熱のみを交換し、2つの液体は直接混ざらない
  • CDUから出た冷却水はマニホールドを通じて複数のTPUサーバーへ分配される
  • TPUチップ接続は順次(シリーズ)構成で、ループ内の最後のチップの熱需要を基準に全体の冷却予算を算定する

冷却技術の最適化

  • Split-flow cold plate構造を適用し、従来の直線型設計より向上した冷却性能を確保している
  • さらにbare-die冷却(TPUv4、過去のTPUv3はlidded)を適用しており、一般に上級PC愛好家が熱伝達効率を高めるために行う「delidding」に近い
  • TPUv4はv3比で1.6倍高い消費電力のため、このような追加冷却方式を必要とする

電力効率と熱移動

  • 液体冷却ポンプの消費電力は、従来の空冷ファン電力に対して5%未満とされる
  • Googleのシステムはwater-to-water熱交換方式を通じて、実質的な冷却動力の大部分をポンプが担う
  • PC愛好家の環境では多くの場合ファン+ラジエーターの組み合わせが残っており、データセンターほど電力面の利点は大きくない

保守、信頼性、安全性

  • 保守の観点では、微生物繁殖や漏水リスクなど、水冷システムに共通するリスクがデータセンター規模でも存在する
  • クイックディスコネクトフィッティング、予備CDUなど、さまざまな保守支援機構によってダウンタイムなしの大規模運用を目指している
  • 予防保全、漏水テスト、各種異常信号の検知、体系的な対応プロトコルを整備し、全社的な一貫性と信頼性の確保策を講じている
  • これは個々のPC愛好家による非公式な管理方法とは対照的である

業界動向とAIブーム

  • NVIDIARebellions AIなどもHot Chips 2025の展示でさまざまな外部液体冷却システムを披露した
    • NVIDIA GB300サーバー: 外部液体冷却ポートとファンを併設
    • Rebellions AIは韓国企業で、新しいMLアクセラレータ「REBEL Quad」のプロトタイプを、クーラーとチラーを組み合わせた類似方式で実演した
  • AIワークロードの増加は、今後もデータセンター向け液体冷却への需要と採用をさらに加速させる見通しである

まだコメントはありません。

まだコメントはありません。