7 ポイント 投稿者 GN⁺ 2024-09-29 | 1件のコメント | WhatsAppで共有
  • 2020年、チップレイアウトを設計するための新しい強化学習手法を紹介するプレプリントを発表した
  • この手法はその後 Nature に掲載され、オープンソースとして提供された
  • 今日、私たちはこの手法とチップ設計分野に与えた影響を詳しく説明する Nature のアデンダムを発表した
  • また、事前学習済みチェックポイントを公開し、モデルの重みを共有するとともに、AlphaChip という名称を発表した
  • コンピュータチップは人工知能(AI)の目覚ましい進歩を支えてきたが、AlphaChip は AI を活用してチップ設計を高速化・最適化する
  • この手法は、Google のカスタム AI アクセラレータである Tensor Processing Unit(TPU)の直近3世代で、超人的なチップレイアウトを設計するために使われている
  • AlphaChip は、実際のエンジニアリング問題の解決に使われた最初期の強化学習アプローチの1つである
  • 数週間から数か月にわたる人的投入の代わりに、数時間で超人的または同等レベルのチップレイアウトを生成し、これらのレイアウトは世界中のデータセンターから携帯電話まで多様なチップに使われている

AlphaChipの仕組み

  • チップレイアウトの設計は簡単な作業ではない
  • コンピュータチップは、多数の相互接続されたブロックで構成されており、回路コンポーネントの階層と非常に細いワイヤによってすべて接続されている
  • さらに、同時に満たさなければならない複雑で絡み合った多くの設計制約がある
  • その複雑さのため、チップ設計者は60年以上にわたり、チップのフロアプランニングプロセスの自動化に苦労してきた
  • AlphaGo や AlphaZero と同様に、私たちは AlphaChip がチップのフロアプランニングを一種のゲームとして扱うように構築した
  • 空のグリッドから始めて、AlphaChip は一度に1つずつ回路コンポーネントを配置し、すべてのコンポーネントの配置が完了するまでこれを繰り返す
  • その後、最終レイアウトの品質に応じて報酬を受け取る
  • 新しい「エッジベース」のグラフニューラルネットワークにより、AlphaChip は相互接続されたチップコンポーネント間の関係を学習し、チップ全体にわたって汎化できるため、設計するレイアウトごとに改善できる

AIを用いたGoogleのAIアクセラレータチップ設計

  • AlphaChip は 2020年の発表以来、Google の TPU のすべての世代で使われる超人的なチップレイアウトを生成してきた
  • これらのチップは、Google の Transformer アーキテクチャに基づく大規模 AI モデルを可能にしている
  • TPU は、Gemini のような大規模言語モデルから、Imagen や Veo のような画像・動画生成器に至るまで、強力な生成 AI システムの中核にある
  • これらの AI アクセラレータは Google の AI サービスの中核でもあり、Google Cloud を通じて外部ユーザーにも提供されている
  • TPU レイアウトを設計するために、AlphaChip はまず、オンチップおよびチップ間ネットワークブロック、メモリコントローラ、データ転送バッファなど、前世代のさまざまなチップブロックで学習する(これを事前学習と呼ぶ)
  • その後、現在の TPU ブロック上で AlphaChip を実行し、高品質なレイアウトを生成する
  • 以前のアプローチとは異なり、AlphaChip は人間の専門家と同様に、より多くのチップ配置タスクのインスタンスを解くほど性能が向上し、速度も増していく
  • AlphaChip は、最新の Trillium(第6世代)を含む各新しい TPU 世代ごとに、より優れたチップレイアウトを設計し、フロアプラン全体のより多くの部分を担うことで、設計サイクルを加速し、より高性能なチップを生み出してきた

AlphaChipの広範な影響

  • Alphabet、研究コミュニティ、そしてチップ設計業界全体にわたる応用を通じて、AlphaChip の影響を見ることができる
  • TPU のような専用 AI アクセラレータ設計を超えて、AlphaChip は Alphabet 全体の他のチップ、たとえば Google 初の Arm ベース汎用データセンター CPU である Axion プロセッサなどのレイアウトも生成してきた
  • 外部組織でも AlphaChip を採用し、それを基盤に発展させている(例: 世界有数のチップ設計企業の1社である MediaTek は、Samsung のスマートフォンに使われる Dimensity Flagship 5G のような最先端チップの開発を加速しつつ、電力、性能、チップ面積を改善するために AlphaChip を拡張している)
  • AlphaChip はチップ設計向け AI 研究の爆発的な拡大を引き起こし、論理合成やマクロ選択のような、チップ設計の他の重要な段階にも広がっている

未来のチップを作る

  • 私たちは、AlphaChip がコンピュータアーキテクチャから製造に至るまで、チップ設計サイクルのあらゆる段階を最適化する潜在力を持っていると考えている
  • スマートフォン、医療機器、農業用センサーなど、日常的なデバイスに搭載されるカスタムハードウェアのチップ設計を革新できる
  • AlphaChip の今後のバージョンは現在開発中であり、私たちはこの分野で革新を続け、チップがより高速で、より安価で、より電力効率の高い未来を実現するために、コミュニティと協力していくことを楽しみにしている

GN⁺の見解

  • AlphaChip の AI ベースのアプローチは、チップ設計分野に革命をもたらしている。特に、チップレイアウト設計プロセスの自動化において大きな進展を遂げた
  • AlphaChip は、実際のエンジニアリング問題に強化学習を適用した初期の事例の1つであり、AI が現実世界でどのように活用できるかを示す好例である
  • AlphaChip が TPU 設計に与えた影響は、AI アクセラレータハードウェアの発展における重要なマイルストーンになるだろう。より優れた AI アクセラレータは、より強力な AI モデルを可能にし、それがさらに AI の進歩を加速させるだろう
  • しかし、AI 設計ツールへの過度な依存は、人間の設計者の専門知識の喪失につながる可能性がある。長期的には、AI と人間の専門家の協業が最も望ましいだろう
  • 類似の AI ベース設計ツールとしては、Cadence の Cerebrus、Synopsys の DSO.ai などがある。今後、AI ベース設計自動化ツール間の競争は激化するとみられる

1件のコメント

 
GN⁺ 2024-09-29
Hacker Newsの意見
  • GoogleのNature論文は、EDA CAD分野の研究者から批判を受けている
    • Google社内研究者による反論論文: "Stronger Baselines for Evaluating Deep Reinforcement Learning in Chip Placement"
    • UCSD研究チームの2023 ISPD論文: "Assessment of Reinforcement Learning for Macro Placement"
    • Igor Markovの批判論文: "The False Dawn: Reevaluating Google's Reinforcement Learning for Chip Macro Placement"
  • GoogleのRLマクロ配置アルゴリズムは、他の最新アルゴリズムと公平に比較されていない
    • 人間より優れたマクロ配置性能を主張しているが、これは現在の混合配置アルゴリズムの性能には及ばない
    • RL技術は他のアルゴリズムより多くの計算資源を必要とし、配置問題そのものの新しい表現を学習するのではなく、代理関数を学習している
  • Googleの取り組みに懐疑的で、個人Webサイトに詳しい投稿を書いている
  • Googleの研究者が嫌がらせを受け、Anthropicに転職した事例がある
    • 関連記事: "Google Brain AI Researcher Fired Tension"
  • TSMCは、最新のチップ設計自動化ソフトウェアがTDPのための論理設計を選択できる機能を強調している
    • これはDennard scalingを維持する方法になり得る
    • 光の速度と物理的近接性は依然として重要だが、熱スロットリングを回避することがどれほどの利点をもたらすのか気になる
  • チップ設計の品質をどう測定するかについての疑問
    • Googleが報告しているメトリクスは妥当なのか、それとも単に自分たちを良く見せようとしているだけなのか気になる
    • チップ設計の「品質」は多面的であり、ユースケースに大きく依存する
    • データセンター向けチップと、携帯電話のカメラ用や自動車向けのチップでは大きく異なるはず
    • この特定の問題/タスクにおいて、「より良い」とは何を意味するのか気になる
  • Euriscoはかつて配置・配線作業の実行に使われており、非常にうまく機能していた
    • EuriscoはTraveler TCSゲームの戦闘宇宙船艦隊を設計するために使われた
    • EuriscoはVLSI設計で学習した対称性ベースの配置を使用していた
    • AlphaChipのヒューリスティックが他の分野でも使えるのか気になる
  • Googleのチップ設計の取り組みは「論争の余地がある」
    • なぜ新しいことをせず、PRだけをしているのか気になる
  • 多くのDeepX論文が、適切なCSフォーラムではなくNatureに投稿される問題
    • チップ設計でより良い研究をしているなら、IPSDやISCAなどに投稿すべき
    • Natureがこのような論文をどのように扱っているのかわからない
  • なぜ「超人的」という表現を使い続けるのか気になる
    • アルゴリズムはこうした作業に使われており、人間が何兆個ものトランジスタを手作業で配置しているわけではない
  • PCB設計/レイアウト向けのツールがあればいいのにと思う
  • メモリベースコンピューティングが、研究段階から競争力のある製品へ移行する時点にどれだけ近づいているのか気になる
    • メモリスタのような実験を大規模に拡張するため、非常に積極的に投資する段階に達したと思う
    • AIデータセンターのために新たな原子炉がいくつ必要になるかが議論されている