8 ポイント 投稿者 GN⁺ 2024-04-10 | 1件のコメント | WhatsAppで共有
  • Intel Gaudi 3 AIアクセラレーターの紹介

    • 2024年4月9日にアリゾナ州フェニックスで開催されたIntel Visionイベントで、Intel Gaudi 3 AIアクセラレーターが発表された
    • BF16で4倍のAI演算性能と、前世代比1.5倍のメモリ帯域幅向上を提供する
    • 汎用的なコミュニティベースのソフトウェアと業界標準のイーサネットを通じて顧客に選択肢を提供し、システムをより柔軟に拡張できるよう支援する
  • Gaudi 3が重要な理由

    • 金融、製造、医療など主要分野の企業がAIへのアクセスを拡大し、生成AI(GenAI)プロジェクトを実験段階から大規模実装段階へと急速に移行している
    • この移行を管理し、イノベーションを促進し、収益拡大の目標を実現するには、オープンでコスト効率が高く、エネルギー効率にも優れたソリューションと製品が必要となる
    • Intel Gaudi 3アクセラレーターはこうした要件を満たし、オープンなコミュニティベースのソフトウェアとオープンな業界標準イーサネットを通じて多様性を提供することで、企業がAIシステムとアプリケーションを柔軟に拡張できるよう支援する見込みである
  • カスタムアーキテクチャがGenAIの性能と効率を実現する方法

    • Intel Gaudi 3アクセラレーターは効率的な大規模AI演算のために設計されており、5nmプロセスで製造され、前世代と比べて大きな進歩を遂げた
    • すべてのエンジンを並列で稼働できるよう設計されており、高速かつ効率的なディープラーニング演算と、スケールアウトに必要な加速を可能にする
    • 主な機能:
      • AI専用演算エンジン: 64基のAI向けカスタム・プログラマブルTPCと8基のMMEで構成される異種演算エンジンを搭載
      • LLMの容量要件に向けたメモリ強化: 128GB HBMe2メモリ、3.7TBのメモリ帯域幅、96MBのオンボードSRAMを提供
      • エンタープライズGenAI向けの効率的なシステム拡張: 柔軟でオープンな標準ネットワーキングを提供する24基の200Gbイーサネットポートを統合
      • 開発者の生産性を高めるオープンな業界ソフトウェア: PyTorchフレームワークを統合し、最適化されたHugging Faceのコミュニティベースモデルを提供
    • Gaudi 3 PCIeの追加機能: ファインチューニング、推論、検索拡張生成(RAG)に最適な新しいフォームファクター
  • 市場採用と提供時期

    • Intel Gaudi 3アクセラレーターは2024年第2四半期に、Universal Baseboardおよびオープン・アクセラレーター・モジュール(OAM)の業界標準構成でOEM向けに提供される予定
    • Dell Technologies、Hewlett Packard Enterprise、Lenovo、Supermicroなどの主要OEMで採用予定
    • Intel Gaudi 3アクセラレーターの一般提供は2024年第3四半期を予定しており、Intel Gaudi 3 PCIeアドインカードは2024年第4四半期に提供される見込み
    • NAVERを含む複数のコスト効率に優れたクラウドLLMインフラでIntel Gaudi 3アクセラレーターが採用される予定
  • 今後の計画

    • Intel Gaudi 3アクセラレーターの勢いは、Intelの次世代AI/HPC向けGPUであるFalcon Shoresの基盤となる見込み
    • Falcon ShoresはIntel GaudiとIntel Xe IPを統合し、Intel oneAPI仕様に基づく単一のGPUプログラミングインターフェースを提供する予定

GN⁺の見解

  • Intel Gaudi 3は、Nvidia H100やH200といった主要競合製品に対し、GenAIモデルの学習および推論性能で大幅な改善を示している。これは、AI市場におけるNvidiaの独占的地位に挑戦し得る代替選択肢として位置づけられる可能性がある
  • オープンソフトウェアおよび標準ベースの拡張性サポートは、企業のコスト効率向上とvendor lock-inの回避に寄与し得る。特にAIシステムを大規模に構築しようとする企業にとって、魅力的な選択肢となり得る
  • ただしIntelは近年、CPU市場での競争力低下や製品投入の遅延などの課題に直面してきた。Gaudi 3が予定どおりに投入され、幅広い顧客導入を実現できるかは注目に値する
  • AI半導体市場ではAMDのInstinct MI300のような競合製品も投入を控えており、競争は一段と激化すると見られる。技術的優位性だけでなく、ソフトウェアエコシステムの構築や顧客基盤の確保なども主要な勝負どころになる見通しだ

1件のコメント

 
GN⁺ 2024-04-10
Hacker Newsの意見
  • OAMインターフェースを使っているため、8〜10年後でも愛好家たちがこのデバイスを活用できそう
  • Intelがこの製品群を長期にわたって継続的にサポートするかについては懐疑的
  • HBM2eメモリを採用しており、これは2020年に発売された Nvidia A100 で使われたもので最新ではないが、8スタックを使って H100 の帯域幅に匹敵する
  • 「Gaudi 3 PCIe」の価格が、ワークステーションに搭載できるほど妥当なものになるのか気になる
  • この発表で 5W1H の手法が使われていたことに感謝
  • Gaudi 3 は TSMC または Samsung の 5nm プロセスで製造されているようだ
  • MoE などの疎なアーキテクチャの台頭により 128GB の容量が重要に見え、Nvidia と競合しそう
  • AMD MI300x についても MLPerf ベンチマークの取り組みを期待
  • 200Gb Ethernet ポート 24基の統合は印象的である一方、ケーブルコストなどを考えるとがっかりでもある
  • メモリ帯域幅の単位として "terabytes (TB)" が使われているのは珍しい