2024.09.25 20:11 更新
2024.09.25 取材
インテル株式会社(本社:東京都千代田区)は2024年9月25日、プレス向け新製品発表会を開催。エンタープライズ向けCPU「Xeon 6900P」とAI向けアクセラレータ「Gaudi 3」の詳細を解説した。
Intelのエンタープライズ向けCPU「Xeon 6」からは、第1弾モデルとしてTDP350WのEコアモデル「Xeon 6700E」が今年6月に登場している。そして、よりパフォーマンスを重視したAIワークロードなどがターゲットの第2弾モデルとして、今回発表されたのがTDP500WのPコアモデル「Xeon 6900P」だ。
第1弾モデル「Xeon 6700E」ではTDPが350Wで、Eコアだったのに対して、「Xeon 6900P」ではTDPが500Wに引き上げられ、CPUコアもPコアへと変更されている |
先代モデルに比べてコア数は最大64コアから最大128コアへと2倍に、マイクロアーキテクチャもRaptor CoveからRedwood Coveへとアップグレードされている。さらに504MBの大容量L3キャッシュや、Intel AMXのFP16対応、UPIリンクの拡張といった改良により、競合のCPUに対してAI推論性能では最大5.5倍、HPC演算性能は最大2.1倍のパフォーマンスを発揮できるという。
またメモリチャネルは12chで、サーバー向けCPUでは初めてMRDIMMをサポートしているのも特徴。メモリクロックはDDR5メモリで最大6,400MT/s、MRDIMMメモリなら最大8,800MT/sまで対応しており、メモリクロックが重要になるワークロードでは30%以上性能がアップするものもある。
さらに「Xeon 6900P」では、電力を制御するパワーモードもより細かく制御ができるように改良されている。これにより、一般的なサーバーで最も多い稼働率40%時のワットパフォーマンスは最大1.9倍も向上している。
なおIntelでは、「Xeon 6700E」「Xeon 6900P」のほか、TDP350WのPコアモデル「Xeon 6700P」やTDP500WのEコアモデル「Xeon 6900E」などのバリエーションモデルも準備中だ。
「Gaudi 3」は、推論処理やファインチューニング、学習処理などを対象にした第3世代のAIアクセラレータ。フォームファクタはメザニンカードのアクセラレータカードと、8基のアクセラレータカードを搭載したユニバーサルベースボードに加えて、先代モデルではなかったPCI Expressカードも用意されている。
PCI Expressカードでは、アクセラレータカードと同等のパフォーマンスを維持しながら、TDPは900Wから600Wに削減されている。またトップボードと呼ばれる接続ボードを使えば4台のカードを連携して動作させることができるため、消費電力を抑えたいユーザーや、ラックマウントサーバーの導入が難しいオフィスなどでの運用に向く。
また「Gaudi 3」では256×256の大規模な行列乗算エンジン(MME)や、4つの独立したパイプラインを備えるベクトル演算プロセッサ「Tensorプロセッシング・コア」、演算処理をキャッシュの収まるサイズに分割してスケジューリングする効率的なパイプライン方式などを採用する。
ちなみにIntelの資料によれば、現在AIワークロードで主流のNVIDIA H100との比較では「LLaMA-3」の推論スループットは約1.09倍、「LLaMA-2 70B」の推論スループットは約1.19倍の性能を発揮。さらにコストパフォーマンスはそれぞれ約1.8倍と約2倍に達し、コスト面での優位性もアピールしていた。
文: 編集部 池西 樹
インテル株式会社: https://www.intel.co.jp/