Intel Xeon w9-3495X


スポンサードリンク




パーソナルワークステーション向けXeon Wシリーズながら倍率アンロックでOCに対応するXeon W-3400Xの最上位モデル、56コア112スレッドの「Intel Xeon w9-3495X」をレビューします。
W-2400Xの最上位 Xeon w7-2495Xや、メインストリーム向け最上位モデルのCore i9 13900KやRyzen 9 7950Xと比較して、マルチスレッド性能重視なクリエイティブタスクにおいてどれくらい性能を発揮するのか、各種ベンチマーク比較によって徹底検証していきます。
DSC01879_DxO


製品公式ページ:https://www.intel.co.jp/content/www/jp/ja/products/sku/233416/intel-xeon-w72495x-processor-45m-cache-2-50-ghz/specifications.html





Intel Xeon w9-3495X レビュー目次


1.Intel Xeon w9-3495Xの外観・付属品・概要
  ・Intel Xeon w9-3495Xとプロセッサーグループについて

2.Intel Xeon w9-3495Xの検証機材・動作設定

3.Intel Xeon w9-3495Xの動作クロック・消費電力・温度

4.Intel Xeon w9-3495Xのクリエイティブ性能
  ・3Dレンダリング性能
  ・動画編集・エンコード性能
  ・RAW現像・写真リタッチ性能
  ・PCゲーム/スマホアプリのビルド性能

5.Intel Xeon w9-3495Xのレビューまとめ
  ・温度・消費電力について
  ・クリエイティブ性能について
  ・総評



【機材協力:Intel】


Intel Xeon w9-3495Xの外観・付属品・概要

「Intel Xeon w9-3495X」の外観や付属品について簡単にチェックしておきます。またこの章では「Intel Xeon w9-3495X」の仕様等について簡単に触れておきたい概要もあれば紹介します。
倍率アンロックなXeon W-2400X/3400XシリーズCPUは現在、8モデルがラインナップされていますが、ボックス版が展開されているのは36コアのXeon w9-3475Xまで、56コアの最上位モデル「Intel Xeon w9-3495X」はバルク販売となっています。そのため今回入手したレビュー用サンプルもプラスチック製トレーに乗っているだけの状態でした。
DSC01876_DxO

肝心の「Intel Xeon w9-3495X」のCPU本体を見ていきます。
LGA4677ソケットに対応する「Intel Xeon w9-3495X」は、競合AMDのRyzen ThreadripperやEPYCと同様に縦長の形状です。
DSC01880_DxO
DSC01883_DxO
Xeon W-3400XとXeon W-2400Xは前者がx4チップレット、後者がモノリシックでCPUダイ構成が異なりますが、同じLGA4677なのでサイズこそ同じであるものの、CPU全体を見ると基板上の実装やヒートスプレッダ形状に違いがあります。
DSC01885_DxO
DSC01897_DxO-horz


パッケージや外観の話はこの辺りにして、続いて「Intel Xeon w9-3495X」のスペックについて見ていきます。
Xeon W-3400Xシリーズの最上位モデル「Intel Xeon w9-3495X」は56コア112スレッドのCPUです。
CPUコアは全て、13900Kなどメインストリーム向け第13世代CPUのP-Coreと同等のアーキテクチャ Raptor Coveで構成されています。

単コア最大ブーストクロックは4.8GHz(TBM3.0有効時)、全コア最大ブーストクロックは1.9GHzとなっています。CPU消費電力の指標となるProcessor Base Powerは350W、Maximum Turbo Powerは420Wです。
Intel-Sapphire-Rapids-Xeon-W-3400_lineup

Sapphire Rapidsのコードネームで呼ばれる「第4世代Xeonスケーラブル・プロセッサー(4th Gen Xeon Scalable Processors:Xeon SP)には、4xタイルによるチップレット構造を採用するXCC(eXtreme Core Count)と、従来同様のモノリシックなMCC(Medium Core Count)という2種類のパッケージが用意されています。
Intel-4th-Gen-Xeon-Scalable-Family-Sapphire-Rapids_package
Intelのメインストリーム向け第12/13世代CPUでは高性能コアと高効率コアの2種類の混成でCPUを構成するIntel Hybrid Computing Architectureが採用されていますが、Sapphire Rapidsは高性能コアのみで構成されています。
Sapphire RapidsのCPUコアには、一般デスクトップ向け第13世代Raptor Lake-SのP-Coreと同じく、Raptor Cove(改良型Golden Cove)アーキテクチャが採用されています。
Intel-4th-Gen-Xeon_Core-Architecture

Platinum/Goldなどでランク分けされるXeon SP(Xeon Scalable Processors)は主にエンタープライズ向けCPUですが、同じ第4世代Xeonスケーラブル・プロセッサーを、パーソナルorスモールビジネスのワークステーション向けCPUとして展開したのがXeon W-2400/3400シリーズCPUです。
上記の通り、2種類のCPUパッケージが存在するので、Xeon W-2400シリーズはMCC、Xeon W-3400シリーズはXCCを採用する形で2種類がラインナップされています。
CPU直結PCIEレーン数がそれぞれ64レーンと112レーンなので、Sapphire Rapids-64L、Sapphire Rapids-112Lとも呼ばれます。
Intel Xeon W-2400X and 3400X Series
Intel Xeon W-2400X and 3400X Series_feature

Xeon W9-3495XやXeon W7-2495Xなど末尾”X”付きモデルは倍率アンロックなのでW790マザーボードと組み合わせれば、Core i9 13900Kなどメインストリーム向けのK付きCPU同様にCPUコアクロックのOCに対応します。
Intel Xeon W-2400X and 3400X_unlocked

Xeon W-2400X/3400XシリーズCPUは、LGA4677ソケットのW790チップセット搭載マザーボードと組み合わせて使用します。
Intel-Sapphire-Rapids-Xeon-W-3400_platform

Xeon W-2400X/3400XシリーズCPUのシステムメモリはDDR5メモリを採用し、定格でメモリ周波数4800MHzをサポートしています。
なお自作PCで一般的なアンバッファードなメモリにも対応していたCore-Xと異なり、Xeon W-2400X/3400XシリーズCPUの対応システムメモリはレジスタードDDR5メモリに限定されます。
Xeon W-2400Xは4チャンネル、Xeon W-3400Xは8チャンネルとなっており、いずれも1チャンネル当たり最大2枚のメモリモジュールに対応します。(実際に使用可能なメモリチャンネル数、モジュール数はマザーボードによる)
DSC01827_DxO
DSC01831_DxO





W790チップセットはPCIE4.0相当のDMI4.0x8レーンによってCPUと接続されており、PCIE4.0x16レーン、PCIE3.0x12レーン、8基のSATA3.0、最大5基のUSB3.2 Gen2x2などを拡張できます。
下の比較表を見ての通り、W790チップセット自体の拡張性はメインストリーム向けのZ790チップセットとほとんど変わらない、というかPCIEやUSBといったインターフェースの仕様は前世代Z690チップセットとほぼ同じです。
Xeon W-2400X/3400XシリーズCPU環境が拡張性においてCore i9 13900Kなどメインストリーム向け第13世代CPU環境と大きく異なるのは、主にCPU直結PCIEレーン数とメモリチャンネル数(搭載可能メモリ数、容量)の2つです。
Intel W790 vs Z790
Xeon W-2400-3400_vs-13th Core-S

CPUクーラーマウント関連についても少し補足しておきます。Intel LGA4677ソケットは、Intel LGA1700やAMD AM5といったメインストリーム向けのLGAソケットと大きく異なるポイントとしてCPUソケット自体にはCPUを上から押さえつけて固定するフレームがありません。
DSC04686_DxO
LGA4677ソケットではマザーボード自体にCPU単独で固定することはできないので、Intel Xeon W-2400X/3400XシリーズCPUのボックス品にはプロセッサーキャリアと呼ばれる、CPUクーラー側にCPUを固定するフレーム部品が付属しています。
CPUはプロセッサーキャリアによってCPUクーラーベースプレートに固定されて脱落することはないので、CPUクーラーの着脱時にCPUクーラーからCPUが落下してLGAソケットがピン折れする心配はありません。
DSC01903_DxO
DSC04747_DxO
LGA4677ソケットの場合、CPUクーラーを固定するリテンションがそのままCPU底面接点とLGAピンの接触リテンションとなっており、Intelの公式仕様では『8 lbs・in (≒ 0.9Nm)』のトルクでネジ締めが推奨されています。
Intel LGA4677_install
万全を期すのであれば、Ryzen Threadripperに付属するような形状のトルクグリップT30のビットを用意するのがオススメです。(ENERMAX LIQTECH TR4 IIはプラスネジのビットが必要)
1/4”ビットのドライバーを使用しているのであればトルク空転ビットでも対応できます。あとは初期費用は割高になりますが可変トルク調整に対応したトルク空転ドライバーを買っておけば別プラットフォームで異なるトルクが必要になっても買い替えの必要がなく便利です。
DSC04816_DxO


Intel Xeon w9-3495Xとプロセッサーグループについて

Windows 11/10は論理コア数が64スレッドを超えるCPUを扱うため、プロセッサーグループというWindows OS特有の構造を備えており、パーソナルワークステーションとして使用する場合は注意が必要です。

プロセッサーグループについては、パーソナルWS向けに2020年に発売された64コア128スレッドのAMD Ryzen Threadripper 3990Xでも話題になったので、記憶している人もいるかと思います。
AMD Ryzen Threadripper 3990X_howtouse

論理コア数が65コアを超えるCPUで、その圧倒的リソースによるマルチスレッド性能を十分に発揮するにはいくつかの前提条件があり、特に重要なものを抜粋すると次のように、赤字で書いた必須要件と、パフォーマンス向上を目指すための推奨要件の2種類に分けられます。
  • Windows 11 OSはHomeではなくPro(for WS)を使用する必要がある
  • アプリケーションが65+論理コアに対応している必要がある
  • 1論理コア当たり1~2GBの割り当てが可能なシステムメモリ128~256GB容量を推奨
  • ストレージはNVMe SSDを推奨 (2023年現在なら、PCIE4.0x4もしくはPCIE5.0x4に対応したもの)
    読み書き分担、ウィルススキャンやバックアップの無効化などアクセス最適化も
まず論理コア数が65コアを超えるCPUが本領を発揮するための必須要件その1について。
Windows 11 OSには一般自作PCユーザーにもよく知られるHomeとProの2種類に加えて、さらにパーソナルワークステーション向けのPro for Workstations(以下、Pro for WS)があります。
Pro for Workstationsは馴染みがないかもしれませんが、Home/Proと同様にマイクロソフト公式ストアでライセンスが購入できますし、PCパーツショップではDPS版が販売されています。
Windows 11 Pro for Workstations

この3種類のソフトウェア機能的な違い、リモートデスクトップ等の一部機能の可否については今回は割愛します。(比較はウィキペディアが詳しい)

Home/Pro/Pro for WSの3種類のハードウェアへの影響は下の表の通り、Windows 11 Homeは64論理コアまでしかサポートしないので、「Intel Xeon w9-3495X」の論理コアを全て使用するにはProもしくはPro for WSを使用する必要があります。
また「Intel Xeon w9-3495X」はシステムメモリとしてオクタチャンネル 2DPCで最大16枚のメモリモジュールを使用でき、合計容量として4TBまでサポートしています。
2023年4がつ現在、DDR5 R-DIMMのメモリモジュール 1枚の最大容量は64GBなので合計の最大容量は1TBですが、将来的に256GB容量のメモリモジュールが登場すれば4TBまでのシステムメモリを構築できます。
サポートする論理コア数についてはProでもPro for WSでも構いませんが、2TBを超えるシステムメモリを使用するならPro for WSが必要になります。
Windows 11 エディション別 対応ハードウェア比較
エディション Pro
for WS
Pro Home
最大論理コア 256スレッド
(4PG)
128スレッド
(2PG)
64スレッド
(1PG)
最大システムメモリ 6TB 2TB 128GB


次に65論理コア以上で重要になるプロセッサグループについて説明していきます。
Windows 11 Pro(for WS)は65+論理コア(スレッド)に対応していますが、OSは全てのスレッドを単一のプロセッサとして認識するのではなく、1グループにつき64論理コアを上限とした複数のプロセッサグループとして認識します。
なおプロセッサーグループの分け方は、”64スレッドを超えたら、次のプロセッサーグループ”という形になっています。今のところ任意にプロセッサーグループの分け方を調整することはできません。
今回レビューしている「Intel Xeon w9-3495X」の56コア112スレッドなら64スレッドと48スレッドの2つに分かれます。
Intel Xeon w9-3495X_Processor Group

プロセッサーグループで問題になるのは、プロセッサグループの壁を超えて2つを同時に活用できるアプリと、そうでなく1つしか活用できないアプリがあることです。
1つのプロセッサグループしか活用できないアプリは自動的にどちらかのプロセッサグループに割り振られ(ランダムではなく規則性はあるようですが、割り振りの詳細についてはちょっとよくわからない)、そのプロセッサグループの中で実行されます。
1つのプロセッサグループしか活用できないアプリはタスクマネージャーの詳細タブでアプリを選択、右クリックしてメニューに表示される”関係の設定”から、そのアプリを実行するプロセッサグループの切り替え、特定コアの割り当てが可能です。
Windows 11 22H2_processor group_1 (1)
Windows 11 22H2_processor group_1 (2)

通常は上記のようにプロセッサーグループの設定が可能なのですが、「Intel Xeon w9-3495X」については2023年5月現在、OSの不具合なのか最初に割り当てられたプロセッサーグループから別のプロセッサーグループへの切り替えが上手く動作しません。
もともとプロセッサーグループ1で動作しているアプリに、プロセッサーグループ0のコア1/2を設定しても、なぜか、プロセッサーグループ1のコア1/2で動作します。
Windows 11 22H2_processor group_error_1
他にもプロセッサーグループという機能の仕様なのか、同様に不具合なのか分かりませんが、「Intel Xeon w9-3495X」のようにPG0とPG1で論理コア数が異なる場合、少ない方から多い方への切り替えで最初のPGよりも多い論理コア数を選択できなかったり(最初に48コアのPG1が選択されているとPG0に切り替える時にコア数を48コアまでしか選択できない)、最初のPGに該当する番号のないコアを選択するとエラーが出る(48コアまでしかないPG1からPG0の50番目のコアを選択する)、という現象も確認しています。
Windows 11 22H2_processor group_error_2a
Windows 11 22H2_processor group_error_2b


65論理コア以上で複数プロセッサグループがある環境において、各種アプリがプロセッサグループに対してどのように動作するか、一部を抜粋して簡単にまとめると次のようになります。
プロセッサグループとアプリの関係
(Intel Xeon w9-3495X, Windows 11 22H2)
レンダリング Cinema 4D
(Cinebench)

プロセッサグループを超えて実行可能
Blender
プロセッサグループを超えて実行可能
Corona
プロセッサグループを超えて実行可能
V-Ray
プロセッサグループを超えて実行可能
エンコード Handbrake
x264
プロセッサグループを超えるが、
全スレッドを上手く使うことができない
Handbrake
x265

プロセッサグループを超えるが、
全スレッドを上手く使うことができない
RAW現像 DxO PhotoLab 6

並列した数だけRAW現像実行exeが動き、各exeはプロセッサグループを超えて概ね均等に割り当てられる
アプリ製作
(コンパイル)
Unreal Engine 4/5 △~〇
プロセッサグループを超えてシェーダーコンパイルが可能


まず3Dレンダリング関連は複数プロセッサグループと相性が良く、Cinema 4D(Cinebench)やBlenderのような有名どころは対応しています。
Intel Xeon w9-3495X_Processor Group_3D-Rendering

またゲーム・アプリ製作について、Unreal Engine 4/5のパッケージ化やシェーダーコンパイルもプロセッサグループを超えた実行に対応しています。
パッケージ化は全てではありませんが重い部分は複数プロセッサーグループでも全論理コアを使用してくれます。シェーダーコンパイルは複数プロセッサーグループを使用するものの、なぜか物理コア毎に一方の論理コアしか使用しないという動作でした。OS側の問題でしょうか?
Intel Xeon w9-3495X_Processor Group_UnrealEngine5_pp
Intel Xeon w9-3495X_Processor Group_UnrealEngine5_sc
なおライティングのビルド(ベイク)はUnreal Engine 4のver4.27ではプロセッサグループを超えた実行に非対応でした。
Threadripper 3990Xを検証した当時、ver4.22ではプロセッサーグループを超えた実行に対応していてマルチスレッド性能に応じて高速化していましたが、Xeon w9-3495Xではver4.22を使用しても部分的にプロセッサーグループを超えて動作するものの、プロセッサーグループの扱いが下手なのか(Windows OSのCPUスケジューラが良くないとの報告も)、あまり性能が出ません。
ただUnreal Engine 4のver4.27ではGPU Lightmass、さらに次世代バージョンのUnreal Engine 5ではLumenのようにライティングにGPUを使うようになっているので、実用的にはあまり影響はないかなと。
Intel Xeon w9-3495X_Processor Group_UnrealEngine4_lb

以下、プロセッサグループの壁を超えられないタスクについて簡単に説明を加えていきます。
動画のエンコードについて、フリーのエンコードソフトとしてユーザーの多いHandbrakeで確認したところ、現在最も主流なx264は主となるプロセッサグループを主に使用するものの、部分的にはもう1つのプロセッサーグループを使用できていました。疎らではありますが、プロセッサーグループを超えて分散はしています。
Intel Xeon w9-3495X_Processor Group_encode_x264_x1
一方で、近年次世代規格として普及しつつあるx265もプロセッサグループを超えて実行できますが、使用率には4:1くらいで偏りがあり、もう一方のプロセッサグループの使用率が安定せず、対応状態は不十分です。
Intel Xeon w9-3495X_Processor Group_encode_x265_x1

エンコードについては64論理コアの時点ですでに単一実行ではCPUが遊びます。単一実行であればフルHDなら8コア16スレッド、4Kでも16コア32スレッド程度あれば十分なので、必ずしも1つ1つがプロセッサグループを超える必要はないというのが実状です。
今後の展望としては、アプリもしくはOSによって空いているプロセッサグループを選んで並列実行される各エンコード作業を割り振ることができれば十分だと思います。

ただし、「Intel Xeon w9-3495X」については上で言及した通り、OSのCPUスケジューラの問題なのか、仕様なのか不明ですが、メインとなるプロセッサーグループの割り当て自体が現状ではどちらか一方に偏ります。
x264のほうは単一実行でもプロセッサーグループを超えて比較的に均等に分布するので、4K解像度なら4つも並列実行すればほぼCPUをフルに使用してくれますが、x265のほうは単一実行は不均等なので、並列実行しても片方のプロセッサーグループが遊ぶ感じになり、3Dレンダリングなどで見るマルチスレッド性能に対してエンコード速度の伸びが鈍ります。OSによる改善を期待したいところです。
Intel Xeon w9-3495X_Processor Group_encode_x264_x4
Intel Xeon w9-3495X_Processor Group_encode_x265_x4

RAW現像についてはDxO PhotoLab 6で試したところ、レンダリングのように巨大な1つの実行exeがあるわけでなく、現像する画像1枚ずつに2~3スレッド以下を使う実行exeがあり、それが数十並列実行する形なので、プロセッサグループはあまり気にする必要がありません。
ただし、今回検証したDxO PhotoLab 6のように2つのプロセッサグループへ上手く均等に分配できないと虫食い状態でCPUが遊ぶので、個別の実行exeの分配には改善の余地があると思います。
Intel Xeon w9-3495X_Processor Group_RAW_DxO

少し補足すると、DxO PhotoLab 6の場合、RAW現像する枚数が十分に多ければ物理コア数の半分+1くらいの並列実行数で変換速度が最大になるのですが、「Intel Xeon w9-3495X」の場合は24~40で最速となり、40を超えると大幅に速度が下がりました。24~40の中でも誤差はあるものの何故か24と40が最速で、その中間の並列数を選択すると5~10%程度ですが平均の変換速度が下がる感じです。



Intel Xeon w9-3495Xの検証機材・動作設定

以下、「Intel Xeon w9-3495X」の各種検証を行うベンチ機、および比較対象となる各CPUのベンチ機の詳細となります。
Intel LGA4677(W790)環境 テストベンチ機の構成
CPU Intel Xeon w7-3495X (レビュー
Intel Xeon w7-2495X (レビュー
Intel Xeon w5-2455X (レビュー
マザーボード (W-3400)
ASUS Pro WS W790E-SAGE SE
(レビュー)
マザーボード (W-2400) ASUS Pro WS W790-ACE
レビュー
CPUクーラー ENERMAX LIQTECH TR4 II 360 (レビュー
Noctua NF-A12x25 PWM x3 (レビュー
メインメモリ (W-3400) G.Skill Zeta R5 DDR5 R-DIMM
F5-6400R3239G16GE8-ZR5K
16GB×8=128GB (レビュー
6400MHz, CL32-39-39-102
メインメモリ (W-2400) G.Skill Zeta R5 DDR5 R-DIMM
F5-6000R3039G16GQ4-ZR5K
16GB×4=64GB (レビュー
6000MHz, CL30-39-39-96
ビデオカード(共通) PNY GeForce RTX 4090 24GB XLR8
Gaming VERTO EPIC-X RGB OC 3FAN
レビュー
システムストレージ(共通) Samsung SSD 990 PRO 1TB
レビュー
OS(共通) Windows 11 Pro 64bit
電源ユニット(共通) Corsair HX1500i 2022 (レビュー
ベンチ板 STREACOM BC1 (レビュー



比較に使用しているその他のテストシステムについてはこちらを参照してください。



Intel Xeon w9-3495XなどXeon W-3400XシリーズCPUを検証するIntel LGA4677(W790)環境では、検証機材マザーボードとして「ASUS Pro WS W790E-SAGE SE」を使用しています。


ASUS製マザーボードではBIOS設定のASUS Multicore Enhancementを”Disabled - Enforce All limits”にすれば、Intel公式仕様通りの電力制限が適用されます。
ASUS Pro WS W790-ACE_BIOS_MCE


ディスクリートGPU、グラフィックボードがゲーミング性能において重要なのは言うまでもありませんが、近年ではクリエイティブタスクでもGPU支援による性能向上が主流になっているので、CPU性能比較の統一検証機材として、2022年最新のウルトラハイエンドGPUを搭載したグラフィックボード「PNY GeForce RTX 4090 24GB XLR8 Gaming VERTO EPIC-X RGB OC 3FAN」を使用しています。
GPU for CPU Test

PNY GeForce RTX 4090 24GB XLR8は、ベイパーチャンバー構造のベースコアや、厚みのあるファンブレードをバリヤーリングで結合した重厚な冷却ファンを採用する4スロット占有大型GPUクーラーにより、各社AIBモデルの中でもトップクラスの静音性を実現しています。
メーカーのPNYは2022年に株式会社アスクが販売代理店契約を結んだばかりの新参なので国内での知名度は高くありませんが、北米など海外市場では30年以上に渡りコンシューマーならびにビジネス向けで電子機器の製造・販売を行う大手メーカーです。
国内正規品なら代理店を介してPNY公式のグローバル保証と同じ3年間の長期保証が受けられるところも魅力です。
「PNY GeForce RTX 4090 24GB XLR8」をレビュー
PNY GeForce RTX 4090 24GB XLR8 Gaming VERTO EPIC-X RGB OC 3FAN

Intel Xeon W-3400XシリーズCPUの検証機ではシステムメモリとして、DDR5 R-DIMMながらIntel XMP3.0によるメモリOCに対応した「G.Skill Zeta R5 DDR5 R-DIMM(型番:F5-6400R3239G16GE8-ZR5K)」を使用しています。
サーバー・WS向けプラットフォームなのでOCに躊躇する人もいると思いますが、Xeon W-2400X/3400XをCore-Xの後継、ゲームもクリエイティブタスクもこなせる超高性能なハイエンドデスクトップとして運用したい人には、6000MHz超のメモリOCに対応したG.Skill Zeta R5 DDR5 R-DIMMシリーズはオススメです。
「G.Skill Zeta R5 DDR5 R-DIMM」をレビュー。6400MHz/CL32のOCを試す!
G.Skill Zeta R5 DDR5 R-DIMM F5-6400R3239G16GE8-ZR5K

ベンチ機のシステムストレージには「Samsung SSD 990 PRO 1TB」を使用しています。
Samsung SSD 990 PROは、PCIE4.0対応SSDで最速クラスの性能を発揮し、なおかつ電力効率は前モデル980 PRO比で最大50%も向上しており、7GB/s超の高速アクセスでも低発熱なところも魅力な高性能SSDです。 これからPCIE4.0対応プラットフォームの自作PCを組むなら、システム/データ用ストレージとして非常にオススメな製品です。
「Samsung SSD 990 PRO 1TB」をレビュー。性能も電力効率もトップクラス!
Samsung SSD 990 PRO 1TB

360サイズや240サイズなど120mmファンを複数搭載できるマルチファンラジエーターの簡易水冷CPUクーラーを使用するのであれば、「Noctua NF-A12x25 PWM」への換装もおすすめです。
「Noctua NF-A12x25 PWM」は、超硬質かつ軽量な新素材 Sterrox LCPの採用によってフレーム-ブレード間0.5mmの限界を実現させた次世代汎用120mm口径ファンとなっており、1基あたり3500円ほどと高価ですが、標準ファンよりも静音性と冷却性能を向上させることができます。
Noctua NF-A12x25シリーズのレビュー記事一覧へ
Noctua NF-A12x25 PWM chromax.black.swap


CPUとCPUクーラー間の熱伝導グリスには当サイト推奨で管理人も愛用しているお馴染みのクマさんグリス(Thermal Grizzly Kryonaut)を塗りました。使い切りの小容量から何度も塗りなおせる大容量までバリエーションも豊富で、性能面でも熱伝導効率が高く、塗布しやすい柔らかいグリスなのでおすすめです。


通常グリスを塗る量はてきとうでOKで、管理人はヘラとかも使わず中央山盛りで対角線だけ若干伸ばして塗っています。特にThermal Grizzly Kryonautは柔らかいグリスでCPUクーラー固定時の圧着で伸びるので塗り方を気にする必要もありません。
ただしIntel Xeon W-2400X/3400XシリーズCPUはヒートスプレッダのサイズが大きいので、同じくヒートスプレッダが大きいAMD Ryzen Threadripperのグリスの塗り方としてNoctuaが推奨している方式を真似て、今回はグリスを塗りました。
DSC04718_DxO
DSC05108_DxO



Intel Xeon w9-3495Xの動作クロック・消費電力・温度

「Intel Xeon w9-3495X」に関する検証のはじめに、「Intel Xeon w9-3495X」の動作クロック、消費電力、温度など同CPUの基本的な動作についてチェックしていきます。

「Intel Xeon w9-3495X」は56コア112スレッドのCPUです。
現在最新のIntel製メインストリーム向けCPUの上位モデルは高性能P-Coreと高効率E-Coreの混成ですが、「Intel Xeon w9-3495X」はシンプルに高性能コアのみで構成されています。
Intel Xeon w9-3495X_CPU-Z
「Intel Xeon w9-3495X」は定格動作において1コア~56コアまで同時に負荷がかかった時、アクティブコア数に応じた最大動作倍率(By Core Usage倍率)は、[2c: x48, 6c: x44, 10c: x43, 18c: x42, 26c: x38, 36c: x34, 46c: x31, 56c: x29]です。
「Intel Xeon w9-3495X」は定格のBy Core Usage倍率において、全56コアへ同時に負荷がかかっても最大で2.9GHz動作が可能です。
Intel Xeon w9-3495X_Spec_XTU
ちなみにIntel Xeon W-2400X/3400Xについては、定格設定ではBy Core Usage倍率に応じて異なるAVXオフセット値が適用されています。
Intel Xeon w9-3495X_Spec_HWiNFO_AVX

参考までに、「Intel Xeon w9-3495X」のコアtoコア遅延は次のようになっています。なお測定アプリがプロセッサーグループを超えた実行に対応していないので、マルチスレッディングをオフにして物理コア=論理コア=56コアで測定しています。
「Intel Xeon w9-3495X」は4xタイルによるチップレット構造を採用するXCC(eXtreme Core Count)を採用するCPUですが、コアtoコア遅延は一律で40~70ns程度です。
Intel Xeon w9-3495X_latency-heatmap
薄眼で見ると16分割っぽく見えるヒートマップが偶々できたので、そのスクショを上に掲載していますが、「Intel Xeon w9-3495X」のコアtoコア遅延はあまり一貫性がなく、各遅延は40~70nsに収まるものの、測定を複数回実行してみると、ランダムにバラける感じでした。
Intel Xeon w9-3495X_latency-heatmap
「Intel Xeon w9-3495X」などSapphire Rapidsの4xタイルによるチップレット構造ではEMIB(Embedded Multi-die Interconnect Bridge)と呼ばれるCPUダイ接続技術が利用されており、通常のチップレットなどに比べてより高速にデータ通信を可能にしているとアピールされていました。
確かに、下に掲載しているRyzen 9 7950XやRyzen Threadripper 3970XのようなAMD製CPUのチップレット構造とは違って、各CPUダイ内とチップレットを構成しているCPUダイ間とで遅延に大きな差はないので、「Intel Xeon w9-3495X」ではCPUダイを跨ぐようなアクセスが発生しても性能低下を心配する必要はなさそうです。
AMD Ryzen 9 7950X_latency-heatmap
AMD Ryzen Threadripper 3970X_latency-heatmap

HWiNFOやCPU-Zから「Intel Xeon w9-3495X」のコアクロックの挙動を確認したところ、確かに負荷の軽い場面では最大4.8GHz程度で動作するコアがありました。
Intel Xeon w9-3495X_Boost-Clock_Single

またIntel Xeon W-2400/3400シリーズCPUの製品仕様では、Processor Base Power(従来で言うところのTDP)が長期間電力制限/Power Limit 1(PL1)に、Maximum Turbo Powerが短期間電力制限/Power Limit 2(PL2)に一致します。
「Intel Xeon w9-3495X」はシンプルにPL1=PBP=350W、PL2=MTP=420Wです。
なおメインストリーム向けCPUと大きく異なり、Turbo Boost Power Time Window(短期間電力制限時間/Tau)は1sでかなり短い設定になっているので、短期間電力制限によるターボはほとんど効きません。
Intel Package Power Control

「Intel Xeon w9-3495X」の定格仕様である『PL1:350W、PL2:420W、Tau:1s』で動作させたところ、Cinebenchやx264エンコードなど、全コアへ同時に大きな負荷がかかった時の動作クロックの実動平均は2.3~2.5GHz前後で推移します。
CPU Package PowerはTau:1sなので約1秒程度だけPL1を超過しますが、その後はPL1の350W前後に張り付いています。
By Core Usageの全コア最大動作倍率は2.9GHzですが、PL1:350Wの電力制限やAVXオフセットにより、それよりも低い数字となっています。なおタスクがAVX命令をどれくらい使用するか、タスクの種類によって実動コアクロックは上記よりも多少上下する可能性があります。
Intel Xeon w9-3495X_Boost-Clock_Multi


続いてCPU消費電力やCPU温度の検証結果をチェックしていきます。
当サイトのCPUレビューでは主として”CPU温度への影響要因”という意味においてCPU消費電力を評価しているので、動画のエンコードによって長期間電力制限が効いている状態の平均的な消費電力をCPU消費電力として比較します。

個人的な意見としては短期間電力制限は短期間かつCPU温度によっても制御されるのでCPU温度への影響要因として比重は小さく、また瞬間ピーク電力はせいぜいがTDP+100W程度なので、マザーボードVRM電源の破損を心配するほどではなく、その程度の電力超過は電源ユニットで十分吸収できるので、評価対象としてあまり意味がないと思っています。
またCPU製品仕様のTDPについては、定義がIntel/AMDで厳密には異なり、各社の具体的な測定・算出方法も不明なので、CPU動作クロックを含めて総合的に判断する必要があるものの、基本的には長期間電力制限時の消費電力がTDP仕様値とほぼ一致、もしくはTDP仕様値を下回れば正常であると評価します。
当レビュー記事では簡単のため割愛しますが、CPUの消費電力に関する評価基準の補足として下記の記事も参考にしてください。


CPUの消費電力測定には、当サイトの検証に使用するためワンオフで特注した測定ツール「CPU Power Tester」を使用しています。
CPU Power TesterはEPS電源端子、ATX24PIN電源、PCIEスロット経由の各消費電力を直接測定できるツールです。5分間程度の負荷に対して、1ms間隔でモニタリングを行い、平均値を”消費電力”、最大値を”瞬間的な最大電源負荷”とします。


消費電力の測定にあたってCPU負荷には、FF14ベンチマークの動画(再生時間6分40秒、4K解像度、60FPS、容量5.7GB)を変換ソースとして、HandBrakeによるx264動画エンコードを使用しています。
メニーコアになるほど単独のエンコードではCPUが遊ぶので、CPU使用率が100%前後に張り付くように、動画エンコードの同時実行数については4~6コアは並列なし、8~14コアは2並列、16コア以上は3並列のように適宜調整しています。
Power-Consumption-Test
注:CPUのストレステストについてはOCCTやPrimeなど専用負荷ソフトを使用しているレビューもありますが、管理人の私見としてはCPU負荷が非現実的なので、当サイトではPCゲームや動画のエンコードなど一般的なユースを想定した場合、ほぼ最大のCPU負荷となるx264による動画エンコードとストレステストに採用しています。


【注:以下説明が前後しますが、後ほど説明する動作設定で消費電力を測定しています。】

定格仕様や検証用設定で指定する電力制限を適用した状態で動画エンコードによるフル負荷をかけると、「Intel Xeon w9-3495X」など各CPUについてCPU Package Powerは次のようになりました。 全CPU比較データ
CPU Package PowerはIntelのPL1/PL2、AMDのPPTといったパラメーターによる電力制限の制御ソースとなる数値です。メーカー純正ソフトウェアのIntel Extreme Tuning Utility (XTU)やAMD Ryzen Master、サードパーティー製ソフトHWiNFOなどでソフトウェアモニタリングが可能です。
Intel Xeon w9-3495X_power_3_cpp

続いてCPU Power Testerを使用して実際の消費電力をチェックしていきますが、注意点として、マザーボード独自のコア電圧調整によってCPU消費電力は変化します。Intel/AMDともに現状ではCPU動作のリファレンスになるようなマザーボードがないので、あくまで今回のレビューに使用している検証機材マザーボードを組み合わせた場合の数値となります。
また組み合わせるマザーボードによってはCPU Package Powerにマイナスオフセットをかけて事実上の電力制限解除が行われる場合があります。管理人の判断で定格っぽい動作のものを選んでいますが、こういった事情も念頭に置いて検証結果をご確認ください。

定格仕様や検証用設定で指定する電力制限を適用した状態で動画エンコードによるフル負荷をかけると、「Intel Xeon w9-3495X」など各CPUについてEPS 8PIN電源の消費電力は次のようになりました。 全CPU比較データ
Intel Xeon w9-3495X_power_1_eps

定格仕様や検証用設定で指定する電力制限を適用した状態で動画エンコードによるフル負荷をかけると、「Intel Xeon w9-3495X」など各CPUについてEPS 8PIN電源&ATX 24PIN電源の消費電力は次のようになりました。 全CPU比較データ
Intel Xeon w9-3495X_power_2_eps+arx


Cinebench R23とEPS消費電力の関係からワットパフォーマンスを確認してみると、「Intel Xeon w9-3495X」は消費電力そのものは大きいものの、定格よりも電力制限を強くして200Wから300Wまでの範囲では、Core i9 13900KやRyzen 9 7950Xといったメインストリーム向けCPUで最も電力効率の高いCPUに近い性能を発揮しています。
ワットパフォーマンス的には”多コアをゆっくり”が強いので、「Intel Xeon w9-3495X」の56コア112スレッドという圧倒的な物量がものを言う結果です。
Intel Xeon w9-3495X_Performance_per-Wtt
電力と性能は2乗根的なカーブを描き、曲線部分が最も電力効率が高まるのですが、「Intel Xeon w9-3495X」ではそのスイートスポットはちょうど300~350W前後となっており、そこからは電力(コアクロック)の上昇に比例して、直線的に性能が伸びていきます。
Intel Xeon w9-3495X_Performance_per-Wtt_c

「Intel Xeon w9-3495X」に対して許容する消費電力によってマルチスレッド性能がどのように変化するのか、Cinebench R23 マルチスレッドスコアとEPS電源経由の消費電力で性能比率の推移をグラフ化しました。
定格のPL1:350WにおいてCinebench R23のスコアは60000~62000となりそれを基準に性能比率をグラフ化しています。
グラフ横軸はEPS電源経由の消費電力ですが、電力制限PL1の設定値は200W/300W/350W/420W/500W、以降は+100Wです。後半ほどPL1の設定値と実際の消費電力のズレが大きくなるのでグラフの見方に注意してください。
電力制限に対してコア倍率がボトルネックにならないようにBCU 56cの数値は適宜調整しています。

「Intel Xeon w9-3495X」はSpecific Per Coreでx46~x48が許容されている定格倍率のまま(By Core Usage倍率は全コア時を適宜調整)、電力制限を解除すると、電力制限を引き上げただけ性能が伸びていきます。
最終的にPL1:900W、実際のEPS電源経由の消費電力で1100~1200W程度の消費電力を許容すれば、定格のPL1:350Wと比較して+60%程度のマルチスレッド性能向上が得られます。(Blenderやhandbrakeのエンコードだと+5%程度さらに伸びる感じ)
「Intel Xeon w9-3495X」でOC・電力制限解除を行う場合、Noctua NH-U14S DX-4677のような大型空冷環境ならPL1:500W前後、水冷環境ならPL1:600~700W前後で、+25~50%程度のマルチスレッド性能向上を狙うのがオススメです。(後述しますがPL1:700W以上は常用が困難)
Intel Xeon w9-3495X_Performance_per-and-game

ちなみに、後述の通り常用は難しい一発芸のOCですが、『BCU 56x:x42、PL1:900W、Offset Voltage:-0.050V』にOCすると、「Intel Xeon w9-3495X」のCinebench R23スコアは10万を超えます。
Intel Xeon w9-3495X_Cinebench R23_100K





この章の最後に、「Intel Xeon w9-3495X」を空冷CPUクーラーやAIO水冷CPUクーラーで運用する時のCPU温度についてです。

「Intel Xeon w9-3495X」は定格の電力制限が仕様値PBPと同じ350Wですが、56コアで分散しており、CPUダイサイズも非常に大きいので定格運用なら電力の数字ほどCPU温度は高くなりません。
定格ならNoctua NH-U12S DX-4677やNoctua NH-U14S DX-4677サイズを使用すれば空冷でも十分な静音性で問題なく運用できます。




一方で「Intel Xeon w9-3495X」のOCの上限について、CPU Package Powerが1000Wに達してもまだ動作クロックは4.2GHz程度なので電力制限を解除しただけ性能は伸びていく余地があるのですが、実際には360サイズAIO水冷CPUクーラーでもCPU Package Powerで700W前後(EPS電源経由の消費電力で800~850W)を長期的に冷やすのは難しくなります。(PL2で数十秒のターボならCPU Package Powerで900Wもいけますが)

加えて「Intel Xeon w9-3495X」のOC環境としては現状で最強なASUS Pro WS W790E-SAGE SEでも、CPU Package Powerで500Wからは付属ファンマウントによるVRM電源ファンの増設、600WからはCPUソケットやVRM電源回路周辺を広範囲に冷やせる大きめの冷却ファンの増設が必要となります。詳細はMBのレビューで。
DSC05470_DxO

「Intel Xeon w9-3495X」でPL1:800W以上のOCを行うとなると、単純な室温冷却ではDIY水冷でも困難でチラーが必要、なおかつVRM電源回路の冷却も要求されます。またPL1:700WあたりでCPUのみのフル負荷において壁コンセントからのシステム消費電力が1000Wに達するので、GPUのことも考えると、これ以上は200Vコンセント案件になります。
以上のような要件を前提に”パーソナルワークステーション”という範疇で考えると、日本国内においては「Intel Xeon w9-3495X」はOCするにしてもPL1:600~700Wの範囲内で行うのが限界だと思います。




Xeon w9-3495XのOC実演の参考として、Supermicro X13SWA-TFやASUS Pro WS W790E-SAGE SEのレビュー記事も参照してみてください。



ベンチマーク用のCPU動作設定について

「Intel Xeon w9-3495X」の各種ベンチマーク時に使用しているCPU動作設定について予め説明しておきます。
IntelやAMDのメインストリーム向けCPUについては基本的に定格設定、もしくは簡単な電力制限解除で測定を行っており、各章の補足やグラフを見ればそのまま把握できるようになっているので、特に注意する要素はありません。

最初に結論を書いておくと
・”定格動作設定”と”簡易的な実用OC設定”の2つの動作設定を用意
・いずれもクリエイティブタスク性能のみを検証し、ゲーム性能の検証は省略
・クリエイティブタスクも、マルチスレッド性能依存なものを重視し、一部省略
となります。


Xeon W-2400シリーズCPUはともかく、56コア112スレッドの「Intel Xeon w9-3495X」ともなると、”偶にPCゲームもするハイエンドデスクトップとして使う”みたいな用途からは流石に外れますし、By Core Usage倍率で全コア負荷時の倍率が低く測定する意味を感じないため、ゲーム性能の検証は省略しています。

Intel Xeon W-3400X/2400XシリーズCPUについては、2023年5月下旬現在、下記のような不具合、もしくは特殊な挙動を確認しています。
・【共通】 電源プランは高パフォーマンスを推奨 (バランスはエクスプローラーの開閉でもラグる)
・【W-3400X】 TBM3.0によるアクティブタスクの割り当てが上手く動作しない(ほぼランダム状態)
・【共通】 Active Core Countが正常に検出されず、単コアブーストが効かない
・【共通】 PL2は設定値より10%低い値でCPU Package Powerが制御される(CPUの仕様)
・【共通】 Adaptive Override Voltageが正常に動作しない

まず『電源プランは高パフォーマンスを推奨』については、Intel Xeon w7-2495Xのレビュー内でも説明したので割愛。共通する不具合もあるので、こちらも参照してください。



続いて定格動作に影響の大きい、『TBM3.0によるアクティブタスクの割り当てが上手く動作しない(ほぼランダム状態)』について説明します。
現象は表題の通りで、通常、Cinebench R23のシングルスレッドテストのようなアクティブタスクは自動的に高クロック動作が可能なベストコアへ割り振られるのですが、「Intel Xeon w9-3495X」などXeon W-3400シリーズCPUでは、このTBM3.0によるアクティブタスクの割り当てが正常に動作しておらず、ランダム割り当てな状態です。


加えて、Intel Xeon w7-2495XなどXeon W-2400XシリーズCPUのレビューでも説明した通り、『Active Core Countが正常に検出されず、単コアブーストが効かない』の現象も同時に発生しています。
Xeon W-2400XシリーズCPUのレビューでは単コア最大ブーストが機能する”定格動作っぽいBIOS設定”で検証したのですが、「Intel Xeon w9-3495X」は同じようにBCU 56cの動作倍率を最大に設定しても、TBM3.0が機能していないので単コア最大ブースト効きません。
またその設定をすると電力制限をかけていてもマルチスレッド負荷で落ちるという問題も。(PL2よりも短い電力制限で発生する瞬間負荷で落ちる模様?)

以上のように、「Intel Xeon w9-3495X」ではTBM3.0とアクティブコアカウントの問題が同時に発生していて、シングルスレッド性能重視な検証は現状では行う意義を感じないので、クリエイティブタスクはマルチスレッド性能依存なものを重視して検証しています。
またXeon W-2400Xの時と違ってBIOS設定を調整する意味もないので、シンプルに検証機材マザーボード ASUS Pro WS W790E-SAGE SEでBIOS設定のASUS Multicore Enhancementを”Disabled - Enforce All limits”として、定格動作設定のまま検証しています。
Intel Xeon w9-3495X_Default-Setting


次に「Intel Xeon w9-3495X」のOC設定について、ベンチマーク測定に関わる部分を説明します。
「Intel Xeon w9-3495X」でもXeon W-2400XシリーズCPUと同様に『Adaptive Override Voltageが正常に動作しない』という問題が発生していました。
また「Intel Xeon w9-3495X」の場合、By Core Usage倍率の全コア負荷時の数値をx48など高い数値に設定するとSpecific Per Core最大倍率や電力制限をかけていてもマルチスレッド負荷で落ちる現象も発生しました。x44まではセーフだったので、PL2よりも短い電力制限で発生する瞬間負荷で落ちるのか、マザーボードBIOSの問題なのか分かりませんが。

ともあれ、すでに説明した通りシングルスレッド重視な検証は省略する方向ですし、ゲーム性能の検証も行わないのであまり複雑なOCは行っていません。
「Intel Xeon w9-3495X」のOC設定は、BIOSから『ASUS Multicore Enhancement: Auto』、『PL1:700W, PL2:800W』で電力制限を解除し、Intel XTUから『By Core Usage 56c: x38』というシンプルな設定で検証しています。
Intel Xeon w9-3495X_OC-Setting (1)
Intel Xeon w9-3495X_OC-Setting (2)
Intel Xeon w9-3495X_OC-Setting (3)

加えて「Intel Xeon w9-3495X」を単一プロセッサーグループで動作させる例として、BIOSから『Enable LP: Single LP』でマルチスレッディングを無効化し(その他の設定は上と同じ)、Intel XTUから『By Core Usage 56c: x43』にしたケースについても検証しています。
Intel Xeon w9-3495X_OC-Setting_HT-Off (1)
Intel Xeon w9-3495X_OC-Setting_HT-Off (2)


「Intel Xeon w9-3495X」などXeon W-3400シリーズCPUの具体的なOC設定や実演例については、マザーボードのレビュー記事内で解説しているのでこちらを参照してください。

【後日、Xeon w9-3495XのOC実演の参考として、Supermicro X13SWA-TFやASUS Pro WS W790E-SAGE SEのレビュー記事を公開予定】



Intel Xeon w9-3495Xのクリエイティブ性能

Intel Xeon w9-3495Xについて3Dレンダリング、動画編集・エンコード、RAW現像・写真リタッチ、PCゲーム/スマホアプリのビルド、AI機能による超解像・写真分類などクリエイティブ作業に関する性能を各種ベンチマークソフトや実際のアプリケーションで検証しました。

Intel Xeon w9-3495Xの3Dレンダリング性能

まずは「Intel Xeon w9-3495X」を含めた各種CPUの3Dレンダリング性能を比較していきます。
CPUのマルチスレッド性能を比較するベンチマークソフトとして国内外で最も知られているCinebenchの2021年リリース最新バージョン「Cinebench R23」、オープンソース3DCGソフト「Blender」の公式ベンチマークソフト、3Dレンダラー「V-Ray」の公式ベンチマークソフトの4種類を使用してベンチマーク測定を行いました。

Cinebench R23は3Dレンダリング性能を測定するベンチマークソフトになっており、マルチスレッド性能を測定するテストとシングルスレッド性能を測定するテストの2種類を実行しています。
Intel Xeon w9-3495X_Cinebench R23

360サイズAIO水冷や国内100Vコンセントでは温度・消費電力的に常用が難しい一発芸のOCですが、『BCU 56x:x42、PL1:900W、Offset Voltage:-0.050V』にOCすると、「Intel Xeon w9-3495X」のCinebench R23スコアは10万を超えます。
Intel Xeon w9-3495X_Cinebench R23_100K




Cinebench R23 マルチスレッド性能テストについて「Intel Xeon w9-3495X」を含めた各種CPUのベンチマーク結果を比較すると次のようになっています。 全CPU比較データ
Intel Xeon w9-3495X_rendering_1_cine_r23_multi

Cinebench R23 シングルスレッド性能テストについて「Intel Xeon w9-3495X」を含めた各種CPUのベンチマーク結果を比較すると次のようになっています。 全CPU比較データ
Intel Xeon w9-3495X_rendering_1_cine_r23_single

3DCGソフト「Blender」の公式ベンチマークソフト(ver3.4.0)
について「Intel Xeon w9-3495X」を含めた各種CPUのベンチマーク結果を比較すると次のようになっています。 全CPU比較データ
Blender Benchmark 3.0ではmonster/junkshop/classroomの3つのレンダリングが実行され、それぞれ分間サンプル数がベンチマークスコアとして表示されます。Core i5 12400Fを基準にして(全CPU比較データではCore i5 12400Fが基準)、3つのスコアについて性能比率を算出し、その平均値をグラフ化しています。
Intel Xeon w9-3495X_rendering_2_blender

3Dレンダラー「V-Ray」の公式ベンチマークソフト(ver5.2.0)について「Intel Xeon w9-3495X」を含めた各種CPUのベンチマーク結果を比較すると次のようになっています。 全CPU比較データ
V-Rayのベンチマークソフトのレンダリングサンプル数が結果として表示されますが、性能差が直感的にわかりにくいので、Core i5 12400Fを基準にして(全CPU比較データではCore i5 12400Fが基準)、各種CPUのレンダリング速度を性能比としてグラフ化しています、
Intel Xeon w9-3495X_rendering_3_vray


Intel Xeon w9-3495Xの動画エンコード・動画編集性能

続いて「Intel Xeon w9-3495X」を含めた各種CPUの動画編集や動画エンコードの性能を比較していきます。
検証には、無料で利用できる動画編集ソフトとして国内外で多数のユーザーがいる「Aviutl」、大量の動画ファイルを一括エンコードする時に便利なフリーソフト「HandBrake」を使用しています。
またアマチュアからプロまで動画編集ソフトとして幅広く使用されている「Adobe Premiere Pro」の実用性能を検証するベンチマークとしてULMarkのUL Procyon Video Editing Benchmarkも測定しています。


まずは単純に動画ファイルをそのまま圧縮するエンコード作業の性能比較として、HandBrakeを使用したエンコード性能をチェックします。
HandBrakeは、現在主流なH.264 (MPEG-4 AVC) ビデオストリームへエンコードを行う「x264」エンコーダ、そしてH.264より高圧縮・高画質で次世代規格として期待されているH.265(HEVC) ビデオストリームへエンコードを行う「x265」エンコーダが使用できるので、CPUをリソースとして各エンコーダで共通の動画ファイルのエンコードを行いました。
エンコードを行う動画ファイルについては、Tom Clancy's Ghost Recon Wildlandsのゲーム内ベンチマーク(60秒ほど)をNVIDIA ShadowPlayで録画したものを使用しています。1920×1080/60FPS/50Mbpsと3840×2160/60FPS/120Mbpsの2種類の動画ファイルを作成し、それぞれ解像度はそのままにCRF値指定でエンコードを行っています。
HandBrake_test
比較グラフのx2/x3/x4のバーについては同じエンコードを添え字の数だけ並列実行した時の合計変換フレームレートを示しています。
ソースファイルやエンコード設定にも依りますが、フルHD解像度では8コア16スレッド程度、4K解像度では16コア32スレッド程度でマルチスレッド分散がボトルネックになり始め、単独エンコードではCPUが遊び始めます。
20コアオーバーのウルトラメニーコアCPUでマルチスレッド性能をフルに活用しようと思うと、8K解像度のような超高解像度のエンコード、もしくは複数並列エンコードを行う必要があるので注意してください。

x264エンコーダによって1920×1080解像度の動画をH.264 (MPEG-4 AVC)の1920×1080解像度へエンコードした時のエンコード速度について、「Intel Xeon w9-3495X」を含めた各種CPUのベンチマーク結果を比較すると次のようになっています。 全CPU比較データ
Intel Xeon w9-3495X_encode_1_handbrake_x264_1920-1920

x264エンコーダによって3840×2160解像度の動画をH.264 (MPEG-4 AVC)の3840×2160解像度へエンコードした時のエンコード速度について、「Intel Xeon w9-3495X」を含めた各種CPUのベンチマーク結果を比較すると次のようになっています。 全CPU比較データ
Intel Xeon w9-3495X_encode_2_handbrake_x264_3840-3840

x265エンコーダによって1920×1080解像度の動画をH.265(HEVC)の1920×1080解像度へエンコードした時のエンコード速度について、「Intel Xeon w9-3495X」を含めた各種CPUのベンチマーク結果を比較すると次のようになっています。 全CPU比較データ
Intel Xeon w9-3495X_encode_3_handbrake_x265_1920-1920

x265エンコーダによって3840×2160解像度の動画をH.265(HEVC)の3840×2160解像度へエンコードした時のエンコード速度について、「Intel Xeon w9-3495X」を含めた各種CPUのベンチマーク結果を比較すると次のようになっています。 全CPU比較データ
Intel Xeon w9-3495X_encode_4_handbrake_x265_3840-3840


続いてAviutlで編集した動画プロジェクトのエンコード速度について、「Intel Xeon w9-3495X」を含めた各種CPUの性能を比較していきます
編集プロジェクト自体は単純で、4K解像度とフルHD解像度(4K解像度に拡大)の2つの動画ファイルを使用し、それぞれの動画を左右にフェードイン/アウト、後は画面上にテキストをオーバーレイさせているだけです。YouTubeにアップしている下の動画が完成物となっており、冒頭1分間部分のエンコード速度を測定しています。


Aviutlで作成した3840×2160解像度の4K動画プロジェクトをH.264 (MPEG-4 AVC)の3840×2160解像度へエンコードした時のエンコード速度について、「Intel Xeon w9-3495X」を含めた各種CPUのベンチマーク結果を比較すると次のようになっています。 全CPU比較データ
動画編集ソフトにも依りますが、Aviutlの場合、動画開始直後のように単独の4K映像に文字をオーバーレイするだけでもエンコード出力のCPU使用効率が下がります。
カット編集だけならAviutlもHandBrakeも大差ありませんが、編集したプロジェクト1つをエンコード出力した場合、上で見たHandBrakeによる単純エンコードと比較してマルチスレッド性能に比例したスケーリングは鈍り、シングルスレッド性能で差が出る傾向が強まります。
Intel Xeon w9-3495X_encode_5_aviutl_x264_3840-Project


Intel Xeon w9-3495XのRAW現像・写真リタッチ性能

続いて「Intel Xeon w9-3495X」を含めた各種CPUのRAW現像や写真リタッチの性能を比較していきます。
検証には、強力なノイズ除去機能PRIMEや最新版DeepPRIMEで評判の写真編集ソフトDxO PhotoLab 6によるRAW現像に加えて、アマチュアからプロまで動画編集ソフトとして幅広く使用されている「Adobe Lightroom Classic」と「Adobe Photoshop」の実用性能を検証するベンチマークとしてULMarkのUL Procyon Photo Editing Benchmarkも測定しています。

まずはDxO PhotoLab 6によるRAW現像について、「Intel Xeon w9-3495X」を含めた各種CPUの性能を比較していきます
ミラーレス一眼カメラSONY α1で撮影した8640×5760解像度のRAW画像ファイル 100枚に対して、DxO PhotoLab 6の画質プリセット「DxO 標準」をベースにノイズ除去をPRIMEに変更したプリセットを適用し、RAW現像を行いました。
なおDxO PhotoLab 6によるRAW現像は並列処理数を設定できますが、CPUコア数の半分前後の並列処理で最速になるようです。
DxO Photolab_test

DxO PhotoLab 6によるRAW現像速度について、「Intel Xeon w9-3495X」を含めた各種CPUのベンチマーク結果を比較すると次のようになっています。 全CPU比較データ
Intel Xeon w9-3495X_photo_1_DxO


Intel Xeon w9-3495XのPCゲーム/スマホアプリのビルド性能

最後に「Unreal Engine 4/5」や「Unity」などフリーウェアながら高画質なPCゲームやスマホゲームを製作可能なゲームエンジンを使用したゲーム制作におけるCPU性能の検証として、Unreal Engine 4で「Intel Xeon w9-3495X」を含めた各種CPUの性能を比較していきます。
Epic Games Storeで無料配布されているUnreal Engine 4のデモプロジェクト Infiltratorを使用したビルド時間の比較を行います。検証設定としてリアルタイム表示はオフ、ライティングの品質をプロダクションとしています。Unreal Engine 4のバージョンは4.27.2で統一しています。
Unreal Engine 4_Infiltrator_test

【注】 プロセッサーグループの解説で言及した通り、Windows 11 22H2のCPUスケジューラの動作が良くないのか、複数PGで性能の伸びが良くありません。
Unreal EngineのライティングについてはGPU LightmassやUE5の新機能Lumenがあるので、今後、検証内容を変更予定です。


「Unreal Engine 4 - Infiltrator」のビルド時間について、「Intel Xeon w9-3495X」を含めた各種CPUのベンチマーク結果を比較すると次のようになっています。 全CPU比較データ
「Unreal Engine 4 - Infiltrator」のビルド時間だけを見ても性能差が直感的にわかりにくいので、Core i5 12400Fを基準にして(全CPU比較データではCore i5 12400Fが基準)、各種CPUのビルド速度を性能比としてグラフ化しています、
Intel Xeon w9-3495X_dev_Unreal-Engine



Intel Xeon w9-3495Xのレビューまとめ

「Intel Xeon w9-3495X」を検証してみた結果のまとめを行います。簡単に箇条書きで以下、管理人のレビュー後の所感となります。

良いところ or 概要
  • メインストリーム向け第13世代と同等の高性能コアによる56コア112スレッドCPU
  • PL1:350Wにおいて実動コアクロックは2.4~2.5GHz前後
  • サーバー・WS向けのXeon CPUながら倍率アンロックでOCに対応
  • 360サイズAIO水冷環境で電力制限解除によるMT性能向上は最大で+50%程度
    (PL1:800Wを超えるOCの常用にはチラーなど特殊な冷却環境が必要)
  • システムメモリはオクタチャンネルで最大16枚のDIMMを搭載可能
  • DDR5 R-DIMM対応なので1TBを超えるシステムメモリを搭載可能(最大4TB)
  • CPU直結PCIEレーンとしてPCIE5.0でx112レーンも使用できる
  • AVX512やAMXといったAIに強い拡張命令に対応
悪いところ or 注意点
  • 税込み99万円程度と非常に高価(2023年5月現在)
  • W-3400Xのうち最上位のw9-3495Xのみ非BOX販売で、MB等とセット購入が必要
  • W790マザーボード、LGA4677対応CPUクーラー、DDR5 R-DIMMメモリなど
    環境構築には主要パーツを一通り新調する必要がある
  • OC運用の場合、CPU消費電力は500~1000Wと非常に大きくなる

温度・消費電力について

「Intel Xeon w9-3495X」のPBP(従来のTDP)は350Wとなっており、定格のまま運用してもCPU消費電力は350Wを超過しますが、メインストリーム向けCPUよりもCPUダイが圧倒的に大きく、またメニーコアで発熱も分散するので、消費電力の数字に感じるほど運用(冷却)は難しくありません。
LGA4677ソケットに対応しているCPUクーラーがそもそも少なく、Xeon W2400/3400で自作PC的にパーソナルワークステーションを組むとなったら、空冷CPUクーラーならNoctua製品一択になると思うので、悩みがないという意味では導入のハードルはかなり低いと思います。


「Intel Xeon w9-3495X」はProcessor Base Power/TDPの350Wの時にCinebench R23でスコア60000~62000程度のマルチスレッド性能になります。
定格Specific Per Core最大倍率のまま(By Core Usage倍率は全コア時を適宜調整)、つまり最初から定格VFカーブが存在する範囲内でも、電力制限を解除すると引き上げただけ性能が伸びていきます。
ワットパフォーマンス的には300~400W辺りがスイートスポットではあるものの、マルチスレッド性能のコストパフォーマンスを考えると、ややもったいない使い方という気がします。
「Intel Xeon w9-3495X」でOC・電力制限解除を行う場合、Noctua NH-U14S DX-4677のような大型空冷環境ならPL1:500W前後、水冷環境ならPL1:600~700W前後で、+25~50%程度のマルチスレッド性能向上を狙うのがオススメです。
Intel Xeon w9-3495X_Performance_per-and-game


クリエイティブ性能について

「Intel Xeon w9-3495X」のクリエイティブ性能について、高性能コアのみで構成される56コア112スレッドのウルトラメニーコアCPUではあるものの、定格の電力設定ではマルチスレッド負荷時のコアクロックが2.4~2.5GHz程度になるので、マルチスレッド性能はメインストリーム向け最上位のCore i9 13900Kと比較して、+50~70%程度です。
ただワットパフォーマンスを無視すれば、標準でVFカーブが存在するSpecific Per Core最大倍率の範囲内に限定しても、電力制限の解除とそれに応じたBy Core Usage倍率の引き上げにより性能は大きく伸びていきます。
「Intel Xeon w9-3495X」は”360サイズAIO水冷CPUクーラーで長期的に常用が可能”という条件でも、PL1:700W程度の設定で、定格と比較して+50%程度も上回るマルチスレッド性能を発揮できます。
実用的な限界は上の通りですが、CPUそのものやマザーボードVRM電源の冷却、日本国内のコンセント事情(100V/15A)といった諸事情を考えると、比較的に扱いやすいOC設定としてPL1:500W程度(BCU 56x: x35)で+30%程度の性能向上を狙うのもオススメです。

「Intel Xeon w9-3495X」のマルチスレッド性能についてもう少し細かく見ていくと、まず3Dレンダリングのようにプロセッサグループの壁を超えられるワークロードについては特に問題ないことは言うまでもありません。コアスレッド数×コアクロックに応じて非常に高い性能を発揮できます。
65+論理コア対応の可否は事前に調べがつくと思いますし、Ryzen Threadripper 3990Xの発売が2020年だったので対応するソフトはもう対応しているし、そうでなければ諦める感じです。
65+論理コアに対応していないワークロードについても使い方次第です。
1つ目の例、動画のエンコードについてはそもそも20コアを超えた辺りからx264やx265ではCPUが遊び始めていて、並列エンコードが前提になっていました。アプリにも依るのですが、同時並列実行さえできれば動画エンコードでも「Intel Xeon w9-3495X」のマルチスレッド性能を活用できます。
2つ目の例としてRAW現像についても動画のエンコードと考え方は同じで、画像1枚1枚に対する現像exeが数十個並列して実行されます。Windows OSの問題なのか現状では性能の伸びが若干鈍いですが、プロセッサグループに対する分配さえ最適化されれば、さらに性能向上が期待できると思います。
Intel Xeon w9-3495X_Performance_vs
参考までに、「Intel Xeon w9-3495X」でマルチスレッディングを無効化して物理コア=論理コア=56コアのCPUとして扱った場合の性能比率です。
Unreal Engine 4のライティングビルドはGPU LightmassやLumenがあるのでレガシーユースになりつつありますが、x265のエンコードのように複数プロセッサーグループがあると性能の伸びが頭打ちになるケースがあります。今回の検証ではプロセッサーグループの扱い(Windows OSのCPUスケジューラの動作)が怪しかったので、そのせいかもしれませんが。
Intel Xeon w9-3495X_Performance_vs-HT


「Intel Xeon w9-3495X」の競合製品としてAMD Threadripper PRO 5995WXを挙げることもできますが、1世代古いアーキテクチャなので、本格的に比較するなら7000番台のThreadripper PROが出てからかなと。(いつ出るか、そもそも出るか不明ですが)

Threadripper PRO 5995WXの実機を触っていないので、以下、外部レビュー等を参考にした管理人の想像です。
5995WXの時点でマルチスレッド性能のワットパフォーマンスは「Intel Xeon w9-3495X」よりも上なので、7000番台のThreadripper PROが出たら、そこは厳しい戦いになると思います。
5995WXは280WでCinebench R23 マルチスレッドスコアが70000程度、PBO(400W)で80000を超えるかどうかなので、OCも込みなら「Intel Xeon w9-3495X」の方が高いマルチスレッド性能を出します。ただメインストリーム向けRyzen 7000から考えて7000番台のThreadripperは280~350W程度の定格でも4GHz以上のコアクロックは余裕で出しそうなので、そうなるとやはり厳しいかと。

「Intel Xeon w9-3495X」はチップレット構造ながらCPUダイを跨ぐアクセスでもCPUダイ内のアクセスと遅延が変わらないことに加えて、アーキテクチャ的にシングルスレッド性能は「Intel Xeon w9-3495X」の方が高いので、5995WXと非マルチスレッド性能依存なクリエイティブタスク性能で比較すると、第12/13世代CPU vs Ryzen 5000みたいな感じになり、「Intel Xeon w9-3495X」のほうが有利だと思います。(TBM3.0がちゃんと動けば)
Intel第13世代CPUとRyzen 7000のシングル性能には大きな差はなかったので、CPUダイを跨ぐCtoC遅延の違いが「Intel Xeon w9-3495X」と7000番台のThreadripperの性能にどう響くのかは気になります。

その他にもDDR5 R-DIMMのオクタチャンネル対応、CPU直結の112レーンPCIE5.0といった足周りの差もあるので、現状、「Intel Xeon w9-3495X」はなくてThreadripper PRO 5995WXを選ぶ理由はないように思います。


総評 - PGの扱いに注意だがマルチスレッド性能は圧倒的

「Intel Xeon w9-3495X」の56コア112スレッドという圧倒的なマルチスレッド性能を活用するにはWindows 11における2つのプロセッサグループとどう向き合うかが重要になります。
CinebenchやBlenderの3Dレンダリングのように65+論理コアに対応していてプロセッサグループの壁を正面から超えるというのが正攻法であり、このイメージが強いのでXeon w9-3495Xは使い難そうなイメージですが、それ以外にも、並列動画エンコードやRAW現像のようにタスクを分散させることでプロセッサグループの壁を無視して65+論理コアを全て使うという手があります。
65+論理コア対応という正面突破にせよタスク分散という裏口にせよ、どちらもCPUの論理コアを全て使うことができるので、総合したマルチスレッド性能は概ねコアスレッド数×コアクロックに比例し、相応の性能を発揮できます。

プロセッサーグループの扱いに注意は必要ではあるものの、56コア112スレッドという圧倒的リソースの「Intel Xeon w9-3495X」はパーソナルワークステーション向けCPUとして、他の追随を許さない最強マルチスレッド性能なCPUであることは間違いありません。
1つのタスクに集約するにせよ、複数のタスクで分散するにせよ、112スレッドを使い切る自信があるクリエイターにとっては5900ドルの価値がある武器だと思います。

とはいえ複数プロセッサーグループが存在するCPUは一般的な自作PC向けCPUと全く同じように使えるとも言えないので、第4世代Xeon Wの倍率アンロックモデルをCore-Xの後継として使用するなら、Xeon w7-2495XなどXeon W-2400XシリーズCPUがオススメです。
Xeon W-3400XシリーズCPUの112レーンPCIE5.0やオクタチャンネルメモリが必要でも、汎用性を重視するなら28コアのXeon w7-3465Xか16コアのXeon w5-3435Xのほうが扱いやすいと思います。
Intel Xeon W-2400X and 3400X_unlocked


以上、「Intel Xeon w9-3495X」のレビューでした。
Intel Xeon w9-3495X



記事が参考になったと思ったら、ツイートの共有(リツイートやいいね)をお願いします。



今回は自作PC向けパーツとして「Intel Xeon w9-3495X」を評価しましたが、Xeon W-2400/3400シリーズCPUを搭載したパーソナルワークステーションが国内のBTO PCメーカーから発売されています。
自分で組むのはハードルが高い、一から組む時間がないなど自作PCを組むのが難しいという人は、TSUKUMOやマウスコンピューターから発売されているBTO PCを検討してみてください。

















関連記事

Intel第13世代Raptor Lake-Sのレビュー記事一覧へ
Intel 13th-Gen RaptorLake-S CPU

Core i9 12900Kの殻割りクマメタル化&銅製IHSの冷却性能を検証
ROCKITCOOL 12th Gen Delid & Relid Kit

AMD Ryzen 7000&AM5マザーボードのレビュー記事一覧へ
AMD Ryzen 7000

Intel Xeon W-2400X/3400Xのレビュー記事一覧へ
Intel Xeon W-2400X and 3400X

Intel第12世代Alder Lake-Sのレビュー記事一覧へ
Intel 12th-Gen AlderLake-S CPU

AMD Ryzen 5000シリーズCPUのレビュー記事一覧へ
AMD Ryzen 5000シリーズCPU

【できる!自作PC】最新CPUの選び方とオススメCPUを徹底解説
オススメCPUを徹底比較_2019

おすすめの自作PCマザーボードを徹底解説
おすすめマザーボード




(注:記事内で参考のため記載された商品価格は記事執筆当時のものとなり変動している場合があります)



スポンサードリンク