第4世代Intel Xeon Scalableプロセッサー搭載Supermicroサーバーへ移行する理由
基本性能は、異なる世代のインテルXeon CPUを比較しています。
| 第2世代(Cascade Lake)(92xxシリーズを除く) | 第3世代(アイスレイク) | 第4世代(サファイア・ラピッズ) | 2番手から4番手へ | |
|---|---|---|---|---|
| 最大コア数 | 28 | 40 | 60 | 114% |
| 最大コアでの最大GHz | 2.7 | 2.3 | 1.9 | |
| 最大コア*GHz | =28*2.7 = 75.6 | =60*1.9 = 114 | 51% | |
| メモリ速度 | 2400 MHz | 3200 MHz | 4800 MHz | 100% |
| ソケットあたりの最大メモリ | 3 | 8TB(DRAMのみ) | 8TB(DRAMのみ) | 166% |
| 高帯域幅メモリ | X | X | 最大64GB | 該当なし |
| UPIリンク*パフォーマンス | 2 @ 9.6 GT/s = 19.2 GT/s | 3 @ 11.2 GT/s = 33.6 GT/s | 4@16GT/s = 64GT/s | 233 % |
ベンチマークの範囲
一般的に受け入れられている特定のベンチマークは存在するかもしれませんが、現代の企業が実行する可能性のある多くのワークロードは、単純に一般的なベンチマークレポートに押し込めることはできません。ベンチマークは、ローレベルからフルアプリケーションまで、以下の階層に分類することができます。
最低 - CPUの能力に基づく絶対的な最大性能。この数値は1つのCPUの理論上の性能であり、一般的にはクロックレートにコア数、クロックあたりの命令数を乗じることで算出できます。
数学カーネル・レベル - CPUアーキテクチャに高度に調整された小さなアプリケーション。最大性能は通常、理論性能の約85%です。最も一般的な数学ベンチマークは、線形方程式を解くLINPACKです。
小規模アプリケーション - システムの性能をテストするために一般的に使用されるエンタープライズクラスのサーバーで最も人気があるのは、SPEC(Standard Performance Evaluation Corporation)です。SPECは、30年以上にわたって様々なテスト・スイートを提供・収集しています。)
完全なアプリケーション - アプリケーション全体が実行され、完了までの時間が記録されます。
Supermicroサーバーは第4世代Intel Xeon Scalableプロセッサーを搭載し、様々なSPEC結果において優れた性能を発揮します。具体的には、
SPECcpu2017スイートは、以下の方法でシステムの性能を測定します:
浮動小数点: (アプリケーションは浮動小数点に重点を置いています)
- スピード - スイートの各アプリケーションを1部ずつ実行します。そして、基準マシンの完了までの時間を割って「スコア」を計算します。
- レート - テストスイートの多数のコピー(通常はスレッド数に等しい)をシステムにロードし、その結果を参照マシンの時間で割ります。
整数: (アプリケーションは整数計算のみを使用します)
- スピード - スイートの各アプリケーションを1部ずつ実行します。そして、基準マシンの完了までの時間を割って「スコア」を計算します。
- レート - テスト・スイートの多数のコピー(通常はスレッド数に等しい)をシステムにロードし、その結果を参照マシンで割ります。
ピーク - 各アプリケーションのソースコードは、特定のフラグを付けて再コンパイルすることができます。
Base - すべてのアプリケーションのコンパイルに同じコンパイラ・フラグが使用されます。
SPECの結果
Supermicro 8ソケット SPEC CPUベンチマーク:
| システム | インテル | ワークロード | 意義 | スコア |
|---|---|---|---|---|
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_speed_base | ベスト8ソケットシステム | 13.8 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_speed_peak | ベスト8ソケットシステム | 14.0 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_rate_base | トップ3 ベスト8ソケットシステム | 3510 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_rate_peak | トップ2 ベスト8ソケットシステム | 3560 |
| システム | インテル | ワークロード | 意義 | スコア |
|---|---|---|---|---|
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_rate_base | トップ2 ベスト8ソケットシステム | 3540 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_rate_peak | トップ2 ベスト8ソケットシステム | 3560 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_speed_base | ベスト8ソケットシステム | 343 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_speed_peak | ベスト8ソケットシステム | 334 |
Supermicro 4ソケット SPEC CPU ベンチマーク:
| システム | インテル | ワークロード | 意義 | スコア |
|---|---|---|---|---|
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_rate_base | トップ4 ベスト4ソケットシステム | 1930 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_rate_peak | トップ4 ベスト4ソケットシステム | 1970 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_speed_base | トップ3 ベスト4ソケットシステム | 16 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_speed_peak | トップ3 ベスト4ソケットシステム | 16.2 |
| システム | インテル | ワークロード | 意義 | スコア |
|---|---|---|---|---|
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_rate_base | トップ2 ベスト4ソケットシステム | 1900 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_rate_peak | トップ2 ベスト4ソケットシステム | 2010 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_speed_base | トップ2 ベスト4ソケットシステム | 387 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_speed_peak | トップ2 ベスト4ソケットシステム | 387 |
SPECストレージ
SPECstorage Solution 2020ベンチマークは、アプリケーションベースの作業負荷と相互作用するストレージ構成全体の性能を測定します。最新版には、人工知能(AI)およびゲノミクス向けの新しいワークロード、カスタム・ワークロード機能の拡張、スケーリングの大幅な向上、ベンチマーク結果を表示するための統計的可視化メカニズムが含まれています。
(https://www.spec.org/storage2020/press/release.html)
| システム | インテル | ワークロード | 意義 | スコア |
|---|---|---|---|---|
| SYS-221H-TN24RHyper | 8468V 8450H | SPECstorage Solution 2020 | AIイメージでのSpecStorage_2020のベスト結果 | 0.57 |
| SYS-221H-TN24RHyper | 8468V 8450H | SPECstorage Solution 2020 | SWBUILD/JobsでのSpecStorage_2020のベスト結果:72 | 0.47 |
| SYS-221H-TN24RHyper Storage Sever | 8468V 8450H | SPECstorage Solution 2020 | #1位 SpecStorage_2020 IDCベンダー上位5社によるゲノミクスのリーダーシップ。 | 0.19 |
| SYS-221H-TN24RHyper Storage Sever | 8468V 8450H | SPECstorage Solution 2020 | #1位 SpecStorage_2020 VDA/ジョブに関するリーダーシップ:IDCベンダー上位5社で720件。 | 5.56 |
| SYS-220U-TNRと22 NVMeストレージ・ノード | 8380 8360Y | SPECstorage Solution 2020 | #1位 SpecStorage_2020 EDA/ジョブに関するリーダーシップ:IDCベンダー上位5社で240。 | 0.28 |
| SuperServer SYS-741GE-TNRT | 8490H | SPEChpc2021_タイニー | MPIモデルでのシングルノードベースの最良の結果 | 8.20 |
| SuperServer SYS-741GE-TNRT | 8490H | SPEChpc2021_タイニー | #OPMモデルにおける単一ノードベースのリーダーシップは、IDCによるトップ5ベンダーの中でNo.1 | 9.24 |
| SuperServer SYS-741GE-TNRT | 8490H | SPECpower_ssj2008 | #IDCによるトップ5ベンダーのリーダーシップ4Uサーバ第1位 | 13546 |
インテルアクセラレーターエンジンを使用したフルアプリケーションベンチマーク
Supermicroは、第4世代Intel Xeon Scalableプロセッサーと、異なるIntel Accelerator Engineを有効にした場合の比較ベンチマークをいくつか実施しました。下のグラフは、実際のベンチマークを示しており、Intel Xeon 8380とIntel Xeon 8490Hの性能およびワットあたりの性能を比較しています。特定のベンチマークで使用されたIntel Accelerator Engineも記載されています。ベンチマークが実行されたサーバーの詳細は、このドキュメントの最後に記載されています。

SupermicroのX13 CloudDCサーバーは、ResNet 50 v1.5推論ベンチマークのテストに使用され、Intel Xeon 8480+はIntel Xeon 8380 CPUと比較されました。以下のグラフでは、データセットに応じて性能向上が2.38倍から3.24倍でした。このベンチマークには、IntelのAMXアクセラレーション機能が使用されました。

SupermicroのX13 GrandTwin®システムは、Intel® AMX機能を使用して、第3世代Intel Xeon Goldプロセッサーと第4世代Intel Xeon Goldプロセッサーと比較されました。結果として、ResNet 50 v1.5推論テストの実行時に2.38倍から3.24倍の高速化が示されました。

第3世代 Intel Xeon スケーラブル・プロセッサー(80コア使用)を搭載したSupermicro X12世代システムから、第4世代 Intel Xeon スケーラブル・プロセッサー(48コア使用)へ移行した場合、データベースおよび分析アプリケーションにおいて大幅な改善が見られます。X12 UltraプラットフォームとX13 Hyperプラットフォームを比較すると、40%少ないコア数でClickHouseデータベースを使用した場合、25%の性能向上が確認されました。

概要
第4世代Intel Xeon Scalableプロセッサーは、Supermicroの8ソケットおよび4ソケットシステムでアプリケーションを実行する際に著しい性能向上を示します。Supermicro SYS-681E-TR 8ソケットシステムは、単一システムでこれまでに記録された中で最速の性能を示します。
- SPECcpu2017_int_rate_base
- SPECcpu2017_int_rate_peak
- SPECcpu2017_fp_rate_base
- SPECcpu2017_fp_rate_peak
8ソケットおよび4ソケットのSupermicroサーバーのSMPアーキテクチャは、多数のコアとメモリを必要とする大規模なエンタープライズアプリケーションに最適です。
Intelは世代を重ねるごとに性能とセキュリティを一貫して向上させています。以下は、Intelがどのように性能を向上させているかを示す、Intel提供の比較です。Supermicroサーバーは、エッジからデータセンターに設置されるマルチプロセッサーシステムまで、製品ライン全体で最新の第4世代Intel Xeon Scalableプロセッサーを搭載しています。


