本文へスキップ

第4世代Intel Xeon Scalableプロセッサー搭載Supermicroサーバーへ移行する理由

Supermicroの最新サーバーには、第4世代Intel Xeon Scalableプロセッサーが搭載されています。これらの新しいCPUは、以前の2世代のIntel CPUと比較して大幅な性能向上を提供します。多くのベンチマークが実行可能なので、いくつか見てみましょう。

基本性能は、異なる世代のインテルXeon CPUを比較しています。

 第2世代(Cascade Lake)(92xxシリーズを除く)第3世代(アイスレイク)第4世代(サファイア・ラピッズ)2番手から4番手へ
最大コア数284060114%
最大コアでの最大GHz2.72.31.9 
最大コア*GHz=28*2.7 = 75.6 =60*1.9 = 11451%
メモリ速度2400 MHz3200 MHz4800 MHz100%
ソケットあたりの最大メモリ38TB(DRAMのみ)8TB(DRAMのみ)166%
高帯域幅メモリXX最大64GB該当なし
UPIリンク*パフォーマンス2 @ 9.6 GT/s = 19.2 GT/s3 @ 11.2 GT/s = 33.6 GT/s4@16GT/s = 64GT/s233 %

ベンチマークの範囲

一般的に受け入れられている特定のベンチマークは存在するかもしれませんが、現代の企業が実行する可能性のある多くのワークロードは、単純に一般的なベンチマークレポートに押し込めることはできません。ベンチマークは、ローレベルからフルアプリケーションまで、以下の階層に分類することができます。

最低 - CPUの能力に基づく絶対的な最大性能。この数値は1つのCPUの理論上の性能であり、一般的にはクロックレートにコア数、クロックあたりの命令数を乗じることで算出できます。

数学カーネル・レベル - CPUアーキテクチャに高度に調整された小さなアプリケーション。最大性能は通常、理論性能の約85%です。最も一般的な数学ベンチマークは、線形方程式を解くLINPACKです。

小規模アプリケーション - システムの性能をテストするために一般的に使用されるエンタープライズクラスのサーバーで最も人気があるのは、SPEC(Standard Performance Evaluation Corporation)です。SPECは、30年以上にわたって様々なテスト・スイートを提供・収集しています。)

完全なアプリケーション - アプリケーション全体が実行され、完了までの時間が記録されます。
 

Supermicroサーバーは第4世代Intel Xeon Scalableプロセッサーを搭載し、様々なSPEC結果において優れた性能を発揮します。具体的には、

SPECcpu2017スイートは、以下の方法でシステムの性能を測定します:

浮動小数点: (アプリケーションは浮動小数点に重点を置いています)

  1. スピード - スイートの各アプリケーションを1部ずつ実行します。そして、基準マシンの完了までの時間を割って「スコア」を計算します。
  2. レート - テストスイートの多数のコピー(通常はスレッド数に等しい)をシステムにロードし、その結果を参照マシンの時間で割ります。

整数: (アプリケーションは整数計算のみを使用します)

  1. スピード - スイートの各アプリケーションを1部ずつ実行します。そして、基準マシンの完了までの時間を割って「スコア」を計算します。
  2. レート - テスト・スイートの多数のコピー(通常はスレッド数に等しい)をシステムにロードし、その結果を参照マシンで割ります。

ピーク - 各アプリケーションのソースコードは、特定のフラグを付けて再コンパイルすることができます。

Base - すべてのアプリケーションのコンパイルに同じコンパイラ・フラグが使用されます。

SPECの結果

Supermicro 8ソケット SPEC CPUベンチマーク:

SPECcpu2017 整数
システムインテルワークロード意義スコア
SuperServer SYS-681E-TR8490HSPECcpu2017_int_speed_baseベスト8ソケットシステム13.8
SuperServer SYS-681E-TR8490HSPECcpu2017_int_speed_peakベスト8ソケットシステム14.0
SuperServer SYS-681E-TR8490HSPECcpu2017_int_rate_baseトップ3 ベスト8ソケットシステム3510
SuperServer SYS-681E-TR8490HSPECcpu2017_int_rate_peakトップ2 ベスト8ソケットシステム3560
SPECcpu2017 浮動小数点
システムインテルワークロード意義スコア
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_rate_baseトップ2 ベスト8ソケットシステム3540
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_rate_peakトップ2 ベスト8ソケットシステム3560
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_speed_baseベスト8ソケットシステム343
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_speed_peakベスト8ソケットシステム334

Supermicro 4ソケット SPEC CPU ベンチマーク:

SPECcpu2017 整数
システムインテルワークロード意義スコア
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_rate_baseトップ4 ベスト4ソケットシステム1930
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_rate_peakトップ4 ベスト4ソケットシステム1970
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_speed_baseトップ3 ベスト4ソケットシステム16
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_speed_peakトップ3 ベスト4ソケットシステム16.2
SPECcpu2017 浮動小数点
システムインテルワークロード意義スコア
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_rate_baseトップ2 ベスト4ソケットシステム1900
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_rate_peakトップ2 ベスト4ソケットシステム2010
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_speed_baseトップ2 ベスト4ソケットシステム387
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_speed_peakトップ2 ベスト4ソケットシステム387

SPECストレージ

SPECstorage Solution 2020ベンチマークは、アプリケーションベースの作業負荷と相互作用するストレージ構成全体の性能を測定します。最新版には、人工知能(AI)およびゲノミクス向けの新しいワークロード、カスタム・ワークロード機能の拡張、スケーリングの大幅な向上、ベンチマーク結果を表示するための統計的可視化メカニズムが含まれています。
(https://www.spec.org/storage2020/press/release.html)

システムインテルワークロード意義スコア
SYS-221H-TN24RHyper8468V
8450H
SPECstorage Solution 2020AIイメージでのSpecStorage_2020のベスト結果0.57
SYS-221H-TN24RHyper8468V
8450H
SPECstorage Solution 2020SWBUILD/JobsでのSpecStorage_2020のベスト結果:720.47
SYS-221H-TN24RHyper Storage Sever8468V
8450H
SPECstorage Solution 2020#1位 SpecStorage_2020 IDCベンダー上位5社によるゲノミクスのリーダーシップ。0.19
SYS-221H-TN24RHyper Storage Sever8468V
8450H
SPECstorage Solution 2020#1位 SpecStorage_2020 VDA/ジョブに関するリーダーシップ:IDCベンダー上位5社で720件。5.56
SYS-220U-TNRと22 NVMeストレージ・ノード8380
8360Y
SPECstorage Solution 2020#1位 SpecStorage_2020 EDA/ジョブに関するリーダーシップ:IDCベンダー上位5社で240。0.28
SuperServer SYS-741GE-TNRT8490HSPEChpc2021_タイニーMPIモデルでのシングルノードベースの最良の結果8.20
SuperServer SYS-741GE-TNRT8490HSPEChpc2021_タイニー#OPMモデルにおける単一ノードベースのリーダーシップは、IDCによるトップ5ベンダーの中でNo.19.24
SuperServer SYS-741GE-TNRT8490HSPECpower_ssj2008#IDCによるトップ5ベンダーのリーダーシップ4Uサーバ第1位13546

インテルアクセラレーターエンジンを使用したフルアプリケーションベンチマーク

Supermicroは、第4世代Intel Xeon Scalableプロセッサーと、異なるIntel Accelerator Engineを有効にした場合の比較ベンチマークをいくつか実施しました。下のグラフは、実際のベンチマークを示しており、Intel Xeon 8380とIntel Xeon 8490Hの性能およびワットあたりの性能を比較しています。特定のベンチマークで使用されたIntel Accelerator Engineも記載されています。ベンチマークが実行されたサーバーの詳細は、このドキュメントの最後に記載されています。

大幅なパフォーマンスとパフォーマンス/ワットの向上 - インテル® アクセラレーター・エンジンのメリット

SupermicroのX13 CloudDCサーバーは、ResNet 50 v1.5推論ベンチマークのテストに使用され、Intel Xeon 8480+はIntel Xeon 8380 CPUと比較されました。以下のグラフでは、データセットに応じて性能向上が2.38倍から3.24倍でした。このベンチマークには、IntelのAMXアクセラレーション機能が使用されました。

SupermicroのAIにおける性能向上 – CloudDC SuperServerでのResNet 50 v1.5推論 – Intel® Advanced Matrix Extensions (Intel® AMX)。最大3.24倍の性能向上。

SupermicroのX13 GrandTwin®システムは、Intel® AMX機能を使用して、第3世代Intel Xeon Goldプロセッサーと第4世代Intel Xeon Goldプロセッサーと比較されました。結果として、ResNet 50 v1.5推論テストの実行時に2.38倍から3.24倍の高速化が示されました。

SupermicroのAIにおける性能向上 – GrandTwin SuperServerでのResNet 50 v1.5推論 – Intel® Advanced Matrix Extensions (Intel® AMX)。最大2.85倍の性能向上。

第3世代 Intel Xeon スケーラブル・プロセッサー(80コア使用)を搭載したSupermicro X12世代システムから、第4世代 Intel Xeon スケーラブル・プロセッサー(48コア使用)へ移行した場合、データベースおよび分析アプリケーションにおいて大幅な改善が見られます。X12 UltraプラットフォームとX13 Hyperプラットフォームを比較すると、40%少ないコア数でClickHouseデータベースを使用した場合、25%の性能向上が確認されました。

Supermicroのアナリティクスにおける性能向上 – ClickHouseの世代ごとの改善。コア数を40%削減し、25%高い性能。

概要

第4世代Intel Xeon Scalableプロセッサーは、Supermicroの8ソケットおよび4ソケットシステムでアプリケーションを実行する際に著しい性能向上を示します。Supermicro SYS-681E-TR 8ソケットシステムは、単一システムでこれまでに記録された中で最速の性能を示します。

  • SPECcpu2017_int_rate_base
  • SPECcpu2017_int_rate_peak
  • SPECcpu2017_fp_rate_base
  • SPECcpu2017_fp_rate_peak

8ソケットおよび4ソケットのSupermicroサーバーのSMPアーキテクチャは、多数のコアとメモリを必要とする大規模なエンタープライズアプリケーションに最適です。

Intelは世代を重ねるごとに性能とセキュリティを一貫して向上させています。以下は、Intelがどのように性能を向上させているかを示す、Intel提供の比較です。Supermicroサーバーは、エッジからデータセンターに設置されるマルチプロセッサーシステムまで、製品ライン全体で最新の第4世代Intel Xeon Scalableプロセッサーを搭載しています。

プロセッサー世代別インテル・アクセラレーター・エンジン(比較表)
リソースと構成