跳至主要内容

为何选择搭载第四代 Intel Xeon 可扩展处理器的 Supermicro 服务器

Supermicro 的最新服务器搭载了第四代 Intel Xeon 可扩展处理器。这些新型 CPU 比前两代 Intel CPU 提供了显著的性能提升。可以进行许多基准测试,下面我们来看几个。

基础性能对比了不同代的英特尔Xeon 。

 第二代(Cascade Lake)(92xx系列除外)第三代(冰湖)第四代(蓝宝石急流)增加第二档至第四档
最大核心数284060114%
最大核心数下的最高GHz频率2.72.31.9 
最大核心数*GHz=28×2.7 = 75.6 =60×1.9 = 11451%
内存速度2400兆赫3200兆赫4800兆赫100%
每个插槽的最大内存3TB8TB(仅DRAM)8TB(仅DRAM)166%
高带宽内存XX最高可达64 GB不适用
UPI链接*性能2 @ 9.6 GT/s = 19.2 GT/s3 × 11.2 GT/s = 33.6 GT/s4×16 GT/s = 64 GT/s233 %

基准范围

尽管可能存在被普遍接受的特定基准测试,但现代企业运行的许多工作负载无法简单地套用到通用基准报告中。基准测试可按以下层次划分,从低级到完整应用程序:

最低值——基于CPU能力的绝对最大性能。该数值代表单颗CPU的理论性能,通常可通过时钟频率乘以核心数量再乘以每时钟周期指令数来计算。

数学内核层级——高度针对CPU架构优化的微型应用程序。其峰值性能通常可达理论性能的85%左右。最常见的数学基准测试是LINPACK,该测试用于求解线性方程组。

小型应用程序——企业级服务器最常用的系统性能测试工具是SPEC(标准性能评估公司)。三十多年来,SPEC始终致力于提供并收集各类测试套件。

完整应用程序——运行整个应用程序,并记录完成所需的时间。
 

搭载第四代 Intel Xeon 可扩展处理器的 Supermicro 服务器在各项 SPEC 测试结果中表现出色。具体而言,

SPECcpu2017套件通过以下方式衡量系统性能:

浮点运算:(应用程序高度依赖浮点运算)

  1. 速度——仅运行套件中每个应用程序的一个副本。随后通过将参考机器的完成时间除以基准值来计算"得分"。
  2. 速率 – 系统加载多个测试套件副本(通常等于线程数),然后将结果除以基准机器的运行时间。

整数:(应用程序仅使用整数运算)

  1. 速度——仅运行套件中每个应用程序的一个副本。随后通过将参考机器的完成时间除以基准值来计算"得分"。
  2. 速率——系统加载了大量测试套件副本(通常等于线程数),然后将结果除以基准机器的运行时间。

Peak – 每个应用程序的源代码都可以使用特定标志重新编译。

基础 – 所有应用程序的编译均采用相同的编译器标志。

SPEC 结果

Supermicro 8 路 SPEC CPU 基准测试:

SPECcpu2017 整数
系统英特尔Xeon工作量重要性得分
SuperServer8490HSPECcpu2017_整数运算速度基准测试最佳8插座系统13.8
SuperServer8490HSPECcpu2017_整数运算峰值速度最佳8插座系统14.0
SuperServer8490HSPECcpu2017_整数运算速率基准测试最佳8插座系统前三名3510
SuperServer8490HSPECcpu2017_整数运算速率峰值最佳八插座系统前两名3560
SPECcpu2017 浮点运算
系统英特尔Xeon工作量重要性得分
SuperServer8490HSPECcpu2017_浮点运算速率基准测试最佳八插座系统前两名3540
SuperServer8490HSPECcpu2017_浮点运算速率峰值最佳八插座系统前两名3560
SuperServer8490HSPECcpu2017_浮点运算速度基准测试最佳8插座系统343
SuperServer8490HSPECcpu2017_浮点运算峰值速度最佳8插座系统334

Supermicro 4 路 SPEC CPU 基准测试:

SPECcpu2017 整数
系统英特尔Xeon工作量重要性得分
SuperServer8490HSPECcpu2017_整数运算速率基准测试最佳四插座系统前四名1930
SuperServer8490HSPECcpu2017_整数运算速率峰值最佳四插座系统前四名1970
SuperServer8490HSPECcpu2017_整数运算速度基准测试最佳四插座系统前三名16
SuperServer8490HSPECcpu2017_整数运算峰值速度最佳四插座系统前三名16.2
SPECcpu2017 浮点运算
系统英特尔Xeon工作量重要性得分
SuperServer8490HSPECcpu2017_浮点运算速率基准测试最佳四插座系统前两名1900
SuperServer8490HSPECcpu2017_浮点运算速率峰值最佳四插座系统前两名2010
SuperServer8490HSPECcpu2017_浮点运算速度基准测试最佳四插座系统前两名387
SuperServer8490HSPECcpu2017_浮点运算峰值速度最佳四插座系统前两名387

SPEC存储

SPECstorage Solution 2020基准测试用于评估整个存储配置在处理应用程序工作负载时的性能表现。最新版本新增了人工智能(AI)和基因组学工作负载,扩展了自定义工作负载功能,实现了显著提升的扩展能力,并引入统计可视化机制以直观展示基准测试结果。
(https://www.spec.org/storage2020/press/release.html)

系统英特尔Xeon工作量重要性得分
SYS-221H-TN24RHyper 服务器8468V
8450H
SPEC存储解决方案2020最佳SpecStorage_2020在AI图像上的结果0.57
SYS-221H-TN24RHyper 服务器8468V
8450H
SPEC存储解决方案2020在SWBUILD/Jobs上获得最佳SpecStorage_2020结果:720.47
SYS-221H-TN24RHyper 服务器8468V
8450H
SPEC存储解决方案2020#1 2020年基因组学领域存储解决方案领导者(基于IDC前五大供应商排名)0.19
SYS-221H-TN24RHyper 服务器8468V
8450H
SPEC存储解决方案2020#1 SpecStorage_2020 虚拟桌面基础架构/工作负载领导力:前五大IDC供应商均达720。5.56
SYS-220U-TNR 配备22个NVMe存储节点8380
8360Y
SPEC存储解决方案2020#1 SpecStorage_2020 领导力评估:在EDA/Jobs领域,前五大IDC供应商平均每家创造240个就业岗位。0.28
SuperServer8490HSPEChpc2021_微型MPI模型中最佳单节点基准测试结果8.20
SuperServer8490HSPEChpc2021_微型IDC数据显示,在前五大供应商中,该产品在OPM模型中以单节点基础结果排名第一。9.24
SuperServer8490HSPECpower_ssj2008IDC数据显示,#1领导力4U服务器位列前五大供应商之列13546

基于英特尔加速引擎的完整应用基准测试

Supermicro 运行了多项基准测试,比较了开启不同 Intel 加速引擎的第四代 Intel Xeon 可扩展处理器。下图显示了实际基准测试,并比较了 Intel Xeon 8380 与 Intel Xeon 8490H 的性能和每瓦性能。用于特定基准测试的 Intel 加速引擎也一并列出。运行基准测试的服务器的具体配置在本文件末尾进行了描述。

显著性能与性能/瓦提升——英特尔®加速引擎的优势

Supermicro 的 X13 CloudDC 服务器用于 ResNet 50 v1.5 推理基准测试,并将 Intel Xeon 8480+ 与 Intel Xeon 8380 CPU 进行了比较。在下图中,性能提升范围为 2.38 倍至 3.24 倍,具体取决于数据集。此基准测试使用了 Intel 的 AMX 加速功能。

Supermicro 在 AI 领域的性能提升 – CloudDC SuperServer 上的 ResNet 50 v1.5 推理 – Intel® 高级矩阵扩展 (Intel® AMX)。性能提升高达 3.24 倍。

Supermicro 的 X13 GrandTwin® 系统与使用 Intel® AMX 功能的第四代 Intel Xeon Gold 处理器和第三代 Intel Xeon Gold 处理器进行了比较。结果显示,在运行 ResNet 50 v1.5 推理测试时,速度提升了 2.38 到 3.24 倍。

Supermicro 在 AI 领域的性能提升 – GrandTwin SuperServer 上的 ResNet 50 v1.5 推理 – Intel® 高级矩阵扩展 (Intel® AMX)。性能提升高达 2.85 倍。

当从配备第三代 Intel Xeon Scalable 处理器(使用 80 个核心)的 Supermicro X12 代系统迁移到第四代 Intel Xeon Scalable 处理器(使用 48 个核心)时,数据库和分析应用程序的性能有显著提升。与 X13 Hyper 平台相比,使用 X12 Ultra 平台,在核心数减少 40% 的情况下,ClickHouse 数据库的性能提升了 25%。

Supermicro 在分析领域的性能提升 – ClickHouse 跨代改进。核心数减少 40% 的情况下,性能提升 25%。

摘要

第四代 Intel Xeon Scalable 处理器在 Supermicro 8 路和 4 路系统上运行应用程序时显示出显著的性能提升。Supermicro SYS-681E-TR 八路系统在单系统上实现了有史以来最快的性能,适用于:

  • SPECcpu2017_整数运算速率基准测试
  • SPECcpu2017_整数运算速率峰值
  • SPECcpu2017_浮点运算速率基准测试
  • SPECcpu2017_浮点运算速率峰值

八路和四路 Supermicro 服务器的 SMP 架构非常适合需要大量核心和内存的大规模企业级应用程序。

Intel 持续改进其产品的代际性能和安全性。以下是 Intel 提供的一项比较,展示了 Intel 如何提升其性能。Supermicro 服务器在整个产品线中集成了最新的第四代 Intel Xeon Scalable 处理器,涵盖从边缘计算到数据中心的多处理器系统。

英特尔加速引擎按处理器代际划分(对比图表)
资源与配置