跳至主要内容

为什么要搬家Supermicro 搭载第四代英特尔处理器的服务器Xeon 可扩展处理器

来自最新的服务器Supermicro 包含第四代英特尔处理器Xeon 可扩展处理器。这些新型CPU相比前两代英特尔CPU,性能有了显著提升。可以进行多种基准测试,让我们来看几个例子。

基本功能对比了不同代英特尔处理器。 Xeon CPU。

 第二代(卡斯卡德湖)(不包括 92xx 系列)第三代(冰湖)第四代(蓝宝石急流)将第二级提升至第四级
最大核心数284060114%
最大主频(最大核心数)2.72.31.9 
最大核心数*GHz=28*2.7 = 75.6 =60*1.9 = 11451%
内存速度2400 MHz3200 MHz4800 MHz100%
每个插槽最大内存3TB8TB(仅限DRAM)8TB(仅限DRAM)166%
高带宽内存XX最高可达 64 GB不适用
UPI链接*性能2 @ 9.6 GT/s = 19.2 GT/s3 @ 11.2 GT/s = 33.6 GT/s4@16 GT/s = 64 GT/s233 %

基准范围

尽管存在一些普遍接受的特定基准测试,但现代企业运行的许多工作负载无法简单地套用通用的基准测试报告。基准测试可以按照以下层级结构进行分类,从底层到完整应用程序。

最低性能——基于CPU性能的绝对最大性能。该数值为单个CPU的理论性能,通常可通过时钟频率乘以核心数再乘以每时钟周期指令数计算得出。

数学内核级测试——一种针对 CPU 架构高度优化的小型应用程序。其最大性能通常约为理论性能的 85%。最常用的数学基准测试是 LINPACK,它可以求解线性方程组。

小型应用——对于企业级服务器而言,最常用的系统性能测试工具是 SPEC(标准性能评估公司)。SPEC 提供和收集各种测试套件已有 30 多年历史。

完整应用程序 – 运行整个应用程序,并记录完成时间。
 

Supermicro 搭载第四代英特尔处理器的服务器Xeon 可扩展处理器在各项 SPEC 测试中均表现出色。具体而言,

SPECcpu2017 测试套件通过以下方式衡量系统性能:

浮点运算:(应用程序高度依赖浮点运算)

  1. 速度——运行套件中每个应用程序的一个副本。然后,通过将完成时间除以参考机器的完成时间来计算“得分”。
  2. 速率 – 系统加载多个测试套件副本(通常等于线程数),然后将结果除以参考机器的时间。

整数:(应用程序仅使用整数运算)

  1. 速度——运行套件中每个应用程序的一个副本。然后,通过将完成时间除以参考机器的完成时间来计算“得分”。
  2. 速率 – 系统加载多个测试套件副本(通常等于线程数),然后将结果除以参考机器。

Peak – 每个应用程序源代码都可以使用特定的标志重新编译。

基本设置 – 所有应用程序的编译都使用相同的编译器标志。

SPEC 结果

Supermicro 8路SPEC CPU基准测试:

SPECcpu2017 整数
系统英特尔Xeon工作量意义分数
SuperServer SYS-681E-TR8490HSPECcpu2017_int_speed_base最佳8插座系统13.8
SuperServer SYS-681E-TR8490HSPECcpu2017_int_speed_peak最佳8插座系统14.0
SuperServer SYS-681E-TR8490HSPECcpu2017_int_rate_base最佳8孔插座系统前3名3510
SuperServer SYS-681E-TR8490HSPECcpu2017_int_rate_peak最佳2款8孔插座系统3560
SPECcpu2017 浮点
系统英特尔Xeon工作量意义分数
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_rate_base最佳2款8孔插座系统3540
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_rate_peak最佳2款8孔插座系统3560
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_speed_base最佳8插座系统343
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_speed_peak最佳8插座系统334

Supermicro 四路 SPEC CPU 基准测试:

SPECcpu2017 整数
系统英特尔Xeon工作量意义分数
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_rate_base最佳四孔插座系统前四名1930
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_rate_peak最佳四孔插座系统前四名1970
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_speed_base最佳四孔插座系统前三名16
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_speed_peak最佳四孔插座系统前三名16.2
SPECcpu2017 浮点
系统英特尔Xeon工作量意义分数
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_rate_base排名前二的最佳四孔插座系统1900
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_rate_peak排名前二的最佳四孔插座系统2010
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_speed_base排名前二的最佳四孔插座系统387
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_speed_peak排名前二的最佳四孔插座系统387

规格存储

SPECstorage Solution 2020 基准测试衡量整个存储配置在与基于应用程序的工作负载交互时的性能。最新版本新增了人工智能 (AI) 和基因组学工作负载,扩展了自定义工作负载功能,大幅提升了扩展性,并新增了用于显示基准测试结果的统计可视化机制。
https://www.spec.org/storage2020/press/release.html)

系统英特尔Xeon工作量意义分数
SYS-221H-TN24R Hyper 存储服务器8468V
8450H
SPEC存储解决方案2020最佳 SpecStorage_2020 AI 图像结果0.57
SYS-221H-TN24R Hyper 存储服务器8468V
8450H
SPEC存储解决方案2020SWBUILD/Jobs 上 SpecStorage_2020 的最佳结果:720.47
SYS-221H-TN24R Hyper 存储服务器8468V
8450H
SPEC存储解决方案2020#1 SpecStorage_2020 在基因组学领域排名前五IDC 供应商。0.19
SYS-221H-TN24R Hyper 存储服务器8468V
8450H
SPEC存储解决方案2020#1 SpecStorage_2020 在 VDA/Jobs 领域的领先地位:前 5 名平均获得 720 个职位IDC 供应商。5.56
SYS-220U-TNR 带 22 NVMe 存储节点8380
8360Y
SPEC存储解决方案2020#1 SpecStorage_2020 在 EDA/Jobs 领域的领先地位:前 5 名平均每人 240 个IDC 供应商。0.28
SuperServer SYS-741GE-TNRT8490HSPEChpc2021_Tiny基于 MPI 模型的最佳单节点结果8.20
SuperServer SYS-741GE-TNRT8490HSPEChpc2021_Tiny在排名前五的供应商中,OPM 模型单节点基础结果领先者排名第一IDC9.24
SuperServer SYS-741GE-TNRT8490HSPECpower_ssj2008在排名前五的供应商中,4U 服务器的领导力排名第一IDC13546

使用英特尔加速引擎的完整应用程序基准测试

Supermicro 已经运行了多个基准测试,对第四代英特尔处理器进行了比较。 Xeon 启用不同英特尔加速引擎的可扩展处理器。下图显示了实际基准测试结果,并对英特尔处理器进行了比较。 Xeon 8380 到英特尔Xeon 8490H 在性能和每瓦性能方面均名列前茅。用于该基准测试的英特尔加速引擎也已列出。运行基准测试的服务器的具体信息将在本文档末尾描述。

显著的性能提升和能效比提高——英特尔®加速引擎的优势

Supermicro的X13 CloudDC 服务器用于测试 ResNet 50 v1.5 推理基准测试和英特尔Xeon 8480+ 与英特尔进行了比较Xeon 8380 CPU。如下表所示,性能提升幅度在 2.38 倍到 3.24 倍之间,具体数值取决于数据集。此基准测试使用了英特尔 AMX 加速功能。

Supermicro人工智能性能提升——ResNet 50 v1.5 推理CloudDC SuperServer – 英特尔® 高级矩阵扩展技术(英特尔® AMX)。性能提升高达 3.24 倍。

Supermicro的X13 GrandTwin® 该系统与第三代英特尔处理器进行了比较。 Xeon 采用第四代英特尔® 英特尔® 处理器的金牌处理器Xeon 采用英特尔® AMX 特性的 Gold 处理器。结果表明,在运行 ResNet 50 v1.5 推理测试时,速度提升了 2.38 到 3.24 倍。

Supermicro 's Performance Gains in AI – ResNet 50 v1.5 推理在 GrandTwin 上的应用SuperServer – 英特尔® 高级矩阵扩展技术 (Intel® AMX)。性能提升高达 2.85 倍。

从Supermicro X12 搭载第三代英特尔处理器的下一代系统Xeon 可扩展处理器(使用 80 个核心)至第四代英特尔处理器Xeon 可扩展处理器(使用 48 个核心)。使用X12 Ultra 平台与……相比X13 Hyper 在该平台上,使用 ClickHouse 数据库,同时减少 40% 的核心数,性能提高了 25%。

Supermicro ClickHouse 分析性能提升——代际改进:核心数减少 40%,性能提升 25%。

概括

第四代英特尔Xeon 可扩展处理器在运行应用程序时表现出显著的性能提升Supermicro 8孔和4孔系统。 Supermicro SYS-681E-TR 八插槽系统展现了有史以来单系统最快的性能:

  • SPECcpu2017_int_rate_base
  • SPECcpu2017_int_rate_peak
  • SPECcpu2017_fp_rate_base
  • SPECcpu2017_fp_rate_peak

八插槽和四插槽的SMP架构Supermicro 服务器非常适合需要大量内核和内存的大型企业应用程序。

英特尔持续提升产品性能和安全性,每一代产品都如此。以下是英特尔提供的对比数据,展示了英特尔如何不断改进其产品性能。 Supermicro 服务器采用最新的第四代英特尔处理器Xeon 从边缘计算到数据中心的多处理器系统,全线产品均采用可扩展处理器。

按处理器世代划分的英特尔加速引擎(对比图)
资源和配置