为何选择搭载第四代英特尔Xeon 处理器的Supermicro
基础性能对比了不同代的英特尔Xeon 。
| 第二代(Cascade Lake)(92xx系列除外) | 第三代(冰湖) | 第四代(蓝宝石急流) | 增加第二档至第四档 | |
|---|---|---|---|---|
| 最大核心数 | 28 | 40 | 60 | 114% |
| 最大核心数下的最高GHz频率 | 2.7 | 2.3 | 1.9 | |
| 最大核心数*GHz | =28×2.7 = 75.6 | =60×1.9 = 114 | 51% | |
| 内存速度 | 2400兆赫 | 3200兆赫 | 4800兆赫 | 100% |
| 每个插槽的最大内存 | 3TB | 8TB(仅DRAM) | 8TB(仅DRAM) | 166% |
| 高带宽内存 | X | X | 最高可达64 GB | 不适用 |
| UPI链接*性能 | 2 @ 9.6 GT/s = 19.2 GT/s | 3 × 11.2 GT/s = 33.6 GT/s | 4×16 GT/s = 64 GT/s | 233 % |
基准范围
尽管可能存在被普遍接受的特定基准测试,但现代企业运行的许多工作负载无法简单地套用到通用基准报告中。基准测试可按以下层次划分,从低级到完整应用程序:
最低值——基于CPU能力的绝对最大性能。该数值代表单颗CPU的理论性能,通常可通过时钟频率乘以核心数量再乘以每时钟周期指令数来计算。
数学内核层级——高度针对CPU架构优化的微型应用程序。其峰值性能通常可达理论性能的85%左右。最常见的数学基准测试是LINPACK,该测试用于求解线性方程组。
小型应用程序——企业级服务器最常用的系统性能测试工具是SPEC(标准性能评估公司)。三十多年来,SPEC始终致力于提供并收集各类测试套件。
完整应用程序——运行整个应用程序,并记录完成所需的时间。
搭载第四代英特尔Xeon 处理Supermicro 在各类SPEC测试中表现卓越。具体而言:
SPECcpu2017套件通过以下方式衡量系统性能:
浮点运算:(应用程序高度依赖浮点运算)
- 速度——仅运行套件中每个应用程序的一个副本。随后通过将参考机器的完成时间除以基准值来计算"得分"。
- 速率 – 系统加载多个测试套件副本(通常等于线程数),然后将结果除以基准机器的运行时间。
整数:(应用程序仅使用整数运算)
- 速度——仅运行套件中每个应用程序的一个副本。随后通过将参考机器的完成时间除以基准值来计算"得分"。
- 速率——系统加载了大量测试套件副本(通常等于线程数),然后将结果除以基准机器的运行时间。
Peak – 每个应用程序的源代码都可以使用特定标志重新编译。
基础 – 所有应用程序的编译均采用相同的编译器标志。
SPEC 结果
Supermicro SPEC CPU 基准测试:
| 系统 | 英特尔Xeon | 工作量 | 重要性 | 得分 |
|---|---|---|---|---|
| SuperServer | 8490H | SPECcpu2017_整数运算速度基准测试 | 最佳8插座系统 | 13.8 |
| SuperServer | 8490H | SPECcpu2017_整数运算峰值速度 | 最佳8插座系统 | 14.0 |
| SuperServer | 8490H | SPECcpu2017_整数运算速率基准测试 | 最佳8插座系统前三名 | 3510 |
| SuperServer | 8490H | SPECcpu2017_整数运算速率峰值 | 最佳八插座系统前两名 | 3560 |
| 系统 | 英特尔Xeon | 工作量 | 重要性 | 得分 |
|---|---|---|---|---|
| SuperServer | 8490H | SPECcpu2017_浮点运算速率基准测试 | 最佳八插座系统前两名 | 3540 |
| SuperServer | 8490H | SPECcpu2017_浮点运算速率峰值 | 最佳八插座系统前两名 | 3560 |
| SuperServer | 8490H | SPECcpu2017_浮点运算速度基准测试 | 最佳8插座系统 | 343 |
| SuperServer | 8490H | SPECcpu2017_浮点运算峰值速度 | 最佳8插座系统 | 334 |
Supermicro SPEC CPU 基准测试:
| 系统 | 英特尔Xeon | 工作量 | 重要性 | 得分 |
|---|---|---|---|---|
| SuperServer | 8490H | SPECcpu2017_整数运算速率基准测试 | 最佳四插座系统前四名 | 1930 |
| SuperServer | 8490H | SPECcpu2017_整数运算速率峰值 | 最佳四插座系统前四名 | 1970 |
| SuperServer | 8490H | SPECcpu2017_整数运算速度基准测试 | 最佳四插座系统前三名 | 16 |
| SuperServer | 8490H | SPECcpu2017_整数运算峰值速度 | 最佳四插座系统前三名 | 16.2 |
| 系统 | 英特尔Xeon | 工作量 | 重要性 | 得分 |
|---|---|---|---|---|
| SuperServer | 8490H | SPECcpu2017_浮点运算速率基准测试 | 最佳四插座系统前两名 | 1900 |
| SuperServer | 8490H | SPECcpu2017_浮点运算速率峰值 | 最佳四插座系统前两名 | 2010 |
| SuperServer | 8490H | SPECcpu2017_浮点运算速度基准测试 | 最佳四插座系统前两名 | 387 |
| SuperServer | 8490H | SPECcpu2017_浮点运算峰值速度 | 最佳四插座系统前两名 | 387 |
SPEC存储
SPECstorage Solution 2020基准测试用于评估整个存储配置在处理应用程序工作负载时的性能表现。最新版本新增了人工智能(AI)和基因组学工作负载,扩展了自定义工作负载功能,实现了显著提升的扩展能力,并引入统计可视化机制以直观展示基准测试结果。
(https://www.spec.org/storage2020/press/release.html)
| 系统 | 英特尔Xeon | 工作量 | 重要性 | 得分 |
|---|---|---|---|---|
| SYS-221H-TN24RHyper 服务器 | 8468V 8450H | SPEC存储解决方案2020 | 最佳SpecStorage_2020在AI图像上的结果 | 0.57 |
| SYS-221H-TN24RHyper 服务器 | 8468V 8450H | SPEC存储解决方案2020 | 在SWBUILD/Jobs上获得最佳SpecStorage_2020结果:72 | 0.47 |
| SYS-221H-TN24RHyper 服务器 | 8468V 8450H | SPEC存储解决方案2020 | #1 2020年基因组学领域存储解决方案领导者(基于IDC前五大供应商排名) | 0.19 |
| SYS-221H-TN24RHyper 服务器 | 8468V 8450H | SPEC存储解决方案2020 | #1 SpecStorage_2020 虚拟桌面基础架构/工作负载领导力:前五大IDC供应商均达720。 | 5.56 |
| SYS-220U-TNR 配备22个NVMe存储节点 | 8380 8360Y | SPEC存储解决方案2020 | #1 SpecStorage_2020 领导力评估:在EDA/Jobs领域,前五大IDC供应商平均每家创造240个就业岗位。 | 0.28 |
| SuperServer | 8490H | SPEChpc2021_微型 | MPI模型中最佳单节点基准测试结果 | 8.20 |
| SuperServer | 8490H | SPEChpc2021_微型 | IDC数据显示,在前五大供应商中,该产品在OPM模型中以单节点基础结果排名第一。 | 9.24 |
| SuperServer | 8490H | SPECpower_ssj2008 | IDC数据显示,#1领导力4U服务器位列前五大供应商之列 | 13546 |
基于英特尔加速引擎的完整应用基准测试
Supermicro 多项基准测试,对比了第四代英Xeon 处理器在不同英特尔加速引擎开启状态下的表现。下图展示了实际基准测试结果,对比了英特尔Xeon Xeon 在性能及每瓦性能方面的差异,同时标注了各测试中使用的英特尔加速引擎类型。 本文件末尾详述了运行基准测试的服务器具体配置。

Supermicro CloudDC 用于测试ResNet 50 v1.5推理基准,其中IntelXeon 处理器与IntelXeon 进行了对比。如下图所示,根据不同数据集,性能提升幅度从2.38倍至3.24倍不等。本次基准测试采用了英特尔AMX加速功能。

SupermicroGrandTwin®系统在运行ResNet 50 v1.5推理测试时,与采用英特尔®AMX功能的第四代Xeon 相比,相较于第三代Xeon 实现了2.38至3.24倍的加速效果。

从搭载第三代英特尔Xeon (80核)Supermicro 系统迁移至第四代英特尔Xeon 处理器(48核)系统后,数据库和分析应用程序的性能显著提升。 在X12Ultra 与X13Hyper 对比测试中,采用ClickHouse数据库时,X12平台以减少40%核心数量的配置实现了25%的性能提升。

摘要
第四代英特尔Xeon 处理器Supermicro 和4插槽系统上运行应用程序时,展现出显著的性能提升。Supermicro 八插槽系统创下了单系统有史以来最快的性能记录:
- SPECcpu2017_整数运算速率基准测试
- SPECcpu2017_整数运算速率峰值
- SPECcpu2017_浮点运算速率基准测试
- SPECcpu2017_浮点运算速率峰值
Supermicro 八插槽和Supermicro SMP架构,是需要大量核心和内存的大型企业应用的理想选择。
英特尔持续通过代际迭代提升性能与安全性。下文展示了英特尔性能提升的对比数据(由英特尔提供)。Supermicro 线全面搭载最新第四代Xeon 覆盖从边缘计算到数据中心多处理器系统的全场景应用。


