为什么要搬家Supermicro 搭载第四代英特尔处理器的服务器Xeon 可扩展处理器
基本功能对比了不同代英特尔处理器。 Xeon CPU。
| 第二代(卡斯卡德湖)(不包括 92xx 系列) | 第三代(冰湖) | 第四代(蓝宝石急流) | 将第二级提升至第四级 | |
|---|---|---|---|---|
| 最大核心数 | 28 | 40 | 60 | 114% |
| 最大主频(最大核心数) | 2.7 | 2.3 | 1.9 | |
| 最大核心数*GHz | =28*2.7 = 75.6 | =60*1.9 = 114 | 51% | |
| 内存速度 | 2400 MHz | 3200 MHz | 4800 MHz | 100% |
| 每个插槽最大内存 | 3TB | 8TB(仅限DRAM) | 8TB(仅限DRAM) | 166% |
| 高带宽内存 | X | X | 最高可达 64 GB | 不适用 |
| UPI链接*性能 | 2 @ 9.6 GT/s = 19.2 GT/s | 3 @ 11.2 GT/s = 33.6 GT/s | 4@16 GT/s = 64 GT/s | 233 % |
基准范围
尽管存在一些普遍接受的特定基准测试,但现代企业运行的许多工作负载无法简单地套用通用的基准测试报告。基准测试可以按照以下层级结构进行分类,从底层到完整应用程序。
最低性能——基于CPU性能的绝对最大性能。该数值为单个CPU的理论性能,通常可通过时钟频率乘以核心数再乘以每时钟周期指令数计算得出。
数学内核级测试——一种针对 CPU 架构高度优化的小型应用程序。其最大性能通常约为理论性能的 85%。最常用的数学基准测试是 LINPACK,它可以求解线性方程组。
小型应用——对于企业级服务器而言,最常用的系统性能测试工具是 SPEC(标准性能评估公司)。SPEC 提供和收集各种测试套件已有 30 多年历史。
完整应用程序 – 运行整个应用程序,并记录完成时间。
Supermicro 搭载第四代英特尔处理器的服务器Xeon 可扩展处理器在各项 SPEC 测试中均表现出色。具体而言,
SPECcpu2017 测试套件通过以下方式衡量系统性能:
浮点运算:(应用程序高度依赖浮点运算)
- 速度——运行套件中每个应用程序的一个副本。然后,通过将完成时间除以参考机器的完成时间来计算“得分”。
- 速率 – 系统加载多个测试套件副本(通常等于线程数),然后将结果除以参考机器的时间。
整数:(应用程序仅使用整数运算)
- 速度——运行套件中每个应用程序的一个副本。然后,通过将完成时间除以参考机器的完成时间来计算“得分”。
- 速率 – 系统加载多个测试套件副本(通常等于线程数),然后将结果除以参考机器。
Peak – 每个应用程序源代码都可以使用特定的标志重新编译。
基本设置 – 所有应用程序的编译都使用相同的编译器标志。
SPEC 结果
Supermicro 8路SPEC CPU基准测试:
| 系统 | 英特尔Xeon | 工作量 | 意义 | 分数 |
|---|---|---|---|---|
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_speed_base | 最佳8插座系统 | 13.8 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_speed_peak | 最佳8插座系统 | 14.0 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_rate_base | 最佳8孔插座系统前3名 | 3510 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_rate_peak | 最佳2款8孔插座系统 | 3560 |
| 系统 | 英特尔Xeon | 工作量 | 意义 | 分数 |
|---|---|---|---|---|
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_rate_base | 最佳2款8孔插座系统 | 3540 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_rate_peak | 最佳2款8孔插座系统 | 3560 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_speed_base | 最佳8插座系统 | 343 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_speed_peak | 最佳8插座系统 | 334 |
Supermicro 四路 SPEC CPU 基准测试:
| 系统 | 英特尔Xeon | 工作量 | 意义 | 分数 |
|---|---|---|---|---|
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_rate_base | 最佳四孔插座系统前四名 | 1930 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_rate_peak | 最佳四孔插座系统前四名 | 1970 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_speed_base | 最佳四孔插座系统前三名 | 16 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_speed_peak | 最佳四孔插座系统前三名 | 16.2 |
| 系统 | 英特尔Xeon | 工作量 | 意义 | 分数 |
|---|---|---|---|---|
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_rate_base | 排名前二的最佳四孔插座系统 | 1900 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_rate_peak | 排名前二的最佳四孔插座系统 | 2010 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_speed_base | 排名前二的最佳四孔插座系统 | 387 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_speed_peak | 排名前二的最佳四孔插座系统 | 387 |
规格存储
SPECstorage Solution 2020 基准测试衡量整个存储配置在与基于应用程序的工作负载交互时的性能。最新版本新增了人工智能 (AI) 和基因组学工作负载,扩展了自定义工作负载功能,大幅提升了扩展性,并新增了用于显示基准测试结果的统计可视化机制。
( https://www.spec.org/storage2020/press/release.html)
| 系统 | 英特尔Xeon | 工作量 | 意义 | 分数 |
|---|---|---|---|---|
| SYS-221H-TN24R Hyper 存储服务器 | 8468V 8450H | SPEC存储解决方案2020 | 最佳 SpecStorage_2020 AI 图像结果 | 0.57 |
| SYS-221H-TN24R Hyper 存储服务器 | 8468V 8450H | SPEC存储解决方案2020 | SWBUILD/Jobs 上 SpecStorage_2020 的最佳结果:72 | 0.47 |
| SYS-221H-TN24R Hyper 存储服务器 | 8468V 8450H | SPEC存储解决方案2020 | #1 SpecStorage_2020 在基因组学领域排名前五IDC 供应商。 | 0.19 |
| SYS-221H-TN24R Hyper 存储服务器 | 8468V 8450H | SPEC存储解决方案2020 | #1 SpecStorage_2020 在 VDA/Jobs 领域的领先地位:前 5 名平均获得 720 个职位IDC 供应商。 | 5.56 |
| SYS-220U-TNR 带 22 NVMe 存储节点 | 8380 8360Y | SPEC存储解决方案2020 | #1 SpecStorage_2020 在 EDA/Jobs 领域的领先地位:前 5 名平均每人 240 个IDC 供应商。 | 0.28 |
| SuperServer SYS-741GE-TNRT | 8490H | SPEChpc2021_Tiny | 基于 MPI 模型的最佳单节点结果 | 8.20 |
| SuperServer SYS-741GE-TNRT | 8490H | SPEChpc2021_Tiny | 在排名前五的供应商中,OPM 模型单节点基础结果领先者排名第一IDC | 9.24 |
| SuperServer SYS-741GE-TNRT | 8490H | SPECpower_ssj2008 | 在排名前五的供应商中,4U 服务器的领导力排名第一IDC | 13546 |
使用英特尔加速引擎的完整应用程序基准测试
Supermicro 已经运行了多个基准测试,对第四代英特尔处理器进行了比较。 Xeon 启用不同英特尔加速引擎的可扩展处理器。下图显示了实际基准测试结果,并对英特尔处理器进行了比较。 Xeon 8380 到英特尔Xeon 8490H 在性能和每瓦性能方面均名列前茅。用于该基准测试的英特尔加速引擎也已列出。运行基准测试的服务器的具体信息将在本文档末尾描述。

Supermicro的X13 CloudDC 服务器用于测试 ResNet 50 v1.5 推理基准测试和英特尔Xeon 8480+ 与英特尔进行了比较Xeon 8380 CPU。如下表所示,性能提升幅度在 2.38 倍到 3.24 倍之间,具体数值取决于数据集。此基准测试使用了英特尔 AMX 加速功能。

Supermicro的X13 GrandTwin® 该系统与第三代英特尔处理器进行了比较。 Xeon 采用第四代英特尔® 英特尔® 处理器的金牌处理器Xeon 采用英特尔® AMX 特性的 Gold 处理器。结果表明,在运行 ResNet 50 v1.5 推理测试时,速度提升了 2.38 到 3.24 倍。

从Supermicro X12 搭载第三代英特尔处理器的下一代系统Xeon 可扩展处理器(使用 80 个核心)至第四代英特尔处理器Xeon 可扩展处理器(使用 48 个核心)。使用X12 Ultra 平台与……相比X13 Hyper 在该平台上,使用 ClickHouse 数据库,同时减少 40% 的核心数,性能提高了 25%。

概括
第四代英特尔Xeon 可扩展处理器在运行应用程序时表现出显著的性能提升Supermicro 8孔和4孔系统。 Supermicro SYS-681E-TR 八插槽系统展现了有史以来单系统最快的性能:
- SPECcpu2017_int_rate_base
- SPECcpu2017_int_rate_peak
- SPECcpu2017_fp_rate_base
- SPECcpu2017_fp_rate_peak
八插槽和四插槽的SMP架构Supermicro 服务器非常适合需要大量内核和内存的大型企业应用程序。
英特尔持续提升产品性能和安全性,每一代产品都如此。以下是英特尔提供的对比数据,展示了英特尔如何不断改进其产品性能。 Supermicro 服务器采用最新的第四代英特尔处理器Xeon 从边缘计算到数据中心的多处理器系统,全线产品均采用可扩展处理器。


