為何轉用搭載第4代Intel Xeon Scalable處理器的Supermicro伺服器
基礎效能比較了不同世代的英特爾Xeon 。
| 第二代(Cascade Lake)(92xx系列除外) | 第三代(Ice Lake) | 第四代(藍寶石急流) | 增加第二至第四 | |
|---|---|---|---|---|
| 最大核心數 | 28 | 40 | 60 | 114% |
| 最大核心數下的最高 GHz | 2.7 | 2.3 | 1.9 | |
| 最大核心*GHz | 28乘以2.7等於75.6 | =60×1.9 = 114 | 51% | |
| 記憶體速度 | 2400 兆赫 | 3200 兆赫 | 4800 兆赫 | 100% |
| 每插槽最大記憶體容量 | 3TB | 8TB(僅限DRAM) | 8TB(僅限DRAM) | 166% |
| 高頻寬記憶體 | X | X | 最高可達 64 GB | 不適用 |
| UPI連結*表現 | 2 × 9.6 GT/s = 19.2 GT/s | 3 × 11.2 GT/s = 33.6 GT/s | 4×16 GT/s = 64 GT/s | 233 % |
基準範圍
儘管可能存在普遍認可的特定基準測試,但現代企業所執行的許多工作負載無法簡單地套用於通用基準報告。基準測試可依循以下層級進行分類,從低階到完整應用程式:
最低值——基於CPU效能的絕對最大表現。此數值代表CPU 的理論性能CPU 通常可透過時脈頻率乘以核心數量再乘以每時脈週期指令數來計算。
數學核心層級——一款高度針對CPU 優化的小型應用程式。其最高效能通常約達理論效能的85%。最常見的數學基準測試是LINPACK,該程式用於求解線性方程組。
小型應用程式——企業級伺服器最常用的系統效能測試工具是SPEC(標準效能評估公司)。三十多年來,SPEC持續提供並彙整各類測試套件。
完整應用程式 – 執行整個應用程式,並記錄完成所需的時間。
搭載第 4 代 Intel Xeon 可擴充處理器的 Supermicro 伺服器在各項 SPEC 測試結果中表現卓越。具體而言,
SPECcpu2017 套件透過以下方式測量系統的效能:
浮點運算:(應用程式高度聚焦於浮點運算)
- 速度 – 套件中的每個應用程式僅執行單一副本。隨後透過將完成時間除以基準機的執行時間來計算「分數」。
- 速率 – 系統載入多個測試套件副本(通常等於執行緒數量),再將結果除以參考機器的執行時間。
整數:(應用程式僅使用整數運算)
- 速度 – 套件中的每個應用程式僅執行單一副本。隨後透過將完成時間除以基準機的執行時間來計算「分數」。
- 速率 – 系統載入大量測試套件副本(通常等於執行緒數量),再將結果除以基準機的表現。
Peak – 每個應用程式的原始碼皆可透過特定標記重新編譯。
基座 – 所有應用程式皆採用相同的編譯器標記進行編譯。
SPEC 結果
Supermicro 8 插槽 SPEC CPU 基準測試:
| 系統 | 英特爾Xeon | 工作量 | 重要性 | 得分 |
|---|---|---|---|---|
| SuperServer | 8490H | SPECcpu2017_整數運算速度基準測試 | 最佳八插座系統 | 13.8 |
| SuperServer | 8490H | SPECcpu2017_整數運算峰值速度 | 最佳八插座系統 | 14.0 |
| SuperServer | 8490H | SPECcpu2017_整數運算速率基準測試 | 最佳八插座系統前三名 | 3510 |
| SuperServer | 8490H | SPECcpu2017_整數運算速率峰值 | 最佳八插座系統前兩名 | 3560 |
| 系統 | 英特爾Xeon | 工作量 | 重要性 | 得分 |
|---|---|---|---|---|
| SuperServer | 8490H | SPECcpu2017_浮點運算速率基準測試 | 最佳八插座系統前兩名 | 3540 |
| SuperServer | 8490H | SPECcpu2017_浮點運算速率峰值 | 最佳八插座系統前兩名 | 3560 |
| SuperServer | 8490H | SPECcpu2017_浮點運算速度基準測試 | 最佳八插座系統 | 343 |
| SuperServer | 8490H | SPECcpu2017_浮點運算速度峰值 | 最佳八插座系統 | 334 |
Supermicro 4 插槽 SPEC CPU 基準測試:
| 系統 | 英特爾Xeon | 工作量 | 重要性 | 得分 |
|---|---|---|---|---|
| SuperServer | 8490H | SPECcpu2017_整數運算速率基準測試 | 最佳四插座系統前四名 | 1930 |
| SuperServer | 8490H | SPECcpu2017_整數運算速率峰值 | 最佳四插座系統前四名 | 1970 |
| SuperServer | 8490H | SPECcpu2017_整數運算速度基準測試 | 最佳四插座系統前三名 | 16 |
| SuperServer | 8490H | SPECcpu2017_整數運算峰值速度 | 最佳四插座系統前三名 | 16.2 |
| 系統 | 英特爾Xeon | 工作量 | 重要性 | 得分 |
|---|---|---|---|---|
| SuperServer | 8490H | SPECcpu2017_浮點運算速率基準測試 | 最佳四插座系統前兩名 | 1900 |
| SuperServer | 8490H | SPECcpu2017_浮點運算速率峰值 | 最佳四插座系統前兩名 | 2010 |
| SuperServer | 8490H | SPECcpu2017_浮點運算速度基準測試 | 最佳四插座系統前兩名 | 387 |
| SuperServer | 8490H | SPECcpu2017_浮點運算速度峰值 | 最佳四插座系統前兩名 | 387 |
SPEC儲存裝置
SPECstorage Solution 2020 基準測試用於衡量完整儲存配置在處理應用程式工作負載時的效能表現。最新版本新增了人工智慧(AI)與基因組學工作負載,擴展了自訂工作負載功能,大幅提升擴展能力,並導入統計視覺化機制以呈現基準測試結果。
(https://www.spec.org/storage2020/press/release.html)
| 系統 | 英特爾Xeon | 工作量 | 重要性 | 得分 |
|---|---|---|---|---|
| SYS-221H-TN24RHyper 伺服器 | 8468V 8450H | SPEC儲存解決方案 2020 | 最佳SpecStorage_2020結果於AI | 0.57 |
| SYS-221H-TN24RHyper 伺服器 | 8468V 8450H | SPEC儲存解決方案 2020 | 在 SWBUILD/Jobs 上獲得最佳 SpecStorage_2020 結果:72 | 0.47 |
| SYS-221H-TN24RHyper 伺服器 | 8468V 8450H | SPEC儲存解決方案 2020 | #1 根據IDC 前五大IDC ,SpecStorage_2020 在基因組學領域居於領導地位。 | 0.19 |
| SYS-221H-TN24RHyper 伺服器 | 8468V 8450H | SPEC儲存解決方案 2020 | #1 SpecStorage_2020 針對 VDA/工作負載的領導地位:IDC 前五大IDC 平均為 720。 | 5.56 |
| 配備 22 個NVMe 節點的 SYS-220U-TNR | 8380 8360Y | SPEC儲存解決方案 2020 | #1 SpecStorage_2020 在 EDA/Jobs 領域的領導地位:IDC 前五大IDC 平均每人 240 份工作。 | 0.28 |
| SuperServer | 8490H | SPEChpc2021_微型 | MPI模型上最佳單節點基底結果 | 8.20 |
| SuperServer | 8490H | SPEChpc2021_微型 | 根據IDC數據,在五大供應商中,該產品在 OPM 模型下的單一節點基礎效能表現位居榜首 | 9.24 |
| SuperServer | 8490H | SPECpower_ssj2008 | 根據IDC的數據,該伺服器在五大供應商中名列第一 | 13546 |
採用英特爾加速引擎的完整應用基準測試
Supermicro 執行了多項基準測試,比較了開啟不同 Intel 加速引擎的第 4 代 Intel Xeon 可擴充處理器。下圖顯示了實際基準測試,並比較了 Intel Xeon 8380 與 Intel Xeon 8490H 在效能和每瓦效能方面的表現。特定基準測試中使用的 Intel 加速引擎也已列出。執行基準測試的伺服器詳細資訊將在本文件末尾說明。

本次測試採用Supermicro X13 CloudDC ResNet 50 v1.5推論 ,並將 IntelXeon 與 IntelXeon CPU比較。如下圖所示,根據資料集的不同,效能提升幅度介於 2.38 倍至 3.24 倍之間。此基準測試採用了 Intel 的 AMX 加速功能。

Supermicro X13 GrandTwin® Intel® AMX 功能,將第三代 IntelXeon 處理器與第四代 IntelXeon 處理器進行了比較。測試結果顯示,在執行 ResNet 50 v1.5推論 ,效能提升幅度介於 2.38 倍至 3.24 倍之間。

在將系統從搭載第三代 IntelXeon 處理器(使用 80 個核心)的Supermicro X12 ,升級至搭載第四代 IntelXeon 處理器(使用 48 個核心)的系統後,資料庫與分析應用程式的效能顯著提升。 相較於X13 Hyper ,採用X12 Ultra ,在核心數減少 40% 的情況下,使用 ClickHouse 資料庫仍可觀察到 25% 的效能提升。

摘要
第 4 代 Intel Xeon 可擴充處理器在 Supermicro 8 插槽和 4 插槽系統上執行應用程式時,展現出顯著的效能提升。Supermicro SYS-681E-TR 八插槽系統在單一系統上展現了有史以來最快的效能,適用於:
- SPECcpu2017_整數運算速率基準測試
- SPECcpu2017_整數運算速率峰值
- SPECcpu2017_浮點運算速率基準測試
- SPECcpu2017_浮點運算速率峰值
Supermicro 8 插槽和 4 插槽伺服器的 SMP 架構非常適合需要大量核心和記憶體的大規模企業應用程式。
Intel 不斷地從每一代產品中提升效能和安全性。以下是 Intel 提供的一項比較,展示了 Intel 如何提升其效能。Supermicro 伺服器在其產品線中,從邊緣運算到資料中心的多處理器系統,均整合了最新的第 4 代 Intel Xeon 可擴充處理器。


