為何轉用搭載第4代Intel Xeon Scalable處理器的Supermicro伺服器
基礎效能比較了不同世代的英特爾Xeon 。
| 第二代(Cascade Lake)(92xx系列除外) | 第三代(Ice Lake) | 第四代(藍寶石急流) | 增加第二至第四 | |
|---|---|---|---|---|
| 最大核心數 | 28 | 40 | 60 | 114% |
| 最大核心數下的最高 GHz | 2.7 | 2.3 | 1.9 | |
| 最大核心*GHz | 28乘以2.7等於75.6 | =60×1.9 = 114 | 51% | |
| 記憶體速度 | 2400 兆赫 | 3200 兆赫 | 4800 兆赫 | 100% |
| 每插槽最大記憶體容量 | 3TB | 8TB(僅限DRAM) | 8TB(僅限DRAM) | 166% |
| 高頻寬記憶體 | X | X | 最高可達 64 GB | 不適用 |
| UPI連結*表現 | 2 × 9.6 GT/s = 19.2 GT/s | 3 × 11.2 GT/s = 33.6 GT/s | 4×16 GT/s = 64 GT/s | 233 % |
基準範圍
儘管可能存在普遍認可的特定基準測試,但現代企業所執行的許多工作負載無法簡單地套用於通用基準報告。基準測試可依循以下層級進行分類,從低階到完整應用程式:
最低值——基於CPU效能的絕對最大表現。此數值代表CPU 的理論性能CPU 通常可透過時脈頻率乘以核心數量再乘以每時脈週期指令數來計算。
數學核心層級——一款高度針對CPU 優化的小型應用程式。其最高效能通常約達理論效能的85%。最常見的數學基準測試是LINPACK,該程式用於求解線性方程組。
小型應用程式——企業級伺服器最常用的系統效能測試工具是SPEC(標準效能評估公司)。三十多年來,SPEC持續提供並彙整各類測試套件。
完整應用程式 – 執行整個應用程式,並記錄完成所需的時間。
搭載第 4 代 Intel Xeon 可擴充處理器的 Supermicro 伺服器在各項 SPEC 測試結果中表現卓越。具體而言,
SPECcpu2017 套件透過以下方式測量系統的效能:
浮點運算:(應用程式高度聚焦於浮點運算)
- 速度 – 套件中的每個應用程式僅執行單一副本。隨後透過將完成時間除以基準機的執行時間來計算「分數」。
- 速率 – 系統載入多個測試套件副本(通常等於執行緒數量),再將結果除以參考機器的執行時間。
整數:(應用程式僅使用整數運算)
- 速度 – 套件中的每個應用程式僅執行單一副本。隨後透過將完成時間除以基準機的執行時間來計算「分數」。
- 速率 – 系統載入大量測試套件副本(通常等於執行緒數量),再將結果除以基準機的表現。
Peak – 每個應用程式的原始碼皆可透過特定標記重新編譯。
基座 – 所有應用程式皆採用相同的編譯器標記進行編譯。
SPEC 結果
Supermicro 8 插槽 SPEC CPU 基準測試:
| 系統 | 英特爾Xeon | 工作量 | 重要性 | 得分 |
|---|---|---|---|---|
| SuperServer | 8490H | SPECcpu2017_整數運算速度基準測試 | 最佳八插座系統 | 13.8 |
| SuperServer | 8490H | SPECcpu2017_整數運算峰值速度 | 最佳八插座系統 | 14.0 |
| SuperServer | 8490H | SPECcpu2017_整數運算速率基準測試 | 最佳八插座系統前三名 | 3510 |
| SuperServer | 8490H | SPECcpu2017_整數運算速率峰值 | 最佳八插座系統前兩名 | 3560 |
| 系統 | 英特爾Xeon | 工作量 | 重要性 | 得分 |
|---|---|---|---|---|
| SuperServer | 8490H | SPECcpu2017_浮點運算速率基準測試 | 最佳八插座系統前兩名 | 3540 |
| SuperServer | 8490H | SPECcpu2017_浮點運算速率峰值 | 最佳八插座系統前兩名 | 3560 |
| SuperServer | 8490H | SPECcpu2017_浮點運算速度基準測試 | 最佳八插座系統 | 343 |
| SuperServer | 8490H | SPECcpu2017_浮點運算速度峰值 | 最佳八插座系統 | 334 |
Supermicro 4 插槽 SPEC CPU 基準測試:
| 系統 | 英特爾Xeon | 工作量 | 重要性 | 得分 |
|---|---|---|---|---|
| SuperServer | 8490H | SPECcpu2017_整數運算速率基準測試 | 最佳四插座系統前四名 | 1930 |
| SuperServer | 8490H | SPECcpu2017_整數運算速率峰值 | 最佳四插座系統前四名 | 1970 |
| SuperServer | 8490H | SPECcpu2017_整數運算速度基準測試 | 最佳四插座系統前三名 | 16 |
| SuperServer | 8490H | SPECcpu2017_整數運算峰值速度 | 最佳四插座系統前三名 | 16.2 |
| 系統 | 英特爾Xeon | 工作量 | 重要性 | 得分 |
|---|---|---|---|---|
| SuperServer | 8490H | SPECcpu2017_浮點運算速率基準測試 | 最佳四插座系統前兩名 | 1900 |
| SuperServer | 8490H | SPECcpu2017_浮點運算速率峰值 | 最佳四插座系統前兩名 | 2010 |
| SuperServer | 8490H | SPECcpu2017_浮點運算速度基準測試 | 最佳四插座系統前兩名 | 387 |
| SuperServer | 8490H | SPECcpu2017_浮點運算速度峰值 | 最佳四插座系統前兩名 | 387 |
SPEC儲存裝置
SPECstorage Solution 2020 基準測試用於衡量完整儲存配置在處理應用程式工作負載時的效能表現。最新版本新增了人工智慧(AI)與基因組學工作負載,擴展了自訂工作負載功能,大幅提升擴展能力,並導入統計視覺化機制以呈現基準測試結果。
(https://www.spec.org/storage2020/press/release.html)
| 系統 | 英特爾Xeon | 工作量 | 重要性 | 得分 |
|---|---|---|---|---|
| SYS-221H-TN24RHyper 伺服器 | 8468V 8450H | SPEC儲存解決方案 2020 | 最佳SpecStorage_2020結果於AI | 0.57 |
| SYS-221H-TN24RHyper 伺服器 | 8468V 8450H | SPEC儲存解決方案 2020 | 在 SWBUILD/Jobs 上獲得最佳 SpecStorage_2020 結果:72 | 0.47 |
| SYS-221H-TN24RHyper 伺服器 | 8468V 8450H | SPEC儲存解決方案 2020 | #1 SpecStorage_2020 基因組學領導地位(根據前五大IDC供應商評選) | 0.19 |
| SYS-221H-TN24RHyper 伺服器 | 8468V 8450H | SPEC儲存解決方案 2020 | #1 SpecStorage_2020 領導地位:在虛擬桌面基礎架構/工作負載領域,前五大IDC供應商共計720項。 | 5.56 |
| SYS-220U-TNR 配備 22 個 NVMe 儲存節點 | 8380 8360Y | SPEC儲存解決方案 2020 | #1 SpecStorage_2020 領導地位:在電子設計自動化(EDA)/職缺領域,前五大IDC供應商共創造240個職缺。 | 0.28 |
| SuperServer | 8490H | SPEChpc2021_微型 | MPI模型上最佳單節點基底結果 | 8.20 |
| SuperServer | 8490H | SPEChpc2021_微型 | IDC報告顯示,在前五大供應商中,本產品於OPM模型中以單一節點基礎結果表現位居領導地位 | 9.24 |
| SuperServer | 8490H | SPECpower_ssj2008 | IDC評選中位列前五大供應商的#1領導者4U伺服器 | 13546 |
採用英特爾加速引擎的完整應用基準測試
Supermicro 執行了多項基準測試,比較了開啟不同 Intel 加速引擎的第 4 代 Intel Xeon 可擴充處理器。下圖顯示了實際基準測試,並比較了 Intel Xeon 8380 與 Intel Xeon 8490H 在效能和每瓦效能方面的表現。特定基準測試中使用的 Intel 加速引擎也已列出。執行基準測試的伺服器詳細資訊將在本文件末尾說明。

Supermicro 的 X13 CloudDC 伺服器用於測試 ResNet 50 v1.5 推論基準測試,並將 Intel Xeon 8480+ 與 Intel Xeon 8380 CPU 進行比較。在下圖中,效能提升範圍為 2.38 倍至 3.24 倍,具體取決於資料集。此基準測試使用了 Intel 的 AMX 加速功能。

Supermicro 的 X13 GrandTwin® 系統,搭載使用 Intel® AMX 功能的第 4 代 Intel Xeon Gold 處理器,與第 3 代 Intel Xeon Gold 處理器進行了比較。結果顯示,在執行 ResNet 50 v1.5 推論測試時,效能提升了 2.38 到 3.24 倍。

當從搭載第 3 代 Intel Xeon 可擴充處理器 (使用 80 個核心) 的 Supermicro X12 世代系統,轉移到搭載第 4 代 Intel Xeon 可擴充處理器 (使用 48 個核心) 時,資料庫和分析應用程式的效能有顯著提升。將 X12 Ultra 平台與 X13 Hyper 平台進行比較,使用 ClickHouse 資料庫時,在核心數量減少 40% 的情況下,效能仍提升了 25%。

摘要
第 4 代 Intel Xeon 可擴充處理器在 Supermicro 8 插槽和 4 插槽系統上執行應用程式時,展現出顯著的效能提升。Supermicro SYS-681E-TR 八插槽系統在單一系統上展現了有史以來最快的效能,適用於:
- SPECcpu2017_整數運算速率基準測試
- SPECcpu2017_整數運算速率峰值
- SPECcpu2017_浮點運算速率基準測試
- SPECcpu2017_浮點運算速率峰值
Supermicro 8 插槽和 4 插槽伺服器的 SMP 架構非常適合需要大量核心和記憶體的大規模企業應用程式。
Intel 不斷地從每一代產品中提升效能和安全性。以下是 Intel 提供的一項比較,展示了 Intel 如何提升其效能。Supermicro 伺服器在其產品線中,從邊緣運算到資料中心的多處理器系統,均整合了最新的第 4 代 Intel Xeon 可擴充處理器。


