跳至主要內容

為何轉用搭載第4代Intel Xeon Scalable處理器的Supermicro伺服器

Supermicro的最新伺服器搭載第4代Intel Xeon Scalable處理器。這些新型CPU相較於前兩代Intel CPU,在效能上提供了顯著提升。可執行多項基準測試,讓我們來看看其中幾項。

基礎效能比較了不同世代的英特爾Xeon 。

 第二代(Cascade Lake)(92xx系列除外)第三代(Ice Lake)第四代(藍寶石急流)增加第二至第四
最大核心數284060114%
最大核心數下的最高 GHz2.72.31.9 
最大核心*GHz28乘以2.7等於75.6 =60×1.9 = 11451%
記憶體速度2400 兆赫3200 兆赫4800 兆赫100%
每插槽最大記憶體容量3TB8TB(僅限DRAM)8TB(僅限DRAM)166%
高頻寬記憶體XX最高可達 64 GB不適用
UPI連結*表現2 × 9.6 GT/s = 19.2 GT/s3 × 11.2 GT/s = 33.6 GT/s4×16 GT/s = 64 GT/s233 %

基準範圍

儘管可能存在普遍認可的特定基準測試,但現代企業所執行的許多工作負載無法簡單地套用於通用基準報告。基準測試可依循以下層級進行分類,從低階到完整應用程式:

最低值——基於CPU效能的絕對最大表現。此數值代表CPU 的理論性能CPU 通常可透過時脈頻率乘以核心數量再乘以每時脈週期指令數來計算。

數學核心層級——一款高度針對CPU 優化的小型應用程式。其最高效能通常約達理論效能的85%。最常見的數學基準測試是LINPACK,該程式用於求解線性方程組。

小型應用程式——企業級伺服器最常用的系統效能測試工具是SPEC(標準效能評估公司)。三十多年來,SPEC持續提供並彙整各類測試套件。

完整應用程式 – 執行整個應用程式,並記錄完成所需的時間。
 

搭載第 4 代 Intel Xeon 可擴充處理器的 Supermicro 伺服器在各項 SPEC 測試結果中表現卓越。具體而言,

SPECcpu2017 套件透過以下方式測量系統的效能:

浮點運算:(應用程式高度聚焦於浮點運算)

  1. 速度 – 套件中的每個應用程式僅執行單一副本。隨後透過將完成時間除以基準機的執行時間來計算「分數」。
  2. 速率 – 系統載入多個測試套件副本(通常等於執行緒數量),再將結果除以參考機器的執行時間。

整數:(應用程式僅使用整數運算)

  1. 速度 – 套件中的每個應用程式僅執行單一副本。隨後透過將完成時間除以基準機的執行時間來計算「分數」。
  2. 速率 – 系統載入大量測試套件副本(通常等於執行緒數量),再將結果除以基準機的表現。

Peak – 每個應用程式的原始碼皆可透過特定標記重新編譯。

基座 – 所有應用程式皆採用相同的編譯器標記進行編譯。

SPEC 結果

Supermicro 8 插槽 SPEC CPU 基準測試:

SPECcpu2017 整數
系統英特爾Xeon工作量重要性得分
SuperServer8490HSPECcpu2017_整數運算速度基準測試最佳八插座系統13.8
SuperServer8490HSPECcpu2017_整數運算峰值速度最佳八插座系統14.0
SuperServer8490HSPECcpu2017_整數運算速率基準測試最佳八插座系統前三名3510
SuperServer8490HSPECcpu2017_整數運算速率峰值最佳八插座系統前兩名3560
SPECcpu2017 浮點運算
系統英特爾Xeon工作量重要性得分
SuperServer8490HSPECcpu2017_浮點運算速率基準測試最佳八插座系統前兩名3540
SuperServer8490HSPECcpu2017_浮點運算速率峰值最佳八插座系統前兩名3560
SuperServer8490HSPECcpu2017_浮點運算速度基準測試最佳八插座系統343
SuperServer8490HSPECcpu2017_浮點運算速度峰值最佳八插座系統334

Supermicro 4 插槽 SPEC CPU 基準測試:

SPECcpu2017 整數
系統英特爾Xeon工作量重要性得分
SuperServer8490HSPECcpu2017_整數運算速率基準測試最佳四插座系統前四名1930
SuperServer8490HSPECcpu2017_整數運算速率峰值最佳四插座系統前四名1970
SuperServer8490HSPECcpu2017_整數運算速度基準測試最佳四插座系統前三名16
SuperServer8490HSPECcpu2017_整數運算峰值速度最佳四插座系統前三名16.2
SPECcpu2017 浮點運算
系統英特爾Xeon工作量重要性得分
SuperServer8490HSPECcpu2017_浮點運算速率基準測試最佳四插座系統前兩名1900
SuperServer8490HSPECcpu2017_浮點運算速率峰值最佳四插座系統前兩名2010
SuperServer8490HSPECcpu2017_浮點運算速度基準測試最佳四插座系統前兩名387
SuperServer8490HSPECcpu2017_浮點運算速度峰值最佳四插座系統前兩名387

SPEC儲存裝置

SPECstorage Solution 2020 基準測試用於衡量完整儲存配置在處理應用程式工作負載時的效能表現。最新版本新增了人工智慧(AI)與基因組學工作負載,擴展了自訂工作負載功能,大幅提升擴展能力,並導入統計視覺化機制以呈現基準測試結果。
(https://www.spec.org/storage2020/press/release.html)

系統英特爾Xeon工作量重要性得分
SYS-221H-TN24RHyper 伺服器8468V
8450H
SPEC儲存解決方案 2020最佳SpecStorage_2020結果於AI0.57
SYS-221H-TN24RHyper 伺服器8468V
8450H
SPEC儲存解決方案 2020在 SWBUILD/Jobs 上獲得最佳 SpecStorage_2020 結果:720.47
SYS-221H-TN24RHyper 伺服器8468V
8450H
SPEC儲存解決方案 2020#1 根據IDC 前五大IDC ,SpecStorage_2020 在基因組學領域居於領導地位。0.19
SYS-221H-TN24RHyper 伺服器8468V
8450H
SPEC儲存解決方案 2020#1 SpecStorage_2020 針對 VDA/工作負載的領導地位:IDC 前五大IDC 平均為 720。5.56
配備 22 個NVMe 節點的 SYS-220U-TNR8380
8360Y
SPEC儲存解決方案 2020#1 SpecStorage_2020 在 EDA/Jobs 領域的領導地位:IDC 前五大IDC 平均每人 240 份工作。0.28
SuperServer8490HSPEChpc2021_微型MPI模型上最佳單節點基底結果8.20
SuperServer8490HSPEChpc2021_微型根據IDC數據,在五大供應商中,該產品在 OPM 模型下的單一節點基礎效能表現位居榜首9.24
SuperServer8490HSPECpower_ssj2008根據IDC的數據,該伺服器在五大供應商中名列第一13546

採用英特爾加速引擎的完整應用基準測試

Supermicro 執行了多項基準測試,比較了開啟不同 Intel 加速引擎的第 4 代 Intel Xeon 可擴充處理器。下圖顯示了實際基準測試,並比較了 Intel Xeon 8380 與 Intel Xeon 8490H 在效能和每瓦效能方面的表現。特定基準測試中使用的 Intel 加速引擎也已列出。執行基準測試的伺服器詳細資訊將在本文件末尾說明。

顯著的效能提升與每瓦效能提升 – Intel® 加速引擎的優勢

本次測試採用Supermicro X13 CloudDC ResNet 50 v1.5推論 ,並將 IntelXeon 與 IntelXeon CPU比較。如下圖所示,根據資料集的不同,效能提升幅度介於 2.38 倍至 3.24 倍之間。此基準測試採用了 Intel 的 AMX 加速功能。

Supermicro在AI 效能提升AI  推論  CloudDC SuperServer  推論 ResNet 50 v1.5推論 SuperServer 採用 Intel® 進階矩陣擴展技術 (Intel® AMX)。效能最高可提升 3.24 倍。

Supermicro X13 GrandTwin® Intel® AMX 功能,將第三代 IntelXeon 處理器與第四代 IntelXeon 處理器進行了比較。測試結果顯示,在執行 ResNet 50 v1.5推論 ,效能提升幅度介於 2.38 倍至 3.24 倍之間。

Supermicro在AI 效能提升AI GrandTwinSuperServer  推論 ResNet 50 v1.5推論  SuperServer Intel® 進階矩陣擴展 (Intel® AMX)。效能最高提升 2.85 倍。

在將系統從搭載第三代 IntelXeon 處理器(使用 80 個核心)的Supermicro X12 ,升級至搭載第四代 IntelXeon 處理器(使用 48 個核心)的系統後,資料庫與分析應用程式的效能顯著提升。 相較於X13 Hyper ,採用X12 Ultra ,在核心數減少 40% 的情況下,使用 ClickHouse 資料庫仍可觀察到 25% 的效能提升。

Supermicro 在分析領域的效能提升 – ClickHouse 世代間的改進。核心數量減少 40%,效能提升 25%。

摘要

第 4 代 Intel Xeon 可擴充處理器在 Supermicro 8 插槽和 4 插槽系統上執行應用程式時,展現出顯著的效能提升。Supermicro SYS-681E-TR 八插槽系統在單一系統上展現了有史以來最快的效能,適用於:

  • SPECcpu2017_整數運算速率基準測試
  • SPECcpu2017_整數運算速率峰值
  • SPECcpu2017_浮點運算速率基準測試
  • SPECcpu2017_浮點運算速率峰值

Supermicro 8 插槽和 4 插槽伺服器的 SMP 架構非常適合需要大量核心和記憶體的大規模企業應用程式。

Intel 不斷地從每一代產品中提升效能和安全性。以下是 Intel 提供的一項比較,展示了 Intel 如何提升其效能。Supermicro 伺服器在其產品線中,從邊緣運算到資料中心的多處理器系統,均整合了最新的第 4 代 Intel Xeon 可擴充處理器。

依處理器世代劃分的英特爾加速引擎(比較圖表)
資源與配置