跳至主要內容

為何轉用搭載第4代Intel Xeon Scalable處理器的Supermicro伺服器

Supermicro的最新伺服器搭載第4代Intel Xeon Scalable處理器。這些新型CPU相較於前兩代Intel CPU,在效能上提供了顯著提升。可執行多項基準測試,讓我們來看看其中幾項。

基礎效能比較了不同世代的英特爾Xeon 。

 第二代(Cascade Lake)(92xx系列除外)第三代(Ice Lake)第四代(藍寶石急流)增加第二至第四
最大核心數284060114%
最大核心數下的最高 GHz2.72.31.9 
最大核心*GHz28乘以2.7等於75.6 =60×1.9 = 11451%
記憶體速度2400 兆赫3200 兆赫4800 兆赫100%
每插槽最大記憶體容量3TB8TB(僅限DRAM)8TB(僅限DRAM)166%
高頻寬記憶體XX最高可達 64 GB不適用
UPI連結*表現2 × 9.6 GT/s = 19.2 GT/s3 × 11.2 GT/s = 33.6 GT/s4×16 GT/s = 64 GT/s233 %

基準範圍

儘管可能存在普遍認可的特定基準測試,但現代企業所執行的許多工作負載無法簡單地套用於通用基準報告。基準測試可依循以下層級進行分類,從低階到完整應用程式:

最低值——基於CPU效能的絕對最大表現。此數值代表CPU 的理論性能CPU 通常可透過時脈頻率乘以核心數量再乘以每時脈週期指令數來計算。

數學核心層級——一款高度針對CPU 優化的小型應用程式。其最高效能通常約達理論效能的85%。最常見的數學基準測試是LINPACK,該程式用於求解線性方程組。

小型應用程式——企業級伺服器最常用的系統效能測試工具是SPEC(標準效能評估公司)。三十多年來,SPEC持續提供並彙整各類測試套件。

完整應用程式 – 執行整個應用程式,並記錄完成所需的時間。
 

搭載第 4 代 Intel Xeon 可擴充處理器的 Supermicro 伺服器在各項 SPEC 測試結果中表現卓越。具體而言,

SPECcpu2017 套件透過以下方式測量系統的效能:

浮點運算:(應用程式高度聚焦於浮點運算)

  1. 速度 – 套件中的每個應用程式僅執行單一副本。隨後透過將完成時間除以基準機的執行時間來計算「分數」。
  2. 速率 – 系統載入多個測試套件副本(通常等於執行緒數量),再將結果除以參考機器的執行時間。

整數:(應用程式僅使用整數運算)

  1. 速度 – 套件中的每個應用程式僅執行單一副本。隨後透過將完成時間除以基準機的執行時間來計算「分數」。
  2. 速率 – 系統載入大量測試套件副本(通常等於執行緒數量),再將結果除以基準機的表現。

Peak – 每個應用程式的原始碼皆可透過特定標記重新編譯。

基座 – 所有應用程式皆採用相同的編譯器標記進行編譯。

SPEC 結果

Supermicro 8 插槽 SPEC CPU 基準測試:

SPECcpu2017 整數
系統英特爾Xeon工作量重要性得分
SuperServer8490HSPECcpu2017_整數運算速度基準測試最佳八插座系統13.8
SuperServer8490HSPECcpu2017_整數運算峰值速度最佳八插座系統14.0
SuperServer8490HSPECcpu2017_整數運算速率基準測試最佳八插座系統前三名3510
SuperServer8490HSPECcpu2017_整數運算速率峰值最佳八插座系統前兩名3560
SPECcpu2017 浮點運算
系統英特爾Xeon工作量重要性得分
SuperServer8490HSPECcpu2017_浮點運算速率基準測試最佳八插座系統前兩名3540
SuperServer8490HSPECcpu2017_浮點運算速率峰值最佳八插座系統前兩名3560
SuperServer8490HSPECcpu2017_浮點運算速度基準測試最佳八插座系統343
SuperServer8490HSPECcpu2017_浮點運算速度峰值最佳八插座系統334

Supermicro 4 插槽 SPEC CPU 基準測試:

SPECcpu2017 整數
系統英特爾Xeon工作量重要性得分
SuperServer8490HSPECcpu2017_整數運算速率基準測試最佳四插座系統前四名1930
SuperServer8490HSPECcpu2017_整數運算速率峰值最佳四插座系統前四名1970
SuperServer8490HSPECcpu2017_整數運算速度基準測試最佳四插座系統前三名16
SuperServer8490HSPECcpu2017_整數運算峰值速度最佳四插座系統前三名16.2
SPECcpu2017 浮點運算
系統英特爾Xeon工作量重要性得分
SuperServer8490HSPECcpu2017_浮點運算速率基準測試最佳四插座系統前兩名1900
SuperServer8490HSPECcpu2017_浮點運算速率峰值最佳四插座系統前兩名2010
SuperServer8490HSPECcpu2017_浮點運算速度基準測試最佳四插座系統前兩名387
SuperServer8490HSPECcpu2017_浮點運算速度峰值最佳四插座系統前兩名387

SPEC儲存裝置

SPECstorage Solution 2020 基準測試用於衡量完整儲存配置在處理應用程式工作負載時的效能表現。最新版本新增了人工智慧(AI)與基因組學工作負載,擴展了自訂工作負載功能,大幅提升擴展能力,並導入統計視覺化機制以呈現基準測試結果。
(https://www.spec.org/storage2020/press/release.html)

系統英特爾Xeon工作量重要性得分
SYS-221H-TN24RHyper 伺服器8468V
8450H
SPEC儲存解決方案 2020最佳SpecStorage_2020結果於AI0.57
SYS-221H-TN24RHyper 伺服器8468V
8450H
SPEC儲存解決方案 2020在 SWBUILD/Jobs 上獲得最佳 SpecStorage_2020 結果:720.47
SYS-221H-TN24RHyper 伺服器8468V
8450H
SPEC儲存解決方案 2020#1 SpecStorage_2020 基因組學領導地位(根據前五大IDC供應商評選)0.19
SYS-221H-TN24RHyper 伺服器8468V
8450H
SPEC儲存解決方案 2020#1 SpecStorage_2020 領導地位:在虛擬桌面基礎架構/工作負載領域,前五大IDC供應商共計720項。5.56
SYS-220U-TNR 配備 22 個 NVMe 儲存節點8380
8360Y
SPEC儲存解決方案 2020#1 SpecStorage_2020 領導地位:在電子設計自動化(EDA)/職缺領域,前五大IDC供應商共創造240個職缺。0.28
SuperServer8490HSPEChpc2021_微型MPI模型上最佳單節點基底結果8.20
SuperServer8490HSPEChpc2021_微型IDC報告顯示,在前五大供應商中,本產品於OPM模型中以單一節點基礎結果表現位居領導地位9.24
SuperServer8490HSPECpower_ssj2008IDC評選中位列前五大供應商的#1領導者4U伺服器13546

採用英特爾加速引擎的完整應用基準測試

Supermicro 執行了多項基準測試,比較了開啟不同 Intel 加速引擎的第 4 代 Intel Xeon 可擴充處理器。下圖顯示了實際基準測試,並比較了 Intel Xeon 8380 與 Intel Xeon 8490H 在效能和每瓦效能方面的表現。特定基準測試中使用的 Intel 加速引擎也已列出。執行基準測試的伺服器詳細資訊將在本文件末尾說明。

顯著的效能與每瓦效能提升——英特爾®加速引擎的優勢

Supermicro 的 X13 CloudDC 伺服器用於測試 ResNet 50 v1.5 推論基準測試,並將 Intel Xeon 8480+ 與 Intel Xeon 8380 CPU 進行比較。在下圖中,效能提升範圍為 2.38 倍至 3.24 倍,具體取決於資料集。此基準測試使用了 Intel 的 AMX 加速功能。

Supermicro 在 AI 領域的效能提升 – 在 CloudDC SuperServer 上進行 ResNet 50 v1.5 推論 – Intel® Advanced Matrix Extensions (Intel® AMX)。效能提升高達 3.24 倍。

Supermicro 的 X13 GrandTwin® 系統,搭載使用 Intel® AMX 功能的第 4 代 Intel Xeon Gold 處理器,與第 3 代 Intel Xeon Gold 處理器進行了比較。結果顯示,在執行 ResNet 50 v1.5 推論測試時,效能提升了 2.38 到 3.24 倍。

Supermicro 在 AI 領域的效能提升 – 在 GrandTwin SuperServer 上進行 ResNet 50 v1.5 推論 – Intel® Advanced Matrix Extensions (Intel® AMX)。效能提升高達 2.85 倍。

當從搭載第 3 代 Intel Xeon 可擴充處理器 (使用 80 個核心) 的 Supermicro X12 世代系統,轉移到搭載第 4 代 Intel Xeon 可擴充處理器 (使用 48 個核心) 時,資料庫和分析應用程式的效能有顯著提升。將 X12 Ultra 平台與 X13 Hyper 平台進行比較,使用 ClickHouse 資料庫時,在核心數量減少 40% 的情況下,效能仍提升了 25%。

Supermicro 在分析領域的效能提升 – ClickHouse 世代間的改進。核心數量減少 40%,效能提升 25%。

摘要

第 4 代 Intel Xeon 可擴充處理器在 Supermicro 8 插槽和 4 插槽系統上執行應用程式時,展現出顯著的效能提升。Supermicro SYS-681E-TR 八插槽系統在單一系統上展現了有史以來最快的效能,適用於:

  • SPECcpu2017_整數運算速率基準測試
  • SPECcpu2017_整數運算速率峰值
  • SPECcpu2017_浮點運算速率基準測試
  • SPECcpu2017_浮點運算速率峰值

Supermicro 8 插槽和 4 插槽伺服器的 SMP 架構非常適合需要大量核心和記憶體的大規模企業應用程式。

Intel 不斷地從每一代產品中提升效能和安全性。以下是 Intel 提供的一項比較,展示了 Intel 如何提升其效能。Supermicro 伺服器在其產品線中,從邊緣運算到資料中心的多處理器系統,均整合了最新的第 4 代 Intel Xeon 可擴充處理器。

依處理器世代劃分的英特爾加速引擎(比較圖表)
資源與配置