跳至主要內容

選擇 Supermicro 作為 HPC 基礎架構的 5 個理由

高效能運算 (HPC) 應用於許多產業,以解決複雜的物理問題。機械系統模擬、天氣預報和新藥設計僅是 HPC 的其中幾個應用案例。根據應用案例,HPC 系統由多個伺服器組成,這些伺服器相互連網並在模擬過程中共享資訊。HPC 應用可能需要大量資料,因此快速儲存和快速網路是高效解決方案的必要組成部分。Supermicro 是 HPC 產業伺服器和儲存系統的領先供應商。以下是客戶選擇 Supermicro 解決方案以滿足其 HPC 需求的幾個原因。

1.產品範圍

Supermicro 設計並製造適用於從邊緣到資料中心的各種最佳化伺服器。在選擇具有多種配置選項的伺服器之前,必須了解特定的應用程式需求。需要考量的功能包括:

  1. CPU 數量 – Supermicro 提供單一系統中包含 1、2、4 和 8 個 CPU 的系統。應用程式的可擴展性 (應用程式是否能隨著更多核心擴展以及最多可擴展到多少核心) 和/或同時運行的不同應用程式數量是重要的考量因素。Supermicro 提供單一機箱中包含 1 到 8 個 CPU 的伺服器,並根據環境限制提供多種選項。
  2. 記憶體需求 – 一般而言,無論採用 2、4 或 8 個 CPU 的對稱多處理架構,皆能提供更多記憶體資源,因每個CPU 從其插槽中存取特定容量的記憶體。然而,受限於物理結構,各產品系列中每顆CPU 支援的記憶體模組數量CPU 有所差異。
  3. 直接連接儲存裝置 – 每Supermicro 皆可支援多種格式、容量及數量不等的直接連接儲存裝置。多數系統皆可支援SATA 裝置。此外,亦可支援最新的EDSFF .S 及 E3.S 裝置。
  4. 網路 – 對於跨系統運行的應用程式 (例如使用 MPI),具有低延遲的快速網路對於更快地獲得結果至關重要。Supermicro 提供從 1G 到 400G 的多種網路選項。網路也可以在特定伺服器中使用 DPU。
SuperBlade

Supermicro SuperBlade®

Hyper

Supermicro Hyper

2.機架規模整合

HPC 環境需要數十個裝滿高效能伺服器的機架,這些伺服器必須經過共同測試。整合包含伺服器、儲存、網路,甚至可能包含液冷系統的機架,需要專業知識以及與客戶的協作關係,以確定最佳解決方案。Supermicro 擁有專業知識和經驗,能夠為各種需求建立機架級解決方案。測試具有互連系統 (L11) 的單一機架以及多個機架組成的叢集 (L12),需要製造能力以及對終端使用者應用程式和環境的了解。若要在叢集規模下測試完整的液冷系統,必須有專門的設施正在運行並可供使用。使用最先進的硬體建立和建構從單一機架到多個機架並非易事,供應商應具備伺服器、儲存、網路、散熱和整合方面的專業知識。

RackScale

深入了解 Supermicro 機架級整合

3.領先供應商的最新 CPU

CPU 技術不斷精進,每一代新微處理器的每瓦效能都在提升。英特爾 (Intel)、AMD 和 NVIDIA 均推出涵蓋多個產品系列的 CPU 產品線。最高效能的 CPU 處理頻率可達 3 至 5 GHz,並配備多達 128 個核心。 當整合至雙插槽伺服器時,單一應用程式或同時執行多個應用程式時,皆可運用數百個核心。Supermicro 領先的CPU Supermicro 提供採用最新HPC 技術的廣泛伺服器產品線。無論是支援高達 8TB 記憶體的單插槽伺服器,或是支援高達 32TB 記憶體的多處理器系統Supermicro 適用於任何HPC 完整系統系列。

進一步了解搭載 Intel 處理器的Supermicro
進一步了解搭載AMD Supermicro

4.領先供應商的最新 GPU

對於許多HPC ,GPU 已成為不可或缺的元件。許多應用程式已進行修改,利用 GPU 內建的並行處理能力來處理演算法的特定部分。由於 GPU 內含數千個核心,HPC 某些部分可從CPU 移CPU GPU 執行,從而大幅提升運算速度。與 CPU 一樣,各式各樣的 GPU 皆可應用於HPC 。CPU 多種外形規格及與CPU 通訊路徑CPU 雖然許多 GPU 安裝在PCIe ,必須透過PCIe CPU 與彼此通訊;但也有其他 GPU 獨立安裝在專用電路板上,並透過彼此間的通訊來提升應用程式速度(儘管初始的資料傳輸仍需透過PCIe 進行)

UniversalGPU

配備 8 個 NVIDIA HGX H100 GPU 的通用 GPU

深入了解配備 NVIDIA GPU 的 Supermicro GPU 伺服器
深入了解配備 Intel GPU 的 Supermicro GPU 伺服器

5.儲存與網路系統

HPC 需要快速儲存裝置,以將資料傳送至CPU 寫回中間結果與最終答案。 伺服器可針對運算或儲存進行設計與優化。儘管許多運算優化伺服器的儲存容量已遠超前代產品,但仍需專為連接多台運算伺服器而設計的儲存設備,使其能同時支援讀寫作業。穩健HPC 需採用多元儲存技術,從高速低延遲硬體到用於溫儲存、冷儲存及歸檔的硬碟驅動器皆不可或缺。

HPC 網路架構需要配備高效能乙太網路或InfiniBand 及交換器。當多台伺服器共同處理同一項任務時,這些伺服器必須頻繁交換資料與運算結果,因此需要高速網路。除了應用程式所需的網路連線外,還必須建置獨立的管理網路,以便管理伺服器並在必要時執行更新作業。

儲存24E3S

配備 24 個 E3.SNVMe 的Supermicro 伺服器

深入了解 Supermicro 儲存解決方案

6.摘要

Supermicro 製造一系列針對HPC 進行優化的伺服器與儲存系統。Supermicro HPC Intel、AMD 及 NVIDIA 的最新 CPU,以及 NVIDIA、Intel 和AMD 的最新一代 GPU。憑藉在提供機架級與經過全面測試的叢集解決方案方面的專業技術Supermicro 全球公認的HPC 製造商與供應商。

深入了解 Supermicro 高效能運算 (HPC) 解決方案