跳至主要內容

選擇 Supermicro 作為 HPC 基礎架構的 5 個理由

高效能運算 (HPC) 應用於許多產業,以解決複雜的物理問題。機械系統模擬、天氣預報和新藥設計僅是 HPC 的其中幾個應用案例。根據應用案例,HPC 系統由多個伺服器組成,這些伺服器相互連網並在模擬過程中共享資訊。HPC 應用可能需要大量資料,因此快速儲存和快速網路是高效解決方案的必要組成部分。Supermicro 是 HPC 產業伺服器和儲存系統的領先供應商。以下是客戶選擇 Supermicro 解決方案以滿足其 HPC 需求的幾個原因。

1.產品範圍

Supermicro 設計並製造適用於從邊緣到資料中心的各種最佳化伺服器。在選擇具有多種配置選項的伺服器之前,必須了解特定的應用程式需求。需要考量的功能包括:

  1. CPU 數量 – Supermicro 提供單一系統中包含 1、2、4 和 8 個 CPU 的系統。應用程式的可擴展性 (應用程式是否能隨著更多核心擴展以及最多可擴展到多少核心) 和/或同時運行的不同應用程式數量是重要的考量因素。Supermicro 提供單一機箱中包含 1 到 8 個 CPU 的伺服器,並根據環境限制提供多種選項。
  2. 記憶體需求 – 一般而言,無論採用 2、4 或 8 個 CPU 的對稱多處理架構,皆能提供更多記憶體資源,因每個CPU 從其插槽中存取特定容量的記憶體。然而,受限於物理結構,各產品系列中每顆CPU 支援的記憶體模組數量CPU 有所差異。
  3. 直接連接儲存裝置 – 每Supermicro 皆可支援多種格式、容量及數量不等的直接連接儲存裝置。多數系統皆可支援SAS 儲存裝置。此外,亦可支援最新的 EDSFF E1.S 及 E3.S 裝置。
  4. 網路 – 對於跨系統運行的應用程式 (例如使用 MPI),具有低延遲的快速網路對於更快地獲得結果至關重要。Supermicro 提供從 1G 到 400G 的多種網路選項。網路也可以在特定伺服器中使用 DPU。
SuperBlade

Supermicro SuperBlade®

Hyper

Supermicro Hyper

2.機架規模整合

HPC 環境需要數十個裝滿高效能伺服器的機架,這些伺服器必須經過共同測試。整合包含伺服器、儲存、網路,甚至可能包含液冷系統的機架,需要專業知識以及與客戶的協作關係,以確定最佳解決方案。Supermicro 擁有專業知識和經驗,能夠為各種需求建立機架級解決方案。測試具有互連系統 (L11) 的單一機架以及多個機架組成的叢集 (L12),需要製造能力以及對終端使用者應用程式和環境的了解。若要在叢集規模下測試完整的液冷系統,必須有專門的設施正在運行並可供使用。使用最先進的硬體建立和建構從單一機架到多個機架並非易事,供應商應具備伺服器、儲存、網路、散熱和整合方面的專業知識。

RackScale

深入了解 Supermicro 機架級整合

3.領先供應商的最新 CPU

CPU 不斷改進,每代新微處理器的每瓦效能都在提升。Intel、AMD 和 NVIDIA 都生產各種產品系列的 CPU。效能最高的 CPU 可以在 3-5 GHz 範圍內處理資料,並包含多達 128 個核心。當整合到雙插槽伺服器中時,數百個核心可用於單一應用程式或同時執行多個應用程式。Supermicro 與領先的 CPU 製造商合作,提供各種採用最新技術的 HPC 伺服器。無論是支援高達 8TB 記憶體的單插槽伺服器,還是可支援高達 32TB 記憶體的多處理器系統,Supermicro 都能為任何 HPC 應用提供廣泛的系統選擇。

深入了解搭載 Intel 處理器的 Supermicro 伺服器
深入了解搭載 AMD 處理器的 Supermicro 伺服器

4.領先供應商的最新 GPU

GPU 已成為許多HPC 不可或缺的HPC 。眾多應用程式經修改後,能利用 GPU 內建的平行運算能力處理演算法的特定環節。憑藉著數千個核心的運算能力,部分HPC 可從CPU 移CPU GPU 執行,從而實現驚人的運算加速。如同 CPU 般,各類 GPU 皆可應用於HPC 。CPU 多種外型規格與CPU 路徑CPU 多數GPU透過PCIe匯流排運作,需經由PCIeCPU進行通訊;而獨立板卡型GPU則透過板間通訊提升應用效能(儘管初始資料傳輸仍需經由PCIe匯流排完成)。

UniversalGPU

配備 8 個 NVIDIA HGX H100 GPU 的通用 GPU

深入了解配備 NVIDIA GPU 的 Supermicro GPU 伺服器
深入了解配備 Intel GPU 的 Supermicro GPU 伺服器

5.儲存與網路系統

HPC 需要快速儲存裝置,以將資料傳送至CPU 寫回中間結果與最終答案。 伺服器可針對運算或儲存進行設計與優化。儘管許多運算優化伺服器的儲存容量已遠超前代產品,但仍需專為連接多台運算伺服器而設計的儲存設備,使其能同時支援讀寫作業。穩健HPC 需採用多元儲存技術,從高速低延遲硬體到用於溫儲存、冷儲存及歸檔的硬碟驅動器皆不可或缺。

針對HPC 網路建置,需配備高效能乙太網路或InfiniBand介面卡與交換器。當多台伺服器協同處理同一問題時,伺服器間需頻繁交換數據與運算結果,因此必須採用高速網路架構。除應用程式所需的網路功能外,還需建置獨立的管理網路,用於伺服器管理及執行必要更新作業。

儲存24E3S

Supermicro 儲存伺服器配備 24 個 E3.S NVMe 裝置

深入了解 Supermicro 儲存解決方案

6.摘要

Supermicro 設計並製造各種針對 HPC 工作負載優化的伺服器和儲存系統。Supermicro 生產的 HPC 伺服器基於 Intel、AMD 和 NVIDIA 的最新 CPU,以及 NVIDIA、Intel 和 AMD 的最新一代 GPU。憑藉在提供機架級和經過全面測試的叢集解決方案方面的專業知識,Supermicro 是全球 HPC 環境中公認的製造商和供應商。

深入了解 Supermicro 高效能運算 (HPC) 解決方案