AI 基礎設施伺服器解決方案

加速所有類型的工作負載

透過Supermicro的先進AI基礎設施解決方案，釋放AI的最大潛力。從大規模訓練到智慧化邊緣推論，我們的一站式設計可優化並加速AI技術部署。最佳效能與高度可擴充性可強化您的工作負載，同時降低成本並減少對環境的影響。Supermicro的多元AI工作負載最佳化解決方案可幫助您探索更高的可能性，並加速業務增長。

大規模AI訓練與推論

大型語言模型、生成式AI訓練、自動駕駛、機器人

大規模的AI訓練需要最先進的技術，最大化GPU的平行運算能力，以處理數十億甚至數兆的AI模型參數，並使用大量的資料集進行訓練。Supermicro系統搭載了NVIDIA HGX™B200與GB200 NVL72，以及最快的NVLink®與NVSwitch® GPU-GPU互連技術（頻寬最高可達1.8TB/秒），並與每個GPU進行一對一相連，進而將節點叢集化。這些最佳化系統能夠從頭開始訓練大型語言模型，並將模型同時提供給數百萬名使用者。我們透過全快閃NVM來完成堆疊，實現快速的AI資料管道，進一步提供經完全整合的機架與液體冷卻技術，以確保快速部署與順暢無阻的AI訓練體驗。

工作負載規模

特大型
大型
中型
儲存

超大型工作負載規格：NVIDIA GB200 NVL72 搭配Supermicro — NVIDIA GB200 NVL72與Supermicro液體冷卻技術
了解更多

大型工作負載規格：配備 HGX B200 8 GPU 或 HGX H200 8 GPU 的 10U/8U 8 GPU 系統 — 搭載NVIDIAHGX B200 8-GPU的10U系統與搭載HGX H200 8-GPU的8U系統
了解更多

資源

HPC/AI

工程模擬、科學研究、基因組測序、藥物研究與發展

可助力加速科學家、研究人員和工程師的研發時間，同時，越來越多的HPC工作負載正在強化機器學習演算法，以及透過GPU加速的平行運算，以更快獲得成果。目前，全球許多最快的超級運算叢集都運用到GPU和AI技術。

HPC工作負載通常需要進行資料密集型模擬與分析，並需要處理大量的資料集，以及提供高度精準性。GPU（如NVIDIA H100/H200）可提供前的雙精確度效能，且每GPU效能可達60 teraflops。Supermicro的高彈性HPC平台能支援多組GPU與CPU，確保在多種密集型機體規格內運行，並可進行機架規模整合與搭配液體冷卻技術。

NVIDIA® HGX H100/H200 圖形處理器 — HGX H100/H200、H100 NVL 與 H200 NVL

NVIDIA® H100 NVL/H200 NVL 圖形處理器 — HGX H100/H200、H100 NVL 與 H200 NVL

NVIDIA® Grace Hopper Superchip — Grace Hopper Superchip

NVIDIA® RTX PRO™ 6000 Blackwell 圖形處理器 — RTX PRO™ 6000 Blackwell

工作負載規模

大型
中型

大型工作負載規模：8U SuperBlade® — 8U SuperBlade®
了解更多

中等工作負載規模：4U/5U 機箱，配備8-10張GPU PCIe擴充卡 — 4U/5U 8-10 GPU PCIe
了解更多

中型工作負載大小：1U Grace Hopper系統 — 1U Grace Hopper系統
了解更多

資源

企業型AI的推論與訓練

生成式AI推論、AI服務/應用程式、聊天機器人、推薦系統、商業自動化

生成式AI技術已成為科技、銀行、媒體等各類產業的全新趨勢。因AI技術是孕育創新、大幅提升生產力、簡化營運、以資料為導向的決策，以及改善客戶體驗的源頭，AI應用賽道已開啟序章。

無論是AI應用程式與商業模式、用於客戶服務的智慧化擬真聊天機器人，或是AI協同的程式碼生成與內容創作，企業都可以運用開放式架構、程式庫、預先訓練的AI模型相關技術，並透過自有資料集，依據特殊專案需求，對這些架構、程式庫和模型進行微調。許多企業已開始打造AI基礎設施，而Supermicro多元的GPU最佳化系統可為這些企業提供開放式模組化架構、供應商靈活性，以及順暢的部署與設施升級途徑，進而導入更先進的技術。

工作負載規模

特大型
大型
中型

中等工作負載規模：6U SuperBlade® — 6U SuperBlade®
了解更多

中等工作負載規模：2U Grace MGX 系統 — 2U Grace MGX系統
了解更多

資源

視覺化與設計

即時協作、3D設計、遊戲開發

現今的GPU為3D圖形與AI應用程式提升了逼真度，進而加速工業的數位化。高真實度的3D模擬技術推動了產品開發與設計流程、製造，以及內容創作的轉型，進一步實現更好的品質、無機會成本的永續迭代，以及更快的上市時間。

Supermicro全面整合解決方案，大規模建構虛擬製作基礎架構以加速產業數位化進程。解決方案包含：4U/5U 8-10 GPU系統、NVIDIAOVX™參考架構（針對NVIDIA Omniverse Enterprise進行優化並配備通用場景描述(USD)連接器），以及NVIDIA認證的機架式伺服器與多GPU工作站。

工作負載規模

大型
中型

資源

內容傳遞與虛擬化

內容傳遞網路（CDN）、轉碼、壓縮、雲端遊戲/串流

影片傳遞工作負載在目前的網路流量占比量仍然相當高。隨著串流服務供應商提供更多的4K和甚至8K的內容，或是螢幕更新率更高的雲端遊戲，結合媒體引擎的GPU加速變成了必須要素，為串流管線提供數倍的吞吐量效能，同時藉由AV1編碼和解碼等最新技術，維持更佳的視覺擬真度，並減少所需的資料量。

Supermicro的多節點與多GPU系統，例如2U 4節點BigTwin®系統，可滿足現代影片傳遞的嚴格需求。這些系統的每個節點都支援NVIDIA L4 GPU，並具備大量的PCIe Gen5儲存與網路速度，針對內容傳遞網路，因應需求嚴苛的資料管道。

工作負載規模

大型
中型
小

中等工作負載規模：CloudDC UP — 2U UP CloudDC
了解更多

資源

邊緣AI

邊緣影片轉碼、邊緣推論、邊緣訓練

在不同產業內，不少企業的員工與客戶在城市、工廠、零售店、醫院等邊緣地點接觸與互動，其中，越來越多的企業開始投資在邊緣AI的部署。透過在邊緣端處理資料和運行AI和ML演算法，企業能克服頻寬和延遲方面的限制，實現實時分析，進而及時做出決策、預測型看護、個人化服務，以及優化業務運作。

專為環境優化設計AI 具備多種緊湊機型，可提供低延遲、開放架構所需的效能。其預先整合的元件、多元的硬體與軟體堆疊相容性，以及開箱即用的隱私與安全功能集，皆能滿足複雜邊緣部署的需求。

工作負載規模

特大型
大型
中型
小

中等工作負載規模：淺深度多GPU邊緣伺服器 — 搭載多組GPU的短機身邊緣伺服器
了解更多

資源

解決方案

COMPUTEX 2024 執行長主題演講

機架式伺服器

1U雙處理器

2U雙處理器

單一處理器

多處理器

產品系列

GPU伺服器

8U/10U GPU系列

4U/5U GPU系列

2U GPU系列

1U GPU產品線

Twin伺服器

FlexTwin™

BigTwin®

GrandTwin®

TwinPro®

FatTwin®

Blade伺服器

SuperBlade®

MicroBlade®

MicroCloud

儲存伺服器

所有儲存系統

全快閃NVMe

頂部裝載式儲存

JBOF

Petascale Grace儲存

企業最佳化儲存系統

JBOD儲存機箱

主機板

伺服器主機板

工作站主機板

嵌入式 / IoT主機板

桌上型 / 電競主機板

主機板系列

全球SKU

機殼

1U機箱

2U機箱

3U機箱

4U / 塔式機箱

中型 / 迷你立式機型

嵌入式 / 物聯網機箱

移動式貨架 / 驅動套件

JBOD儲存機箱

全球SKU

SuperRack®

資料中心解決方案工程（DCSE）

機架整合服務

配件裝置

各式電源線/連接線

Riser卡系列

儲存AOC系列

電源供應器系列

散熱器系列

系統風扇系列

移動式貨架 / 驅動套件

前機箱邊框

儲存、輸入/輸出、安全性

邊緣AI與物聯網系統

緊湊型邊緣系統

緊湊型邊緣伺服器

機架式邊緣伺服器

嵌入式元件

嵌入式主機板

嵌入式機箱

交換器

轉接器

SuperWorkstations

液冷式AI開發平台

單處理器

雙處理器

Supero™ Gaming解決方案

人工智慧基礎架構

資料中心建構組件解決方案（Data Center Building Block Solutions®，DCBBS）

AI工廠

邊緣AI

AI儲存

NVIDIA解決方案

AMD解決方案