数据中心的网络硬件、装置和设备
人工智能正推动着对更先进计算基础设施的需求,其中包括网络架构。网络带宽的不足常常成为驱动人工智能应用的信息处理瓶颈。加速计算基础设施的速度取决于其最薄弱的环节,而网络往往就是这个瓶颈。 值得庆幸的是,通过与英伟达合作Supermicro 多款系统中Supermicro 认证全新NVIDIA Spectrum-X网络平台,使AI工作负载的网络性能提升高达1.6倍,同时增强能效并降低总体拥有成本。借助NVIDIA Spectrum-4以太网交换机与NVIDIA BlueField®-3 SuperNIC的组合,客户现可部署性能最优的以太网AI云处理基础设施。

目前正在通过NVIDIA Spectrum-X网络解决方案认证的Supermicro受欢迎的GPUSuperServers 提供4U、5U和8U三种机架高度,并在以下系统中支持NVIDIA GPU:
- Supermicro GPU服务器搭载NVIDIA HGX H100 8-GPU系统:
- SYS-821GE-TNHR(8U) - 英特尔 CPU
- AS -8125GS-TNHR(8U) -AMD CPU
- SYS-421GU-TNXR(4U) - 英特尔 CPU
- Supermicro (4U和5U机箱),搭载NVIDIA H100 PCIe GPU或NVIDIA L40S GPU:
- SYS-521GE-TNRT(5U) - 英特尔 CPU
- SYS-421GE-TNRT(4U) - 英特尔 CPU
- SYS-421GE-TNRT3(4U) - 英特尔 CPU
- AS -4125GS-TNRT(4U) -AMD CPU
- AS -4125GS-TNRT2(4U) -AMD CPU

这些搭载NVIDIA Spectrum-X的Supermicro ,显著缩短了基于大型变压器模型的生成式人工智能模型的训练与推理运行时间,这对加速人工智能成果交付与洞察获取至关重要。
除了将网络在人工智能领域的性能提升1.6倍外,搭载NVIDIA Spectrum-X网络Supermicro 还能在多租户环境中实现工作负载性能隔离。对于高性能应用而言,关键在于让不同工作负载能够独立传输数据,避免受"噪声邻居"干扰而影响性能。 此外,网络工作负载的隔离还带来额外的安全优势:可防止某个工作负载中的恶意行为者干扰其他独立工作负载。NVIDIA Spectrum-X通过为每个租户分配安全虚拟私有云(VPC),实现了这种增强型工作负载隔离。
在运行高性能、高功耗的AI系统时,能效始终是关键考量因素。NVIDIA Spectrum-X能在相同网络功耗范围内提供更强的网络性能,从而助力打造更节能的AI环境。这种更优的每瓦性能表现可降低整体功耗,并有望减少总拥有成本。 对于常需通过限电措施控制能耗成本的用户,搭载Spectrum-X的Supermicro 可确保能耗上限不会被突破,从而提供可靠保障。
采用标准化以太网网络的用户可放心,NVIDIA Spectrum-X 完全基于行业标准,并与以太网堆栈实现完全互操作。此外,搭载 NVIDIA Spectrum-X 的Supermicro 能帮助客户攻克部署人工智能的最大挑战——可扩展性。 单台交换机可支持256个200G端口,或在双层叶脊拓扑中支持16K端口,这些系统是满足组织不断演进的加速计算基础设施需求的理想选择。
Supermicro 满足人工智能客户的需求,这些客户不仅需要高性能网络,还需支持云端多租户环境。搭载NVIDIASupermicro 通过融合以太网远程直接内存访问(RoCE)扩展技术,同时实现了卓越性能与多租户支持。相较于传统以太网,其性能提升令人惊叹,如下图所示。
NVIDIA的突破性网络技术(包括应用于众多Supermicro )实现了突破性的AI网络性能、多租户性能隔离以及更高的能效。 该方案在以太网标准基础上,通过将NVIDIA Spectrum-4以太网交换机与NVIDIA BlueField-3 SuperNIC协同工作实现上述突破。这种组合能有效缩短大型生成式AI模型的运行时间。对于需要快速获取关键洞察、实现多租户支持及未来可扩展性的客户,搭载NVIDIA Spectrum-XSupermicro 堪称理想之选。
