跳至主要内容

数据中心的网络硬件、装置和设备

Supermicro NVIDIA Spectrum™-X 提供针对 AI 优化的加速以太网连接

人工智能正在推动对更先进的计算基础设施(包括网络)的需求。网络带宽不足常常会成为驱动人工智能应用的信息处理瓶颈。加速计算基础设施的速度取决于其最薄弱的环节,而网络往往就是这个薄弱环节。幸运的是,通过与 NVIDIA 合作, Supermicro NVIDIA 已在其多个系统中验证了全新的 NVIDIA Spectrum-X 网络平台,该平台可将 AI 工作负载的网络性能提升高达 1.6 倍,同时提高能源效率并降低总体拥有成本。借助 NVIDIA Spectrum-4 以太网交换机和 NVIDIA BlueField®-3 超级网卡,客户现在可以充分利用性能卓越的以太网 AI 云处理基础设施。

英伟达™ Spectrum-4 和英伟达™ BlueField-3

目前正在通过 NVIDIA Spectrum-X 网络解决方案认证的系统包括Supermicro非常受欢迎的GPU SuperServers 提供 4U、5U 和 8U 三种高度规格,并支持以下系统中的 NVIDIA GPU:

三人组Supermicro GPU系统:4U 8GPU、8U 8GPU和5U 10GPU

这些Supermicro 由 NVIDIA Spectrum-X 提供支持的系统,可减少大规模基于 Transformer 的生成式 AI 模型的训练和推理运行时间,这对于更快地从 AI 中获得结果和见解至关重要。

除了将网络的人工智能性能大幅提升1.6倍之外, Supermicro 采用 NVIDIA Spectrum-X 网络技术的系统能够有效隔离多租户环境中的工作负载性能。对于高性能应用而言,允许工作负载独立地移动数据,避免“邻居干扰”(即“嘈杂邻居”干扰),至关重要。此外,隔离网络工作负载还能带来额外的安全优势,防止一个工作负载中的恶意行为者干扰其他工作负载。NVIDIA Spectrum-X 通过为每个租户分配安全的虚拟私有云 (VPC) 来实现这种增强的工作负载隔离。

在运行高性能、高功耗的人工智能系统时,能效始终是一个至关重要的问题。NVIDIA Spectrum-X 能够在相同的网络功耗范围内提供更高的网络性能,从而有助于构建更节能的人工智能环境。更高的每瓦性能意味着更低的总体功耗,并有可能降低总拥有成本。对于通常依赖功率限制来控制能源成本的用户而言, Supermicro 配备 Spectrum-X 的系统有助于确保能源消耗不会超过上限。  

对于采用标准以太网网络的用户而言,NVIDIA Spectrum-X 完全符合标准,并且与基于以太网的协议栈完全兼容。此外, Supermicro 搭载 NVIDIA Spectrum-X 技术的服务器可帮助客户克服部署 AI 时面临的最大挑战——可扩展性。这些服务器能够在单个交换机中支持 256 个 200G 端口,或在两层叶脊式拓扑结构中支持 16K 个端口,是满足企业不断发展的加速计算基础设施需求的理想之选。

作为Supermicro 致力于满足人工智能客户的需求,这些客户不仅需要高性能网络,还需要云多租户服务。 Supermicro 搭载 NVIDIA Spectrum-X 的系统利用基于融合以太网的远程直接内存访问 (RDMA) (RoCE) 扩展,以支持高性能和多租户。如下图所示,其在传统以太网上的性能表现令人惊叹。  

NVIDIA 的突破性网络技术,包括众多应用领域。 Supermicro 服务器实现了突破性的网络性能,为人工智能、多租户性能隔离和更高的能源效率提供了保障。这一切都是通过将 NVIDIA Spectrum-4 以太网交换机与 NVIDIA BlueField-3 SuperNIC 相结合,并基于以太网网络标准实现的。这种组合最终有助于缩短大规模生成式 AI 模型的运行时间。对于那些需要更快获得关键洞察、多租户支持和未来可扩展性的客户而言,这些解决方案尤为重要。 Supermicro 配备 NVIDIA Spectrum-X 的系统非常适合满足他们的需求。