跳至主要内容
现代人工智能数据中心的蓝图

Supermicro模块解决方案(DCBBS)提供完整的模块化人工智能基础设施。该方案基于经过验证的组件和子系统构建,可实现端到端的部署灵活性——从独立GPU和网络交换机,到完整的机架、站点基础设施、管理软件及专业服务。

DCBBS

率先上市,快速部署

现场服务整体解决方案

根据您的工作量定制

发货前经过验证和测试

数据中心构件解决方案® (DCBBS)

人工智能与计算系统

业界最广泛的人工智能和计算系统产品组合,提供无与伦比的定制服务 - 从 GPU 系统到千万亿次存储、多节点系统和液冷系统。

机架内解决方案

机架内完全集成:冷却分配单元和集管、软管套件、网络交换机、电源架和备用电池单元,RDHx 可实现最大密度和效率。

行内解决方案

提供可扩展的液冷解决方案,涵盖从200kW液冷至风冷侧柜到1.8MW行级CDU,此外还提供预验证的SuperCluster解决方案,该方案集成了网络功能,专为交钥匙式多机架部署而设计。

场地基础设施解决方案

现场级冷却基础设施,配备可扩展的水冷却塔和干式冷却塔,用于热管理和电源管理。为高性能数据管道优化布线设计和实施。

管理软件套件

从裸机到人工智能工作负载的端到端超级云软件--提供统一的基础架构控制、部署自动化、开发人员工具和多租户 GPU 云管理。

服务与现场部署

从数据中心设计和解决方案验证到现场部署和持续支持,提供全面的专业服务,并提供 4 小时响应选项,以确保关键任务正常运行。

人工智能与计算系统

从业界最广泛的人工智能与计算系统产品组合中进行选择,这些系统搭载了NVIDIA、AMD特尔的最新技术。Supermicro模块化构建方案提供无与伦比的定制化与优化能力——从高密度GPU人工智能系统到拍级存储系统——让您能够针对工作负载精细调整每个组件。 通过液冷冷板可消除关键电子元件高达98%的热量,并无缝集成领先的软件定义存储合作伙伴方案,每套系统均从底层设计起便实现性能与效率的最大化优化。

了解更多

Supermicro 服务器产品组合一览

GPU 和 CPU 系统

广泛的密度、效率和可扩展性优化系统,采用英伟达™(NVIDIA®)、AMD 和英特尔™(Intel®)的最新人工智能和计算技术,具有各种外形尺寸,专为各种工作负载(从人工智能培训和推理到高性能计算)而设计。

存储系统

Petascale 和对象存储服务器与领先的软件定义存储合作伙伴无缝集成,为数据密集型人工智能工作负载以及大规模人工智能模型训练和大批量推理提供最大吞吐量和可扩展性。

系统Building Blocks、冷板

Supermicro液冷冷板能高效带走系统关键电子元件高达98%的热量,配合模块化构建组件,可针对特定工作负载需求实现精确的系统定制与优化。

4U NVIDIA HGX 8-GPU SystemPower Supplies and High-speed NICsGPU Cold PlatesNVIDIA HGX B200 8-GPUCPU, DIMM, and PCIe Switch Cold PlatesHot-swappable High-performance Drives

4U NVIDIA HGX 8 GPU 系统

图4U NVIDIA HGX 8 GPU 系统
  1. 热插拔高性能硬盘
  2. CPU、DIMM 和 PCIe 交换机冷板
  3. NVIDIA HGX B200 8 Gpu
  4. GPU 冷板
  5. 电源和高速网卡

机架内解决方案

通过专为机架集成设计的解决方案,为最严苛的人工智能与计算系统提供供电、散热及连接支持。Supermicro 冷却液分配单元,支持高达250kW的液体冷却能力,并配备高性能网络交换机,涵盖NVIDIA InfiniBand及以太网解决方案。 结合33kW电源柜与电池备份单元(可提供90秒48V直流电源保障应用程序检查点)Supermicro解决方案为新一代AI数据中心提供所需的热管理、网络架构、供电能力和弹性——所有设计均针对最大机架密度与运营效率进行优化。

了解更多

Supermicro 机架解决方案特写

CDU 和 CDM

各种配置的冷却液分配单元和歧管,包括用于较高服务器密度的垂直 CDM。机架式 CDU 可为高达 45°C 的液体提供高达 250kW 的冷却能力,并标配冗余电源和泵,以实现最高的可靠性。

后门热交换器

后门热交换器可直接安装在服务器机架上,从源头消除热量,从而大幅降低数据中心的空调需求,同时为高密度人工智能基础设施保持最佳运行温度。

冷却软管套件

灵活的软管套件设计用于将液冷机架直接连接到数据中心的主供水系统或冷却塔。预装软管套件可实现即插即用、无须工具的部署,并可无缝集成到新的或现有的设施管道中。

电源架和 BBU

33kW 电源架专为最新一代高密度 AI 机架设计,与电池备份单元相结合,可在断电期间提供 90 秒的 48V 直流电源,用于应用程序检查点--无需重新启动整个应用程序。

网络交换机

NVIDIA以太网和InfiniBand平台(包括NVIDIA Spectrum-X和Quantum-2)可实现优化的人工智能集群网络,同时提供经过认证的合作伙伴解决方案。Supermicro 交换机最高支持800 GbE链路速率和51.2 Tbps吞吐量,满足多样化工作负载需求。

行内解决方案

通过专为多机架部署设计的灵活机架内解决方案,扩展您的液体冷却基础设施。Supermicro (CDU)可在多个机架间提供高达1.8兆瓦的冷却能力,而液-气侧车(Sidecars)则提供高达200千瓦的独立冷却能力,无需外部基础设施改造。 为实现完整的交钥匙部署,SuperCluster提供预验证的即插即用多机架解决方案,集成网络架构并通过严格的L11/L12测试——支持从试点项目到全面生产的无缝扩展。

了解更多

Supermicro

行内 CDU

大容量行内冷却剂分配装置可容纳多个大功率液冷服务器机架,提供高达 1.8MW 的冷却能力,适用于密集人工智能数据中心环境中的可扩展多机架部署。

液-气(L2A)侧挂式 CDU

独立冷却装置可在数据中心内将服务器中的热液体转换回冷却液体,提供高达 200 千瓦的冷却能力,无需对外部基础设施进行改造,是改造和快速部署液冷系统的理想之选。

超级集群

高度可定制、即插即用的集群解决方案,配备多个机架和集成网络结构。每个系统在发货前都经过严格的 L11 或 L12 验证测试,确保交钥匙部署,实现从试点项目到全面生产型人工智能基础设施的无缝扩展。

场地基础设施解决方案

构建高性能数据中心基础架构,配备全面工程设计的布线、供电及制冷系统。Supermicro 优化的布线设计与实施方案,包含完整的文档记录,涵盖线路规划、端口映射及线缆长度优化,从而缩短上线时间,降低物料成本与人力投入。针对站点级热管理Supermicro 可扩展配置的水冷塔及无需耗水的干式冷却塔——所有设备均采用简易安装设计,并支持随基础设施扩展实现并行扩展。

了解更多

Supermicro 站点基础设施实景图

布线

优化流量工程,提供完整的布线设计、文档和实施服务,包括路由选择、端口映射和电缆长度优化。工程解决方案可缩短上线时间、降低材料成本和人工成本,同时确保多机架部署的高性能数据流。

水冷塔

一次液体循环设备支持从 1 兆瓦到 50 兆瓦或更大的可扩展冷却能力,采用模块化设计,可加快运行时间。闭环系统采用 EC 风扇设计和 N+1 潜水泵,与传统的风冷系统相比,可确保高能效、可靠的运行,并减少电力和水的使用。

干式冷却器

为用水紧张地区提供低 PUE/WUE 冷却,容量可从 1 MW 扩展到 50 MW 以上。绝热辅助模式可实现空气预冷,在高温环境下性能卓越。闭环设计可保持冷却剂清洁无腐蚀,确保卓越的效率、最少的维护和长期的可靠性。

数据中心变压器(定制订单)

垫装变压器可为 AI 行和多兆瓦区块提供稳健的低阻抗电力。可通过智能监控和环路馈电选项配置中压初级和次级,与中压开关设备、UPS/BESS 和预制撬无缝集成,实现快速、灵活的部署。

数据中心发电机(定制订单)

备用发电机提供快速启动、高阶跃负荷接受能力、本机并联和无缝自动转换开关集成。构建从边缘机房到大型园区的可扩展 N+1/N+N 备份架构,确保人工智能计算环境的关键任务正常运行,实现统一、可预测的运行。

管理软件套件

从裸机到 AI 工作负载,作为数据中心构建模块解决方案的一部分,SuperCloud 软件套件可为现代数据中心提供端到端的管理。统一基础架构控制、自动化部署管道、通过自助式人工智能工具增强开发人员的能力,以及优化多租户 GPU 云操作--所有这些都是专为人工智能工厂和超大规模环境的规模和复杂性而构建的。

了解更多

屏幕截图 -SuperCloud Composer (SCC)屏幕截图 - 超级云自动化中心(SCAC)屏幕截图 - 超级云开发人员体验控制台 (SDX)屏幕截图 - 超级云总监 (SCD)

SuperCloud Composer (SCC)

SuperCloud Composer 提供跨服务器、网络、PDU、CDU 和第三方系统的统一机架规模和液体冷却管理。它提供电源管理、高级泄漏检测、保护和警报,以保护 GPU 和冷却基础设施。SuperCloud Composer 具有大规模可观察性和可调整性,可通过单一门户管理 20K+ 主机。

超级云自动化中心(SCAC)

超级云自动化中心为数据中心和边缘基础设施提供预构建的企业级自动化。它涵盖从固件和操作系统调配到启用 Kubernetes 和人工智能工作负载的所有功能,同时确保安全性、可扩展性和治理。

超级云开发者体验控制台(SDX)

SuperCloud 开发者控制台是面向开发者的人工智能体验控制台,它将 GPU 即服务(GPUaaS)、 Kubernetes、机器学习管道和数据服务整合到一个工作区中。与其他仅提供基础架构的控制台不同,它通过自助式调配、AI 原生工作流和内置的可观察性,为开发人员提供交钥匙敏捷性,使团队能够更快、更安全地完成从代码到模型的转换。

超级云总监 (SCD)

SuperCloud Director 通过集成的裸机、以太网和 Infiniband 网络多租户和存储管理,提供多租户 AI 云控制,优化性能、安全性和开发人员敏捷性。与一般的云管理工具不同,该软件专为 GPU 即服务(GPUaaS)、AI 工厂部署和超大规模运营而设计。

服务和现场部署

借助从规划到持续支持的全面专业服务,加速您的数据中心部署。无论您是在空地上新建数据中心、改造空气至液体冷却系统,还是在托管设施中部署Supermicro 都能提供端到端的专长支持,包括数据中心设计、解决方案验证和专业现场部署。 我们的集成化方案可缩短上线时间,确保更高质量的安装,并提供持续的现场支持及4小时响应选项,保障关键任务的持续运行。

了解更多

规划和验证

项目均经过周密规划,涵盖数据中心平面图设计、机架布局规划、端口映射等环节。在发货前Supermicro 行业标准的测试,包括机架级(L11)和集群级(L12)验证。

现场部署

端到端Supermicro专属配送服务,确保全程精心呵护。现场服务团队负责机架安装与堆叠操作,并可提供可选的软件安装服务。

现场支持

Supermicro 部署后平稳过渡,提供完整文档和持续支持以保障长期成功。全球服务可提供最快4小时的现场响应时间选项及零件更换服务。

数据中心装修服务

将数据中心外壳转变为运行环境的交钥匙解决方案。包括设计、工程、许可、从 PDU 到服务器的电气设备、带机架和 CDU 的机械系统以及液体冷却基础设施,以确保完全就绪。

建设服务

布线服务显著缩短了新建数据中心的建设周期。Supermicro 端到端项目管理,Supermicro 从空地建设到数据中心液冷改造的成功Supermicro 。

准备好打造人工智能的未来了吗?

Supermicro 联系Supermicro ,设计您的下一代人工智能数据中心。

联系我们