跳至主要内容
现代人工智能数据中心的蓝图

Supermicro 的数据中心构建模块解决方案 (DCBBS) 提供完整的模块化 AI 基础设施。DCBBS 由经过验证的组件和子系统构建,提供端到端的部署灵活性——从独立的 GPU 和网络交换机到完整的机架、站点基础设施、管理软件和专业服务。

DCBBS

率先上市,快速部署

现场服务整体解决方案

根据您的工作量定制

发货前经过验证和测试

数据中心构件解决方案® (DCBBS)

人工智能与计算系统

业界最广泛的人工智能和计算系统产品组合,提供无与伦比的定制服务 - 从 GPU 系统到千万亿次存储、多节点系统和液冷系统。

机架内解决方案

机架内完全集成:冷却分配单元和集管、软管套件、网络交换机、电源架和备用电池单元,RDHx 可实现最大密度和效率。

行内解决方案

提供可扩展的液冷解决方案,涵盖从200kW液冷至风冷侧柜到1.8MW行级CDU,此外还提供预验证的SuperCluster解决方案,该方案集成了网络功能,专为交钥匙式多机架部署而设计。

场地基础设施解决方案

现场级冷却基础设施,配备可扩展的水冷却塔和干式冷却塔,用于热管理和电源管理。为高性能数据管道优化布线设计和实施。

管理软件套件

从裸机到人工智能工作负载的端到端超级云软件--提供统一的基础架构控制、部署自动化、开发人员工具和多租户 GPU 云管理。

服务与现场部署

从数据中心设计和解决方案验证到现场部署和持续支持,提供全面的专业服务,并提供 4 小时响应选项,以确保关键任务正常运行。

人工智能与计算系统

从业界最广泛的 AI 和计算系统产品组合中选择,这些系统搭载 NVIDIA、AMD 和 Intel 的最新技术。Supermicro 的积木式 (Building Block) 方法提供无与伦比的定制化和优化——从 GPU 密集型 AI 系统到拍字节级存储系统——让您能够针对工作负载精细调整每个组件。凭借可从关键电子元件中去除高达 98% 热量的液冷冷板,以及与领先的软件定义存储合作伙伴的无缝集成,每个系统都从底层开始优化,以实现最大性能和效率。

了解更多

Supermicro DCBBS 服务器产品组合概览

GPU 和 CPU 系统

广泛的密度、效率和可扩展性优化系统,采用英伟达™(NVIDIA®)、AMD 和英特尔™(Intel®)的最新人工智能和计算技术,具有各种外形尺寸,专为各种工作负载(从人工智能培训和推理到高性能计算)而设计。

存储系统

Petascale 和对象存储服务器与领先的软件定义存储合作伙伴无缝集成,为数据密集型人工智能工作负载以及大规模人工智能模型训练和大批量推理提供最大吞吐量和可扩展性。

系统Building Blocks、冷板

Supermicro 设计的液冷冷板可有效去除系统中关键电子元件高达 98% 的热量,同时模块化构建块组件可实现针对特定工作负载需求的精确系统定制和优化。

4U NVIDIA HGX 8-GPU SystemPower Supplies and High-speed NICsGPU Cold PlatesNVIDIA HGX B200 8-GPUCPU, DIMM, and PCIe Switch Cold PlatesHot-swappable High-performance Drives

4U NVIDIA HGX 8 GPU 系统

图4U NVIDIA HGX 8 GPU 系统
  1. 热插拔高性能硬盘
  2. CPU、DIMM 和 PCIe 交换机冷板
  3. NVIDIA HGX B200 8 Gpu
  4. GPU 冷板
  5. 电源和高速网卡

机架内解决方案

凭借专为机架内集成而设计,Supermicro 为最严苛的 AI 和计算系统提供供电、散热和连接。Supermicro 提供支持高达 250kW 液冷能力的冷却液分配单元,以及包括 NVIDIA InfiniBand 和以太网解决方案在内的高性能网络交换机。结合 33kW 电源架和可为应用程序检查点提供 90 秒 48V 直流电源的电池备份单元,Supermicro 的机架内解决方案为下一代 AI 数据中心提供所需的散热管理、网络结构、供电和弹性——所有这些都经过优化,以实现最大机架密度和运营效率。

了解更多

Supermicro DCBBS 机架解决方案视图

CDU 和 CDM

多种配置的冷却液分配单元和歧管,包括适用于更高服务器密度的垂直冷却液分配单元。机架内冷却液分配单元可提供高达250千瓦的冷却能力,适用于最高45°C的液体,标配冗余电源和水泵以确保最高可靠性。

后门热交换器

后门热交换器直接安装于服务器机架,在热源处直接散热, 在维持高密度人工智能基础设施最佳运行温度的同时, 显著降低数据中心空调需求。

冷却软管套件

柔性软管套件专为将液冷机架直接连接至数据中心主供水系统或冷却塔而设计。预装式软管套件支持即插即用,无需工具即可部署,可无缝集成至新建或现有设施的管道系统中。

电源架和 BBU

专为新一代高密度AI机架设计的33kW电源机架,配合电池备份单元,可在断电时提供90秒的48V直流电源,确保应用程序检查点功能——彻底消除完全重启应用程序的需求。

网络交换机

NVIDIA 以太网和 InfiniBand 平台,包括 NVIDIA Spectrum-X 和 Quantum-2,用于优化 AI 集群网络,以及合格的合作伙伴解决方案。Supermicro 以太网交换机也提供高达 800 GbE 链路速度和 51.2 Tbps 吞吐量,以满足各种工作负载需求。

行内解决方案

通过专为多机架部署设计的灵活行级解决方案扩展您的液冷基础设施。Supermicro 行级 CDU 可为多个机架提供高达 1.8MW 的冷却能力,而液气侧柜则提供高达 200kW 的独立冷却能力,无需外部基础设施改造。对于完整的交钥匙部署,SuperCluster 提供预验证、即插即用的多机架解决方案,这些解决方案集成了网络结构并经过严格的 L11/L12 测试——从而实现从试点项目到全面生产的无缝扩展。

了解更多

Supermicro 行级集群概览

货架

Supermicro 品牌机架提供一站式、端到端平台——从机架结构和系统集成,到冷却准备和工厂验证。凭借全面的内部工程和制造能力,每个机架都按照严格的质量标准制造,同时确保整个系统的无缝兼容性。

行内 CDU

大容量行内冷却剂分配装置可容纳多个大功率液冷服务器机架,提供高达 1.8MW 的冷却能力,适用于密集人工智能数据中心环境中的可扩展多机架部署。

液-气(L2A)侧挂式 CDU

独立冷却装置可在数据中心内将服务器中的热液体转换回冷却液体,提供高达 200 千瓦的冷却能力,无需对外部基础设施进行改造,是改造和快速部署液冷系统的理想之选。

超级集群

高度可定制、即插即用的集群解决方案,配备多个机架和集成网络结构。每个系统在发货前都经过严格的 L11 或 L12 验证测试,确保交钥匙部署,实现从试点项目到全面生产型人工智能基础设施的无缝扩展。

场地基础设施解决方案

通过全面设计的布线、供电和冷却基础设施,构建高性能数据中心基础。Supermicro 提供优化的布线设计和实施,并附带完整的文档,包括布线、端口映射和线缆长度优化,从而缩短上线时间,降低材料成本和人工成本。对于站点级热管理,Supermicro 提供可扩展配置的水冷塔和消除水消耗的干冷塔——所有这些都旨在方便安装,并随着基础设施的增长而并行扩展。

了解更多

Supermicro DCBBS 站点基础设施概览

布线

优化流量工程,提供完整的布线设计、文档和实施服务,包括路由选择、端口映射和电缆长度优化。工程解决方案可缩短上线时间、降低材料成本和人工成本,同时确保多机架部署的高性能数据流。

水冷塔

一次液体循环设备支持从 1 兆瓦到 50 兆瓦或更大的可扩展冷却能力,采用模块化设计,可加快运行时间。闭环系统采用 EC 风扇设计和 N+1 潜水泵,与传统的风冷系统相比,可确保高能效、可靠的运行,并减少电力和水的使用。

干式冷却器

为用水紧张地区提供低 PUE/WUE 冷却,容量可从 1 MW 扩展到 50 MW 以上。绝热辅助模式可实现空气预冷,在高温环境下性能卓越。闭环设计可保持冷却剂清洁无腐蚀,确保卓越的效率、最少的维护和长期的可靠性。

数据中心变压器(定制订单)

垫装变压器可为 AI 行和多兆瓦区块提供稳健的低阻抗电力。可通过智能监控和环路馈电选项配置中压初级和次级,与中压开关设备、UPS/BESS 和预制撬无缝集成,实现快速、灵活的部署。

数据中心发电机(定制订单)

备用发电机提供快速启动、高阶跃负荷接受能力、本机并联和无缝自动转换开关集成。构建从边缘机房到大型园区的可扩展 N+1/N+N 备份架构,确保人工智能计算环境的关键任务正常运行,实现统一、可预测的运行。

管理软件套件

从裸机到 AI 工作负载,作为数据中心构建模块解决方案的一部分,SuperCloud 软件套件可为现代数据中心提供端到端的管理。统一基础架构控制、自动化部署管道、通过自助式人工智能工具增强开发人员的能力,以及优化多租户 GPU 云操作--所有这些都是专为人工智能工厂和超大规模环境的规模和复杂性而构建的。

了解更多

屏幕截图 - SuperCloud Composer® (SCC)屏幕截图 - 超级云自动化中心(SCAC)屏幕截图 - 超级云开发人员体验控制台 (SDX)屏幕截图 - 超级云总监 (SCD)

超级云计算作曲家® (SCC)

SuperCloud Composer 提供跨服务器、网络、PDU、CDU 和第三方系统的统一机架规模和液体冷却管理。它提供电源管理、高级泄漏检测、保护和警报,以保护 GPU 和冷却基础设施。SuperCloud Composer 具有大规模可观察性和可调整性,可通过单一门户管理 20K+ 主机。

超级云自动化中心(SCAC)

SuperCloud Automation Center 为数据中心和边缘基础设施SuperCloud Automation Center 预构建的企业级自动化解决方案。其功能涵盖从固件和操作系统配置到Kubernetes及AI工作负载支持的全方位服务,同时确保安全性、可扩展性和治理能力。

超级云开发者体验控制台(SDX)

SuperCloud 开发者控制台是面向开发者的人工智能体验控制台,它将 GPU 即服务(GPUaaS)、 Kubernetes、机器学习管道和数据服务整合到一个工作区中。与其他仅提供基础架构的控制台不同,它通过自助式调配、AI 原生工作流和内置的可观察性,为开发人员提供交钥匙敏捷性,使团队能够更快、更安全地完成从代码到模型的转换。

超级云总监 (SCD)

SuperCloud Director 通过集成的裸机、以太网和 Infiniband 网络多租户和存储管理,提供多租户 AI 云控制,优化性能、安全性和开发人员敏捷性。与一般的云管理工具不同,该软件专为 GPU 即服务(GPUaaS)、AI 工厂部署和超大规模运营而设计。

服务和现场部署

通过从规划到持续支持的全面专业服务,加速您的数据中心部署。Supermicro 全球服务提供端到端专业知识,包括数据中心设计、解决方案验证和专业的现场部署——无论您是从零开始建设、改造空冷系统为液冷系统,还是在托管设施中进行部署。我们的集成方法可缩短上线时间,并确保更高质量的安装,同时提供持续的现场支持和针对关键任务正常运行时间的 4 小时响应选项。

了解更多

规划和验证

项目经过周密规划,包括数据中心平面图、机架布局、端口映射等设计。发货前,Supermicro 通过超越行业标准的测试,包括机架级 (L11) 和集群级 (L12) 验证。

现场部署

端到端部署始于 Supermicro 的白手套交付服务,确保无微不至的关怀。现场服务团队成员负责机架安装和堆叠,并可选择提供软件安装服务。

现场支持

Supermicro 确保部署后平稳过渡,提供完整的文档和持续支持,以确保长期成功。全球服务提供最短 4 小时现场响应时间和部件更换服务等选项。

数据中心装修服务

将数据中心外壳转变为运行环境的交钥匙解决方案。包括设计、工程、许可、从 PDU 到服务器的电气设备、带机架和 CDU 的机械系统以及液体冷却基础设施,以确保完全就绪。

建设服务

建设服务显著缩短了新建数据中心的交付周期。Supermicro 通过端到端项目管理,确保裸地建设和数据中心液冷改造项目的成功。

准备好打造人工智能的未来了吗?

立即联系Supermicro,设计您的下一代AI数据中心。

联系我们