Ir al contenido principal

El anteproyecto de los centros de datos de IA modernos

A medida que la demanda de aplicaciones avanzadas de IA sigue creciendo, los centros de datos deben evolucionar para soportar cargas informáticas masivas, cargas de trabajo de misión crítica y requisitos de refrigeración líquida, todo ello sin sacrificar la velocidad, el tiempo de actividad o la flexibilidad. La solución Data Center Building Block Solution (DCBBS) de Supermicroestá diseñada para proporcionar todo lo necesario para equipar un moderno centro de datos de IA. DCBBS se basa en una filosofía modular: sistemas complejos a partir de componentes y subsistemas validados. Desde GPU individuales hasta bastidores completos e infraestructura del lado de la instalación, Supermicro permite un despliegue integral con la máxima flexibilidad.

DCBBS

Despliegue rápido con First-to-Market

La solución de soluciones modulares para centros de datos (DCBBS) proporciona el primer acceso a las tecnologías más avanzadas -incluidas las últimas GPU, CPU, interconexiones, almacenamiento, redes y refrigeración líquida a cualquier escala- para maximizar el rendimiento, la eficiencia y el retorno de la inversión en infraestructuras.

Ventanilla única con servicios in situ

Como único socio de confianza para la infraestructura de IA, Supermicro gestiona el ciclo de vida completo, desde el diseño y el montaje hasta el despliegue in situ y la asistencia continua, lo que permite una rápida implementación del centro de datos con una capacidad mensual de más de 5.000 bastidores -incluidos más de 2.000 bastidores con refrigeración líquida- disponibles en instalaciones de producción globales.

Adaptado a sus cargas de trabajo

El ADN de Building Blocks en todas las soluciones de Supermicropermite un nivel de personalización insuperable a nivel de servidor, rack, clúster, refrigeración y potencia, adaptado a sus requisitos de carga de trabajo y aplicaciones.

Validado para un tiempo rápido de puesta en línea

Definidos como parte de las soluciones modulares del centro de datos, los bastidores están totalmente integrados y validados a nivel de clúster con las pruebas L11 y L12 para acelerar el tiempo de puesta en línea y garantizar la implantación plug-and-play.

Building Blocks a nivel de sistema

Los sistemas Supermicro se diseñan desde hace tiempo con arquitectura Building Block. Este enfoque es parte de la razón por la que Supermicro es capaz de ofrecer la cartera de servidores más amplia de la industria, lo que permite una mejor optimización a los requisitos del proyecto. Supermicro DCBBS comienza aquí a nivel de sistema. Es de vital importancia ajustar cuidadosamente la lista de materiales (BOM) del sistema porque establece el equilibrio de los recursos informáticos para todo el centro de datos. Supermicro ofrece un nivel de personalización insuperable, con la libertad de elegir subcomponentes individuales.

Familia de servidores Supermicro compatibles con aceleradores NVIDIA Blackwell

Diseño modular con infinitas posibilidades de personalización

Ajuste con precisión el equilibrio de los recursos del centro de datos con personalización hasta en las CPU, GPU, DIMM, unidades, NIC y más con varios factores de forma de chasis. Las múltiples opciones de diseño del sistema optimizan las E/S, la térmica, la alimentación y el cableado a la disposición de su centro de datos.

Amplia gama de sistemas con optimización de recursos

Building block Solution permite una amplia gama de diseños de sistemas optimizados que adoptan rápidamente tecnologías de vanguardia. Los sistemas adaptados con precisión ajustan el hardware a la aplicación, incluyendo sistemas especializados para computación de IA escalable, almacenamiento de alto rendimiento y computación de borde.

Sistemas avanzados de refrigeración

Reduzca los costes energéticos del centro de datos y aumente la IA por vatio con CPU, GPU, DIMM, conmutadores PCIe, VRM, fuentes de alimentación y mucho más refrigerados por líquido. El flujo de aire optimizado gracias a los avanzados diseños mecánicos de los chasis superan los límites de la densidad de cálculo y la eficiencia energética.

Reducción de los retos de la cadena de suministro, producción rápida

El uso común de subsistemas de bloques modulares acelera el tiempo de comercialización y elimina los cuellos de botella en la cadena de suministro. La capacidad de fabricación de Supermicro, líder en el sector, con una logística mundial, garantiza el montaje y la entrega puntual a escala.

4U NVIDIA HGX™ B200 8-GPU systemPower Supplies and High-speed NICsGPU Cold PlatesNVIDIA HGX B200 8-GPUCPU, DIMM, and PCIe Switch Cold PlatesHot-swappable High-performance Drives

Building Blocks racks y clusters

Una vez definidos los sistemas, se integran en soluciones modulares a nivel de rack, la columna vertebral organizativa de su cluster.

  • Disposición optimizada de los cables para reducir la obstrucción del flujo de aire y mejorar el rendimiento
  • Las unidades escalables permiten clústeres de 256 nodos y más
  • Topología de red sin bloqueos para una comunicación rápida de nodo a nodo

El complejo proceso de construcción de grandes clústeres de IA, como los de 256 nodos de sistema, puede simplificarse dividiéndolo en partes más pequeñas. Estas "unidades escalables" consisten en grupos de sistemas, interconectados con una topología de red optimizada, que pueden multiplicarse para alcanzar el tamaño de clúster deseado.

3 tipos de racks para servidores con refrigeración líquida: GB200 NVL72; 4U 8-GPU; 6U SuperBlade
Unidad escalable a nivel de clúster validado L11 y L12 (64 nodos con 512 GPU)
NetworkingComputeLiquid Cooling

Compute

  • 8x SYS-422GA-NBRT-LCC o AS -4126GS-NBR-LCC por rack
  • 8x NVIDIA HGX B200 8-GPU por rack
  • 64x GPUs NVIDIA B200 Tensor Core
  • 8x 1440GB HBM3e por rack
  • Opciones de almacenamiento flexibles con tejido de almacenamiento local o dedicado con soporte completo de RDMA directo de la GPU NVIDIA

Refrigeración líquida

  • Placas frías de refrigeración líquida directa al chip (DLC) Supermicro para CPU, GPU, DIMM, VRM, conmutador PCIe, PSU y más
  • Unidad de distribución de refrigerante (CDU) Supermicro de 250 kW de capacidad con PSU redundante y bombas intercambiables en caliente
  • Colectores de distribución de refrigerante (CDM) Supermicro
  • Capacidad opcional de 240 kW o 180 kW Solución líquido-aire

Redes

  • Conmutador de gestión en banda
  • Conmutador de gestión IPMI fuera de banda
  • Red no bloqueante
  • Conmutadores Spine y Leaf en el bastidor de red dedicado o en los bastidores informáticos individuales
Centro de datos e infraestructura de refrigeración líquida

Cuando todo encaja correctamente, el centro de datos se convierte en una única unidad funcional de computación. Además de los equipos informáticos, Supermicro proporciona una gestión integral del proyecto, que incluye el diseño de las disposiciones del centro de datos y las topologías de red. Tras la consulta inicial, Supermicro entrega una propuesta de proyecto adaptada a un determinado presupuesto de energía del centro de datos, objetivo de rendimiento u otros requisitos a través de DCBBS.

Supermicro DLC-2

Un recurso del centro de datos que presenta un reto igual o mayor que la potencia es la térmica y la refrigeración. Supermicro lidera el sector en tecnología de refrigeración líquida directa al chip (DLC). La infraestructura de refrigeración líquida se planifica y despliega a escala de centro de datos, incluyendo las tuberías y la torre de refrigeración líquida del lado de la instalación para la disipación del calor. DCBBS proporciona una solución total para la infraestructura DLC, que consiste en sistemas DLC, placas frías DLC, unidades de distribución de refrigeración en rack o en fila, colectores de distribución de refrigeración, torres de refrigeración y mucho más.

Ahorro de energía

Hasta 40% Ahorro en todo el centro de datos (frente a la refrigeración por aire) utilizando Supermicro DLC-2

Ahorro de agua

Hasta 40% Ahorro con el funcionamiento a 45°C del agua caliente y eliminando el agua fría y el compresor

Captación de calor del sistema

Hasta 98% Captura de calor en refrigeración líquida DLC-2 con CPU, GPU, conmutador PCIe, DIMM, VRM y PSU

Centro de datos silencioso

~50dB Reduce significativamente el ruido con menos ventiladores y velocidad de ventilación. Tan silencioso como una biblioteca

Ahorro de espacio

Hasta 60% Ahorro con más de 2,5 veces la densidad de cálculo en comparación con los sistemas refrigerados por aire

Características

Integración de soluciones

Pruebas y validación

Sistemas de refrigeración líquida

Redes y cableado

CDU, CDM y Cold Plate

Torre de refrigeración

Más información sobre el DLC-2

Unidad escalable de referencia DCBBS prevalidada y plug-and-play

Supermicro ofrece paquetes DCBBS listos para su despliegue, que incluyen:

Fábrica de IA escalable de 256 nodos

  • Basado en implantaciones probadas de los mayores clusters de IA del mundo
  • Totalmente probado y escalable
  • Configurable para tipos de aplicaciones, presupuestos de energía y recuentos de GPU.
Unidades escalables de referencia DCBBS

Nodos de cálculo x256

Sistema 4U B200 8-GPU de Supermicro con refrigeración líquida (nodo de computación)

Sistemas Supermicro NVIDIA HGX B200 de 8 GPUs para un total de 2.048 GPUs

x32 Bastidores

Rack Supermicro B200 48U

8 sistemas de refrigeración líquida 4U por rack con CDU de 250 kW y CDM vertical

x4 Unidades escalables

Clúster Supermicro B200 48U de 5 bastidores

Una unidad escalable de 512 GPU interconectadas con InfiniBand NVIDIA Quantum-2 o Ethernet Spectrum™-X de hasta 800 G.

Tejido de almacenamiento HPS

Servidor de almacenamiento All-flash Supermicro 1U petascale E3.S

Almacenamiento de alto rendimiento con los sistemas all-flash Supermicro Petascale y los sistemas de almacenamiento de carga superior/frontal Supermicro

Solución total DLC

Torre de refrigeración líquida Supermicro

Soluciones totales de refrigeración líquida con sistemas refrigerados por líquido, bastidores de alta densidad refrigerados por líquido con CDU en bastidor o en fila, y torre de refrigeración

Servicios y asistencia globales

DCBBS incluye los servicios necesarios para alcanzar rápidamente los plazos de comercialización y puesta en línea, sin tener que agotar los propios recursos de TI del cliente. Supermicro ofrece una cartera completa de soluciones modulares a nivel de servicio, como el diseño del centro de datos, la validación de la solución y el despliegue profesional in situ. Incluye asistencia in situ continuada para garantizar el éxito a largo plazo, junto con una opción de tiempo de respuesta in situ de 4 horas para el tiempo de actividad de misión crítica.

Características

Global

Servicio de asistencia

Digital

Servicio de retención de medios

Logística

De extremo a extremo

4 horas

Respuesta in situ

En el sitio

Servicio de integración

Piezas

Servicio de sustitución

Software

Además de los servicios, Supermicro cuenta con una amplia experiencia en la integración de aplicaciones de centros de datos, incluida la formación de IA, la inferencia de IA, la gestión de clústeres y la orquestación de cargas de trabajo. Supermicro proporciona servicios completos para realizar el aprovisionamiento y la validación de software basados en la pila de software del cliente. Muchos de nuestros bloques de construcción de sistemas para la infraestructura de IA cuentan con la certificación NVIDIA y aprovechan el software NVIDIA AI Enterprise.

SuperCloud Composer

Gestione toda su infraestructura, incluidos los dispositivos de terceros, de un vistazo con paneles de control de última generación. Responda y adáptese rápidamente a las necesidades dinámicas de su empresa con una flexibilidad de almacenamiento, computación y redes que se adapta a los requisitos siempre cambiantes de las cargas de trabajo.

Recursos
¿Preparado para construir el futuro de la IA?

Póngase en contacto con Supermicro hoy mismo para diseñar su centro de datos de IA de próxima generación.

Póngase en contacto con nosotros