Por qué migrar a servidores Supermicro con procesadores Intel Xeon Scalable de 4ª generación
Las capacidades básicas comparan las distintas generaciones de CPU Intel Xeon .
| 2ª generación (Cascade Lake) (serie 92xx excluida) | 3ª generación (Ice Lake) | 4ª generación (Sapphire Rapids) | Aumentar de 2ª a 4ª | |
|---|---|---|---|---|
| Núcleos máximos | 28 | 40 | 60 | 114% |
| GHz máximos en núcleos máximos | 2.7 | 2.3 | 1.9 | |
| Núcleo máximo*GHz | =28*2.7 = 75.6 | =60*1.9 = 114 | 51% | |
| Velocidad de la memoria | 2400 MHz | 3200 MHz | 4800 MHz | 100% |
| Memoria máxima por zócalo | 3 | 8TB (sólo DRAM) | 8TB (sólo DRAM) | 166% |
| Memoria de gran ancho de banda | X | X | Hasta 64 GB | N/A |
| Enlaces UPI*Rendimiento | 2 a 9,6 GT/s = 19,2 GT/s | 3 @ 11,2 GT/s = 33,6 GT/s | 4@16 GT/s = 64 GT/s | 233 % |
Gama de puntos de referencia
Aunque pueden existir puntos de referencia específicos generalmente aceptados, muchas cargas de trabajo que puede ejecutar una empresa moderna no pueden forzarse simplemente en un informe general de puntos de referencia. Los puntos de referencia pueden clasificarse en la siguiente jerarquía, desde aplicaciones de bajo nivel hasta aplicaciones completas.
Mínimo - rendimiento máximo absoluto basado en las capacidades de la CPU. Este número es el rendimiento teórico de una única CPU y generalmente puede calcularse multiplicando la velocidad de reloj por el número de núcleos por las instrucciones por reloj.
Niveles del núcleo matemático: una pequeña aplicación muy ajustada a la arquitectura de la CPU. El rendimiento máximo suele rondar el 85% del rendimiento teórico. El punto de referencia Math más común es LINPACK, que resuelve ecuaciones lineales.
Pequeñas aplicaciones - El más popular para servidores de clase empresarial que se utiliza habitualmente para probar el rendimiento del sistema es SPEC (Standard Performance Evaluation Corporation). SPEC ha sido el proveedor y recopilador de varias suites de pruebas durante más de 30 años).
Aplicaciones completas - Se ejecutan aplicaciones completas y se registra el tiempo transcurrido hasta su finalización.
Los servidores Supermicro con procesadores Intel Xeon Scalable de 4ª generación obtienen un rendimiento excelente en diversos resultados de SPEC. Específicamente,
La suite SPECcpu2017 mide el rendimiento de un sistema de las siguientes maneras:
Punto flotante: (las aplicaciones están muy centradas en el punto flotante)
- Velocidad - Se ejecuta una sola copia de cada aplicación del paquete. A continuación se calcula la "puntuación" dividiendo el tiempo hasta la finalización de una máquina de referencia.
- Tasa - El sistema se carga con muchas copias del conjunto de pruebas (normalmente igual al número de hilos), y el resultado se divide por un tiempo de una máquina de referencia.
Entero: (las aplicaciones sólo utilizan cálculos con números enteros)
- Velocidad - Se ejecuta una sola copia de cada aplicación del paquete. A continuación se calcula la "puntuación" dividiendo el tiempo hasta la finalización de una máquina de referencia.
- Tasa - El sistema se carga con muchas copias del conjunto de pruebas (normalmente igual al número de hilos), y el resultado se divide por una máquina de referencia.
Pico - El código fuente de cada aplicación puede recompilarse con banderas específicas.
Base - Se utilizan las mismas banderas del compilador para compilar todas las aplicaciones.
Resultados SPEC
Benchmarks SPEC CPU de 8 sockets Supermicro:
| Sistema | Intel Xeon | Carga de trabajo | Significado | Puntuación |
|---|---|---|---|---|
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_speed_base | El mejor sistema de 8 tomas | 13.8 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_speed_peak | El mejor sistema de 8 tomas | 14.0 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_tasa_int_base | Los 3 mejores sistemas de 8 tomas | 3510 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_rate_peak | Los 2 mejores sistemas de 8 tomas | 3560 |
| Sistema | Intel Xeon | Carga de trabajo | Significado | Puntuación |
|---|---|---|---|---|
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_rate_base | Los 2 mejores sistemas de 8 tomas | 3540 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_rate_peak | Los 2 mejores sistemas de 8 tomas | 3560 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_speed_base | El mejor sistema de 8 tomas | 343 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_speed_peak | El mejor sistema de 8 tomas | 334 |
Benchmarks SPEC CPU de 4 sockets de Supermicro:
| Sistema | Intel Xeon | Carga de trabajo | Significado | Puntuación |
|---|---|---|---|---|
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_tasa_int_base | Los 4 mejores sistemas de 4 tomas | 1930 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_rate_peak | Los 4 mejores sistemas de 4 tomas | 1970 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_speed_base | Top 3 Mejor sistema de 4 tomas | 16 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_speed_peak | Top 3 Mejor sistema de 4 tomas | 16.2 |
| Sistema | Intel Xeon | Carga de trabajo | Significado | Puntuación |
|---|---|---|---|---|
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_rate_base | Top 2 Mejor sistema de 4 tomas | 1900 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_rate_peak | Top 2 Mejor sistema de 4 tomas | 2010 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_speed_base | Top 2 Mejor sistema de 4 tomas | 387 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_speed_peak | Top 2 Mejor sistema de 4 tomas | 387 |
SPECStorage
El benchmark SPECstorage Solution 2020 mide el rendimiento de toda una configuración de almacenamiento en su interacción con cargas de trabajo basadas en aplicaciones. La última versión incluye nuevas cargas de trabajo para inteligencia artificial (IA) y genómica, capacidades ampliadas de cargas de trabajo personalizadas, una mejora masiva del escalado y un mecanismo de visualización estadística para mostrar los resultados del benchmark.
(https://www.spec.org/storage2020/press/release.html)
| Sistema | Intel Xeon | Carga de trabajo | Significado | Puntuación |
|---|---|---|---|---|
| Servidor de Hyper SYS-221H-TN24R | 8468V 8450H | Solución SPECstorage 2020 | Mejor resultado SpecStorage_2020 en imagen AI | 0.57 |
| Servidor de Hyper SYS-221H-TN24R | 8468V 8450H | Solución SPECstorage 2020 | Mejor resultado SpecStorage_2020 en SWBUILD/Jobs: 72 | 0.47 |
| SYS-221H-TN24R Hyper Storage Sever | 8468V 8450H | Solución SPECstorage 2020 | #Nº 1 SpecStorage_2020 liderazgo en Genómica según los 5 principales proveedores de IDC. | 0.19 |
| SYS-221H-TN24R Hyper Storage Sever | 8468V 8450H | Solución SPECstorage 2020 | #Nº 1 SpecStorage_2020 liderazgo en VDA/Trabajos: 720 según los 5 principales proveedores IDC. | 5.56 |
| SYS-220U-TNR con 22 nodos de almacenamiento NVMe | 8380 8360Y | Solución SPECstorage 2020 | #1 Liderazgo SpecStorage_2020 en EDA/Trabajos: 240 según los 5 principales proveedores de IDC. | 0.28 |
| SuperServer SYS-741GE-TNRT | 8490H | SPEChpc2021_Diminuto | Mejor resultado base de un solo nodo en el modelo MPI | 8.20 |
| SuperServer SYS-741GE-TNRT | 8490H | SPEChpc2021_Diminuto | #Líder en resultados de base de nodo único en el modelo OPM entre los 5 principales proveedores según IDC | 9.24 |
| SuperServer SYS-741GE-TNRT | 8490H | SPECpower_ssj2008 | #Liderazgo nº 1 en servidores 4U entre los 5 principales proveedores según IDC | 13546 |
Benchmarks de aplicaciones completas utilizando los motores del acelerador Intel
Supermicro ha ejecutado varios benchmarks que comparan los procesadores Intel Xeon Scalable de 4ª generación con diferentes Intel Accelerator Engines activados. El gráfico a continuación muestra benchmarks reales y compara un Intel Xeon 8380 con un Intel Xeon 8490H tanto en rendimiento como en rendimiento por vatio. El Intel Accelerator Engine utilizado para el benchmark específico también se detalla. Las especificaciones de los servidores en los que se ejecutaron los benchmarks se describen al final de este documento.

El servidor X13 CloudDC de Supermicro se utilizó para probar el benchmark de inferencia ResNet 50 v1.5, y el Intel Xeon 8480+ se comparó con la CPU Intel Xeon 8380. En el gráfico siguiente, la ganancia de rendimiento fue de 2.38X a 3.24X, dependiendo del conjunto de datos. Para este benchmark se utilizaron las características de aceleración AMX de Intel.

Se comparó el sistema X13 GrandTwin® de Supermicro con procesadores Intel Xeon Gold de 3.ª generación y procesadores Intel Xeon Gold de 4.ª generación utilizando las características Intel® AMX. Los resultados demuestran una aceleración entre 2.38 y 3.24 veces al ejecutar la prueba de inferencia ResNet 50 v1.5.

Se observa una mejora significativa para las aplicaciones de bases de datos y análisis al pasar de un sistema Supermicro de generación X12 con el procesador Intel Xeon Scalable de 3.ª generación (utilizando 80 núcleos) al procesador Intel Xeon Scalable de 4.ª generación (utilizando 48 núcleos). Al utilizar una plataforma X12 Ultra en comparación con una plataforma X13 Hyper, se observa una mejora del rendimiento del 25% utilizando la base de datos ClickHouse con un 40% menos de núcleos.

Resumen
Los procesadores Intel Xeon de cuarta generación muestran un aumento significativo del rendimiento al ejecutar aplicaciones en los sistemas Supermicro y 4 zócalos. El sistema Supermicro de ocho zócalos muestra el rendimiento más rápido jamás registrado en un solo sistema para:
- SPECcpu2017_tasa_int_base
- SPECcpu2017_int_rate_peak
- SPECcpu2017_fp_rate_base
- SPECcpu2017_fp_rate_peak
La arquitectura SMP de los servidores Supermicro de ocho y cuatro sockets es ideal para aplicaciones empresariales a gran escala que requieren muchos núcleos y memoria.
Intel mejora constantemente el rendimiento y la seguridad de generación en generación. A continuación, se presenta una comparación, cortesía de Intel, que muestra cómo Intel está mejorando su rendimiento. Los servidores Supermicro incorporan los últimos procesadores escalables Intel Xeon de 4.ª generación en toda la línea de productos, desde el edge hasta los sistemas multiprocesador que residen en el centro de datos.


