Por qué migrar a servidores Supermicro con procesadores Intel Xeon Scalable de 4ª generación
Las capacidades básicas comparan las distintas generaciones de CPU Intel Xeon .
| 2ª generación (Cascade Lake) (serie 92xx excluida) | 3ª generación (Ice Lake) | 4ª generación (Sapphire Rapids) | Aumentar de 2ª a 4ª | |
|---|---|---|---|---|
| Núcleos máximos | 28 | 40 | 60 | 114% |
| GHz máximos en núcleos máximos | 2.7 | 2.3 | 1.9 | |
| Núcleo máximo*GHz | =28*2.7 = 75.6 | =60*1.9 = 114 | 51% | |
| Velocidad de la memoria | 2400 MHz | 3200 MHz | 4800 MHz | 100% |
| Memoria máxima por zócalo | 3 | 8TB (sólo DRAM) | 8TB (sólo DRAM) | 166% |
| Memoria de gran ancho de banda | X | X | Hasta 64 GB | N/A |
| Enlaces UPI*Rendimiento | 2 a 9,6 GT/s = 19,2 GT/s | 3 @ 11,2 GT/s = 33,6 GT/s | 4@16 GT/s = 64 GT/s | 233 % |
Gama de puntos de referencia
Aunque pueden existir puntos de referencia específicos generalmente aceptados, muchas cargas de trabajo que puede ejecutar una empresa moderna no pueden forzarse simplemente en un informe general de puntos de referencia. Los puntos de referencia pueden clasificarse en la siguiente jerarquía, desde aplicaciones de bajo nivel hasta aplicaciones completas.
Mínimo - rendimiento máximo absoluto basado en las capacidades de la CPU. Este número es el rendimiento teórico de una única CPU y generalmente puede calcularse multiplicando la velocidad de reloj por el número de núcleos por las instrucciones por reloj.
Niveles del núcleo matemático: una pequeña aplicación muy ajustada a la arquitectura de la CPU. El rendimiento máximo suele rondar el 85% del rendimiento teórico. El punto de referencia Math más común es LINPACK, que resuelve ecuaciones lineales.
Pequeñas aplicaciones - El más popular para servidores de clase empresarial que se utiliza habitualmente para probar el rendimiento del sistema es SPEC (Standard Performance Evaluation Corporation). SPEC ha sido el proveedor y recopilador de varias suites de pruebas durante más de 30 años).
Aplicaciones completas - Se ejecutan aplicaciones completas y se registra el tiempo transcurrido hasta su finalización.
Los servidores Supermicro con procesadores Intel Xeon Scalable de 4ª generación obtienen un rendimiento excelente en diversos resultados de SPEC. Específicamente,
La suite SPECcpu2017 mide el rendimiento de un sistema de las siguientes maneras:
Punto flotante: (las aplicaciones están muy centradas en el punto flotante)
- Velocidad - Se ejecuta una sola copia de cada aplicación del paquete. A continuación se calcula la "puntuación" dividiendo el tiempo hasta la finalización de una máquina de referencia.
- Tasa - El sistema se carga con muchas copias del conjunto de pruebas (normalmente igual al número de hilos), y el resultado se divide por un tiempo de una máquina de referencia.
Entero: (las aplicaciones sólo utilizan cálculos con números enteros)
- Velocidad - Se ejecuta una sola copia de cada aplicación del paquete. A continuación se calcula la "puntuación" dividiendo el tiempo hasta la finalización de una máquina de referencia.
- Tasa - El sistema se carga con muchas copias del conjunto de pruebas (normalmente igual al número de hilos), y el resultado se divide por una máquina de referencia.
Pico - El código fuente de cada aplicación puede recompilarse con banderas específicas.
Base - Se utilizan las mismas banderas del compilador para compilar todas las aplicaciones.
Resultados SPEC
Benchmarks SPEC CPU de 8 sockets Supermicro:
| Sistema | Intel Xeon | Carga de trabajo | Significado | Puntuación |
|---|---|---|---|---|
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_speed_base | El mejor sistema de 8 tomas | 13.8 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_speed_peak | El mejor sistema de 8 tomas | 14.0 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_tasa_int_base | Los 3 mejores sistemas de 8 tomas | 3510 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_rate_peak | Los 2 mejores sistemas de 8 tomas | 3560 |
| Sistema | Intel Xeon | Carga de trabajo | Significado | Puntuación |
|---|---|---|---|---|
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_rate_base | Los 2 mejores sistemas de 8 tomas | 3540 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_rate_peak | Los 2 mejores sistemas de 8 tomas | 3560 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_speed_base | El mejor sistema de 8 tomas | 343 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_speed_peak | El mejor sistema de 8 tomas | 334 |
Benchmarks SPEC CPU de 4 sockets de Supermicro:
| Sistema | Intel Xeon | Carga de trabajo | Significado | Puntuación |
|---|---|---|---|---|
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_tasa_int_base | Los 4 mejores sistemas de 4 tomas | 1930 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_rate_peak | Los 4 mejores sistemas de 4 tomas | 1970 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_speed_base | Top 3 Mejor sistema de 4 tomas | 16 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_speed_peak | Top 3 Mejor sistema de 4 tomas | 16.2 |
| Sistema | Intel Xeon | Carga de trabajo | Significado | Puntuación |
|---|---|---|---|---|
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_rate_base | Top 2 Mejor sistema de 4 tomas | 1900 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_rate_peak | Top 2 Mejor sistema de 4 tomas | 2010 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_speed_base | Top 2 Mejor sistema de 4 tomas | 387 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_speed_peak | Top 2 Mejor sistema de 4 tomas | 387 |
SPECStorage
El benchmark SPECstorage Solution 2020 mide el rendimiento de toda una configuración de almacenamiento en su interacción con cargas de trabajo basadas en aplicaciones. La última versión incluye nuevas cargas de trabajo para inteligencia artificial (IA) y genómica, capacidades ampliadas de cargas de trabajo personalizadas, una mejora masiva del escalado y un mecanismo de visualización estadística para mostrar los resultados del benchmark.
(https://www.spec.org/storage2020/press/release.html)
| Sistema | Intel Xeon | Carga de trabajo | Significado | Puntuación |
|---|---|---|---|---|
| Servidor de Hyper SYS-221H-TN24R | 8468V 8450H | Solución SPECstorage 2020 | Mejor resultado SpecStorage_2020 en imagen AI | 0.57 |
| Servidor de Hyper SYS-221H-TN24R | 8468V 8450H | Solución SPECstorage 2020 | Mejor resultado SpecStorage_2020 en SWBUILD/Jobs: 72 | 0.47 |
| SYS-221H-TN24R Hyper Storage Sever | 8468V 8450H | Solución SPECstorage 2020 | N.º 1: Liderazgo de SpecStorage_2020 en genómica según los cinco principales IDC . | 0.19 |
| SYS-221H-TN24R Hyper Storage Sever | 8468V 8450H | Solución SPECstorage 2020 | N.º 1 en SpecStorage_2020 en cuanto a liderazgo en VDA/tareas: 720 por cada uno de los cinco principales IDC . | 5.56 |
| SYS-220U-TNR con 22 nodos NVMe | 8380 8360Y | Solución SPECstorage 2020 | N.º 1 en SpecStorage_2020 en el sector del EDA y el empleo: 240 puestos de trabajo entre los cinco principales IDC . | 0.28 |
| SuperServer SYS-741GE-TNRT | 8490H | SPEChpc2021_Diminuto | Mejor resultado base de un solo nodo en el modelo MPI | 8.20 |
| SuperServer SYS-741GE-TNRT | 8490H | SPEChpc2021_Diminuto | N.º 1 en liderazgo en resultados de base de un solo nodo según el modelo OPM entre los cinco principales proveedores, según IDC | 9.24 |
| SuperServer SYS-741GE-TNRT | 8490H | SPECpower_ssj2008 | El servidor «Leadership 4U» ocupa el primer puesto entre los cinco principales proveedores según IDC | 13546 |
Benchmarks de aplicaciones completas utilizando los motores del acelerador Intel
Supermicro ha ejecutado varios benchmarks que comparan los procesadores Intel Xeon Scalable de 4ª generación con diferentes Intel Accelerator Engines activados. El gráfico a continuación muestra benchmarks reales y compara un Intel Xeon 8380 con un Intel Xeon 8490H tanto en rendimiento como en rendimiento por vatio. El Intel Accelerator Engine utilizado para el benchmark específico también se detalla. Las especificaciones de los servidores en los que se ejecutaron los benchmarks se describen al final de este documento.

Para realizar las pruebas del benchmark de inferencia ResNet 50 v1.5 se utilizóCloudDC X13 CloudDC Supermicro, y se comparó la CPU Intel Xeon con la Intel Xeon . En el gráfico que figura a continuación, la mejora en el rendimiento osciló entre 2,38 y 3,24 veces, dependiendo del conjunto de datos. Para este benchmark se utilizaron las funciones de aceleración AMX de Intel.

GrandTwin® X13 GrandTwin® Supermicrose comparó con los procesadores Intel Xeon de tercera generación y con Xeon cuarta generación, utilizando las funciones Intel® AMX. Los resultados muestran que se obtuvo una mejora de rendimiento de entre un 2,38 y un 3,24 al ejecutar la prueba de inferencia ResNet 50 v1.5.

Se observa una mejora significativa en las aplicaciones de bases de datos y análisis al pasar de un sistema Supermicro X12 con el procesador Intel Xeon de tercera generación (que utiliza 80 núcleos) al procesador Intel Xeon de cuarta generación (que utiliza 48 núcleos). Al utilizar unaUltra X12 Ultra en comparación con unaHyper X13 Hyper , se observa un aumento del rendimiento del 25 % al utilizar la base de datos ClickHouse con un 40 % menos de núcleos.

Resumen
Los procesadores Intel Xeon de cuarta generación muestran un aumento significativo del rendimiento al ejecutar aplicaciones en los sistemas Supermicro y 4 zócalos. El sistema Supermicro de ocho zócalos muestra el rendimiento más rápido jamás registrado en un solo sistema para:
- SPECcpu2017_tasa_int_base
- SPECcpu2017_int_rate_peak
- SPECcpu2017_fp_rate_base
- SPECcpu2017_fp_rate_peak
La arquitectura SMP de los servidores Supermicro de ocho y cuatro sockets es ideal para aplicaciones empresariales a gran escala que requieren muchos núcleos y memoria.
Intel mejora constantemente el rendimiento y la seguridad de generación en generación. A continuación, se presenta una comparación, cortesía de Intel, que muestra cómo Intel está mejorando su rendimiento. Los servidores Supermicro incorporan los últimos procesadores escalables Intel Xeon de 4.ª generación en toda la línea de productos, desde el edge hasta los sistemas multiprocesador que residen en el centro de datos.


