Warum auf Supermicro Server mit Intel Xeon Scalable Prozessoren der 4. Generation umsteigen
Die Basisfunktionen vergleichen die verschiedenen Generationen von Intel Xeon CPUs.
| 2. Generation (Cascade Lake) (92xx-Serie ausgeschlossen) | 3. Generation (Ice Lake) | 4. Generation (Sapphire Rapids) | Erhöhung von 2 auf 4 | |
|---|---|---|---|---|
| Maximale Kerne | 28 | 40 | 60 | 114% |
| Maximale GHz bei maximalen Kernen | 2.7 | 2.3 | 1.9 | |
| Max. Kern*GHz | =28*2.7 = 75.6 | =60*1.9 = 114 | 51% | |
| Speicher Geschwindigkeit | 2400 MHz | 3200 MHz | 4800 MHz | 100% |
| Maximaler Speicher pro Sockel | 3TB | 8TB (nur DRAM) | 8TB (nur DRAM) | 166% |
| Hoher Bandbreitenspeicher | X | X | Bis zu 64 GB | Nicht zutreffend |
| UPI Links*Leistung | 2 @ 9,6 GT/s = 19,2 GT/s | 3 @ 11,2 GT/s = 33,6 GT/s | 4@16 GT/s = 64 GT/s | 233 % |
Bereich der Benchmarks
Auch wenn es spezifische Benchmarks gibt, die allgemein anerkannt sind, lassen sich viele Arbeitslasten, die ein modernes Unternehmen ausführen kann, nicht einfach in einen allgemeinen Benchmark-Bericht zwingen. Benchmarks können in der folgenden Hierarchie kategorisiert werden, von einfachen bis hin zu vollständigen Anwendungen.
Niedrigste - absolute Höchstleistung auf der Grundlage der Fähigkeiten der CPU. Diese Zahl ist die theoretische Leistung einer einzelnen CPU und kann im Allgemeinen durch Multiplikation der Taktrate mit der Anzahl der Kerne und den Anweisungen pro Takt berechnet werden.
Math-Kernel-Ebenen - eine kleine Anwendung, die stark auf die CPU-Architektur abgestimmt ist. Die maximale Leistung beträgt in der Regel etwa 85 % der theoretischen Leistung. Der gängigste Mathematik-Benchmark ist LINPACK, der lineare Gleichungen löst.
Kleine Anwendungen - Die beliebteste für Server der Unternehmensklasse, die üblicherweise zum Testen der Systemleistung verwendet werden, ist SPEC (Standard Performance Evaluation Corporation). SPEC ist seit über 30 Jahren Anbieter und Sammler verschiedener Testsuiten.)
Vollständige Anwendungen - Vollständige Anwendungen werden ausgeführt, und die Zeit bis zur Fertigstellung wird aufgezeichnet.
Supermicro Server mit Intel Xeon Scalable Prozessoren der 4. Generation erzielen hervorragende Ergebnisse bei verschiedenen SPEC-Benchmarks. Insbesondere,
Die SPECcpu2017-Suite misst die Leistung eines Systems auf folgende Weise:
Fließkomma: (Anwendungen sind stark auf Fließkomma ausgerichtet)
- Geschwindigkeit - Von jeder Anwendung der Suite wird eine einzige Kopie ausgeführt. Die "Punktzahl" wird dann berechnet, indem die Zeit bis zur Fertigstellung eines Referenzrechners geteilt wird.
- Rate - Das System wird mit vielen Kopien der Testsuite geladen (in der Regel gleich der Anzahl der Threads), und das Ergebnis wird dann durch die Zeit einer Referenzmaschine geteilt.
Integer: (Anwendungen verwenden nur Ganzzahlberechnungen)
- Geschwindigkeit - Von jeder Anwendung der Suite wird eine einzige Kopie ausgeführt. Die "Punktzahl" wird dann berechnet, indem die Zeit bis zur Fertigstellung eines Referenzrechners geteilt wird.
- Rate - Das System wird mit vielen Kopien der Testsuite geladen (in der Regel entsprechend der Anzahl der Threads), und das Ergebnis wird dann durch eine Referenzmaschine geteilt.
Peak - Der Quellcode jeder Anwendung kann mit bestimmten Flags neu kompiliert werden.
Base - Die gleichen Compiler-Flags werden für die Kompilierung aller Anwendungen verwendet.
SPEC-Ergebnisse
Supermicro 8-Sockel SPEC CPU Benchmarks:
| System | Intel Xeon | Arbeitsbelastung | Bedeutung | Ergebnis |
|---|---|---|---|---|
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_speed_base | Bestes 8-Steckdosen-System | 13.8 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_speed_peak | Bestes 8-Steckdosen-System | 14.0 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_rate_base | Top 3 Bestes 8-Steckdosen-System | 3510 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_rate_peak | Top 2 Bestes 8-Steckdosen-System | 3560 |
| System | Intel Xeon | Arbeitsbelastung | Bedeutung | Ergebnis |
|---|---|---|---|---|
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_rate_base | Top 2 Bestes 8-Steckdosen-System | 3540 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_rate_peak | Top 2 Bestes 8-Steckdosen-System | 3560 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_speed_base | Bestes 8-Steckdosen-System | 343 |
| SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_speed_peak | Bestes 8-Steckdosen-System | 334 |
Supermicro 4-Sockel SPEC CPU Benchmarks:
| System | Intel Xeon | Arbeitsbelastung | Bedeutung | Ergebnis |
|---|---|---|---|---|
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_rate_base | Top 4 Bestes 4-Steckdosen-System | 1930 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_rate_peak | Top 4 Bestes 4-Steckdosen-System | 1970 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_speed_base | Top 3 Bestes 4-Steckdosen-System | 16 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_speed_peak | Top 3 Bestes 4-Steckdosen-System | 16.2 |
| System | Intel Xeon | Arbeitsbelastung | Bedeutung | Ergebnis |
|---|---|---|---|---|
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_rate_base | Top 2 Bestes 4-Steckdosen-System | 1900 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_rate_peak | Top 2 Bestes 4-Steckdosen-System | 2010 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_speed_base | Top 2 Bestes 4-Steckdosen-System | 387 |
| SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_speed_peak | Top 2 Bestes 4-Steckdosen-System | 387 |
SPECStorage
Der SPECstorage Solution 2020 Benchmark misst die Leistung einer gesamten Speicherkonfiguration im Zusammenspiel mit anwendungsbasierten Workloads. Die neueste Version enthält neue Workloads für künstliche IntelligenzKI) und Genomik, erweiterte benutzerdefinierte Workload-Funktionen, eine massiv verbesserte Skalierung und einen statistischen Visualisierungsmechanismus für die Anzeige von Benchmark-Ergebnissen.
(https://www.spec.org/storage2020/press/release.html)
| System | Intel Xeon | Arbeitsbelastung | Bedeutung | Ergebnis |
|---|---|---|---|---|
| SYS-221H-TN24R Hyper | 8468V 8450H | SPECstorage-Lösung 2020 | Bestes SpecStorage_2020 Ergebnis auf KI Image | 0.57 |
| SYS-221H-TN24R Hyper | 8468V 8450H | SPECstorage-Lösung 2020 | Bestes SpecStorage_2020 Ergebnis auf SWBUILD/Jobs: 72 | 0.47 |
| SYS-221H-TN24R Hyper Storage Server | 8468V 8450H | SPECstorage-Lösung 2020 | #Nr. 1 SpecStorage_2020 Führung im Bereich Genomics nach Top 5 IDC-Anbietern. | 0.19 |
| SYS-221H-TN24R Hyper Storage Server | 8468V 8450H | SPECstorage-Lösung 2020 | #1 SpecStorage_2020 Führerschaft bei VDA/Jobs: 720 pro Top 5 IDC-Anbietern. | 5.56 |
| SYS-220U-TNR mit 22 NVMe-Speicher-Knoten | 8380 8360Y | SPECstorage-Lösung 2020 | #1 SpecStorage_2020 Führung bei EDA/Arbeitsplätzen: 240 nach Top 5 IDC-Anbietern. | 0.28 |
| SuperServer SYS-741GE-TNRT | 8490H | SPEChpc2021_klein | Bestes Einzelknoten-Basisergebnis im MPI-Modell | 8.20 |
| SuperServer SYS-741GE-TNRT | 8490H | SPEChpc2021_klein | #Nr. 1 bei den Einzelknoten-Ergebnissen auf Basis des OPM-Modells unter den Top-5-Anbietern laut IDC | 9.24 |
| SuperServer SYS-741GE-TNRT | 8490H | SPECpower_ssj2008 | #Führender 4U-Server unter den Top-5-Anbietern laut IDC | 13546 |
Vollständige Anwendungsbenchmarks mit Intel Accelerator Engines
Supermicro hat mehrere Benchmarks durchgeführt, die die Intel Xeon Scalable Prozessoren der 4. Generation mit aktivierten verschiedenen Intel Accelerator Engines vergleichen. Die untenstehende Tabelle zeigt reale Benchmarks und vergleicht einen Intel Xeon 8380 mit einem Intel Xeon 8490H hinsichtlich Leistung und Leistung pro Watt. Die für den jeweiligen Benchmark verwendete Intel Accelerator Engine ist ebenfalls aufgeführt. Die Spezifikationen der Server, auf denen die Benchmarks durchgeführt wurden, sind am Ende dieses Dokuments beschrieben.

Supermicros X13 CloudDC-Server wurde zum Testen des ResNet 50 v1.5 Inference-Benchmarks eingesetzt, und der Intel Xeon 8480+ wurde mit der Intel Xeon 8380 CPU verglichen. In der untenstehenden Grafik lag der Leistungszuwachs zwischen 2,38X und 3,24X, abhängig vom Datensatz. Die AMX-Beschleunigungsfunktionen von Intel wurden für diesen Benchmark verwendet.

Supermicros X13 GrandTwin®-System wurde mit Intel Xeon Gold Prozessoren der 3. Generation und den Intel Xeon Gold Prozessoren der 4. Generation unter Verwendung der Intel® AMX-Funktionen verglichen. Die Ergebnisse zeigen, dass beim Ausführen des ResNet 50 v1.5 Inferenztests eine Beschleunigung zwischen 2,38 und 3,24 erreicht wurde.

Es gibt eine erhebliche Verbesserung für Datenbank- und Analyseanwendungen beim Wechsel von einem Supermicro X12-Generationssystem mit dem Intel Xeon Scalable Prozessor der 3. Generation (mit 80 Kernen) zu einem Intel Xeon Scalable Prozessor der 4. Generation (mit 48 Kernen). Bei Verwendung einer X12 Ultra-Plattform im Vergleich zu einer X13 Hyper-Plattform wird eine Leistungssteigerung von 25 % bei der ClickHouse-Datenbank mit 40 % weniger Kernen beobachtet.

Zusammenfassung
Die Intel Xeon Scalable Prozessoren der 4. Generation zeigen signifikante Leistungssteigerungen beim Ausführen von Anwendungen auf den Supermicro 8- und 4-Sockel-Systemen. Das Supermicro SYS-681E-TR Acht-Sockel-System zeigt die schnellste Leistung auf einem Einzelsystem, die jemals für folgende Bereiche gemessen wurde:
- SPECcpu2017_int_rate_base
- SPECcpu2017_int_rate_peak
- SPECcpu2017_fp_rate_base
- SPECcpu2017_fp_rate_peak
Die SMP-Architektur der Acht-Sockel- und Vier-Sockel-Supermicro-Server ist ideal für große Unternehmensanwendungen, die eine hohe Anzahl an Kernen und viel Arbeitsspeicher erfordern.
Intel verbessert Leistung und Sicherheit kontinuierlich von Generation zu Generation. Unten finden Sie einen Vergleich, mit freundlicher Genehmigung von Intel, der zeigt, wie Intel seine Leistung verbessert. Supermicro Server integrieren die neuesten Intel Xeon Scalable Prozessoren der 4. Generation über die gesamte Produktlinie hinweg, vom Edge bis zu Mehrprozessor-Systemen, die im Rechenzentrum angesiedelt sind.


