Was kommt als Nächstes?
Bei mehr als 400 Weltrekorden fragen Sie sich vielleicht, wie AMD die AMD EPYC™ Prozessoren noch verbessern kann.1 Wie kann man einige der leistungsstärksten Server-Prozessoren, die jemals geschaffen wurden, weiter steigern?1 Ganz einfach mit der „Zen 5“-Architektur und all den Vorteilen, die diese für Kunden bietet.
Wir stellen vor: AMD EPYC™ Prozessoren der 5. Generation
Die AMD EPYC™ Prozessoren der 5. Generation sind ausgelegt auf die Welt der KI und kritische Geschäftsauslastungen und liefern die nächste Generation von Server-CPUs in einer Familie, die schon Hunderte von Weltrekorden im Bereich Performance und Effizienz aufgestellt hat.1 Anknüpfend an diese Erfolgsgeschichte ermöglichen AMD EPYC™ 9005-Serie Prozessoren dank ihrer „Zen 5“-Architektur bahnbrechende Performance.
Mit bis zu 192 Kernen, 384 Threads und 5 GHz max. Boost.-Frequenzen können Kunden erwarten, dass diese neuen Prozessoren praktisch jeden Geschäftsbedarf unterstützen können.2 Sie bieten nicht nur mehr Kerne als die EPYC Produkte der vorherigen Generation und noch höhere Frequenzen, sondern unterstützen auch einen schnelleren DRAM für erweiterte Funktionen bei speicherintensiven Auslastungen.
Leicht zugängliche und einfach bereitzustellende Server, die AMD EPYC Prozessoren der 5. Generation nutzen, bieten führende Performance, Dichte und Effizienz und unterstützen so Bereitstellungen in allen Bereichen, von KI-Initiativen von Unternehmen über geschäftskritische Anwendungen bis hin zur Fähigkeit, große Cloud-basierte Infrastrukturen anzutreiben.
Es handelt sich um ein Angebot, das durch die bekannte x86-Softwarekompatibilität vereint wird, damit Kunden ganz nach individuellem Bedarf bereitstellen können. Dazu gehört eine gängige ISA, die das Alltagsgeschäft ohne große x86-Softwaremodifikationen unterstützt.
Systeme, die auf AMD EPYC 9005 Prozessoren basieren, unterstützen verschiedene Initiativen von der Konsolidierung und Modernisierung von Rechenzentren bis zu den stetig wachsenden Anforderungen von Unternehmensanwendungen. All dies ist möglich dank der hocheffizienten „Zen 5“-Architektur, einer überzeugenden Plattform, die nicht nur auf die wachsenden KI-Anforderungen im Unternehmensbereich zugeschnitten ist, sondern auch Unternehmen bei ihrem Ziel unterstützt, die Energieeffizienz zu verbessern und den Wildwuchs im Rechenzentrum einzudämmen.
Es ist eine Server-CPU, die in puncto Performance, Effizienz und Ergebnis keine Wünsche offenlässt.
Modellnr. |
Kerne |
Max. Threads |
L3-Cache (MB) |
Standard-TDP (W) |
DDR-Kanäle/Max. Speicherkapazität (2DPC) |
Max. DDR5-Freq. (MHz) (1DPC) |
PCIe® Gen 5 (Lanes) |
Sockeldichte |
9965 |
192 |
384 |
384 |
500 |
12/9 TB |
6000 |
160 |
2 |
9845 |
160 |
320 |
320 |
400 |
12/9 TB |
6000 |
160 |
2 |
9825 |
144 |
288 |
384 |
400 |
12/9 TB |
6000 |
160 |
2 |
9755 |
128 |
256 |
512 |
500 |
12/9 TB |
6000 |
160 |
2 |
9745 |
128 |
256 |
256 |
400 |
12/9 TB |
6000 |
160 |
2 |
9655 |
96 |
192 |
384 |
400 |
12/9 TB |
6000 |
160 |
2 |
9645 |
96 |
192 |
256 |
320 |
12/9 TB |
6000 |
160 |
2 |
9655P |
96 |
192 |
384 |
320 |
12/9 TB |
6000 |
128 |
1 |
9565 |
72 |
144 |
384 |
400 |
12/9 TB |
6000 |
160 |
2 |
9575F |
64 |
128 |
256 |
400 |
12/9 TB |
6000 |
160 |
2 |
9555 |
64 |
128 |
256 |
360 |
12/9 TB |
6000 |
160 |
2 |
9555P |
64 |
128 |
256 |
320 |
12/9 TB |
6000 |
128 |
1 |
9535 |
64 |
128 |
256 |
300 |
12/9 TB |
6000 |
160 |
2 |
9475F |
48 |
96 |
256 |
360 |
12/9 TB |
6000 |
160 |
2 |
9455 |
48 |
96 |
256 |
300 |
12/9 TB |
6000 |
160 |
2 |
9455P |
48 |
96 |
192 |
300 |
12/9 TB |
6000 |
128 |
1 |
9365 |
36 |
72 |
192 |
300 |
12/9 TB |
6000 |
160 |
2 |
9375F |
32 |
64 |
256 |
320 |
12/9 TB |
6000 |
160 |
2 |
9355 |
32 |
64 |
256 |
280 |
12/9 TB |
6000 |
160 |
2 |
9355P |
32 |
64 |
256 |
280 |
12/9 TB |
6000 |
128 |
1 |
9335 |
32 |
64 |
192 |
210 |
12/9 TB |
6000 |
160 |
2 |
9275F |
24 |
48 |
256 |
320 |
12/9 TB |
6000 |
160 |
2 |
9255 |
24 |
48 |
128 |
200 |
12/9 TB |
6000 |
160 |
2 |
9175F |
16 |
32 |
256 |
320 |
12/9 TB |
6000 |
160 |
2 |
9135 |
16 |
32 |
128 |
200 |
12/9 TB |
6000 |
160 |
2 |
9125 |
8 |
16 |
256 |
165 |
12/9 TB |
6000 |
160 |
2 |
9015 |
8 |
16 |
64 |
155 |
12/9 TB |
6000 |
160 |
2 |
Performance: Ein klares Bild für Kunden zeichnen
Da KI im Geschäft eine immer wichtigere Rolle spielt, müssen Kunden darauf vertrauen können, dass ihre Serverinfrastruktur den dadurch entstehenden Anforderungen neben den bestehenden Auslastungen gerecht werden kann.
Neue AMD EPYC Prozessoren, wie der AMD EPYC™ 9575F Prozessor, liefern zweistellige Steigerungen bei der IPC-Performance (Instruction-per-Cycle, Instruktionen pro Zyklus) im Vergleich zur vorherigen Generation, und der neueste „Zen 5“-Kern in den AMD EPYC Prozessoren der 5. Generation liefert deutliche Verbesserungen bei ML-, HPC- und Unternehmensauslastungen.3
Im Vergleich zu Produkten der Konkurrenz helfen diese neuen Prozessoren den Unternehmen, unglaubliche Ergebnisse zu erzielen, wie z. B. bahnbrechende durchgängige KI-Durchsatz-Performance bei einer Vielzahl von Anwendungsfällen. Bei der TPCx-AI Benchmark liefern z. B. 2P-Server mit AMD EPYC™ 9965 Prozessoren (192 Kerne) bis zu ~3,8-mal mehr KI-Testfälle pro Minute als 2P-Server mit Intel Xeon Platinum 8592+ (64 Kerne) bei AMD Tests.4
Wenn GPU-Beschleuniger gehostet werden, erreichen zwei AMD EPYC 9575F CPUs bis zu 20 % mehr Inferenzanfragen und 15 % schnellere Trainingszeit als zwei Intel® Xeon® 8592+ CPUs bei Ausführung von Llama3.1.5,6
Auch wenn die Performance überragend ist, bedeutet dies nicht, dass es Abstriche bei der Effizienz gibt. AMD EPYC 9005-Serie Prozessoren bieten energieeffiziente Serverlösungen. Tatsächlich liefern 2P-Server mit AMD EPYC 9965 CPUs 1,8-mal mehr geschätzte Integer Performance pro CPU-Watt als 2P-Server mit Intel® Xeon® 8592+ CPUs.7
Eine neue Generation hochmoderner AMD EPYC Prozessoren ist da, um die Art und Weise, wie Arbeit erledigt wird, zu verändern. Im Zeitalter von KI können es sich Ihre Kunden nicht leisten, in Rückstand zu geraten. Wenden Sie sich an Ihren AMD Ansprechpartner oder besuchen Sie AMD.com, um mehr zu erfahren.
Weitere Ressourcen
AMD Arena
Erweitern Sie Ihr AMD Produktwissen durch Schulungen zu AMD Ryzen™ PRO, AMD EPYC™, AMD Instinct™ und weiteren.
Anmelden
Erhalten Sie monatliche Updates zu den neuesten Produkten, Schulungen und „Meet the Experts“-Online-Seminaren von AMD.

Verwandte Artikel
Fußnoten
Eine vollständige Liste der Performance-Weltrekorde der AMD EPYC Prozessoren finden Sie unter amd.com/worldrecords.
Max. Boost für AMD EPYC Prozessoren ist die maximal erreichbare Taktfrequenz eines einzelnen Kerns auf dem Prozessor unter normalen Betriebsbedingungen für Serversysteme. EPYC-018
9xx5-001: Basierend auf internen Tests von AMD vom 10.09.2024, Performance-Verbesserung im geometrischen Mittel (IPC) bei Festfrequenz.
- EPYC CPU der 5. Generation IPC-Steigerung im Generationsvergleich bei Unternehmens- und Cloud-Serverauslastungen von 1,170 x (geometrisches Mittel) mit ausgewähltem Satz von 36 Auslastungen und geometrisches Mittel der geschätzten Bewertung für Gesamt- und alle Teilmengen von SPECrate®2017_int_base (geometrisches Mittel), geschätzte Bewertungen für Gesamt- und alle Teilmengen von SPECrate®2017_fp_base (geometrisches Mittel), Bewertungen für serverseitige Java Multi-Instanz max. Vorgänge/Sek, repräsentative Cloud-Server-Auslastungen (geometrisches Mittel) und repräsentative Unternehmensserverauslastungen (geometrisches Mittel).
„Genoa“ Konfiguration (alle NPS1): EPYC 9654 BIOS TQZ1005D 12c12t (1c1t/CCD in 12+1), FF 3 GHz, 12 x DDR5-4800 (2Rx4 64 GB), 32 Gbit/s xGMI;
„Turin“ Konfiguration (alle NPS1): EPYC 9V45 BIOS RVOT1000F 12c12t (1c1t/CCD in 12+1), FF 3 GHz, 12 x DDR5-6000 (2Rx4 64 GB), 32 Gbit/s xGMI
Unter Verwendung von Performance-Determinismus und dem Performance-Governor auf Ubuntu® 22.04 mit 6.8.0-40-generic kernel Betriebssystem für alle Auslastungen.
- EPYC der 5. Generation IPC-Steigerung im Generationsvergleich bei ML-/HPC-Server-Auslastungen von 1,369 x (geometrisches Mittel) mit ausgewähltem Satz von 24 Auslastungen und geometrisches Mittel von repräsentativen ML-Server-Auslastungen (geometrisches Mittel) und repräsentativen HPC-Server-Auslastungen (geometrisches Mittel).
„Genoa“ Konfiguration (alle NPS1) „Genoa“ Konfiguration: EPYC 9654 BIOS TQZ1005D 12c12t (1c1t/CCD in 12+1), FF 3 GHz, 12 x DDR5-4800 (2Rx4 64 GB), 32 Gbit/s xGMI;
„Turin“ Konfiguration (alle NPS1): EPYC 9V45 BIOS RVOT1000F 12c12t (1c1t/CCD in 12+1), FF 3 GHz, 12 x DDR5-6000 (2Rx4 64 GB), 32 Gbit/s xGMI
Unter Verwendung von Performance-Determinismus und dem Performance-Governor auf 22.04 mit 6.8.0-40-generic kernel Betriebssystem für alle Auslastungen mit Ausnahme von LAMMPS, HPCG, NAMD, OpenFOAM, Gromacs, die 24.04 mit 6.8.0-40-generic kernel verwenden.
SPEC® und SPECrate® sind eingetragene Marken der Standard Performance Evaluation Corporation. Weitere Informationen unter spec.org.
- 9xx5-012: TPCxAI @SF30 Multi-Instanz mit 32 Kernen Instanzgröße-Durchsatzergebnisse basierend auf internen Tests von AMD vom 05.09.2024 bei Ausführung mehrerer VM-Instanzen. Der aggregierte durchgängige KI-Durchsatztest ist vom TPCx-AI-Benchmark abgeleitet und als solcher nicht mit den veröffentlichten TPCx-AI-Ergebnissen vergleichbar, da die Ergebnisse des durchgängigen KI-Durchsatztests nicht der TPCx-AI-Spezifikation entsprechen.
2P AMD EPYC 9965 (384 Kerne gesamt), 12 Instanzen mit 32 Kernen, NPS1, 1,5 TB 24 x 64 GB DDR5-6400 (bei 6000 MT/s), 1DPC, 1.0 Gbit/s NetXtreme BCM5720 Gigabit Ethernet PCIe, 3,5 TB Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu® 22.04.4 LTS, 6.8.0-40-generic (tuned-adm profile throughput-performance, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C (SMT = off, Determinism = Power, Turbo Boost = Enabled)
2P AMD EPYC 9755 (256 Kerne gesamt), 8 Instanzen mit 32 Kernen, NPS1, 1,5 TB 24 x 64 GB DDR5-6400 (bei 6000 MT/s), 1DPC, 1,0 Gbit/s NetXtreme BCM5720 Gigabit Ethernet PCIe, 3,5 TB Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu 22.04.4 LTS, 6.8.0-40-generic (tuned-adm profile throughput-performance, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT0090F (SMT = off, Determinism = Power, Turbo Boost = Enabled)
2P AMD EPYC 9654 (192 Kerne gesamt), 6 Instanzen mit 32 Kernen, NPS1, 1,5 TB 24 x 64 GB DDR5-4800, 1DPC, 2 x 1,92 TB Samsung MZQL21T9HCJR-00A07 NVMe, Ubuntu 22.04.3 LTS, BIOS 1006C (SMT = off, Determinism = Power)
Im Vergleich zu 2P Xeon Platinum 8592+ (128 Kerne gesamt), 4 Instanzen mit 32 Kernen, AMX Ein, 1 TB 16 x 64 GB DDR5-5600, 1DPC, 1,0 Gbit/s NetXtreme BCM5719 Gigabit Ethernet PCIe, 3,84 TB KIOXIA KCMYXRUG3T84 NVMe, Ubuntu 22.04.4 LTS, 6.5.0-35 generic (tuned-adm profile throughput-performance, ulimit -l 132065548, ulimit -n 1024, ulimit -s 8192), BIOS ESE122V (SMT = off, Determinism = Power, Turbo Boost = Enabled)
Ergebnisse:
CPU Median Relative Generational
Turin 192 Kerne, 12 Instanzen 6067,531 3,775 2,278
Turin 128 Kerne, 8 Instanzen 4091,85 2,546 1,536
Genoa 96 Kerne, 6 Instanzen 2663,14 1,657 1
EMR 64 Kerne, 4 Instanzen 1607,417 1 NA
Die Ergebnisse können abhängig von Faktoren wie Systemkonfiguration, Softwareversion und BIOS-Einstellungen variieren. TPC, TPC Benchmark und TPC-C sind Marken des Transaction Processing Performance Council.
- 9xx5-014: Llama3.1-70B-Inferenz-Durchsatzergebnisse basierend auf internen Tests von AMD vom 01.09.2024.
Llama3.1-70B-Konfigurationen: TensorRT-LLM 0.9.0, nvidia/cuda 12.5.0-devel-ubuntu22.04, FP8, Eingangs-/Ausgangs-Token-Konfigurationen (Anwendungsfälle): [BS=1024 E/A=128/128, BS=1024 E/A=128/2048, BS=96 E/A=2048/128, BS=64 E/A=2048/2048]. Ergebnisse in Token/Sekunde.
2P AMD EPYC 9575F (128 Kerne gesamt) mit 8 x NVIDIA H100 80 GB HBM3, 1,5 TB 24 x 64 GB DDR5-6000, 1,0 Gbit/s 3 TB Micron_9300_MTFDHAL3T8TDP NVMe®, BIOS T20240805173113 (Determinism = Power, SR-IOV = On), Ubuntu 22.04.3 LTS, kernel = 5.15.0-117-generic (mitigations = off, cpupower frequency-set -g performance, cpupower idle-set -d 2, echo 3> /proc/syss/vm/drop_caches),
2P Intel Xeon Platinum 8592+ (128 Kerne gesamt) mit 8 x NVIDIA H100 80 GB HBM3, 1 TB 16 x 64 GB DDR5-5600, 3,2 TB Dell Ent NVMe® PM1735a MU, Ubuntu 22.04.3 LTS, kernel-5.15.0-118-generic, (processor.max_cstate = 1, intel_idle.max_cstate = 0 mitigations = off, cpupower frequency-set -g performance), BIOS 2.1, (Max. Performance, SR-IOV = On),
E/A-Token Batch-Größe EMR Turin Relative
128/128 1024 814,678 1101,966 1,353
128/2048 1024 2120,664 2331,776 1,1
2048/128 96 114,954 146,187 1,272
2048/2048 64 333,325 354,208 1,063
Für eine durchschnittliche Durchsatzsteigerung von 1,197 x.
Die Ergebnisse können abhängig von Faktoren wie Systemkonfiguration, Softwareversion und BIOS-Einstellungen variieren.
- 9xx5-015: Llama3.1-8B (BF16, max. Sequenzlänge 1024) Training Testergebnisse basierend auf internen Tests von AMD vom 05.09.2024.
Llama3.1-8B-Konfigurationen: Max. Sequenzlänge 1024, BF16, Docker: huggingface/transformers-pytorch-gpu:latest
2P AMD EPYC 9575F (128 Kerne gesamt) mit 8 x NVIDIA H100 80 GB HBM3, 1,5 TB 24 x 64 GB DDR5-6000, 1,0 Gbit/s 3 TB Micron_9300_MTFDHAL3T8TDP NVMe®, BIOS T20240805173113 (Determinism = Power, SR-IOV = On), Ubuntu 22.04.3 LTS, kernel = 5.15.0-117-generic (mitigations = off, cpupower frequency-set -g performance, cpupower idle-set -d 2, echo 3> /proc/syss/vm/drop_caches),
Für 31,79 Trainingsbeispiele/Sekunde
2P Intel Xeon Platinum 8592+ (128 Kerne gesamt) mit 8 x NVIDIA H100 80 GB HBM3, 1 TB 16 x 64 GB DDR5-5600, 3,2 TB Dell Ent NVMe® PM1735a MU, Ubuntu 22.04.3 LTS, kernel-5.15.0-118-generic, (processor.max_cstate = 1, intel_idle.max_cstate = 0 mitigations = off, cpupower frequency-set -g performance), BIOS 2.1, (Max. Performance, SR-IOV = On),
Für 27,74 Trainingsbeispiele/Sekunde
Für eine durchschnittliche Durchsatzsteigerung von 1,146.
Die Ergebnisse können abhängig von Faktoren wie Systemkonfiguration, Softwareversion und BIOS-Einstellungen variieren.
- 9xx5-002a: SPECrate®2017_int_base-Vergleich basierend auf internen geschätzten Messungen der Referenzplattform von AMD und veröffentlichten Bewertungen von www.spec.org vom 05.09.2024.
Vergleich von 2P AMD EPYC 9965 (2870 geschätzte SPECrate®2017_int_base, 384 Kerne gesamt, 500 W TDP) 1,5 TB 24 x 64 GB 2Rx4 PC5-6400B-R ausgeführt bei 6000 MT/s, 3,84 TB NVMe, Ubuntu® 24.04 LTS Kernel 6.8.30-41-generic, AOCC v5.0.0, 5.740 est SPECrate®2017_int_base/CPU-W)
2P Intel Xeon Platinum 8592+ (1130 SPECrate®2017_int_base, 128 Kerne gesamt, 350 W TDP) 3.229 SPECrate®2017_int_base/CPU-W, http://spec.org/cpu2017/results/res2023q4/cpu2017-20231127-40064.html)
EPYC 9965 im Vergleich zu 8592+
- geschätzt 2,540 x der Performance
- 1,778 x der geschätzten Performance/CPU-W
Veröffentlichte 2P AMD EPYC 9754 (1950 SPECrate®2017_int_base, 256 Kerne gesamt, 360 W TDP) 5.417 SPECrate®2017_int_base/CPU-W, http://spec.org/cpu2017/results/res2023q2/cpu2017-20230522-36617.html)
EPYC 9754 im Vergleich zu 8592+
- 1,725 x der Performance
- 1,678 x der Performance/CPU-W
Im Generationsvergleich (EPYC 9965 im Vergleich zu EPYC 9754)
- ist 1,472 x die Performance
- bei 1,060 x der Performance/CPU-W
SPEC®, SPEC CPU® und SPECrate® sind eingetragene Marken der Standard Performance Evaluation Corporation. Weitere Informationen auf www.spec.org. Intel CPU TDP unter https://ark.intel.com/.
Eine vollständige Liste der Performance-Weltrekorde der AMD EPYC Prozessoren finden Sie unter amd.com/worldrecords.
Max. Boost für AMD EPYC Prozessoren ist die maximal erreichbare Taktfrequenz eines einzelnen Kerns auf dem Prozessor unter normalen Betriebsbedingungen für Serversysteme. EPYC-018
9xx5-001: Basierend auf internen Tests von AMD vom 10.09.2024, Performance-Verbesserung im geometrischen Mittel (IPC) bei Festfrequenz.
- 9xx5-012: TPCxAI @SF30 Multi-Instanz mit 32 Kernen Instanzgröße-Durchsatzergebnisse basierend auf internen Tests von AMD vom 05.09.2024 bei Ausführung mehrerer VM-Instanzen. Der aggregierte durchgängige KI-Durchsatztest ist vom TPCx-AI-Benchmark abgeleitet und als solcher nicht mit den veröffentlichten TPCx-AI-Ergebnissen vergleichbar, da die Ergebnisse des durchgängigen KI-Durchsatztests nicht der TPCx-AI-Spezifikation entsprechen.
- 9xx5-014: Llama3.1-70B-Inferenz-Durchsatzergebnisse basierend auf internen Tests von AMD vom 01.09.2024.
- 9xx5-015: Llama3.1-8B (BF16, max. Sequenzlänge 1024) Training Testergebnisse basierend auf internen Tests von AMD vom 05.09.2024.
- 9xx5-002a: SPECrate®2017_int_base-Vergleich basierend auf internen geschätzten Messungen der Referenzplattform von AMD und veröffentlichten Bewertungen von www.spec.org vom 05.09.2024.
- EPYC CPU der 5. Generation IPC-Steigerung im Generationsvergleich bei Unternehmens- und Cloud-Serverauslastungen von 1,170 x (geometrisches Mittel) mit ausgewähltem Satz von 36 Auslastungen und geometrisches Mittel der geschätzten Bewertung für Gesamt- und alle Teilmengen von SPECrate®2017_int_base (geometrisches Mittel), geschätzte Bewertungen für Gesamt- und alle Teilmengen von SPECrate®2017_fp_base (geometrisches Mittel), Bewertungen für serverseitige Java Multi-Instanz max. Vorgänge/Sek, repräsentative Cloud-Server-Auslastungen (geometrisches Mittel) und repräsentative Unternehmensserverauslastungen (geometrisches Mittel).
„Genoa“ Konfiguration (alle NPS1): EPYC 9654 BIOS TQZ1005D 12c12t (1c1t/CCD in 12+1), FF 3 GHz, 12 x DDR5-4800 (2Rx4 64 GB), 32 Gbit/s xGMI;
„Turin“ Konfiguration (alle NPS1): EPYC 9V45 BIOS RVOT1000F 12c12t (1c1t/CCD in 12+1), FF 3 GHz, 12 x DDR5-6000 (2Rx4 64 GB), 32 Gbit/s xGMI
Unter Verwendung von Performance-Determinismus und dem Performance-Governor auf Ubuntu® 22.04 mit 6.8.0-40-generic kernel Betriebssystem für alle Auslastungen.
- EPYC der 5. Generation IPC-Steigerung im Generationsvergleich bei ML-/HPC-Server-Auslastungen von 1,369 x (geometrisches Mittel) mit ausgewähltem Satz von 24 Auslastungen und geometrisches Mittel von repräsentativen ML-Server-Auslastungen (geometrisches Mittel) und repräsentativen HPC-Server-Auslastungen (geometrisches Mittel).
„Genoa“ Konfiguration (alle NPS1) „Genoa“ Konfiguration: EPYC 9654 BIOS TQZ1005D 12c12t (1c1t/CCD in 12+1), FF 3 GHz, 12 x DDR5-4800 (2Rx4 64 GB), 32 Gbit/s xGMI;
„Turin“ Konfiguration (alle NPS1): EPYC 9V45 BIOS RVOT1000F 12c12t (1c1t/CCD in 12+1), FF 3 GHz, 12 x DDR5-6000 (2Rx4 64 GB), 32 Gbit/s xGMI
Unter Verwendung von Performance-Determinismus und dem Performance-Governor auf 22.04 mit 6.8.0-40-generic kernel Betriebssystem für alle Auslastungen mit Ausnahme von LAMMPS, HPCG, NAMD, OpenFOAM, Gromacs, die 24.04 mit 6.8.0-40-generic kernel verwenden.
SPEC® und SPECrate® sind eingetragene Marken der Standard Performance Evaluation Corporation. Weitere Informationen unter spec.org.
2P AMD EPYC 9965 (384 Kerne gesamt), 12 Instanzen mit 32 Kernen, NPS1, 1,5 TB 24 x 64 GB DDR5-6400 (bei 6000 MT/s), 1DPC, 1.0 Gbit/s NetXtreme BCM5720 Gigabit Ethernet PCIe, 3,5 TB Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu® 22.04.4 LTS, 6.8.0-40-generic (tuned-adm profile throughput-performance, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C (SMT = off, Determinism = Power, Turbo Boost = Enabled)
2P AMD EPYC 9755 (256 Kerne gesamt), 8 Instanzen mit 32 Kernen, NPS1, 1,5 TB 24 x 64 GB DDR5-6400 (bei 6000 MT/s), 1DPC, 1,0 Gbit/s NetXtreme BCM5720 Gigabit Ethernet PCIe, 3,5 TB Samsung MZWLO3T8HCLS-00A07 NVMe®, Ubuntu 22.04.4 LTS, 6.8.0-40-generic (tuned-adm profile throughput-performance, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT0090F (SMT = off, Determinism = Power, Turbo Boost = Enabled)
2P AMD EPYC 9654 (192 Kerne gesamt), 6 Instanzen mit 32 Kernen, NPS1, 1,5 TB 24 x 64 GB DDR5-4800, 1DPC, 2 x 1,92 TB Samsung MZQL21T9HCJR-00A07 NVMe, Ubuntu 22.04.3 LTS, BIOS 1006C (SMT = off, Determinism = Power)
Im Vergleich zu 2P Xeon Platinum 8592+ (128 Kerne gesamt), 4 Instanzen mit 32 Kernen, AMX Ein, 1 TB 16 x 64 GB DDR5-5600, 1DPC, 1,0 Gbit/s NetXtreme BCM5719 Gigabit Ethernet PCIe, 3,84 TB KIOXIA KCMYXRUG3T84 NVMe, Ubuntu 22.04.4 LTS, 6.5.0-35 generic (tuned-adm profile throughput-performance, ulimit -l 132065548, ulimit -n 1024, ulimit -s 8192), BIOS ESE122V (SMT = off, Determinism = Power, Turbo Boost = Enabled)
Ergebnisse:
CPU Median Relative Generational
Turin 192 Kerne, 12 Instanzen 6067,531 3,775 2,278
Turin 128 Kerne, 8 Instanzen 4091,85 2,546 1,536
Genoa 96 Kerne, 6 Instanzen 2663,14 1,657 1
EMR 64 Kerne, 4 Instanzen 1607,417 1 NA
Die Ergebnisse können abhängig von Faktoren wie Systemkonfiguration, Softwareversion und BIOS-Einstellungen variieren. TPC, TPC Benchmark und TPC-C sind Marken des Transaction Processing Performance Council.
Llama3.1-70B-Konfigurationen: TensorRT-LLM 0.9.0, nvidia/cuda 12.5.0-devel-ubuntu22.04, FP8, Eingangs-/Ausgangs-Token-Konfigurationen (Anwendungsfälle): [BS=1024 E/A=128/128, BS=1024 E/A=128/2048, BS=96 E/A=2048/128, BS=64 E/A=2048/2048]. Ergebnisse in Token/Sekunde.
2P AMD EPYC 9575F (128 Kerne gesamt) mit 8 x NVIDIA H100 80 GB HBM3, 1,5 TB 24 x 64 GB DDR5-6000, 1,0 Gbit/s 3 TB Micron_9300_MTFDHAL3T8TDP NVMe®, BIOS T20240805173113 (Determinism = Power, SR-IOV = On), Ubuntu 22.04.3 LTS, kernel = 5.15.0-117-generic (mitigations = off, cpupower frequency-set -g performance, cpupower idle-set -d 2, echo 3> /proc/syss/vm/drop_caches),
2P Intel Xeon Platinum 8592+ (128 Kerne gesamt) mit 8 x NVIDIA H100 80 GB HBM3, 1 TB 16 x 64 GB DDR5-5600, 3,2 TB Dell Ent NVMe® PM1735a MU, Ubuntu 22.04.3 LTS, kernel-5.15.0-118-generic, (processor.max_cstate = 1, intel_idle.max_cstate = 0 mitigations = off, cpupower frequency-set -g performance), BIOS 2.1, (Max. Performance, SR-IOV = On),
E/A-Token Batch-Größe EMR Turin Relative
128/128 1024 814,678 1101,966 1,353
128/2048 1024 2120,664 2331,776 1,1
2048/128 96 114,954 146,187 1,272
2048/2048 64 333,325 354,208 1,063
Für eine durchschnittliche Durchsatzsteigerung von 1,197 x.
Die Ergebnisse können abhängig von Faktoren wie Systemkonfiguration, Softwareversion und BIOS-Einstellungen variieren.
Llama3.1-8B-Konfigurationen: Max. Sequenzlänge 1024, BF16, Docker: huggingface/transformers-pytorch-gpu:latest
2P AMD EPYC 9575F (128 Kerne gesamt) mit 8 x NVIDIA H100 80 GB HBM3, 1,5 TB 24 x 64 GB DDR5-6000, 1,0 Gbit/s 3 TB Micron_9300_MTFDHAL3T8TDP NVMe®, BIOS T20240805173113 (Determinism = Power, SR-IOV = On), Ubuntu 22.04.3 LTS, kernel = 5.15.0-117-generic (mitigations = off, cpupower frequency-set -g performance, cpupower idle-set -d 2, echo 3> /proc/syss/vm/drop_caches),
Für 31,79 Trainingsbeispiele/Sekunde
2P Intel Xeon Platinum 8592+ (128 Kerne gesamt) mit 8 x NVIDIA H100 80 GB HBM3, 1 TB 16 x 64 GB DDR5-5600, 3,2 TB Dell Ent NVMe® PM1735a MU, Ubuntu 22.04.3 LTS, kernel-5.15.0-118-generic, (processor.max_cstate = 1, intel_idle.max_cstate = 0 mitigations = off, cpupower frequency-set -g performance), BIOS 2.1, (Max. Performance, SR-IOV = On),
Für 27,74 Trainingsbeispiele/Sekunde
Für eine durchschnittliche Durchsatzsteigerung von 1,146.
Die Ergebnisse können abhängig von Faktoren wie Systemkonfiguration, Softwareversion und BIOS-Einstellungen variieren.
Vergleich von 2P AMD EPYC 9965 (2870 geschätzte SPECrate®2017_int_base, 384 Kerne gesamt, 500 W TDP) 1,5 TB 24 x 64 GB 2Rx4 PC5-6400B-R ausgeführt bei 6000 MT/s, 3,84 TB NVMe, Ubuntu® 24.04 LTS Kernel 6.8.30-41-generic, AOCC v5.0.0, 5.740 est SPECrate®2017_int_base/CPU-W)
2P Intel Xeon Platinum 8592+ (1130 SPECrate®2017_int_base, 128 Kerne gesamt, 350 W TDP) 3.229 SPECrate®2017_int_base/CPU-W, http://spec.org/cpu2017/results/res2023q4/cpu2017-20231127-40064.html)
EPYC 9965 im Vergleich zu 8592+
- geschätzt 2,540 x der Performance
- 1,778 x der geschätzten Performance/CPU-W
Veröffentlichte 2P AMD EPYC 9754 (1950 SPECrate®2017_int_base, 256 Kerne gesamt, 360 W TDP) 5.417 SPECrate®2017_int_base/CPU-W, http://spec.org/cpu2017/results/res2023q2/cpu2017-20230522-36617.html)
EPYC 9754 im Vergleich zu 8592+
- 1,725 x der Performance
- 1,678 x der Performance/CPU-W
Im Generationsvergleich (EPYC 9965 im Vergleich zu EPYC 9754)
- ist 1,472 x die Performance
- bei 1,060 x der Performance/CPU-W
SPEC®, SPEC CPU® und SPECrate® sind eingetragene Marken der Standard Performance Evaluation Corporation. Weitere Informationen auf www.spec.org. Intel CPU TDP unter https://ark.intel.com/.