O que vem a seguir?

Com mais de 400 recordes mundiais, você deve estar se perguntando como a AMD pode melhorar os processadores AMD EPYC™.1 Como é possível superar alguns dos processadores de servidor mais avançados já criados?1 Fazemos isso com a arquitetura “Zen 5” e todos os benefícios que ela oferece aos clientes.

Apresentando os processadores AMD EPYC™ de 5a geração

Projetados para o mundo da IA e cargas de trabalho críticas de negócios, os processadores AMD EPYC™ de 5ª geração oferecem a próxima geração de CPUs de servidor em uma linha que já estabeleceu centenas de recordes mundiais de desempenho e eficiência.1 Com base nessa sólida história, os processadores AMD EPYC™ Série 9005 oferecem um desempenho revolucionário, graças à sua arquitetura “Zen 5”.

Com até 192 núcleos, 384 threads e frequências aumento máximo de 5 GHz, a expectativa dos clientes é de que esses novos processadores ofereçam suporte a praticamente qualquer necessidade de negócios que possam imaginar.2 Eles não só contam com mais núcleos do que os produtos EPYC da geração anterior e frequências ainda mais altas, como também são compatíveis com DRAM mais rápida, o que proporciona capacidade avançada para cargas de trabalho sensíveis à memória.

Rapidamente acessíveis e facilmente implantáveis, os servidores que usam os processadores AMD EPYC de 5ª geração oferecem desempenho, densidade e eficiência líderes, sendo compatíveis com implantações em todas as áreas, desde iniciativas corporativas com tecnologia de IA e aplicativos essenciais aos negócios até o fornecimento da capacidade de operar infraestruturas baseadas em nuvem em grande escala.

Essa linha é unificada pela compatibilidade familiar com o software x86, permitindo que os clientes implementem o que precisam, onde precisam, com uma ISA comum que oferece suporte aos negócios diários sem a necessidade de grandes modificações no software x86.

Os sistemas baseados no processador AMD EPYC 9005 oferecerão suporte a várias iniciativas que vão desde a consolidação e modernização do data center até as necessidades de aplicativos corporativos cada vez mais exigentes. Tudo isso graças à arquitetura “Zen 5” altamente eficiente, uma plataforma atraente criada sob medida não só para acomodar as necessidades de IA em expansão no espaço corporativo, mas também para apoiar as empresas em seu objetivo de melhorar a eficiência de energia e controlar a expansão do data center.

Trata-se de uma CPU de servidor que não deixa a desejar em nada em termos de desempenho, eficiência ou resultado. 

Modelo Nº

Núcleos

Máximo de threads

Cache L3 (MB)

TDP padrão (W)

Canais DDR/Capacidade máx. de memória do sistema (2DPC)

Freq. máx. DDR5 (MHz) (1DPC)

PCIe® Gen 5 (faixas)

Densidade do soquete

9965

192

384

384

500

12/9TB

6000

160

2

9845

160

320

320

400

12/9TB

6000

160

2

9825

144

288

384

400

12/9TB

6000

160

2

9755

128

256

512

500

12/9TB

6000

160

2

9745

128

256

256

400

12/9TB

6000

160

2

9655

96

192

384

400

12/9TB

6000

160

2

9645

96

192

256

320

12/9TB

6000

160

2

9655P

96

192

384

320

12/9TB

6000

128

1

9565

72

144

384

400

12/9TB

6000

160

2

9575F

64

128

256

400

12/9TB

6000

160

2

9555

64

128

256

360

12/9TB

6000

160

2

9555P

64

128

256

320

12/9TB

6000

128

1

9535

64

128

256

300

12/9TB

6000

160

2

9475F

48

96

256

360

12/9TB

6000

160

2

9455

48

96

256

300

12/9TB

6000

160

2

9455P

48

96

192

300

12/9TB

6000

128

1

9365

36

72

192

300

12/9TB

6000

160

2

9375F

32

64

256

320

12/9TB

6000

160

2

9355

32

64

256

280

12/9TB

6000

160

2

9355P

32

64

256

280

12/9TB

6000

128

1

9335

32

64

192

210

12/9TB

6000

160

2

9275F

24

48

256

320

12/9TB

6000

160

2

9255

24

48

128

200

12/9TB

6000

160

2

9175F

16

32

256

320

12/9TB

6000

160

2

9135

16

32

128

200

12/9TB

6000

160

2

9125

8

16

256

165

12/9TB

6000

160

2

9015

8

16

64

155

12/9TB

6000

160

2

 

Desempenho: Apresentando um cenário preciso para os clientes

À medida que a IA desempenha um papel cada vez mais importante nos negócios, os clientes precisam saber que podem confiar na infraestrutura de servidores para fazer isso, além das cargas de trabalho existentes.

Os novos processadores AMD EPYC, como o AMD EPYC™ 9575F, oferecem ganhos de dois dígitos no desempenho de instrução por ciclo do clock (IPC) em comparação com a geração anterior, e o mais recente núcleo "Zen 5" nos processadores AMD EPYC de 5ª geração foi projetado para oferecer melhorias significativas em cargas de trabalho de ML, HPC e corporativas.3

Quando comparados aos produtos concorrentes, esses novos processadores ajudam as empresas a alcançar resultados incríveis, como desempenho inovador da produtividade de IA de ponta a ponta em uma ampla variedade de casos de uso. Por exemplo, na avaliação de desempenho TPCx-AI, os servidores 2P com processadores AMD EPYC™ 9965 de 192C oferecem aproximadamente 3,8x mais casos de teste de IA por minuto do que os servidores 2P com Intel Xeon Platinum 8592+ de 64C em testes da AMD.4

Ao hospedar aceleradores de GPU, duas CPUs AMD EPYC 9575F alcançam até 20% mais solicitações de inferência e tempo de treinamento 15% mais rápido em comparação com duas CPUs Intel® Xeon® 8592+ executando o Llama3.1.5,6

Embora o desempenho seja o carro-chefe, isso não significa que a eficiência fique para trás. Os processadores AMD EPYC Série 9005 oferecem soluções de servidor eficientes em termos de energia. De fato, os servidores 2P que usam CPUs AMD EPYC 9965 oferecem 1,8x mais desempenho inteiro estimado por watt de CPU do que aqueles com CPUs Intel® Xeon® 8592+.7

Uma nova geração de processadores AMD EPYC com tecnologia de ponta chegou para transformar a maneira como o trabalho é feito. Na era da IA, seus clientes não podem se dar ao luxo de ficar para trás. Entre em contato com seu representante da AMD ou visite AMD.com para saber mais.

Recursos adicionais


AMD Arena


Melhore seu conhecimento sobre os produtos AMD com treinamentos do AMD Ryzen™ PRO, AMD EPYC™, AMD Instinct™ e muito mais.

Artigos relacionados

Notas de rodapé
  1. Para obter uma lista completa dos recordes mundiais de desempenho detidos pelos processadores AMD EPYC, acesse amd.com/worldrecords.

  2. O aumento máximo para os processadores AMD EPYC é a frequência máxima atingível por qualquer núcleo único no processador sob condições operacionais normais para sistemas de servidor. EPYC-018

  3. 9xx5-001: Com base em testes internos da AMD em 10/9/2024, melhoria de desempenho geométrico (IPC) em frequência fixa.

  4. - Cargas de trabalho de servidor em nuvem e de empresa com CPU EPYC de 5ª geração: melhoria de IPC geracional de 1,170x (média geométrica) usando um conjunto selecionado de 36 cargas de trabalho e a média geométrica das pontuações estimadas para o total e todos os subconjuntos de SPECrate®2017_int_base (média geométrica). Também são apresentadas pontuações estimadas para o total e todos os subconjuntos do SPECrate®2017_fp_base (média geométrica), pontuações para Server Side Java de múltiplas instâncias com operações máximas por segundo, cargas de trabalho representativas do Cloud Server (média geométrica) e cargas de trabalho representativas do servidor Corporativo (média geométrica). 

    Configuração “Genoa” (todos os NPS1): EPYC 9654 BIOS TQZ1005D com 12 núcleos e 12 threads (1 núcleo e 1 thread/CCD em 12+1), FF 3 GHz, 12x DDR5-4800 (2 Rx4 de 64 GB), xGMI de 32 Gbps;

    Configuração “Turin” (todos os NPS1): EPYC 9V45 BIOS RVOT1000F com 12 núcleos e 12 threads (1 núcleo e 1 thread/CCD em 12+1), FF 3 GHz, 12x DDR5-6000 (2 Rx4 de 64 GB), xGMI de 32 Gbps 

    Utilizando o Determinismo de desempenho e o regulador de desempenho no Ubuntu® 22.04 com sistema operacional de kernel genérico 6.8.0-40 para todas as cargas de trabalho.

    - Cargas de trabalho de servidor ML/HPC geracionais do EPYC de 5ª geração IPC com melhoria de 1,369x (média geométrica) usando um conjunto selecionado de 24 cargas de trabalho e é a média geométrica de cargas de trabalho de servidor ML representativas (média geométrica) e cargas de trabalho de servidor HPC representativas (média geométrica).

    “Configuração Genoa (todos os NPS1) Configuração “Genoa”: EPYC 9654 BIOS TQZ1005D com 12 núcleos e 12 threads (1 núcleo e 1 thread/CCD em 12+1), FF 3 GHz, 12x DDR5-4800 (2 Rx4 de 64 GB), xGMI de 32 Gbps;

    Configuração “Turin” (todos os NPS1):   EPYC 9V45 BIOS RVOT1000F com 12 núcleos e 12 threads (1 núcleo e 1 thread/CCD em 12+1), FF 3 GHz, 12x DDR5-6000 (2 Rx4 de 64 GB), xGMI de 32 Gbps 

    Utilizando o Determinismo de desempenho e o regulador de desempenho no sistema operacional Ubuntu 22.04 com kernel genérico 6.8.0-40 para todas as cargas de trabalho, exceto LAMMPS, HPCG, NAMD, OpenFOAM e Gromacs, que utilizam o 24.04 com kernel genérico 6.8.0-40.

    SPEC® e SPECrate® são marcas registradas da Standard Performance Evaluation Corporation. Saiba mais em spec.org.

  5. 9xx5-012: Resultados de produtividade do TPCxAI @SF30 com tamanho de instância de 32 núcleos de várias instâncias com base em testes internos da AMD em 05/09/2024 executando várias instâncias de VM. O teste de produtividade de IA de ponta a ponta agregado é derivado da avaliação de desempenho TPCx-AI e, como tal, não é comparável aos resultados publicados do TPCx-AI, já que os resultados de teste de produtividade de IA de ponta a ponta não estão em conformidade com a especificação do TPCx-AI.

  6. 2P AMD EPYC 9965 (384 núcleos totais), 12 instâncias de 32 núcleos, NPS1, 1,5 TB 24x64 GB DDR5-6400 (a 6000 MT/s), 1DPC, NetXtreme BCM5720 Gigabit Ethernet PCIe de 1,0 Gbps, Samsung MZWLO3T8HCLS-00A07 NVMe® de 3,5 TB, Ubuntu® 22.04.4 LTS, 6.8.0-40-generic (perfil tuned-adm throughput-performance, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT1000C (SMT=off, Determinism=Power, Turbo Boost=Enabled)

    2P AMD EPYC 9755 (256 núcleos totais), 8 instâncias de 32 núcleos, NPS1, 1,5 TB 24x64 GB DDR5-6400 (a 6000 MT/s), 1DPC, NetXtreme BCM5720 Gigabit Ethernet PCIe de 1,0 Gbps, Samsung MZWLO3T8HCLS-00A07 NVMe® de 3,5 TB, Ubuntu 22.04.4 LTS, 6.8.0-40-generic (perfil tuned-adm throughput-performance, ulimit -l 198096812, ulimit -n 1024, ulimit -s 8192), BIOS RVOT0090F (SMT=off, Determinism=Power, Turbo Boost=Enabled)

    2P AMD EPYC 9654 (192 núcleos totais) 6 instâncias de 32 núcleos, NPS1, 1,5 TB 24x64GB DDR5-4800, 1 DPC, 2 Samsung MZQL21T9HCJR-00A07 NVMe de 1,92 TB, Ubuntu 22.04.3 LTS, BIOS 1006C (SMT=off, Determinism=Power)

    Versus 2P Xeon Platinum 8592+ (128 núcleos totais), 4 instâncias de 32 núcleos, AMX ON, 1TB 16x64 GB DDR5-5600, 1DPC, NetXtreme BCM5719 Gigabit Ethernet PCIe de 1,0 Gbps, KIOXIA KCMYXRUG3T84 NVMe de 3,84 TB, Ubuntu 22.04.4 LTS, 6.5.0-35 generic (tuned-adm profile throughput-performance, ulimit -l 132065548, ulimit -n 1024, ulimit -s 8192), BIOS ESE122V (SMT=off, Determinism=Power, Turbo Boost = Enabled)

    Resultados:

    CPU mediana relativa geracional

    Turin de 192 núcleos, 12 instâncias 6067.531 3.775 2.278

    Turin de 128 núcleos, 8 instâncias 4091.85 2.546 1.536

    Genoa de 96 núcleos, 6 instâncias 2663.14 1.657 1

    EMR de 64 núcleos, 4 instâncias 1607.417 1 NA

    Os resultados podem variar devido a fatores como configuração do sistema, versões de software e configurações do BIOS. TPC, TPC Benchmark e TPC-C são marcas registradas do Transaction Processing Performance Council.

  7. 9xx5-014: Resultados de produtividade de inferência do Llama3.1-70B com base em testes internos da AMD em 01/09/2024.
  8. Configurações do Llama3.1-70B: TensorRT-LLM 0.9.0, nvidia/cuda 12.5.0-devel-ubuntu22.04, FP8, configurações de token de entrada/saída (casos de uso): [BS=1024 I/O=128/128, BS=1024 I/O=128/2048, BS=96 I/O=2048/128, BS=64 I/O=2048/2048]. Resultados em tokens/segundo.

    2P AMD EPYC 9575F (128 núcleos totais) com 8x NVIDIA H100 de 80 GB HBM3, 1,5 TB 24x64 GB DDR5-6000, Micron_9300_MTFDHAL3T8TDP NVMe® de 1,0 Gbps e 3 TB, BIOS T20240805173113 (Determinism=Power,SR-IOV=On), Ubuntu 22.04.3 LTS, kernel=5.15.0-117-generic (mitigations=off, cpupower frequency-set -g performance, cpupower idle-set -d 2, echo 3> /proc/syss/vm/drop_caches),

    2P Intel Xeon Platinum 8592+ (128 núcleos totais) com 8x NVIDIA H100 de 80 GB HBM3, 1 TB 16x64 GB DDR5-5600, Dell Ent NVMe® PM1735a MU de 3,2 TB, Ubuntu 22.04.3 LTS, kernel-5.15. 0-118-generic, (processor.max_cstate=1, intel_idle.max_cstate=0 mitigations=off, cpupower frequency-set -g performance), BIOS 2.1, (Maximum performance, SR-IOV=On),

    Tokens de E/S Tamanho do lote EMR Turin Relativo

    128/128 1024 814.678 1101.966 1.353

    128/2048 1024 2120.664 2331.776 1.1

    2048/128 96 114.954 146.187 1.272

    2048/2048 64 333.325 354.208 1.063

    Para um aumento médio da produtividade de 1,197x.

    Os resultados podem variar devido a fatores como configuração do sistema, versões de software e configurações do BIOS.

  9. 9xx5-015: Resultados do teste de treinamento Llama3.1-8B (BF16, comprimento máximo da sequência de 1024) com base em testes internos da AMD em 05/09/2024.
  10. Configurações do Llama3.1-8B: Comprimento máximo da sequência de 1024, BF16, Docker: huggingface/transformers-pytorch-gpu:latest

    2P AMD EPYC 9575F (128 núcleos totais) com 8x NVIDIA H100 de 80 GB HBM3, 1,5 TB 24x64 GB DDR5-6000, Micron_9300_MTFDHAL3T8TDP NVMe® de 1,0 Gbps e 3 TB, BIOS T20240805173113 (Determinism=Power,SR-IOV=On), Ubuntu 22.04.3 LTS, kernel=5.15.0-117-generic (mitigations=off, cpupower frequency-set -g performance, cpupower idle-set -d 2, echo 3> /proc/syss/vm/drop_caches),

    Para 31,79 amostras de treinamento/segundo

    2P Intel Xeon Platinum 8592+ (128 núcleos totais) com 8x NVIDIA H100 de 80 GB HBM3, 1 TB 16x64 GB DDR5-5600, Dell Ent NVMe® PM1735a MU de 3,2 TB, Ubuntu 22.04.3 LTS, kernel-5.15.0-118-generic, (processor.max_cstate=1, intel_idle.max_cstate=0 mitigations=off, cpupower frequency-set -g performance), BIOS 2.1, (Maximum performance, SR-IOV=On),

    Para 27,74 amostras de treinamento/segundo

    Para um aumento médio de produtividade de 1,146. 

    Os resultados podem variar devido a fatores como configuração do sistema, versões de software e configurações do BIOS.

  11. 9xx5-002a: Comparação SPECrate®2017_int_base com base em medições internas estimadas da plataforma de referência da AMD e pontuações publicadas em www.spec.org em 05/09/2024.

Comparação de 2P AMD EPYC 9965 (2870 SPECrate®2017_int_base estimado, 384 núcleos totais, TDP de 500 W) 1,5 TB 24x64 GB 2Rx4 PC5-6400B-R rodando a 6000 MT/s, NVMe de 3,84 TB, Ubuntu® 24.04 LTS Kernel 6.8.30-41-generic, AOCC v5.0.0, 5.740 SPECrate®2017_int_base/CPU por W estimado)

2P Intel Xeon Platinum 8592+ (1130 SPECrate®2017_int_base, 128 núcleos totais, TDP de 350 W) 3.229 SPECrate®2017_int_base/CPU por W, http://spec.org/cpu2017/results/res2023q4/cpu2017-20231127-40064.html)

EPYC 9965 vs. 8592+

- desempenho estimado em 2,540 vezes

- 1,778x o desempenho estimado/CPU por W

Publicado para 2P AMD EPYC 9754 (1950 SPECrate®2017_int_base, 256 núcleos totais, TDP de 360 W) 5.417 SPECrate®2017_int_base/CPU por W, http://spec.org/cpu2017/results/res2023q2/cpu2017-20230522-36617.html)

EPYC 9754 vs. 8592+

- 1,725x o desempenho

- 1,678x desempenho/CPU por W

Geracional (EPYC 9965 vs. EPYC 9754)

- é 1,472x o desempenho

- com 1,060x o desempenho/CPU por W

SPEC®, SPEC CPU® e SPECrate® são marcas registradas da Standard Performance Evaluation Corporation. Consulte www.spec.org para obter mais informações. TDP da CPU Intel em https://ark.intel.com/.