AMD EPYC 9005 Series processor

全新第五代 AMD EPYC(霄龙)服务器 CPU

AMD EPYC(霄龙)9005 服务器 CPU 专为加速数据中心、云计算和 AI 工作负载而设计,助力企业将计算性能提升到全新水平。   

面向 AI 的卓越 CPU1

AMD EPYC(霄龙)9005 服务器 CPU 性能卓越,全方位满足 AI 处理需求。

充分提升每台服务器性能

使用 AMD EPYC(霄龙)9005 CPU,在机架数量减少多达 88% 的情况下仍能实现与原有硬件相当的整数性能2,大幅减少了物理占用空间、功耗和所需软件许可证数量,从而为运行全新或扩展的 AI 工作负载腾出空间。

卓越的 AI 推理性能

基于 AMD EPYC(霄龙)9005 CPU 的纯 CPU 型服务器能够高效处理大量 AI 工作负载,如具有 130 亿个及以下参数的语言模型、图像和欺诈分析或推荐系统。与上一代产品相比,运行两个第五代 AMD EPYC(霄龙)9965 CPU 的服务器可实现高达 2 倍的推理吞吐量提升。3

充分助力 GPU 加速

AMD EPYC(霄龙)9005 系列中的有些型号经过专门优化,在搭载 GPU 的系统中用作主机 CPU 时可帮助提高特定 AI 工作负载的性能,从而提高每台 GPU 服务器的投资回报率。例如,在涵盖 8 个模型与 4 个用例的几何平均推理性能测试中,搭载高频 AMD EPYC(霄龙)9575F CPU 且配备 8 个 GPU 的服务器,相比传统同规格 8 GPU 服务器,首个 token 生成速度提升最高可达 13%,且整体推理吞吐量提升 6.6%。4,5,6

经过优化的企业级性能

AMD EPYC(霄龙)9005 服务器 CPU 在提供出色性能的同时实现卓越能效和总体拥有成本 (TCO) 价值,可解决企业迫在眉睫的关键需求。

业界卓越的整数性能

基于 AMD EPYC(霄龙)9005 CPU 的服务器借助全新“Zen 5”核心在主要性能指标上表现出色,其中整数性能是同类产品的 2.3 倍。7

专为云计算而生

AMD EPYC(霄龙)9005 服务器 CPU 兼具卓越密度和性能,非常适合云计算工作负载。旗舰级 AMD EPYC(霄龙)9965 处理器拥有 192 个核心,能够支持更多的虚拟 CPU (vCPU) (1 个 vCPU 对应 1 个核心)。

卓越能效和 TCO 优势

如今,数据中心对能源的需求远超以往。AMD EPYC(霄龙)9005 服务器 CPU 沿袭了 AMD EPYC(霄龙)处理器的传统优势,带来出色的能效和总体拥有成本 (TCO)。 

非凡性能、密度和能效

AMD EPYC(霄龙)9005 系列服务器 CPU 配备多达 192 个“Zen 5”或“Zen 5c”核心,具有出色的内存带宽和性能。  创新的 AMD 小芯片架构成就高性能、高能效解决方案,并且根据不同计算需求进行全面优化。

“Zen 5”

AMD Zen 5 chip

“Zen 5c”

AMD Zen 5c chip

广泛的生态系统支持,备受行业翘楚青睐

众多解决方案提供商与 AMD 开展合作,采用 AMD EPYC(霄龙)9005 服务器 CPU。全球各地的公司和组织也都选择使用 AMD 处理器来处理其关键工作负载。

资源

附注
  1. 9xx-151:TPCxAI @SF30 多实例(32 核心实例大小)吞吐量测试结果基于截至 2025 年 4 月 1 日的 AMD 内部测试,测试时运行了多个 VM 实例。综合端到端 AI 吞吐量测试结果源自 TPCx-AI 基准测试,与已发布的 TPCx-AI 结果不具有可比性,因为端到端 AI 吞吐量测试结果不符合 TPCx-AI 规范。双路 AMD EPYC(霄龙)9965(总得分为 6067.53 AIUCpm,共 384 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910),3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu® 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on);双路 AMD EPYC(霄龙)9755(总得分为 4073.42 AIUCpm,共 256 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910),3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on)。结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。TPC、TPC Benchmark 和 TPC-H 是 Transaction Processing Performance Council 的商标。
  2. 9xx5TCO-018:此场景包含许多假设和估计,尽管基于 AMD 内部研究和最佳逼近原则,但应视为一个示例,仅供参考,不能用作实际测试的决策依据。通过 AMD 服务器和温室气体排放总体拥有成本估算工具 v1.53,评估实现 391,000 单位的 SPECrate®2017_int_base 总体性能所需的特定 AMD EPYC(霄龙)CPU 服务器解决方案(采用截至 2025 年 12 月 3 日发布的数据)。本次分析评估了搭载 AMD 192 核 EPYC(霄龙)9965 处理器的双路服务器,SPECrate2017_int_base 得分为 3230 (https://spec.org/cpu2017/results/res2025q2/cpu2017-20250324-47086.pdf);
    https://spec.org/cpu2017/results/res2025q2/cpu2017-20250324-47099.pdf
    我们利用相关数据对环境影响进行了评估,采用了 2025 年全球电力排放系数中的国家/地区特定电力排放系数 (https://www.carbondi.com/#electricity-factors/),还采用了美国国家环境保护局“温室气体当量计算器”截至 2024 年 9 月 4 日的数据 (https://www.epa.gov/energy/greenhouse-gas-equivalencies-calculator)。
    有关更多详情,请访问 https://www.amd.com/zh-cn/legal/claims/epyc.html#q=9xx5TCO-018
  3. 9xx5-040A:XGBoost(每小时运行次数)吞吐量测试结果基于截至 2024 年 9 月 5 日的 AMD 内部测试。XGBoost 配置:v2.2.1,Higgs 数据集,32 核心实例,FP32 双路 AMD EPYC(霄龙)9965(总计 384 个核心),12 个 32 核心实例,1.5TB 24x64GB DDR5-6400(速率 6000 MT/s),1.0 Gbps NetXtreme BCM5720 千兆以太网 PCIe,3.5 TB Samsung MZWLO3T8HCLS-00A07 NVMe®,Ubuntu® 22.04.4 LTS,6.8.0-45-generic(tuned-adm profile throughput-performance、ulimit -l 198078840、ulimit -n 1024、ulimit -s 8192),BIOS RVOT1000C(SMT=off、Determinism=Power、Turbo Boost=Enabled),NPS=1;双路 AMD EPYC(霄龙)9755(总计 256 个核心),1.5TB 24x64GB DDR5-6400(速率 6000 MT/s),1DPC,1.0 Gbps NetXtreme BCM5720 千兆以太网 PCIe,3.5 TB Samsung MZWLO3T8HCLS-00A07 NVMe®,Ubuntu 22.04.4 LTS,6.8.0-40-generic(tuned-adm profile throughput-performance、ulimit -l 198094956、ulimit -n 1024、ulimit -s 8192),BIOS RVOT0090F(SMT=off、Determinism=Power、Turbo Boost=Enabled),NPS=1;双路 AMD EPYC(霄龙)9654(总计 192 个核心),1.5TB 24x64GB DDR5-4800,1DPC,2 个 1.92 TB Samsung MZQL21T9HCJR-00A07 NVMe®,Ubuntu 22.04.4 LTS,6.8.0-40-generic(tuned-adm profile throughput-performance、ulimit -l 198120988、ulimit -n 1024、ulimit -s 8192),BIOS TTI100BA(SMT=off、Determinism=Power),NPS=1。结果如下:CPU、第 1 次运行吞吐量、第 2 次运行吞吐量、第 3 次运行吞吐量、吞吐量中值、相对于基准的提升幅度、代际提升幅度 双路 Turin(192 核,NPS1)、1565.217、1537.367、1553.957、1553.957、3、2.41 双路 Turin(128 核,NPS1)、1103.448、1138.34、1111.969、1111.969、2.147、1.725 双路 Genoa(96 核,NPS1)、662.577、644.776、640.95、644.776、1.245、1 参照基准(64 核)、517.986、421.053、553.846、517.986、1、不适用 结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。
  4. 9xx5-258:GPU 推理吞吐量测试结果基于 AMD 截至 2025 年 10 月 24 日进行的内部测试。工作负载配置:vLLM 版本、NIM 版本;输入/输出 Token:128/128、1024/128、128/1024、1024/1024;结果以每秒处理的 token 数为单位 测试系统:双路 AMD EPYC(霄龙)9575F(共 128 个核心)生产系统,配备 8 个 NVIDIA B200 GPU、24x64GB DDR5-6400、SAMSUNG MZWLO3T8HCLS-00A07 3.84 TB NVMe、Ubuntu 24.04 6.8.0-85-generic、BIOS 1.5、SMT OFF、Mitigations OFF、Power Determinism、CUDA 13.0、NPS1;参照系统:搭载其他厂商处理器(共 128 个核心)的生产系统,配备 8 个 NVIDIA B200 GPU、24x64GB DDR5-6400、SAMSUNG MZWLO3T8HCLS-00A07 3.84 TB NVMe、Ubuntu 24.04 6.8.0-85-generic、BIOS 1.2、SMT OFF、Mitigations OFF、Power Determinism、CUDA 13.0、NPS1 结果如下:框架、模型、相对值 NIM、llama3.3-70b-instruct、1.053 NIM、gpt-oss-120b、1.133 NIM、qwen2_5-coder-32b-instruct、1.034 VLLM、Vllm_Deepseek_V3(R1)、1.036 VLLM、Vllm_Llama4_scout、1.049 VLLM、Vllm_Qwen2.5-VL-72B-Instruct、1.073 NIM(多实例)、llama3.1-8b-instruct、1.144 NIM(多实例)、qwen2_5-coder-32b-instruct、1.014 整体几何平均值 1.066 最佳性能结果 1.144 结果可能因系统配置、软件版本和 BIOS 设置等因素而有所不同。
  5. 9xx5-259:GPU 推理延迟(输出首个 token 所需的时间)结果基于 AMD 截至 2025 年 10 月 24 日进行的内部测试。工作负载配置:vLLM 版本、NIM 版本;输入/输出 Token:128/128、1024/128、128/1024、1024/1024;结果以秒为单位 测试系统:双路 AMD EPYC(霄龙)9575F(共 128 个核心)生产系统,配备 8 个 NVIDIA B200 GPU、24x64GB DDR5-6400、SAMSUNG MZWLO3T8HCLS-00A07 3.84 TB NVMe、Ubuntu 24.04 6.8.0-85-generic、BIOS 1.5、SMT OFF、Mitigations OFF、Power Determinism、CUDA 13.0、NPS1 ,结果如下:框架、模型、相对值 NIM、llama3.3-70b-instruct、0.996 NIM、gpt-oss-120b、1.22 NIM、qwen2_5-coder-32b-instruct、1.062 VLLM、Vllm_Deepseek_V3(R1)、1.059 VLLM、Vllm_Llama4_scout、1.246 VLLM、Vllm_Qwen2.5-VL-72B-Instruct、1.164 NIM(多实例)、llama3.1-8b-instruct、1.355 NIM(多实例)、qwen2_5-coder-32b-instruct、1.012 整体几何平均值 1.133 最佳性能结果 1.355 结果可能因系统配置、软件版本和 BIOS 设置等因素而有所不同。
  6. 9xx5-260:GPU 推理 token 延迟(平均每个输出 Token 所需的时间)结果基于 AMD 截至 2025 年 10 月 24 日进行的内部测试。工作负载配置:vLLM 版本、NIM 版本;输入/输出 Token:128/128、1024/128、128/1024、1024/1024;结果以秒为单位 测试系统:双路 AMD EPYC(霄龙)9575F(共 128 个核心)生产系统,配备 8 个 NVIDIA B200 GPU、24x64GB DDR5-6400、SAMSUNG MZWLO3T8HCLS-00A07 3.84 TB NVMe、Ubuntu 24.04 6.8.0-85-generic、BIOS 1.5、SMT OFF、Mitigations OFF、Power Determinism、CUDA 13.0、NPS1,结果如下:框架、模型、相对值 NIM、llama3.3-70b-instruct、1.053 NIM、gpt-oss-120b、1.128 NIM、qwen2_5-coder-32b-instruct、1.019 VLLM、Vllm_Deepseek_V3(R1)、1.025 VLLM、Vllm_Llama4_scout、1.025 VLLM、Vllm_Qwen2.5-VL-72B-Instruct、1.062 NIM(多实例)、llama3.1-8b-instruct、1.102 NIM(多实例)、qwen2_5-coder-32b-instruct、1.033 整体几何平均值 1.055 最佳性能结果 1.128 结果可能因系统配置、软件版本和 BIOS 设置等因素而有所不同
  7. 9xx5-002F:SPECrate®2017_int_base 性能评估基于截至 2025 年 12 月 11 日 www.spec.org 网站上发布的分数。
    双路 AMD EPYC(霄龙)9654,96 核,360W,8452 美元,1830,5.083,0.217,https://www.spec.org/cpu2017/results/res2025q3/cpu2017-20250727-49206.html
    双路 AMD EPYC(霄龙)9754,128 核,360W,10631 美元,1950,5.417,0.183,https://www.spec.org/cpu2017/results/res2023q2/cpu2017-20230522-36617.html
    双路 AMD EPYC(霄龙)9755,128 核,500W,10931 美元,2850,5.70,0.261,https://www.spec.org/cpu2017/results/res2025q4/cpu2017-20250928-49776.html
    双路 AMD EPYC(霄龙)9965,192 核,500W,11988 美元,3230,6.460,0.269,https://www.spec.org/cpu2017/results/res2025q2/cpu2017-20250324-47086.html
    SPEC®、SPEC CPU® 和 SPECrate® 是 Standard Performance Evaluation Corporation 的注册商标。请访问 www.spec.org 获取更多信息。采用截至 2025 年 12 月 11 日的 AMD CPU 价格。‎