选择合适的 AMD EPYC(霄龙)服务器 CPU
基于先进的晶圆制造工艺,在设计上实现突破创新,带来出色的 x86 性能、能效和成本效益,充分满足当今 AI 驱动的数据中心的多元需求。多种 CPU 供您选择,包括适用于 AI 的高密度 CPU、适用于低延迟工作负载的高频 CPU,以及适用于数据库和仿真工作负载的内存优化型 CPU。
AMD EPYC(霄龙)服务器 CPU 性能卓越、实力超凡
压缩
数据中心空间
一台基于 AMD EPYC(霄龙)9005 CPU 的服务器,其处理能力可超过七台传统服务器。1
AMD EPYC(霄龙)服务器 CPU 性能卓越
从数据中心整合能力到原始整数性能,第五代 AMD EPYC(霄龙)服务器 CPU 均展现出卓越的实力,已成为数据中心更新换代和全新部署的适合之选。
对于混合云环境,应坚持选择基于 x86 架构的 AMD EPYC(霄龙)服务器 CPU 实例
基于其他架构的处理器云实例在理论上看似可行,但实际成本投入和性能表现可能达不到预期。如果将其他架构引入云服务,一方面应用移植和多代码库管理会产生高昂成本,另一方面实际性能表现可能不及预期,由此可见这是一种不可取的高风险举措。
单位成本性能提升2
相比基于其他架构的处理器,AMD EPYC(霄龙)服务器 CPU 的单位成本性能提升多达 75%。2
AMD EPYC(霄龙)服务器 CPU 是企业 AI 的卓越之选3
无论是在云端还是本地,无论是大型还是小型部署,AMD EPYC(霄龙)服务器 CPU 都能提供性能强大、经济高效且高度灵活的解决方案,助您轻松完成 AI 发展之旅的每一个阶段。第五代 AMD EPYC(霄龙)9965 在处理能力上表现出色。
在 Llama3.1-8B 翻译应用场景中,第五代 AMD EPYC(霄龙)9965 的推理吞吐量最高可达到参考基准的 1.33 倍4
在运行 XGBoost 时,第五代 AMD EPYC(霄龙)9965 的吞吐量最高可达到参考基准的 1.93 倍5
第五代 AMD EPYC(霄龙)9965 的通用 AI (TPCx-AI) 吞吐量最高可达到参考基准的 1.7 倍6
AMD EPYC(霄龙)服务器 CPU 常见问题解答
是的。在当前的 x86 服务器处理器中,第五代 AMD EPYC(霄龙)服务器 CPU 的核心数量居前。AMD EPYC(霄龙)9965 服务器 CPU 拥有 192 个核心,在 1 个核心对应 1 个虚拟 CPU (vCPU) 的配置下,其支持的 vCPU 数量比参考基准(144 个核心)多出 33%。
通过将第五代 AMD EPYC(霄龙)服务器 CPU 与参考基准进行比较,可以发现 AMD EPYC(霄龙)服务器 CPU 在通用计算、端到端 AI 性能以及能效方面均具有显著优势。在通用计算方面,AMD EPYC(霄龙)服务器 CPU 实现高达 35% 的性能提升。7在能耗方面,AMD EPYC(霄龙)服务器 CPU 实现高达 66% 的能效提升。8在端到端 AI 性能方面,AMD EPYC(霄龙)服务器 CPU 性能提升高达 70%。9
迁移到 AMD 处理器并不难。许多处理器与 AMD EPYC(霄龙)服务器 CPU 一样,均采用 x86 架构。这种情况下,可以轻松完成应用层面的迁移。针对虚拟机 (VM) 的迁移,AMD 提供了 VMware Architecture Migration Tool,可帮助自动完成迁移。
选择 AMD EPYC(霄龙)服务器 CPU 时,您需要综合考量性能、能效需求以及价格预期。全新 EPYC(霄龙)系列涵盖多种不同的 CPU,核心数从 8 核到 192 核,功耗从 155 W 到 500 W 不等。
全球多家知名数据中心硬件制造商,包括 Cisco、Dell、HPE、Lenovo、Oracle、Supermicro 等,均生产采用 AMD EPYC(霄龙)服务器 CPU 的系统。AMD 与原始设备制造商合作伙伴、软件供应商、销售商以及开源社区紧密合作,不断推出卓越解决方案。
您可以通过常用的云服务提供商(包括 AWS、Microsoft Azure、Google Cloud、Oracle Cloud 等),选择基于 AMD EPYC(霄龙)服务器 CPU 的云实例。AMD 与云服务提供商密切合作,确保基于 AMD EPYC(霄龙)服务器 CPU 的虚拟机 (VM) 能够实现卓越的性能和成本效益。
资源
联系 AMD
订阅接收 AMD 资讯和公告,包括即将举行的活动和网络研讨会。
与 AMD EPYC(霄龙)服务器 CPU 销售专家取得联系。
附注
- 此场景包含许多假设和估计,尽管基于 AMD 内部研究和最佳逼近原则,但应视为一个示例,仅供参考,不能用作实际测试的决策依据。通过 AMD 服务器和温室气体排放总体拥有成本估算工具 v1.3,评估实现 391000 单位的 SPECrate®2017_int_base 总体性能所需的特定 AMD EPYC(霄龙)CPU 服务器解决方案(采用截至 2024 年 11 月 21 日发布的数据)。经估算,基于双路 EPYC(霄龙)9965(192 核)的服务器获得 3100 分 (https://spec.org/cpu2017/results/res2024q4/cpu2017-20241004-44979.pdf)。我们利用这些数据对环境影响进行了评估,并采用了“2024 年全球电力排放系数”中的国家/地区特定电力排放系数,以及美国国家环境保护局“温室气体当量计算器”。有关更多详情,请访问 https://www.amd.com/zh-cn/legal/claims/epyc.html#q=9xx5TCO-005。 (9xx5TCO-005)
- Phoronix,“AWS Graviton4 Benchmarks Prove to Deliver the Best ARM Cloud Server Performance”,第 7 页,2024 年 7 月 12 日。单位成本性能的计算方式为:几何平均性能除以完成工作负载的总成本。所示价格是美国东部地区通用云计算实例的按需定价,基于 2024 年 7 月至 2025 年 6 月(最后的核查时间)期间的费率。在此期间,未发现价格有所变化。定价可能会随时更改。
- 基于截至 2024 年 10 月 10 日已上市服务器的线程密度、性能、特性、制程工艺和内置安全功能。EPYC(霄龙)9005 系列 CPU 提供超高线程密度,打破 500 多项性能世界纪录,其中包括创世界纪录的企业级 Java® 运算性能(每秒运算次数 ops/sec)、拥有出色浮点吞吐量性能的卓越高性能计算解决方案,以及拥有卓越 TPCx-AI 性能和最高能效得分的 AI 端到端性能。第五代 EPYC(霄龙)系列还拥有更多 DDR5 内存通道、更大内存带宽,并支持更多 PCIe® Gen5 通道,可实现更高的 I/O 吞吐量;此外,每核 L3 高速缓存提升多达 5 倍,可实现更快的数据访问速度。EPYC(霄龙)9005 系列采用先进的 3-4 纳米制程工艺,提供安全内存加密 + 安全加密虚拟化 (SEV) + SEV 加密状态 + SEV 安全嵌套分页等安全功能。(EPYC-029D)
- 9xx5-156:Llama3.1-8B 吞吐量测试结果基于截至 2025 年 4 月 8 日的 AMD 内部测试。Llama3.1-8B 配置:BF16,批次大小为 32,32 核实例,输入/输出 token 配置(应用场景):[摘要生成 = 1024/128,聊天机器人 = 128/128,翻译 = 1024/1024,文章编写 = 128/1024]。双路 AMD EPYC(霄龙)9965(共 384 个核心),1.5TB 24x64GB DDR5-6400,1.0 Gbps NIC,3.84 TB Samsung MZWLO3T8HCLS-00A07,Ubuntu® 22.04.5 LTS,Linux 6.9.0-060900-generic,BIOS RVOT1004A(SMT=off、mitigations=on、Determinism=Power),NPS=1,ZenDNN 5.0.1;双路 AMD EPYC(霄龙)9755(共 256 个核心),1.5TB 24x64GB DDR5-6400,1.0 Gbps NIC,3.84 TB Samsung MZWLO3T8HCLS-00A07,Ubuntu® 22.04.4 LTS,Linux 6.8.0-52-generic,BIOS RVOT1004A(SMT=off、mitigations=on、Determinism=Power),NPS=1,ZenDNN 5.0.1 结果:CPU 参考基准 9755 9965 摘要 1 n/a 1.093 翻译 1 1.062 1.334 文章 1 n/a 1.14 结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。
- 9xx5-162:XGBoost(每小时运行次数)吞吐量测试结果基于截至 2025 年 4 月 8 日的 AMD 内部测试。XGBoost 配置:v1.7.2,Higgs 数据集,32 核心实例,FP32;双路 AMD EPYC(霄龙)9965(共 384 个核心),1.5TB 24x64GB DDR5-6400 (6000 MT/s),1.0 Gbps NIC,3.84 TB Samsung MZWLO3T8HCLS-00A07,Ubuntu® 22.04.5 LTS,Linux 5.15 kernel,BIOS RVOT1004A(SMT=off、mitigations=on,Determinism=Power),NPS=1;双路 AMD EPYC(霄龙)9755(共 256 个核心),1.5TB 24x64GB DDR5-6400 (6000 MT/s),1.0 Gbps NIC,3.84 TB Samsung MZWLO3T8HCLS-00A07,Ubuntu® 22.04.4 LTS,Linux 5.15 kernel,BIOS RVOT1004A(SMT=off、mitigations=on,Determinism=Power),NPS=1 结果:CPU 吞吐量 相对提升幅度 参考基准 400 1 双路 9755 436 1.090 双路 9965 771 1.928 结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。
- 9xx5-151:TPCxAI @SF30 多实例(32 核心实例大小)吞吐量测试结果基于截至 2025 年 4 月 1 日的 AMD 内部测试,测试时运行了多个 VM 实例。综合端到端 AI 吞吐量测试结果源自 TPCx-AI 基准测试,与已发布的 TPCx-AI 结果不具有可比性,因为端到端 AI 吞吐量测试结果不符合 TPCx-AI 规范。双路 AMD EPYC(霄龙)9965(总得分为 6067.53 AIUCpm,共 384 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910),3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu® 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on);双路 AMD EPYC(霄龙)9755(总得分为 4073.42 AIUCpm,共 256 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910) 3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on)。结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。TPC、TPC Benchmark 和 TPC-H 是 Transaction Processing Performance Council 的商标。
- 9xx5-129:SPECrate®2017_int_base(使用 GCC13)评估结果基于截至 2025 年 4 月 1 日的 AMD 内部测试。双路 AMD EPYC(霄龙)9965(预计 2160 SPECrate®2017_int_base,共 384 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910),3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu® 22.04.3 LTS | 5.15.0-105-generic,SMT=ON,Determinism=power,Mitigations=on);双路 AMD EPYC(霄龙)9755(预计 1850 SPECrate®2017_int_base,共 256 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910) 3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu 22.04.3 LTS | 5.15.0-105-generic,SMT=ON,Determinism=power,Mitigations=on)。SPEC®、SPEC CPU® 和 SPECrate® 是 Standard Performance Evaluation Corporation 的注册商标。有关更多信息,请访问 www.spec.org。
- 9xx5-134:SPECpower_ssj® 2008 评估结果基于 www.spec.org 上公布的分数(截至 2025 年 4 月 30 日)。双路 AMD EPYC(霄龙)9965(35920 ssj_ops/watt,共 384 个核心,https://spec.org/power_ssj2008/results/res2024q4/power_ssj2008-20241007-01464.html);双路 AMD EPYC(霄龙)9755(29950 ssj_ops/watt,共 256 个核心,https://spec.org/power_ssj2008/results/res2024q4/power_ssj2008-20240924-01460.html。SPEC®、SPEC CPU® 和 SPECpower® 是 Standard Performance Evaluation Corporation 的注册商标。有关更多信息,请访问 www.spec.org。
- 9xx5-151:TPCxAI @SF30 多实例(32 核心实例大小)吞吐量测试结果基于截至 2025 年 4 月 1 日的 AMD 内部测试,测试时运行了多个 VM 实例。综合端到端 AI 吞吐量测试结果源自 TPCx-AI 基准测试,与已发布的 TPCx-AI 结果不具有可比性,因为端到端 AI 吞吐量测试结果不符合 TPCx-AI 规范。双路 AMD EPYC(霄龙)9965(总得分为 6067.53 AIUCpm,共 384 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910),3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu® 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on);双路 AMD EPYC(霄龙)9755(总得分为 4073.42 AIUCpm,共 256 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910) 3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on)。结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。TPC、TPC Benchmark 和 TPC-H 是 Transaction Processing Performance Council 的商标。
- 此场景包含许多假设和估计,尽管基于 AMD 内部研究和最佳逼近原则,但应视为一个示例,仅供参考,不能用作实际测试的决策依据。通过 AMD 服务器和温室气体排放总体拥有成本估算工具 v1.3,评估实现 391000 单位的 SPECrate®2017_int_base 总体性能所需的特定 AMD EPYC(霄龙)CPU 服务器解决方案(采用截至 2024 年 11 月 21 日发布的数据)。经估算,基于双路 EPYC(霄龙)9965(192 核)的服务器获得 3100 分 (https://spec.org/cpu2017/results/res2024q4/cpu2017-20241004-44979.pdf)。我们利用这些数据对环境影响进行了评估,并采用了“2024 年全球电力排放系数”中的国家/地区特定电力排放系数,以及美国国家环境保护局“温室气体当量计算器”。有关更多详情,请访问 https://www.amd.com/zh-cn/legal/claims/epyc.html#q=9xx5TCO-005。 (9xx5TCO-005)
- Phoronix,“AWS Graviton4 Benchmarks Prove to Deliver the Best ARM Cloud Server Performance”,第 7 页,2024 年 7 月 12 日。单位成本性能的计算方式为:几何平均性能除以完成工作负载的总成本。所示价格是美国东部地区通用云计算实例的按需定价,基于 2024 年 7 月至 2025 年 6 月(最后的核查时间)期间的费率。在此期间,未发现价格有所变化。定价可能会随时更改。
- 基于截至 2024 年 10 月 10 日已上市服务器的线程密度、性能、特性、制程工艺和内置安全功能。EPYC(霄龙)9005 系列 CPU 提供超高线程密度,打破 500 多项性能世界纪录,其中包括创世界纪录的企业级 Java® 运算性能(每秒运算次数 ops/sec)、拥有出色浮点吞吐量性能的卓越高性能计算解决方案,以及拥有卓越 TPCx-AI 性能和最高能效得分的 AI 端到端性能。第五代 EPYC(霄龙)系列还拥有更多 DDR5 内存通道、更大内存带宽,并支持更多 PCIe® Gen5 通道,可实现更高的 I/O 吞吐量;此外,每核 L3 高速缓存提升多达 5 倍,可实现更快的数据访问速度。EPYC(霄龙)9005 系列采用先进的 3-4 纳米制程工艺,提供安全内存加密 + 安全加密虚拟化 (SEV) + SEV 加密状态 + SEV 安全嵌套分页等安全功能。(EPYC-029D)
- 9xx5-156:Llama3.1-8B 吞吐量测试结果基于截至 2025 年 4 月 8 日的 AMD 内部测试。Llama3.1-8B 配置:BF16,批次大小为 32,32 核实例,输入/输出 token 配置(应用场景):[摘要生成 = 1024/128,聊天机器人 = 128/128,翻译 = 1024/1024,文章编写 = 128/1024]。双路 AMD EPYC(霄龙)9965(共 384 个核心),1.5TB 24x64GB DDR5-6400,1.0 Gbps NIC,3.84 TB Samsung MZWLO3T8HCLS-00A07,Ubuntu® 22.04.5 LTS,Linux 6.9.0-060900-generic,BIOS RVOT1004A(SMT=off、mitigations=on、Determinism=Power),NPS=1,ZenDNN 5.0.1;双路 AMD EPYC(霄龙)9755(共 256 个核心),1.5TB 24x64GB DDR5-6400,1.0 Gbps NIC,3.84 TB Samsung MZWLO3T8HCLS-00A07,Ubuntu® 22.04.4 LTS,Linux 6.8.0-52-generic,BIOS RVOT1004A(SMT=off、mitigations=on、Determinism=Power),NPS=1,ZenDNN 5.0.1 结果:CPU 参考基准 9755 9965 摘要 1 n/a 1.093 翻译 1 1.062 1.334 文章 1 n/a 1.14 结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。
- 9xx5-162:XGBoost(每小时运行次数)吞吐量测试结果基于截至 2025 年 4 月 8 日的 AMD 内部测试。XGBoost 配置:v1.7.2,Higgs 数据集,32 核心实例,FP32;双路 AMD EPYC(霄龙)9965(共 384 个核心),1.5TB 24x64GB DDR5-6400 (6000 MT/s),1.0 Gbps NIC,3.84 TB Samsung MZWLO3T8HCLS-00A07,Ubuntu® 22.04.5 LTS,Linux 5.15 kernel,BIOS RVOT1004A(SMT=off、mitigations=on,Determinism=Power),NPS=1;双路 AMD EPYC(霄龙)9755(共 256 个核心),1.5TB 24x64GB DDR5-6400 (6000 MT/s),1.0 Gbps NIC,3.84 TB Samsung MZWLO3T8HCLS-00A07,Ubuntu® 22.04.4 LTS,Linux 5.15 kernel,BIOS RVOT1004A(SMT=off、mitigations=on,Determinism=Power),NPS=1 结果:CPU 吞吐量 相对提升幅度 参考基准 400 1 双路 9755 436 1.090 双路 9965 771 1.928 结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。
- 9xx5-151:TPCxAI @SF30 多实例(32 核心实例大小)吞吐量测试结果基于截至 2025 年 4 月 1 日的 AMD 内部测试,测试时运行了多个 VM 实例。综合端到端 AI 吞吐量测试结果源自 TPCx-AI 基准测试,与已发布的 TPCx-AI 结果不具有可比性,因为端到端 AI 吞吐量测试结果不符合 TPCx-AI 规范。双路 AMD EPYC(霄龙)9965(总得分为 6067.53 AIUCpm,共 384 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910),3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu® 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on);双路 AMD EPYC(霄龙)9755(总得分为 4073.42 AIUCpm,共 256 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910) 3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on)。结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。TPC、TPC Benchmark 和 TPC-H 是 Transaction Processing Performance Council 的商标。
- 9xx5-129:SPECrate®2017_int_base(使用 GCC13)评估结果基于截至 2025 年 4 月 1 日的 AMD 内部测试。双路 AMD EPYC(霄龙)9965(预计 2160 SPECrate®2017_int_base,共 384 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910),3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu® 22.04.3 LTS | 5.15.0-105-generic,SMT=ON,Determinism=power,Mitigations=on);双路 AMD EPYC(霄龙)9755(预计 1850 SPECrate®2017_int_base,共 256 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910) 3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu 22.04.3 LTS | 5.15.0-105-generic,SMT=ON,Determinism=power,Mitigations=on)。SPEC®、SPEC CPU® 和 SPECrate® 是 Standard Performance Evaluation Corporation 的注册商标。有关更多信息,请访问 www.spec.org。
- 9xx5-134:SPECpower_ssj® 2008 评估结果基于 www.spec.org 上公布的分数(截至 2025 年 4 月 30 日)。双路 AMD EPYC(霄龙)9965(35920 ssj_ops/watt,共 384 个核心,https://spec.org/power_ssj2008/results/res2024q4/power_ssj2008-20241007-01464.html);双路 AMD EPYC(霄龙)9755(29950 ssj_ops/watt,共 256 个核心,https://spec.org/power_ssj2008/results/res2024q4/power_ssj2008-20240924-01460.html。SPEC®、SPEC CPU® 和 SPECpower® 是 Standard Performance Evaluation Corporation 的注册商标。有关更多信息,请访问 www.spec.org。
- 9xx5-151:TPCxAI @SF30 多实例(32 核心实例大小)吞吐量测试结果基于截至 2025 年 4 月 1 日的 AMD 内部测试,测试时运行了多个 VM 实例。综合端到端 AI 吞吐量测试结果源自 TPCx-AI 基准测试,与已发布的 TPCx-AI 结果不具有可比性,因为端到端 AI 吞吐量测试结果不符合 TPCx-AI 规范。双路 AMD EPYC(霄龙)9965(总得分为 6067.53 AIUCpm,共 384 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910),3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu® 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on);双路 AMD EPYC(霄龙)9755(总得分为 4073.42 AIUCpm,共 256 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910) 3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on)。结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。TPC、TPC Benchmark 和 TPC-H 是 Transaction Processing Performance Council 的商标。