选择合适的 AMD EPYC(霄龙)服务器 CPU

基于先进的晶圆制造工艺,在设计上实现突破创新,带来出色的 x86 性能、能效和成本效益,充分满足当今 AI 驱动的数据中心的多元需求。多种 CPU 供您选择,包括适用于 AI 的高密度 CPU、适用于低延迟工作负载的高频 CPU,以及适用于数据库和仿真工作负载的内存优化型 CPU。

AMD EPYC(霄龙)服务器 CPU 性能卓越、实力超凡

压缩
数据中心空间

最高可达
7 倍

一台基于 AMD EPYC(霄龙)9005 CPU 的服务器,其处理能力可超过七台传统服务器。1

AMD EPYC(霄龙)服务器 CPU 性能卓越

从数据中心整合能力到原始整数性能,第五代 AMD EPYC(霄龙)服务器 CPU 均展现出卓越的实力,已成为数据中心更新换代和全新部署的适合之选。

对于混合云环境,应坚持选择基于 x86 架构的 AMD EPYC(霄龙)服务器 CPU 实例

基于其他架构的处理器云实例在理论上看似可行,但实际成本投入和性能表现可能达不到预期。如果将其他架构引入云服务,一方面应用移植和多代码库管理会产生高昂成本,另一方面实际性能表现可能不及预期,由此可见这是一种不可取的高风险举措。 

最高可达
75%

单位成本性能提升2

相比基于其他架构的处理器,AMD EPYC(霄龙)服务器 CPU 的单位成本性能提升多达 75%。2

AMD EPYC(霄龙)服务器 CPU 是企业 AI 的卓越之选3

无论是在云端还是本地,无论是大型还是小型部署,AMD EPYC(霄龙)服务器 CPU 都能提供性能强大、经济高效且高度灵活的解决方案,助您轻松完成 AI 发展之旅的每一个阶段。第五代 AMD EPYC(霄龙)9965 在处理能力上表现出色。

最高可达
1.33 倍
语言模型吞吐量显著提升

在 Llama3.1-8B 翻译应用场景中,第五代 AMD EPYC(霄龙)9965 的推理吞吐量最高可达到参考基准的 1.33 倍4

最高可达
1.93 倍
机器学习工作负载吞吐量显著提升

在运行 XGBoost 时,第五代 AMD EPYC(霄龙)9965 的吞吐量最高可达到参考基准的 1.93 倍5

最高可达
1.7 倍
端到端 AI 基准测试吞吐量显著提升

第五代 AMD EPYC(霄龙)9965 的通用 AI (TPCx-AI) 吞吐量最高可达到参考基准的 1.7 倍6

AMD EPYC(霄龙)服务器 CPU 常见问题解答

是的。在当前的 x86 服务器处理器中,第五代 AMD EPYC(霄龙)服务器 CPU 的核心数量居前。AMD EPYC(霄龙)9965 服务器 CPU 拥有 192 个核心,在 1 个核心对应 1 个虚拟 CPU (vCPU) 的配置下,其支持的 vCPU 数量比参考基准(144 个核心)多出 33%。

通过将第五代 AMD EPYC(霄龙)服务器 CPU 与参考基准进行比较,可以发现 AMD EPYC(霄龙)服务器 CPU 在通用计算、端到端 AI 性能以及能效方面均具有显著优势。在通用计算方面,AMD EPYC(霄龙)服务器 CPU 实现高达 35% 的性能提升。7在能耗方面,AMD EPYC(霄龙)服务器 CPU 实现高达 66% 的能效提升。8在端到端 AI 性能方面,AMD EPYC(霄龙)服务器 CPU 性能提升高达 70%。9

迁移到 AMD 处理器并不难。许多处理器与 AMD EPYC(霄龙)服务器 CPU 一样,均采用 x86 架构。这种情况下,可以轻松完成应用层面的迁移。针对虚拟机 (VM) 的迁移,AMD 提供了 VMware Architecture Migration Tool,可帮助自动完成迁移。 

可以。AMD EPYC(霄龙)服务器 CPU 性能卓越,可以顺畅运行虚拟机 (VM)、数据库和其他企业应用。第五代 AMD EPYC(霄龙)服务器 CPU 具备高核心密度和出色性能,可高效处理云工作负载,非常适合用于虚拟机。AMD EPYC(霄龙)服务器 CPU 还能够快速处理数据库工作负载,为代理式 AI 和分析添能助力。此外,EPYC(霄龙)处理器拥有出色的通用计算性能并且兼容 x86 架构,可出色支持企业应用

选择 AMD EPYC(霄龙)服务器 CPU 时,您需要综合考量性能、能效需求以及价格预期。全新 EPYC(霄龙)系列涵盖多种不同的 CPU,核心数从 8 核到 192 核,功耗从 155 W 到 500 W 不等。

全球多家知名数据中心硬件制造商,包括 Cisco、Dell、HPE、Lenovo、Oracle、Supermicro 等,均生产采用 AMD EPYC(霄龙)服务器 CPU 的系统。AMD 与原始设备制造商合作伙伴、软件供应商、销售商以及开源社区紧密合作,不断推出卓越解决方案。

您可以通过常用的云服务提供商(包括 AWS、Microsoft Azure、Google Cloud、Oracle Cloud 等),选择基于 AMD EPYC(霄龙)服务器 CPU 的云实例。AMD 与云服务提供商密切合作,确保基于 AMD EPYC(霄龙)服务器 CPU 的虚拟机 (VM) 能够实现卓越的性能和成本效益。

AMD EPYC(霄龙)解决方案为核心数据中心工作负载赋能助力

AMD EPYC(霄龙)服务器 CPU 解决方案为重要行业赋能助力

AMD EPYC(霄龙)服务器 CPU 的实际应用

AMD EPYC(霄龙)部署方案

Close-up of a server

广泛的生态系统支持,满足本地部署需求 

我们携手众多原始设备制造商 (OEM) 合作伙伴,推出卓越的企业级硬件。我们拥有阵容齐全、高度成熟的软硬件解决方案组合,包括通用 CPU、AI 专用高级 GPU 以及可互操作的网络解决方案。

Mother Board CPU

充分释放云价值

选择基于 AMD 技术的虚拟机 (VM),在常用的云环境中实现卓越性能,同时降低运营支出。

资源

联系 AMD

订阅接收 AMD 资讯和公告,包括即将举行的活动和网络研讨会。

与 AMD EPYC(霄龙)服务器 CPU 销售专家取得联系。

附注
  1. 此场景包含许多假设和估计,尽管基于 AMD 内部研究和最佳逼近原则,但应视为一个示例,仅供参考,不能用作实际测试的决策依据。通过 AMD 服务器和温室气体排放总体拥有成本估算工具 v1.3,评估实现 391000 单位的 SPECrate®2017_int_base 总体性能所需的特定 AMD EPYC(霄龙)CPU 服务器解决方案(采用截至 2024 年 11 月 21 日发布的数据)。经估算,基于双路 EPYC(霄龙)9965(192 核)的服务器获得 3100 分 (https://spec.org/cpu2017/results/res2024q4/cpu2017-20241004-44979.pdf)。我们利用这些数据对环境影响进行了评估,并采用了“2024 年全球电力排放系数”中的国家/地区特定电力排放系数,以及美国国家环境保护局“温室气体当量计算器”。有关更多详情,请访问 https://www.amd.com/zh-cn/legal/claims/epyc.html#q=9xx5TCO-005。 (9xx5TCO-005)
  2.  Phoronix,“AWS Graviton4 Benchmarks Prove to Deliver the Best ARM Cloud Server Performance”,第 7 页,2024 年 7 月 12 日。单位成本性能的计算方式为:几何平均性能除以完成工作负载的总成本。所示价格是美国东部地区通用云计算实例的按需定价,基于 2024 年 7 月至 2025 年 6 月(最后的核查时间)期间的费率。在此期间,未发现价格有所变化。定价可能会随时更改。
  3. 基于截至 2024 年 10 月 10 日已上市服务器的线程密度、性能、特性、制程工艺和内置安全功能。EPYC(霄龙)9005 系列 CPU 提供超高线程密度,打破 500 多项性能世界纪录,其中包括创世界纪录的企业级 Java® 运算性能(每秒运算次数 ops/sec)、拥有出色浮点吞吐量性能的卓越高性能计算解决方案,以及拥有卓越 TPCx-AI 性能和最高能效得分的 AI 端到端性能。第五代 EPYC(霄龙)系列还拥有更多 DDR5 内存通道、更大内存带宽,并支持更多 PCIe® Gen5 通道,可实现更高的 I/O 吞吐量;此外,每核 L3 高速缓存提升多达 5 倍,可实现更快的数据访问速度。EPYC(霄龙)9005 系列采用先进的 3-4 纳米制程工艺,提供安全内存加密 + 安全加密虚拟化 (SEV) + SEV 加密状态 + SEV 安全嵌套分页等安全功能。(EPYC-029D)
  4. 9xx5-156:Llama3.1-8B 吞吐量测试结果基于截至 2025 年 4 月 8 日的 AMD 内部测试。Llama3.1-8B 配置:BF16,批次大小为 32,32 核实例,输入/输出 token 配置(应用场景):[摘要生成 = 1024/128,聊天机器人 = 128/128,翻译 = 1024/1024,文章编写 = 128/1024]。双路 AMD EPYC(霄龙)9965(共 384 个核心),1.5TB 24x64GB DDR5-6400,1.0 Gbps NIC,3.84 TB Samsung MZWLO3T8HCLS-00A07,Ubuntu® 22.04.5 LTS,Linux 6.9.0-060900-generic,BIOS RVOT1004A(SMT=off、mitigations=on、Determinism=Power),NPS=1,ZenDNN 5.0.1;双路 AMD EPYC(霄龙)9755(共 256 个核心),1.5TB 24x64GB DDR5-6400,1.0 Gbps NIC,3.84 TB Samsung MZWLO3T8HCLS-00A07,Ubuntu® 22.04.4 LTS,Linux 6.8.0-52-generic,BIOS RVOT1004A(SMT=off、mitigations=on、Determinism=Power),NPS=1,ZenDNN 5.0.1 结果:CPU 参考基准 9755 9965 摘要 1 n/a 1.093 翻译 1 1.062 1.334 文章 1 n/a 1.14 结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。
  5. 9xx5-162:XGBoost(每小时运行次数)吞吐量测试结果基于截至 2025 年 4 月 8 日的 AMD 内部测试。XGBoost 配置:v1.7.2,Higgs 数据集,32 核心实例,FP32;双路 AMD EPYC(霄龙)9965(共 384 个核心),1.5TB 24x64GB DDR5-6400 (6000 MT/s),1.0 Gbps NIC,3.84 TB Samsung MZWLO3T8HCLS-00A07,Ubuntu® 22.04.5 LTS,Linux 5.15 kernel,BIOS RVOT1004A(SMT=off、mitigations=on,Determinism=Power),NPS=1;双路 AMD EPYC(霄龙)9755(共 256 个核心),1.5TB 24x64GB DDR5-6400 (6000 MT/s),1.0 Gbps NIC,3.84 TB Samsung MZWLO3T8HCLS-00A07,Ubuntu® 22.04.4 LTS,Linux 5.15 kernel,BIOS RVOT1004A(SMT=off、mitigations=on,Determinism=Power),NPS=1 结果:CPU 吞吐量 相对提升幅度 参考基准 400 1 双路 9755 436 1.090 双路 9965 771 1.928 结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。
  6.  9xx5-151:TPCxAI @SF30 多实例(32 核心实例大小)吞吐量测试结果基于截至 2025 年 4 月 1 日的 AMD 内部测试,测试时运行了多个 VM 实例。综合端到端 AI 吞吐量测试结果源自 TPCx-AI 基准测试,与已发布的 TPCx-AI 结果不具有可比性,因为端到端 AI 吞吐量测试结果不符合 TPCx-AI 规范。双路 AMD EPYC(霄龙)9965(总得分为 6067.53 AIUCpm,共 384 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910),3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu® 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on);双路 AMD EPYC(霄龙)9755(总得分为 4073.42 AIUCpm,共 256 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910) 3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on)。结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。TPC、TPC Benchmark 和 TPC-H 是 Transaction Processing Performance Council 的商标。
  7. 9xx5-129:SPECrate®2017_int_base(使用 GCC13)评估结果基于截至 2025 年 4 月 1 日的 AMD 内部测试。双路 AMD EPYC(霄龙)9965(预计 2160 SPECrate®2017_int_base,共 384 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910),3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu® 22.04.3 LTS | 5.15.0-105-generic,SMT=ON,Determinism=power,Mitigations=on);双路 AMD EPYC(霄龙)9755(预计 1850 SPECrate®2017_int_base,共 256 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910) 3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu 22.04.3 LTS | 5.15.0-105-generic,SMT=ON,Determinism=power,Mitigations=on)。SPEC®、SPEC CPU® 和 SPECrate® 是 Standard Performance Evaluation Corporation 的注册商标。有关更多信息,请访问 www.spec.org。‎
  8. 9xx5-134:SPECpower_ssj® 2008 评估结果基于 www.spec.org 上公布的分数(截至 2025 年 4 月 30 日)。双路 AMD EPYC(霄龙)9965(35920 ssj_ops/watt,共 384 个核心,https://spec.org/power_ssj2008/results/res2024q4/power_ssj2008-20241007-01464.html);双路 AMD EPYC(霄龙)9755(29950 ssj_ops/watt,共 256 个核心,https://spec.org/power_ssj2008/results/res2024q4/power_ssj2008-20240924-01460.html。SPEC®、SPEC CPU® 和 SPECpower® 是 Standard Performance Evaluation Corporation 的注册商标。有关更多信息,请访问 www.spec.org
  9. 9xx5-151:TPCxAI @SF30 多实例(32 核心实例大小)吞吐量测试结果基于截至 2025 年 4 月 1 日的 AMD 内部测试,测试时运行了多个 VM 实例。综合端到端 AI 吞吐量测试结果源自 TPCx-AI 基准测试,与已发布的 TPCx-AI 结果不具有可比性,因为端到端 AI 吞吐量测试结果不符合 TPCx-AI 规范。双路 AMD EPYC(霄龙)9965(总得分为 6067.53 AIUCpm,共 384 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910),3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu® 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on);双路 AMD EPYC(霄龙)9755(总得分为 4073.42 AIUCpm,共 256 个核心,500W TDP,AMD 参考系统,1.5TB 24x64GB DDR5-6400,2 x 40 GbE Mellanox CX-7 (MT2910) 3.84TB Samsung MZWLO3T8HCLS-00A07 NVMe,Ubuntu 24.04 LTS kernel 6.13,SMT=ON,Determinism=power,Mitigations=on)。结果可能会因系统配置、软件版本和 BIOS 设置等因素而有所不同。TPC、TPC Benchmark 和 TPC-H 是 Transaction Processing Performance Council 的商标。