为各种 AI 工作负载选择合适技术以推动业务取得成功
为跟上不断加快的 AI 创新步伐和满足日益紧迫的 AI 创新需求,Supermicro 与 AMD 携手合作,以强大技术助您抢占先机。Supermicro 机架就绪服务器采用 AMD EPYC(霄龙)处理器和 AMD Instinct 加速器,助力优化性能、成本效益和可扩展性,满足当今和未来的大规模 AI 工作负载需求。
实现 GPU 加速,攻克 AI 挑战
Supermicro 与 AMD 携手合作,共同打造开放、强大的生态系统,以突破性的强大技术实力满足 AI 生命周期的各种需求,并以卓越性能和效率满足您的特定需求。
AMD EPYC(霄龙)处理器适用于需要尽量接近数据源的小型 AI 模型和工作负载,而 AMD Instinct 加速器则适用于需要超高性能的大型模型和专用 AI 部署。在 BLOOM 176B 等大语言模型上运行推理时,AMD Instinct 平台可以实现吞吐量大幅提升。1
助力现代化改造,为 AI 发展腾出空间
为充分利用 IT 预算,许多数据中心已在积极尝试突破可用空间和/或功耗限制。Supermicro 服务器配备 AMD EPYC(霄龙)处理器,凭借卓越性能和效率助力整合核心工作负载、释放空间并优化功耗和散热,为全新业务关键型 AI 工作负载提供支持。
用 14 台全新 AMD EPYC(霄龙)9965 CPU 服务器取代原有的 100 台服务器2

服务器数量减少多达 87%

功耗降低高达 71%

3 年 TCO 降低高达 67%
与原有服务器相比,AMD EPYC(霄龙)9965 CPU 服务器有助于降低成本和 TCO2

服务器数量减少多达 63%

功耗降低高达 45%

3 年 TCO 降低高达 44%
注意:白盒系统测试结果;如需了解 Supermicro 产品/平台信息,请访问 www.supermicro.com/aplus。

为何现在要进行现代化改造?IDC Perspective 报告
了解 AI 如何推动对高配服务器的需求,以及为什么 IDC 表示如今必须采用现代化技术。
AMD 与 Supermicro 强强联手,让 AI 推理工作化繁为简
申请试用基于 AMD EPYC(霄龙)处理器的 Supermicro H14 服务器,亲身体验这款服务器的强大 AI 工作负载处理能力。

成功案例

资源

新闻通讯与联系方式
订阅 AMD 数据中心行业见解
联系 AMD EPYC(霄龙)和 Supermicro 销售专家
附注
- MI300-34:使用 DeepSpeed Inference 实现的标记生成吞吐量,并搭配 Bloom-176b 模型,输入序列长度为 1948 个标记,输出序列长度为 100 个标记,批处理大小经过调节后在每个系统中产生最高吞吐量,对比基于截至 2023 年 11 月 17 日的 AMD 内部测试结果,每个系统均采用定制 docker 容器。
服务器制造商可能会采用不同的配置而得到不同的结果。性能可能会随使用的驱动程序版本和优化而有所不同。
- 9xx5TCO-001B:此场景包含许多假设和估计,尽管基于 AMD 内部研究和最佳逼近原则,但应视为一个示例,仅供参考,不能用作实际测试的决策依据。AMD 服务器和温室气体排放总体拥有成本估算工具 v1.12 比较了提供 39100 单位 SPECrate2017_int_base 总体性能所需的 AMD EPYC(霄龙)服务器解决方案,采用了截至 2024 年 10 月 10 日发布的分数。经该方案测试,基于双路 EPYC(霄龙)9965(192 核)的服务器获得 3000 分 (https://www.spec.org/cpu2017/results/res2024q4/cpu2017-20240923-44837.pdf)。不同 OEM 出版资料中的双路 EPYC(霄龙)9965 实际 SPECrate®2017_int_base 分数有所不同。我们利用这些数据对环境影响进行了评估,并采用了“2024 年全球电力排放系数 10 – 2024 年 7 月”中的国家/地区特定电力排放系数、美国国家环境保护局“温室气体当量计算器”。
- MI300-34:使用 DeepSpeed Inference 实现的标记生成吞吐量,并搭配 Bloom-176b 模型,输入序列长度为 1948 个标记,输出序列长度为 100 个标记,批处理大小经过调节后在每个系统中产生最高吞吐量,对比基于截至 2023 年 11 月 17 日的 AMD 内部测试结果,每个系统均采用定制 docker 容器。
服务器制造商可能会采用不同的配置而得到不同的结果。性能可能会随使用的驱动程序版本和优化而有所不同。 - 9xx5TCO-001B:此场景包含许多假设和估计,尽管基于 AMD 内部研究和最佳逼近原则,但应视为一个示例,仅供参考,不能用作实际测试的决策依据。AMD 服务器和温室气体排放总体拥有成本估算工具 v1.12 比较了提供 39100 单位 SPECrate2017_int_base 总体性能所需的 AMD EPYC(霄龙)服务器解决方案,采用了截至 2024 年 10 月 10 日发布的分数。经该方案测试,基于双路 EPYC(霄龙)9965(192 核)的服务器获得 3000 分 (https://www.spec.org/cpu2017/results/res2024q4/cpu2017-20240923-44837.pdf)。不同 OEM 出版资料中的双路 EPYC(霄龙)9965 实际 SPECrate®2017_int_base 分数有所不同。我们利用这些数据对环境影响进行了评估,并采用了“2024 年全球电力排放系数 10 – 2024 年 7 月”中的国家/地区特定电力排放系数、美国国家环境保护局“温室气体当量计算器”。