AMD 助力台积电扩充半导体制造产能

通过部署第四代 AMD EPYC(霄龙)处理器,以更少的服务器、更低的成本实现更高性能

作为全球半导体晶圆代工巨头,台积电仍抱有进一步扩张的雄心壮志。为实现进一步扩张,台积电需要更高的算力来支持生产和研发工作以及整体 IT 基础设施。在台积电的芯片生产过程中,AMD EPYC(霄龙)处理器早已发挥着重要作用,而第四代 AMD EPYC(霄龙)CPU 则进一步为台积电赋能,助其实现扩张目标。

台积电基础架构与通信服务部主管 Simon Wang 表示:“台积电正在快速扩张。我们将扩大全球制造业务版图,在台湾、日本、德国和美国兴建新的晶圆厂。这意味着,我们将需要海量算力来支持晶圆厂的生产、研发、仿真及业务运营。”

台积电希望通过升级基础设施,在限制功耗的前提下充分提高计算性能。Simon Wang 表示:“在评估服务器和存储产品时,我们主要关注单位功耗计算性能、所占空间以及成本。我们的工作负载大致分为三类。第一类工作负载是自动化晶圆厂生产。第二类是研发,包括仿真和设计,目前主要采用 Cadence 和 Synopsys 的电子设计自动化软件。掩模制造和预研也需要大量算力。另外,我们还在为下一代产品寻找新材料和新技术。第三类则涉及业务运营,包括接单、人力资源和法务等辅助部门的日常运营。”

Lobby of TSMC corporation with a big entry desk.
台积电是全球半导体芯片制造巨头,其 2023 年产值(不含存储器)占全球半导体产值的 28%。

为台积电的三大工作负载“添薪加火”

Simon Wang 称:“在晶圆厂自动化生产方面,我们主要依靠 CPU 为运行虚拟机或 Kubernetes 的 Linux 平台提供动力。这需要大量存储做支撑。在研发方面,我们同时使用 CPU 和 GPU。相较于这两方面的工作负载,业务运营涉及的工作负载较为有限,因为这些都是辅助部门使用的系统,而且它们大多使用 CPU 服务器。”

虽然台积电是 AMD EPYC(霄龙)系列处理器的制造合作伙伴,但受内部规章约束,Simon Wang 对即将推出的 AMD 产品并不是特别了解,不过他对前几代产品的使用体验非常满意。Simon Wang 从 AMD 台湾区经理处了解到 EPYC(霄龙)处理器的产品路线图,但仍需确保新一代处理器能够满足台积电的需求。他表示:“台积电的 IT 部门还有一项责任,那就是证明我们生产的产品是好产品。换言之,我们想要证明,台积电生产的新一代 AMD 处理器比上一代性能更好、功耗更低。”

“IT 部门首先要根据工作负载确定所需的配置,”Simon Wang 表示,“我们需要明确 CPU 规格、时钟频率、内存,以及固态硬盘 (SSD) 规格。每年,我们都会确定五到七种配置,将其发送给多个供应商,征求他们的反馈意见。这是一个公开招标的过程,最终供应商由我们自行决定。我们并未与任何供应商绑定。我们会综合考量价格、性能和能效等各个方面,从而确定最终采用哪个供应商。”

添加 Alt 文本
台积电在半导体微型化设计创新方面处于领先地位。

AMD EPYC(霄龙)CPU 助力实现成本和性能优化

Simon Wang 表示:“对于如何部署第四代 AMD EPYC(霄龙)处理器,我们考虑了两种方案:一种是单路 CPU,另一种是双路 CPU,两者的总核数相同。我们从成本和性能两方面对这两种配置进行了评估。起初,我们认为双路 CPU 效果会更好,但结果表明单路 CPU 更胜一筹。”

Simon Wang 补充说:“在性能测试方面,我们采用市场上的通用工具。此外,我们还使用自己的预生产环境进行测试,了解工作负载的运行情况和响应时间。不仅如此,我们在晶圆厂和研发设计中心也进行了测试。除了测试性能和功耗之外,我们还测试服务器的可操作性,其中就包括自动配置,我们与供应商合作开展这项测试。”

“我们发现,与上一代相比,第四代 AMD EPYC(霄龙)CPU 在成本和性能上的总体表现提升了 30% 以上。”Simon Wang 说道,“在晶圆厂自动化生产中,CPU 升级过程非常轻松顺畅。IT 部门也平稳顺利地完成了升级。唯一比较费时费力的工作就是制作研发掩模,因为这道工艺对精度的要求非常高,不过 AMD CPU 最终还是获得了我们团队的认可。”

他补充道:“今年 1 月,我们查看了去年购买的 CPU 总数量以及今年的采购计划。我们发现,通过部署第四代 AMD EPYC(霄龙)CPU,我们购买的服务器数量有所减少,而计算性能提升了 30% 至 40%。因此,升级 CPU 势在必行。”此外,对于台积电而言,每台服务器的性能提升还意味着,数据中心能以更少的空间提供相同的性能。

添加 Alt 文本
台积电的半导体芯片晶圆产自先进的制造厂

性能更佳、成本更低、功耗更小

得益于服务器密度的提高,功耗也有所降低。“每瓦功耗的计算性能提高了 10% 到 20%,”Simon Wang 表示,“AMD 处理器的显著特点在于,每个 CPU 拥有更多核心,能够支持更多内存。每路的成本和性能也得到了优化。我们发现,在核心数量相同的情况下,单路 CPU 的性能提高了近 10%,而且成本更低。根据我们的经验,运行第四代 AMD EPYC(霄龙)处理器时,能效表现可提升 30% 以上。目前,在台积电先进的晶圆厂内,90% 以上的工作负载都在第四代 AMD EPYC(霄龙)CPU 上运行。为支持三个领域的工作负载,台积电 IT 部门当前部署了近 20,000 台基于 AMD EPYC(霄龙)CPU 的服务器,其中 6,600 台服务器已在使用第四代 AMD EPYC(霄龙)CPU。”

现在,台积电使用第四代 AMD EPYC(霄龙)9124 和 9354P 处理器运行 Kubernetes 一般工作节点,使用 9254 处理器运行 Kubernetes 数据库节点,并使用 9254 或 9454P 处理器运行 Cassandra 节点。“我们将继续在数据中心部署 AMD CPU,因为根据我们的经验,AMD CPU 在成本、性能和每瓦算力等各个方面都更具优势,”Simon Wang 表示,“我们现在采购的 X86 服务器中,有 90% 以上都使用第四代 AMD EPYC(霄龙)CPU。我们将密切关注 AMD 的下一代产品。”

“使用全新产品提升数据中心性能,是台积电 IT 部门的一贯政策。”Simon Wang 称,“AMD 产品核心密度高,能够支持大量内存,不仅非常适合云原生环境,也非常适合多租户和多任务环境。而且,成本也不高。”

Simon Wang 总结道:“我们与 AMD 的合作非常顺畅融洽。AMD 的产品充分满足了我们对性能和成本的要求。我们很期待 AMD 新一代 GPU,包括速度更快、性能更高的 Instinct MI300X。届时,我们将可以为更多的工作负载部署 AMD 技术。”

待定
未来十年,台积电计划进一步拓展其全球芯片制造业务,推动其商业版图扩张到更多国家和地区。

关于客户


台积电成立于 1987 年,开创了纯晶圆代工业务模式并一直专注于代工业务,现已成为全球半导体晶圆代工巨头。公司通过行业领先的制程工艺和各种设计赋能解决方案,为全球客户与合作伙伴生态系统提供全面支持,推动全球半导体行业的创新发展。台积电跨全球开展运营,业务版图覆盖亚洲、欧洲和北美,并坚持履行全球企业公民责任。台积电在 2023 年部署了 288 种不同的制程工艺,为 528 家客户代工生产 11895 种产品;通过提供各种先进、专业的封装技术服务,充分满足客户的各类需求。该公司总部位于台湾新竹。如需了解更多信息,请访问 tsmc.com

成功案例资料


  • 行业:
    半导体制造
  • 挑战
    优化数据中心成本与性能,推动全球业务扩张
  • 解决方案:
    部署第四代 AMD EPYC(霄龙)处理器,支持晶圆生产、研发和业务运营
  • 结果:
    以更少的服务器和更低的功耗,实现高达 40% 的性能提升
  • AMD 技术一览:
    第四代 AMD EPYC(霄龙)处理器
  • 技术合作伙伴:
输入 Alt 文本
Hewlett Packard Enterprise
Lenovo 标识
SuperMicro

希望详细了解 AMD 可以为您的数据中心提供哪些解决方案吗?