

共同超越,一起成就_資料中心
身為高效能運算的領導者2, 3,AMD 提供加速全方位資料中心工作負載的技術,讓科學家、工程師和設計師能更快獲得洞見和更準確的結果。



共同超越,一起成就_AI
AI 在現代世界中越來越普遍。它正在推動我們在零售、城市、工廠和醫療保健領域的智慧技術,並改變我們的數位家庭。AMD 提供從資料中心到邊緣的先進 AI 加速,實現高效能和高效率,讓世界變得更智慧。


共同超越,一起成就_雲端運算
隱私權與進步 - Google Cloud。採用 AMD 的機密運算。世界級的安全性提升企業層次,同時保有效能。

共同超越,一起成就_效能
見證 Mercedes-AMG PETRONAS Formula One™ 車隊與 AMD 聯手提升 F1 賽車時所達到的驚人速度,並探索 AMD EPYC™ 處理器如何讓世界上最快的一些賽車跑得更快。

共同超越,一起成就_開創性的研究
採用 AMD 處理器的超級電腦正在協助推動從氣候變遷到次原子結構的研究進展,解決世界上最艱難的挑戰。探索 LUMI 超級電腦如何推動這項開創性的研究。
共同超越,一起成就_永續運算
節能的資料中心可幫助企業運算和科學研究蓬勃發展。AMD 致力於環境永續發展目標、報告我們的進展,並突破高效能運算的極限。

共同超越,一起成就_汽車
AI 是實現更安全通勤的關鍵。自適應晶片上系統 (System-on-Chip, SoC) 正在為進階感應器和駕駛輔助系統 (ADAS) 提供動力,以實現自動駕駛——不用有人駕車,想去哪就去哪。

共同超越,一起成就_航太
毅力號火星車是降落在火星上最先進的機器。AMD 現場可程式化閘陣列 (Field Programmable Gate Array, FPGA) 驅動探測車的電腦視覺,以偵測小如一粒鹽的樣本。其強大的 AI 在整個任務期間不斷學習和適應 - 推進火星上的探索,尋找火星曾經存在生命的跡象。
共同超越,一起成就_娛樂
娛樂界的想像力是無限的。這就是 AMD 使用世界上最進階處理器加快渲染的原因1。從特效到虛擬製作再到 3D 建模,我們正在賦予電影、電視和遊戲創作者實現他們的願景。
共同超越,一起成就_遊戲
我們滿懷熱忱地生產世界上最進階的處理器、顯示卡和軟體,讓充滿熱情的遊戲玩家有卓越的使用體驗。這就是為什麼 AMD 是唯一可跨類用於電腦、遊戲機和手持設備的處理器。
尾註
- 基於截至 2022 年 2 月的節點規模。GD-203
- MLNX-032:世界最高效能的技術運算比較基於截至 2022 年 2 月 14 日的 AMD 內部測試,測量估計的 SPECrate®2017_fp_base、Ansys Fluent、Altair Radioss 和 Ansys LS-Dyna 應用程式測試用例模擬平均加速的得分、評級或每天工作量,在運行 32 核心 EPYC 7573X 的雙路伺服器、運行 32 核心 Intel Xeon Platinum 8362 的雙路伺服器上進行每核心效能領先測試,在運行堆疊頂 64 核心 EPYC 7773X 的雙路伺服器、運行堆疊頂 40 核心 Intel Xeon Platinum 8380 的雙路伺服器上進行密度效能領先測試。AMD 定義的「技術運算」或「技術運算工作負載」可以包括:電子設計自動化、運算流體動力學、有限元分析、地震斷層掃描、天氣預報、量子力學、氣候研究、分子建模等工作負載。結果可能會因硬體矽版本、硬體和軟體配置以及驅動程式版本等因素而有所不同。SPEC®、SPECrate® 和 SPEC CPU® 是 Standard Performance Evaluation Corporation 的註冊商標。請參閱 www.spec.org 瞭解更多資訊。
- 世界上最快的資料中心顯示卡是 AMD Instinct™ MI250X。AMD 效能實驗室於 2021 年 9 月 15 日前對 1,700 MHz 峰值提升引擎時脈下的 AMD Instinct™ MI250X(128GB HBM2e OAM 模組)加速器進行的計算,計算結果為 95.7 TFLOPS 峰值理論雙精度(FP64 矩陣)、47.9 TFLOPS 峰值理論值雙精度 (FP64)、95.7 TFLOPS 峰值理論單精度矩陣(FP32 矩陣)、47.9 TFLOPS 峰值理論單精度 (FP32)、383.0 TFLOPS 峰值理論半精度 (FP16) 和 383.0 TFLOPS 峰值理論 Bfloat16 格式精度 (BF16) 浮點效能。AMD 效能實驗室於 2020 年 9 月 18 日前對 1,502 MHz 峰值提升引擎時脈頻率下的 AMD Instinct™ MI100(32GB HBM2 PCIe® 卡)加速器進行的計算,計算結果為 11.54 TFLOPS 的峰值理論雙精度 (FP64)、46.1 TFLOPS 的峰值理論單精度矩陣 (FP32)、23.1 TFLOPS 的峰值理論單精度 (FP32)、184.6 TFLOPS 的峰值理論半精度 (FP16) 浮點效能。發表的 1410 MHz 提升引擎時脈下的 NVidia Ampere A100 (80GB) 顯示卡加速器的結果:19.5 TFLOPS 峰值雙精度 Tensor 核心(FP64 Tensor 核心)、9.7 TFLOPS 峰值雙精度 (FP64)。19.5 TFLOPS 峰值單精度 (FP32)、78 TFLOPS 峰值半精度 (FP16)、312 TFLOPS 峰值半精度 (FP16 Tensor Flow)、39 TFLOPS 峰值 Bfloat 16 (BF16)、312 TFLOPS 峰值 Bfloat16 格式精度 (BF16 Tensor Flow)、理論浮點效能。 TF32 資料格式不符合 IEEE 標準,因此不包括在此比較中。https://www.nvidia.com/content/dam/en-zz/Solutions/Data-Center/nvidia-ampere-architecture-whitepaper.pdf,第 15 頁,表 1。MI200-01
- 4P 主機組態包括用於 AI 訓練和高效能運算的 AMD 高效能處理器和顯示卡加速器。目標計算基於使用標準效能指標測量的效能分數(HPC: Linpack DGEMM kernel FLOPS,矩陣大小為 4k)。AI 訓練:較低精度浮點數學 GEMM 內核(例如在 4k 矩陣上運行的 FP16 或 BF16 FLOPS)除以代表性加速運算節點(包括處理器主機 + 記憶體和 4 個顯示卡加速器)的額定耗電量。
- AMD 的目標是從 2020 年到 2030 年將 AMD 營運(範圍 1 和 2 排放)的絕對溫室氣體排放量減少 50%。
- 基於截至 2022 年 2 月的節點規模。GD-203
- MLNX-032:世界最高效能的技術運算比較基於截至 2022 年 2 月 14 日的 AMD 內部測試,測量估計的 SPECrate®2017_fp_base、Ansys Fluent、Altair Radioss 和 Ansys LS-Dyna 應用程式測試用例模擬平均加速的得分、評級或每天工作量,在運行 32 核心 EPYC 7573X 的雙路伺服器、運行 32 核心 Intel Xeon Platinum 8362 的雙路伺服器上進行每核心效能領先測試,在運行堆疊頂 64 核心 EPYC 7773X 的雙路伺服器、運行堆疊頂 40 核心 Intel Xeon Platinum 8380 的雙路伺服器上進行密度效能領先測試。AMD 定義的「技術運算」或「技術運算工作負載」可以包括:電子設計自動化、運算流體動力學、有限元分析、地震斷層掃描、天氣預報、量子力學、氣候研究、分子建模等工作負載。結果可能會因硬體矽版本、硬體和軟體配置以及驅動程式版本等因素而有所不同。SPEC®、SPECrate® 和 SPEC CPU® 是 Standard Performance Evaluation Corporation 的註冊商標。請參閱 www.spec.org 瞭解更多資訊。
- 世界上最快的資料中心顯示卡是 AMD Instinct™ MI250X。AMD 效能實驗室於 2021 年 9 月 15 日前對 1,700 MHz 峰值提升引擎時脈下的 AMD Instinct™ MI250X(128GB HBM2e OAM 模組)加速器進行的計算,計算結果為 95.7 TFLOPS 峰值理論雙精度(FP64 矩陣)、47.9 TFLOPS 峰值理論值雙精度 (FP64)、95.7 TFLOPS 峰值理論單精度矩陣(FP32 矩陣)、47.9 TFLOPS 峰值理論單精度 (FP32)、383.0 TFLOPS 峰值理論半精度 (FP16) 和 383.0 TFLOPS 峰值理論 Bfloat16 格式精度 (BF16) 浮點效能。AMD 效能實驗室於 2020 年 9 月 18 日前對 1,502 MHz 峰值提升引擎時脈頻率下的 AMD Instinct™ MI100(32GB HBM2 PCIe® 卡)加速器進行的計算,計算結果為 11.54 TFLOPS 的峰值理論雙精度 (FP64)、46.1 TFLOPS 的峰值理論單精度矩陣 (FP32)、23.1 TFLOPS 的峰值理論單精度 (FP32)、184.6 TFLOPS 的峰值理論半精度 (FP16) 浮點效能。發表的 1410 MHz 提升引擎時脈下的 NVidia Ampere A100 (80GB) 顯示卡加速器的結果:19.5 TFLOPS 峰值雙精度 Tensor 核心(FP64 Tensor 核心)、9.7 TFLOPS 峰值雙精度 (FP64)。19.5 TFLOPS 峰值單精度 (FP32)、78 TFLOPS 峰值半精度 (FP16)、312 TFLOPS 峰值半精度 (FP16 Tensor Flow)、39 TFLOPS 峰值 Bfloat 16 (BF16)、312 TFLOPS 峰值 Bfloat16 格式精度 (BF16 Tensor Flow)、理論浮點效能。 TF32 資料格式不符合 IEEE 標準,因此不包括在此比較中。https://www.nvidia.com/content/dam/en-zz/Solutions/Data-Center/nvidia-ampere-architecture-whitepaper.pdf,第 15 頁,表 1。MI200-01
- 4P 主機組態包括用於 AI 訓練和高效能運算的 AMD 高效能處理器和顯示卡加速器。目標計算基於使用標準效能指標測量的效能分數(HPC: Linpack DGEMM kernel FLOPS,矩陣大小為 4k)。AI 訓練:較低精度浮點數學 GEMM 內核(例如在 4k 矩陣上運行的 FP16 或 BF16 FLOPS)除以代表性加速運算節點(包括處理器主機 + 記憶體和 4 個顯示卡加速器)的額定耗電量。
- AMD 的目標是從 2020 年到 2030 年將 AMD 營運(範圍 1 和 2 排放)的絕對溫室氣體排放量減少 50%。