

概述
彈性的即時預處理
AMD 可程式化邏輯造就差異化,讓設計師能連接任何類型的感測器,建立低延遲的專屬處理功能。
高效率 AI 推論
新一代 AI 引擎支援更廣泛的資料類型,與前一代 AI 引擎架構相比,每瓦 TOPS 最多高 3 倍。1
高效能後處理
針對複雜的決策和類似的工作負載,經過增強的處理系統,其純量運算高達第一代 Versal 器件的 10 倍2。
端對端驅動 AI 系統
運算的三個階段皆能加速
第 2 代 Versal AI Edge 系列自適應晶片上系統 (System-on-Chip, SoC) 支援具備彈性的即時預處理、高效率 AI 推論,以及高效能後處理,同時減少佔用面積與複雜度。


提升系統效能
發揮異構運算的靈活度
第 2 代 Versal AI Edge 系列自適應 SoC 具有世界級的可程式化邏輯、整合式處理器、進階安全與安全性功能等,能完成的工作不僅僅只有推論。
產品優勢
正式推出第 2 代 Versal AI Edge 系列
第 2 代 Versal AI Edge 系列自適應 SoC 進一步強化了經過正式生產環境實證的 Versal 架構,在增強安全與安全性的基礎上,將世界級 Versal 可程式化邏輯與全新高效能處理系統和新一代 AI 引擎結合在單一裝置中。
主要功能
請參閱資料表概覽,瞭解每個器件/封裝的功能組合。
處理系統
最高 8 個 Arm® Cortex®-A78AE 應用處理器和最高 10 個 Cortex-R52 即時處理器,其設計可提供總計超過 20 萬 DMIP 的運算能力,並支援 USB 3.2、DisplayPort™ 1.4、10 GbE、PCIe® Gen5 及其他周邊設備。
可程式化邏輯與 I/O
世界級 Versal 可程式化邏輯,以及具有 MIPI C-PHY 支援的全新高效能 X5IO,可提供靈活彈性與即時處理能力,並能適應未來需求。
AI 引擎
全新 AIE-ML v2 磚的設計,與前一代產品相比,可提供 2 倍的每磚運算能力3、強大的能效,以及新的原生資料類型,包括可提升輸送量和每瓦效能的 MX6 和 MX9。
硬式影像/視訊處理
新的 Image Signal Processor (ISP) 智財 (Intellectual Property, IP) 可加速影像處理,而增強的視訊編解碼器單元 (VCU) 磚支援 HEVC 和 AVC 4K60,4:4:4,12 位元編碼和解碼。5
DDR5 與 LPDDR5X
硬式 DDR 記憶體控制器用全新內嵌加密功能支援 DDR5-6400 與 LPDDR5X 8533,可提供高達 170 GB/s 的記憶體頻寬。
整合式顯示卡
Arm Mali™-G78AE 顯示卡能以高達 268 GFLOPS 的運算能力,實現解析度高達 4K60 的顯示/HMI 應用。6 請閱讀白皮書瞭解更多資訊。
探索其他 Versal 自適應 SoC 功能

第 2 代 Versal AI Edge 系列產品簡介
瞭解第 2 代 Versal AI Edge 系列自適應 SoC 如何在以增強安全與安全性為基礎所打造的單一器件中,為 AI 驅動的嵌入式系統提供端對端加速。
推動汽車創新
隨著電動車、自動駕駛車輛技術的興起,以及安全與資訊娛樂系統的推陳出新(許多是由 AI 推動),汽車產業正面臨巨大的變革,同時也迎來可觀的商機。在本電子書中,您將瞭解推動這項變革的當前趨勢,以及這些趨勢所帶來的技術和製造挑戰。


應用與產業

ADAS 和自動駕駛
第 2 代 Versal AI Edge 系列自適應 SoC 專為滿足汽車先進駕駛輔助系統 (ADAS) 與自動駕駛 (AD) 的中央運算要求而設計,其中包含增強的 AI 引擎,可提供較前一代更高的效率,以及高達 3 倍的每瓦效能1。第 2 代 AI Edge 系列器件的異質架構,非常適合需要感測器融合與即時決策的多感測器視覺感知系統。
工業自動化、機器人與機器視覺
高生產力是工業自動化、機器人及機器視覺應用的主要目標之一。第 2 代 Versal AI Edge 系列自適應 SoC 經過最佳化,能有效率地處理這些需要密集處理的工作負載,同時妥善應對各項關鍵考量,例如功能安全、延遲、確定性、感測器介面、AI 推論、功率、即時控制,以及網路連線。


航太與國防
第 2 代 Versal AI Edge 系列適合多種不同的航太國防 (Aerospace and Defense, A&D) 應用,包括從自主系統,到在任務運算、板載網路、軟體定義無線電和成像等領域應用 AI 推論的系統,再到最先進的偵測與追蹤,以及感測器融合系統。
醫療造影
對今日的醫療診斷造影設備而言,高品質影像、掃描深度、AI 處理,以及即時顯示結果,都是相當重要的。像第 2 代 Versal AI Edge 系列這樣的晶片上系統系列產品具備標定的運算與記憶體效能、整合式硬體功能加速器、新一代的高速連線能力,以及豐富的軟體開發環境,因此相當適合用在醫學影像設備上。


嵌入式 AI Box
隨著即時邊緣 AI 應用程式與要求嚴苛的系統問世,我們比過去更需要同時考量電源、延遲與 AI 效能。第 2 代 Versal AI Edge 系列的設計,是透過其 AI 引擎磚和視訊編解碼器單元來提升 AI 效能,並將延遲最佳化。它還提供可自行調適的 I/O 介面與參考設計,可簡化即時資料同步程序與設計程序。
產品規格
AI 效能
2VE3304 | 2VE3358 | 2VE3504 | 2VE3558 | 2VE3804 | 2VE3858 | |
---|---|---|---|---|---|---|
INT8 TOPS(密集) | 31 | 31 | 123 | 123 | 184 | 184 |
INT8 TOPS(最大稀疏性) | 61 | 61 | 246 | 246 | 369 | 369 |
MX6 TOPS(密集) | 61 | 61 | 246 | 246 | 369 | 369 |
AI 引擎
2VE3304 | 2VE3358 | 2VE3504 | 2VE3558 | 2VE3804 | 2VE3858 | |
---|---|---|---|---|---|---|
AIE-ML v2 磚 | 24 | 24 | 96 | 96 | 144 | 144 |
處理系統
2VE3304 | 2VE3358 | 2VE3504 | 2VE3558 | 2VE3804 | 2VE3858 | |
---|---|---|---|---|---|---|
應用程式核心數/即時核心數 | 4 / 4 | 8 / 10 | 4 / 4 | 8 / 10 | 4 / 4 | 8 / 10 |
應用程式處理器 | Arm Cortex-A78AE,64 KB I 具備同位位元,D 具備 ECC L1 快取記憶體、512 KB L2 快取記憶體、1 MB L3 快取記憶體(每 2 核心叢集)、CMN600,搭配 4 MB 末級快取記憶體(共用) | |||||
即時處理器 | Arm Cortex-R52,32 KB L1 快取記憶體具備 ECC、128 KB TCM 具備 ECC | |||||
記憶體 | 支援 ECC 的 2 MB 晶片上記憶體 | |||||
高速連線能力 | PCI Express® Gen5x4,USB 3.2,DisplayPort™ 1.4,10G 乙太網路,1G 乙太網路,UFS 3.1 | |||||
一般連線能力 | CAN/CAN-FD、SPI、UART、USB 2.0、I2C/I3C、GPIO |
可程式化邏輯
2VE3304 | 2VE3358 | 2VE3504 | 2VE3558 | 2VE3804 | 2VE3858 | |
---|---|---|---|---|---|---|
系統邏輯單元 | 206,920 | 206,920 | 492,188 | 492,188 | 1,188,040 | 1,188,040 |
LUT | 94,592 | 94,592 | 225,000 | 225,000 | 543,104 | 543,104 |
DSP 引擎 | 184 | 184 | 700 | 700 | 2,064 | 2,064 |
記憶體、介面、I/O 及收發器
2VE3304 | 2VE3358 | 2VE3504 | 2VE3558 | 2VE3804 | 2VE3858 | |
---|---|---|---|---|---|---|
PL 記憶體總計 (Mb) | 21.1 | 21.1 | 23.9 | 23.9 | 97.0 | 97.0 |
最大記憶體頻寬 (LPDDR5X) | 102 GB/s | 102 GB/s | 136 GB/s | 136 GB/s | 170 GB/s | 170 GB/s |
100G 多速率乙太網路 MAC | 1 | 1 | 1 | 1 | 3 | 3 |
PL PCIe (Gen5x4) | 1 | 1 | 3 | 3 | 4 | 4 |
高效能 I/O | 260 | 260 | 384 | 384 | 512 | 512 |
GTYP 收發器(僅限 PL) | 4 | 4 | 12 | 12 | 20 | 20 |
影像/視訊處理
2VE3304 | 2VE3358 | 2VE3504 | 2VE3558 | 2VE3804 | 2VE3858 | |
---|---|---|---|---|---|---|
視訊編解碼器單元 (VCU) 磚 | 0 | 1 | 0 | 1 | 0 | 1 |
Image Signal Processor (ISP) 磚 | 0 | 1 | 0 | 3 | 0 | 3 |
顯示卡 | 1x 4 核心 Arm Mali-G78AE 顯示卡 |
適用於所有開發人員
AMD 提供領先業界的軟體開發環境,可使用自適應 SoC 和現場可程式化閘陣列 (Field Programmable Gate Array, FPGA) 進行設計,包括工具(編譯器、模擬器等)、IP 和解決方案。
此環境可縮短開發時間,同時讓開發人員達成高每瓦效能的目標。AMD 自適應 SoC 與 FPGA 設計工具讓 AI 科學家、應用程式與演算法工程師、嵌入式軟體開發人員,以及傳統硬體開發人員等各種開發人員,都能使用 AMD 自適應運算解決方案。

資源

搶先體驗計畫
第 2 代 Versal AI Edge 系列目前處於搶先體驗階段。請聯絡您當地的 AMD 銷售代表,申請加入搶先體驗計畫,或造訪「聯絡銷售人員」頁面。
掌握最新動態
加入 Versal 自適應 SoC 通知清單,以接收最新消息與更新。
尾註
- 根據 AMD 內部對於第 2 代 Versal AI Edge 系列中 AIE-ML v2 運算磚架構的效能和功率估計,使用的是 MX6 資料類型;比較對象是第一代 Versal AI Edge 系列中 AIE-ML 運算磚架構的效能規格和 AMD Power Design Manager 功率結果,使用的是 INT8 資料類型。假設:2 列 8 欄子陣列。作業條件:1 GHz Fmax,0.7V AIE 操作電壓,100°C 接面溫度,典型程序,60% 向量負載,啟動 % = 0 < 10%。最終產品上市時,實際效能會有所不同。2024 年 3 月的效能預測。(VER-023)
- 根據 AMD 內部的矽前效能估計,配置 8 個 Arm Cortex-A78AE 應用核心 (@2.2 GHz) 和 10 個 Arm Cortex-R52 即時核心 (@1.05 GHz) 時,第 2 代 Versal AI Edge 系列和第 2 代 Versal Prime 系列處理系統的 DMIP 總數,與第一代 Versal AI Edge 系列和 Versal Prime 系列處理系統的發布 DMIP 總數相比較。第 2 代 Versal AI Edge 系列與第 2 代 Prime 系列作業條件:最高可用速度等級、0.88 V PS 操作電壓、分割模式作業、最大支援作業頻率。第一代 Versal AI Edge 系列與 Prime 系列的作業條件:最高可用速度等級、0.88 V PS 操作電壓、最大支援作業頻率。最終產品上市時,實際的 DMIP 效能會有所不同。(VER-027)
- 根據第 2 代 Versal AI Edge 系列中 AIE-ML v2 運算磚架構產品規格的 1024 INT8 次運算/時脈,與第一代 Versal AI Edge 系列中 AIE-ML 運算磚架構發佈產品規格的 512 INT8 ops/時脈相比較。2024 年 2 月的效能預測。(VER-024)
- 根據 AMD 內部矽前功能安全目標與效能預估,當配置 8 個 Arm Cortex-A78AE 應用核心 (@2.2 GHz) 時,第 2 代 Versal AI Edge 系列與第 2 代 Versal Prime 系列處理系統中應用處理單元 (Application Processing Unit, APU) 的總 DMIP。作業條件:最高可用速度等級,0.88 V PS 操作電壓,以及最大支援作業頻率,所有 APU 核心在鎖步模式下運作。最終產品上市時,實際效能會有所不同。(VER-028)
- 視訊編解碼加速(至少包括 HEVC (H.265)、H.264、VP9 和 AV1 編解碼)需要包括/安裝相容的媒體播放器,方能使用。(GD-176)
- 根據 Arm 針對第 2 代 Versal AI Edge 系列和第 2 代 Versal Prime 系列器件所發佈的產品規格,分別配置 4 核心 Arm Mali-G78AE 顯示卡,最大作業頻率 1050 MHz,每 ops/每核心/每時脈 64 FP32,以及每 ops/每核心/每時脈 4 紋素。第 2 代 Versal AI Edge 系列和第 2 代 Prime 系列產品的實際最終產品上市時,效能會有所不同。(VER-030)
- 根據 AMD 內部對於第 2 代 Versal AI Edge 系列中 AIE-ML v2 運算磚架構的效能和功率估計,使用的是 MX6 資料類型;比較對象是第一代 Versal AI Edge 系列中 AIE-ML 運算磚架構的效能規格和 AMD Power Design Manager 功率結果,使用的是 INT8 資料類型。假設:2 列 8 欄子陣列。作業條件:1 GHz Fmax,0.7V AIE 操作電壓,100°C 接面溫度,典型程序,60% 向量負載,啟動 % = 0 < 10%。最終產品上市時,實際效能會有所不同。2024 年 3 月的效能預測。(VER-023)
- 根據 AMD 內部的矽前效能估計,配置 8 個 Arm Cortex-A78AE 應用核心 (@2.2 GHz) 和 10 個 Arm Cortex-R52 即時核心 (@1.05 GHz) 時,第 2 代 Versal AI Edge 系列和第 2 代 Versal Prime 系列處理系統的 DMIP 總數,與第一代 Versal AI Edge 系列和 Versal Prime 系列處理系統的發布 DMIP 總數相比較。第 2 代 Versal AI Edge 系列與第 2 代 Prime 系列作業條件:最高可用速度等級、0.88 V PS 操作電壓、分割模式作業、最大支援作業頻率。第一代 Versal AI Edge 系列與 Prime 系列的作業條件:最高可用速度等級、0.88 V PS 操作電壓、最大支援作業頻率。最終產品上市時,實際的 DMIP 效能會有所不同。(VER-027)
- 根據第 2 代 Versal AI Edge 系列中 AIE-ML v2 運算磚架構產品規格的 1024 INT8 次運算/時脈,與第一代 Versal AI Edge 系列中 AIE-ML 運算磚架構發佈產品規格的 512 INT8 ops/時脈相比較。2024 年 2 月的效能預測。(VER-024)
- 根據 AMD 內部矽前功能安全目標與效能預估,當配置 8 個 Arm Cortex-A78AE 應用核心 (@2.2 GHz) 時,第 2 代 Versal AI Edge 系列與第 2 代 Versal Prime 系列處理系統中應用處理單元 (Application Processing Unit, APU) 的總 DMIP。作業條件:最高可用速度等級,0.88 V PS 操作電壓,以及最大支援作業頻率,所有 APU 核心在鎖步模式下運作。最終產品上市時,實際效能會有所不同。(VER-028)
- 視訊編解碼加速(至少包括 HEVC (H.265)、H.264、VP9 和 AV1 編解碼)需要包括/安裝相容的媒體播放器,方能使用。(GD-176)
- 根據 Arm 針對第 2 代 Versal AI Edge 系列和第 2 代 Versal Prime 系列器件所發佈的產品規格,分別配置 4 核心 Arm Mali-G78AE 顯示卡,最大作業頻率 1050 MHz,每 ops/每核心/每時脈 64 FP32,以及每 ops/每核心/每時脈 4 紋素。第 2 代 Versal AI Edge 系列和第 2 代 Prime 系列產品的實際最終產品上市時,效能會有所不同。(VER-030)