概述

彈性的即時預處理

AMD 可程式化邏輯造就差異化,讓設計師能連接任何類型的感測器,建立低延遲的專屬處理功能。

高效率 AI 推論

新一代 AI 引擎支援更廣泛的資料類型,與前一代 AI 引擎架構相比,每瓦 TOPS 最多高 3 倍。1

高效能後處理

針對複雜的決策和類似的工作負載,經過增強的處理系統,其純量運算高達第一代 Versal 器件的 10 倍2

端對端驅動 AI 系統

運算的三個階段皆能加速 

第 2 代 Versal AI Edge 系列自適應晶片上系統 (System-on-Chip, SoC) 支援具備彈性的即時預處理、高效率 AI 推論,以及高效能後處理,同時減少佔用面積與複雜度。

提升系統效能

發揮異構運算的靈活度

第 2 代 Versal AI Edge 系列自適應 SoC 具有世界級的可程式化邏輯、整合式處理器、進階安全與安全性功能等,能完成的工作不僅僅只有推論。

產品優勢

正式推出第 2 代 Versal AI Edge 系列

第 2 代 Versal AI Edge 系列自適應 SoC 進一步強化了經過正式生產環境實證的 Versal 架構,在增強安全與安全性的基礎上,將世界級 Versal 可程式化邏輯與全新高效能處理系統和新一代 AI 引擎結合在單一裝置中。

請參閱資料表概覽,瞭解每個器件/封裝的功能組合。

主要功能

請參閱資料表概覽,瞭解每個器件/封裝的功能組合。

處理系統

最高 8 個 Arm® Cortex®-A78AE 應用處理器和最高 10 個 Cortex-R52 即時處理器,其設計可提供總計超過 20 萬 DMIP 的運算能力,並支援 USB 3.2、DisplayPort™ 1.4、10 GbE、PCIe® Gen5 及其他周邊設備。

可程式化邏輯與 I/O

世界級 Versal 可程式化邏輯,以及具有 MIPI C-PHY 支援的全新高效能 X5IO,可提供靈活彈性與即時處理能力,並能適應未來需求。

AI 引擎

全新 AIE-ML v2 磚的設計,與前一代產品相比,可提供 2 倍的每磚運算能力3、強大的能效,以及新的原生資料類型,包括可提升輸送量和每瓦效能的 MX6 和 MX9。

安全與安全性功能

升級的安全安全性功能,包括處理系統的 ASIL D/SIL 3 作業、晶片上網路 (Network on Chip, NoC)、記憶體控制器、全新應用程式安全性單元,以及其他比前一代更為增強的安全性功能。處理系統可為 ASIL D/SIL 3 應用程式提供高達 10 萬 DMIP 的運算能力。4

硬式影像/視訊處理

新的 Image Signal Processor (ISP) 智財 (Intellectual Property, IP) 可加速影像處理,而增強的視訊編解碼器單元 (VCU) 磚支援 HEVC 和 AVC 4K60,4:4:4,12 位元編碼和解碼。5

DDR5 與 LPDDR5X

硬式 DDR 記憶體控制器用全新內嵌加密功能支援 DDR5-6400 與 LPDDR5X 8533,可提供高達 170 GB/s 的記憶體頻寬。

整合式顯示卡

Arm Mali™-G78AE 顯示卡能以高達 268 GFLOPS 的運算能力,實現解析度高達 4K60 的顯示/HMI 應用。6 請閱讀白皮書瞭解更多資訊。

探索其他 Versal 自適應 SoC 功能

佔位符

第 2 代 Versal AI Edge 系列產品簡介

瞭解第 2 代 Versal AI Edge 系列自適應 SoC 如何在以增強安全與安全性為基礎所打造的單一器件中,為 AI 驅動的嵌入式系統提供端對端加速。

推動汽車創新

隨著電動車、自動駕駛車輛技術的興起,以及安全與資訊娛樂系統的推陳出新(許多是由 AI 推動),汽車產業正面臨巨大的變革,同時也迎來可觀的商機。在本電子書中,您將瞭解推動這項變革的當前趨勢,以及這些趨勢所帶來的技術和製造挑戰。

Automotive eBook

應用與產業

ADAS 和自動駕駛

第 2 代 Versal AI Edge 系列自適應 SoC 專為滿足汽車先進駕駛輔助系統 (ADAS) 與自動駕駛 (AD) 的中央運算要求而設計,其中包含增強的 AI 引擎,可提供較前一代更高的效率,以及高達 3 倍的每瓦效能1。第 2 代 AI Edge 系列器件的異質架構,非常適合需要感測器融合與即時決策的多感測器視覺感知系統。

工業自動化、機器人與機器視覺

高生產力是工業自動化、機器人及機器視覺應用的主要目標之一。第 2 代 Versal AI Edge 系列自適應 SoC 經過最佳化,能有效率地處理這些需要密集處理的工作負載,同時妥善應對各項關鍵考量,例如功能安全、延遲、確定性、感測器介面、AI 推論、功率、即時控制,以及網路連線。

航太與國防

第 2 代 Versal AI Edge 系列適合多種不同的航太國防 (Aerospace and Defense, A&D) 應用,包括從自主系統,到在任務運算、板載網路、軟體定義無線電和成像等領域應用 AI 推論的系統,再到最先進的偵測與追蹤,以及感測器融合系統。

醫療造影

對今日的醫療診斷造影設備而言,高品質影像、掃描深度、AI 處理,以及即時顯示結果,都是相當重要的。像第 2 代 Versal AI Edge 系列這樣的晶片上系統系列產品具備標定的運算與記憶體效能、整合式硬體功能加速器、新一代的高速連線能力,以及豐富的軟體開發環境,因此相當適合用在醫學影像設備上。

嵌入式 AI Box

隨著即時邊緣 AI 應用程式與要求嚴苛的系統問世,我們比過去更需要同時考量電源、延遲與 AI 效能。第 2 代 Versal AI Edge 系列的設計,是透過其 AI 引擎磚和視訊編解碼器單元來提升 AI 效能,並將延遲最佳化。它還提供可自行調適的 I/O 介面與參考設計,可簡化即時資料同步程序與設計程序。

產品規格

AI 效能

  2VE3304 2VE3358 2VE3504 2VE3558 2VE3804 2VE3858
INT8 TOPS(密集) 31 31 123 123 184 184
INT8 TOPS(最大稀疏性) 61 61 246 246 369 369
MX6 TOPS(密集) 61 61 246 246 369 369

AI 引擎

  2VE3304 2VE3358 2VE3504 2VE3558 2VE3804 2VE3858
AIE-ML v2 磚 24 24 96 96 144 144

處理系統

  2VE3304 2VE3358 2VE3504 2VE3558 2VE3804 2VE3858
應用程式核心數/即時核心數 4 / 4 8 / 10 4 / 4 8 / 10 4 / 4 8 / 10
應用程式處理器 Arm Cortex-A78AE,64 KB I 具備同位位元,D 具備 ECC L1 快取記憶體、512 KB L2 快取記憶體、1 MB L3 快取記憶體(每 2 核心叢集)、CMN600,搭配 4 MB 末級快取記憶體(共用)
即時處理器 Arm Cortex-R52,32 KB L1 快取記憶體具備 ECC、128 KB TCM 具備 ECC
記憶體 支援 ECC 的 2 MB 晶片上記憶體 
高速連線能力 PCI Express® Gen5x4,USB 3.2,DisplayPort™ 1.4,10G 乙太網路,1G 乙太網路,UFS 3.1
一般連線能力 CAN/CAN-FD、SPI、UART、USB 2.0、I2C/I3C、GPIO

可程式化邏輯

  2VE3304 2VE3358 2VE3504 2VE3558 2VE3804 2VE3858
系統邏輯單元 206,920 206,920 492,188 492,188 1,188,040 1,188,040
LUT  94,592 94,592 225,000 225,000 543,104 543,104
DSP 引擎 184 184 700 700 2,064 2,064

記憶體、介面、I/O 及收發器

  2VE3304 2VE3358 2VE3504 2VE3558 2VE3804 2VE3858
PL 記憶體總計 (Mb) 21.1 21.1 23.9 23.9 97.0 97.0
最大記憶體頻寬 (LPDDR5X) 102 GB/s 102 GB/s 136 GB/s 136 GB/s 170 GB/s 170 GB/s
100G 多速率乙太網路 MAC 1 1 1 1 3 3
PL PCIe (Gen5x4) 1 1 3 3 4 4
高效能 I/O 260​ 260​ 384 384 512 512
GTYP 收發器(僅限 PL) 4 4 12 12 20 20

影像/視訊處理

  2VE3304 2VE3358 2VE3504 2VE3558 2VE3804 2VE3858
視訊編解碼器單元 (VCU) 磚 0 1 0 1 0 1
Image Signal Processor (ISP) 磚 0 1 0 3 0 3
顯示卡 1x 4 核心 Arm Mali-G78AE 顯示卡

適用於所有開發人員

AMD 提供領先業界的軟體開發環境,可使用自適應 SoC 和現場可程式化閘陣列 (Field Programmable Gate Array, FPGA) 進行設計,包括工具(編譯器、模擬器等)、IP 和解決方案。

此環境可縮短開發時間,同時讓開發人員達成高每瓦效能的目標。AMD 自適應 SoC 與 FPGA 設計工具讓 AI 科學家、應用程式與演算法工程師、嵌入式軟體開發人員,以及傳統硬體開發人員等各種開發人員,都能使用 AMD 自適應運算解決方案。

資源

搶先體驗計畫

第 2 代 Versal AI Edge 系列目前處於搶先體驗階段。請聯絡您當地的 AMD 銷售代表,申請加入搶先體驗計畫,或造訪「聯絡銷售人員」頁面。

掌握最新動態

加入 Versal 自適應 SoC 通知清單,以接收最新消息與更新。

尾註
  1. 根據 AMD 內部對於第 2 代 Versal AI Edge 系列中 AIE-ML v2 運算磚架構的效能和功率估計,使用的是 MX6 資料類型;比較對象是第一代 Versal AI Edge 系列中 AIE-ML 運算磚架構的效能規格和 AMD Power Design Manager 功率結果,使用的是 INT8 資料類型。假設:2 列 8 欄子陣列。作業條件:1 GHz Fmax,0.7V AIE 操作電壓,100°C 接面溫度,典型程序,60% 向量負載,啟動 % = 0 < 10%。最終產品上市時,實際效能會有所不同。2024 年 3 月的效能預測。(VER-023)

  2. 根據 AMD 內部的矽前效能估計,配置 8 個 Arm Cortex-A78AE 應用核心 (@2.2 GHz) 和 10 個 Arm Cortex-R52 即時核心 (@1.05 GHz) 時,第 2 代 Versal AI Edge 系列和第 2 代 Versal Prime 系列處理系統的 DMIP 總數,與第一代 Versal AI Edge 系列和 Versal Prime 系列處理系統的發布 DMIP 總數相比較。第 2 代 Versal AI Edge 系列與第 2 代 Prime 系列作業條件:最高可用速度等級、0.88 V PS 操作電壓、分割模式作業、最大支援作業頻率。第一代 Versal AI Edge 系列與 Prime 系列的作業條件:最高可用速度等級、0.88 V PS 操作電壓、最大支援作業頻率。最終產品上市時,實際的 DMIP 效能會有所不同。(VER-027)

  3. 根據第 2 代 Versal AI Edge 系列中 AIE-ML v2 運算磚架構產品規格的 1024 INT8 次運算/時脈,與第一代 Versal AI Edge 系列中 AIE-ML 運算磚架構發佈產品規格的 512 INT8 ops/時脈相比較。2024 年 2 月的效能預測。(VER-024)

  4. 根據 AMD 內部矽前功能安全目標與效能預估,當配置 8 個 Arm Cortex-A78AE 應用核心 (@2.2 GHz) 時,第 2 代 Versal AI Edge 系列與第 2 代 Versal Prime 系列處理系統中應用處理單元 (Application Processing Unit, APU) 的總 DMIP。作業條件:最高可用速度等級,0.88 V PS 操作電壓,以及最大支援作業頻率,所有 APU 核心在鎖步模式下運作。最終產品上市時,實際效能會有所不同。(VER-028)

  5. 視訊編解碼加速(至少包括 HEVC (H.265)、H.264、VP9 和 AV1 編解碼)需要包括/安裝相容的媒體播放器,方能使用。(GD-176)

  6. 根據 Arm 針對第 2 代 Versal AI Edge 系列和第 2 代 Versal Prime 系列器件所發佈的產品規格,分別配置 4 核心 Arm Mali-G78AE 顯示卡,最大作業頻率 1050 MHz,每 ops/每核心/每時脈 64 FP32,以及每 ops/每核心/每時脈 4 紋素。第 2 代 Versal AI Edge 系列和第 2 代 Prime 系列產品的實際最終產品上市時,效能會有所不同。(VER-030)