產品組合中最高的運算能力,提供最大 AI 與工作負載加速成效

主要功能
- 處理系統
- 可編程邏輯
- AI 引擎與 DSP 引擎
- 新一代 I/O
- 視訊解碼器單元
- 可編程晶片上網路

處理系統
Versal 自適應晶片上系統 (System-on-Chip, SoC) 提供三種純量處理器類型,可支援多種不同的應用需求。應用處理單元是 OS 支援之複雜應用程式的理想選擇,而即時處理單元則適合需要低延遲、決定性和即時控制的應用程式。獨立的平台管理控制器可管理系統開機、安全性及除錯。

可編程邏輯
可編程邏輯讓使用者能開發出客製運算區塊,以適應不斷變化的演算法。Versal 自適應 SoC 中重新設計的邏輯,可提供 4 倍的每可配置邏輯區塊 (Configurable Logic Block, CLB) 密度,以減少對昂貴全域路由的需求。可編程邏輯包含各式各樣的記憶體元素,並與可編程 I/O 緊密結合,讓使用者能為任何應用建立強大的加速器。

AI 引擎與 DSP 引擎
AI 引擎可為向量型演算法提供最多 5 倍的運算密度。AI 引擎已針對即時數位訊號處理 (Digital Signal Processing, DSP) 和 AI/機器學習 (Machine Learning, ML) 運算最佳化,可提供決定性效能。
增強的 DSP 引擎可支援新的操作及資料類型,包括單精度及半精度浮點與複雜的 18x18 操作。

新一代 I/O
Versal Prime 系列結合符合 PCIe® Gen5/Gen4 標準的高效能通用 I/O (General Purpose Input/Output, GPIO)、400 G 高速加密 (High-Speed Crypto, HSC) 引擎*,以及支援各種乙太網路組態的多速率乙太網路 MAC,可大幅提升連線能力與彈性。此外,Versal Prime 系列裝置具有經過重新設計的低延遲 32.75 Gb/s 收發器,且特定裝置還支援 58 Gb/s 與 112 Gb/s* PAM4 收發器。
* 僅 VM2152 裝置支援 400 G HSC 引擎和 112 Gb/s PAM4 收發器

視訊解碼器單元
經過電力最佳化的強化視訊解碼器單元 (Video Decoder Unit, VDU) 包含多個視訊解碼器引擎 (Video Decoder Engine, VDE),每個引擎可為單一 4Kp60 串流到最多三十二個 720p15 串流支援 H.264 與 H.265。VDU 是眾多影像處理應用的理想選擇,這些應用會將多視訊輸入傳送至中央中樞,而該中樞會解碼和執行進階 ML 演算法。

可編程晶片上網路
可編程晶片上網路 (NoC) 提供最佳化的多兆位元互連功能,可在 Versal 自適應 SoC 架構中不同的運算引擎和整合式 IP 區塊之間進行互連,進而簡化時序收斂並節省邏輯資源。NoC 編譯器提供精簡化的編程體驗,同時讓使用者能管理延遲與服務品質 (Quality of Serivce, QoS),確保優先處理重要資料路徑。
應用與產業

5G 無線電和波束成型技術
波束成型技術產生大量的訊號處理要求需要即時處理。自行調適引擎在處理狀態控制和資料格式化時,AI 引擎和 DSP 引擎會處理定點與浮點訊號處理工作負載,以進行高效能的平行處理。
資料中心運算
隨著卷積神經網路持續進化,跟上不斷增加的運算密度需求成為一項挑戰,而這項挑戰只能透過 Versal AI Core 系列裝置來解決,這些裝置具備經過最佳化的 AI 引擎,能以兼具成本效益和能效的方式有效率地提供運算密度。


智慧城市的視訊處理
Versal AI Core 系列裝置能在智慧城市邊緣部署大量的新視訊處理應用程式,AI 引擎可驅動即時牌照、臉部辨識或物件分類功能,視訊轉碼器單元可進行視訊轉碼,而自行調適引擎則可執行視訊縮放、壓縮和自訂作業。
醫療影像處理
Versal AI Core 系列可加速平行波束成型技術與即時影像處理,建立更高品質的影像與機器型影像分析,讓醫師與放射科醫師能更快速且更準確地進行診斷。


雷達處理
將強大的向量型 DSP 引擎與小尺寸外型的 AI 引擎結合,實現主動式電子掃描陣列等進階雷達。AI Core 系列裝置以單一封裝提供每秒數兆位元的天線頻寬。
無線測試設備
即時 DSP 廣泛用於無線通訊測試設備。Versal AI Engine 架構非常適合處理各種通訊協定實作,包括從數位前端到波束成形和基頻的 5G 作業。

產品規格
處理子系統規格
VC1502 | VC1702 | VC1802 | VC1902 | VC2602 | VC2802 | |
---|---|---|---|---|---|---|
應用處理單元 | 雙核心 Arm® Cortex®-A72,48 KB/32 KB L1 快取記憶體搭配奇偶校驗及 ECC;1 MB L2 快取記憶體搭配 ECC | |||||
即時處理單元 | 雙核心 Arm Cortex-R5F,32 KB/32 KB L1 快取記憶體及 256 KB TCM 搭配 ECC | |||||
記憶體 | 256 KB 晶片上記憶體搭配 ECC | |||||
連線 | 乙太網路 (x2);USB 2.0 (x1);UART (x2);SPI (x2);I2C (x2);CAN-FD (x2) |
AI 引擎與 DSP 引擎規格
VC1502 | VC1702 | VC1802 | VC1902 | VC2602 | VC2802 | |
---|---|---|---|---|---|---|
AI 引擎 | 198 | 304 | 300 | 400 | 0 | 0 |
AI 引擎 - ML | 0 | 0 | 0 | 0 | 152 | 304 |
DSP 引擎 | 1,032 | 1,312 | 1,600 | 1,968 | 984 | 1,312 |
可編程邏輯功能
VC1502 | VC1702 | VC1802 | VC1902 | VC2602 | VC2802 | |
---|---|---|---|---|---|---|
系統邏輯單元 (K) | 815 | 981 | 1,586 | 1,968 | 820 | 1,139 |
LUT | 372,352 | 448,512 | 725,000 | 899,840 | 375,000 | 520,704 |
基礎平台規格
VC1502 | VC1702 | VC1802 | VC1902 | VC2602 | VC2802 | |
---|---|---|---|---|---|---|
NoC 主要/NoC 從屬連接埠 | 21 | 21 |
28 | 28 | 21 | 21 |
DDR 記憶體控制器 | 3 | 3 |
4 | 4 | 3 | 3 |
PCIe® 搭配 DMA (CPM) | 1 個 Gen4x16 |
1 個 Gen4x16 |
1 個 Gen4x16 |
1 個 Gen4x16 |
2 個 Gen5x8 |
2 個 Gen5x8 |
PCI Express® | 4 個 Gen4x8 | 4 個 Gen4x8 | 4 個 Gen4x8 | 4 個 Gen4x8 | 4 個 Gen5x4 | 4 個 Gen5x4 |
100 G 多速率乙太網路 MAC | 3 | 4 | 4 | 4 | 2 | 2 |
視訊解碼器引擎 (VDE) | - | - | - | - | 2 | 4 |
GTY 收發器 | 32 | 44 | 44 | 44 | 0 | 0 |
GTYP 收發器 | 0 | 0 | 0 | 0 | 321 | 321 |
1.16 GTYP 收發器專門供 CPM5 用於 PCI Express。
適用於所有開發人員
AMD 提供領先業界的軟體開發環境,可使用自適應 SoC 和現場可程式化閘陣列 (Field-Programmable Gate Array, FPGA) 進行設計,包括工具(編譯器、模擬器等)、IP 和解決方案。
此環境可縮短開發時間,同時讓開發人員達成高每瓦效能的目標。這些工具讓 AI 科學家、應用程式與演算法工程師、嵌入式軟體開發人員,以及傳統硬體開發人員等各種開發人員,都能使用 AMD 自適應運算解決方案。

現在開始
利用套件所提供的經實證的硬體、軟體支援、工具、設計範例及文件,快速展開設計週期並快速上市。

使用 Versal Core AI 系列 VCK190 評估套件著手開發
立即使用含 VC1902 裝置的 VCK190 評估套件,著手評估 Versal AI Core 系列的功能。此平台運用晶片上的 AI 引擎,針對訊號處理和 ML 推理進行最佳化,非常適合用於開發計算任務繁重、對延遲敏感的 DSP 和 ML 應用程式。利用套件所提供的經實證的硬體、軟體支援、工具、設計範例及文件,快速展開設計週期並快速上市。
資源

掌握最新動態
加入 Versal 自適應 SoC 通知清單,以接收最新消息與更新。