Versal Premium 系列 VPK180 评估套件
VPK180 评估套件采用经过硬化和功耗优化的核心,配备 Versal Premium VP1802 器件,非常适合用于开发复杂的计算和网络应用。
突破性集成功耗优化核心
先进的软件可编程自适应 SoC 平台全面集成可编程逻辑、DSP 引擎、AI 引擎和更多应用特定 IP。
可编程逻辑助力开发自定义计算块以实现产品差异化、适应未来以及应对不断变化的算法。结合各种内存以及可编程 I/O,可编程逻辑助力用户为各种应用打造性能强大的加速器。
三种处理器可支持不同的应用需求。应用处理单元非常适合操作系统支持的复杂应用,实时处理单元非常适合延迟敏感型应用。独立平台管理控制器负责管理系统启动、安全性与调试。
800G 及以上网络
Versal Premium 系列 112 Gb/s PAM4 收发器是实现功耗优化型 800G 网络系统的核心。Versal Premium 自适应 SoC 通过同一器件能够实现 32 Gb/s、58 Gb/s 和 112 Gb/s 等多种收发器供选择,从而助力厂商扩展主流 100G 系统,逐步增加 400G 系统的部署量,并做好准备在未来升级到 800G 及更高速率的系统。
安全网络线速率加密
Versal Premium 自适应 SoC 提供 1.6 Tb/s 的行速率加密吞吐量,因此非常适合用于打造安全网络。这个灵活应变的平台采用 400G 通道化高速加密 (HSC) 硬核引擎。HSC 引擎支持 AES-GCM 加密/解密、MACsec 和 IPsec,可实现多层安全性。
适用于 10G 至 800G 的单一平台
专用连接 IP 可实现安全的多太比特以太网,支持多种数据传输速率和协议。100G 和 600G 以太网内核的组合可提供高达 5 Tb/s 的吞吐量,并可在单一平台上实现从接入网到城域网再到核心网的扩展。
可扩展的芯片到芯片互连
器件中集成的 Interlaken 内核支持高达 600 Gb/s 的速度,内置流量控制功能可实现可靠的高带宽数据传输。Versal Premium 器件集成了用于功耗优化纠错的 RS-FEC,支持可扩展的芯片到芯片互连,同时还可大幅减少网络系统的 I/O 和功耗开销。
优化 CPU 与加速器之间的通信
PCIe® Gen5 可对新一代计算应用的服务器 CPU 与加速器之间的通信进行加速,而支持可编程 NoC 的硬化 DMA 引擎可为工作负载调配和部署提供可扩展的预配置虚拟化解决方案。
保证服务质量 (QoS) 和能效
可编程片上网络 (NoC) 可在 Versal 自适应 SoC 中的不同计算引擎和集成 IP 块之间提供优化的多太比特互连,从而简化时序收敛并节省逻辑资源。NoC 编译器不仅提供精简的编程体验,同时还允许用户管理关键数据路径的延迟和 QoS。
Versal Premium 系列通过集成 AI 引擎,可实现业界领先的自适应信号处理功能。
相控雷达阵列的自适应波束成形可在频谱竞争环境下执行精确跟踪和制导。支持 AI 引擎的 Versal™ Premium 器件的信号处理能力是上一代产品的 4 倍1,因此设计人员可实现除波束成形外的更多计算密集型功能。AI 引擎和 DSP 引擎原生支持各种数据类型,包括高效的单精度浮点运算,可实现更大的动态范围,这在雷达应用中至关重要。
Versal Premium 系列带来具有功耗优化型 IP 的 112G PAM4 收发器,从而可在简化系统集成、降低延迟和功耗的同时,确保从天线到后端接口的安全组网。Versal 架构的创新异构集成为大量的雷达系统设计带来了业界领先的尺寸、重量和功耗 (SWaP) 降低优势。
1:总体等效 DSP 引擎性能与 Virtex™ UltraScale+™ VU13P FPGA 的比较
由于 5G 无线、xHaul、PON 和有线接入的带宽需求快速增长,城域/传输网络在对网络流量进行聚合和智能处理方面面临着巨大的压力。Versal™ Premium 系列带来 112G 的 PAM4 收发器,其支持专用连接 IP,如 600G 通道化多速率以太网和支持 FEC 的集成型 600G Interlaken 等,可在复杂的城域/核心传输网络中实现高效的散热设计。
Versal Premium 的计算密度是传统硬件可编程器件的两倍,可实现硬件差异化、适应不断发展的标准,并为未来自主智能网络引入 AI/ML 功能。
作为一个异构平台,Versal Premium 拥有极高的计算密度,可针对基因组学、视频转码、搜索和机器学习等各种工作负载实现灵活应变的云加速。
Dynamic function eXchange (DFX) 允许用户以毫秒为单位交换计算内核来配置加速器,从而高效地使用云基础设施。Versal Premium 具有海量片上内存容量和带宽,以及比当前部署的 FPGA 加速器高一倍的计算密度,可提供卓越的计算性能和优化的调配。
Versal Premium 从零开始构建,能够与云基础设施无缝集成,它提供了一个集成的 shell,可确保主机服务器与系统内存的通信在启动时可用,从而使加速器设计人员能够将更少的时间花在建立连接上,将更多的时间花在实现差异化上。
随着数据中心规模的扩大,数据中心互连 (DCI) 技术必须不断发展,才能实现高容量、高可扩展性以及高能效。Versal Premium 系列提供高达 112G 的可扩展收发器、高达 5 Tb/s 的以太网吞吐量和 1.6 Tb/s 的线速率加密,使服务提供商能够部署灵活的传输技术,从而可在数据中心之间实现快速、安全的连接。
为了在数据中心和 5G 等网络技术方面取得领先,供应商需要利用先进的通信测试设备来确保互操作性和实现强大的网络流量管理。Versal Premium 系列的 AI 引擎和 DSP 引擎提供业界领先的信号处理性能和逻辑功能,可为自动化测试、数据流控制、跟踪和报告实现复杂的测试逻辑。
112G 的 PAM4 收发器集成了支持新兴协议的 KP4 FEC,以及与光学器件和背板的互操作性。专用的通道化多速率以太网内核总吞吐量为 5 Tb/s,可单独访问 MAC、PCS 和 FEC 模块,以及用于自定义错误注入和统计分析的可编程逻辑资源。
借助先进的1自适应 SoC 构建新一代突破性技术。
与上一代仿真级器件 AMD Virtex™ UltraScale+™ VU19P FPGA 相比,VP1902 器件可提供 2 倍容量。
1.基于 AMD 在 2023 年 5 月进行的内部分析,比较 Versal Premium VP1902 器件与 Virtex UltraScale+ VU19P 器件的系统逻辑单元数量。(VER-001)
VP1002 | VP1052 | VP1102 | VP1202 | VP1402 | VP1502 | VP2502 | VP1552 | VP1702 | VP1802 | VP2802 | VP1902 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
应用处理单元 | 双核 Arm® Cortex A72®、48 KB/32 KB L1 高速缓存支持奇偶校验和 ECC,1MB L2 高速缓存支持 ECC | |||||||||||
实时处理单元 | 双核 Arm Cortex R5F、32 KB/32 KB L1 高速缓存以及支持 ECC 的 256 KB TCM | |||||||||||
内存 | 支持 ECC 的 256 KB 片上内存 | |||||||||||
连接 | 以太网 (x2)、UART (x2)、CAN FD (x2)、USB 2.0 (x1)、SPI (x2)、I2C (x2) |
VP1002 | VP1052 |
VP1102 | VP1202 | VP1402 | VP1502 | VP2502 | VP1552 | VP1702 | VP1802 | VP2802 | VP1902 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
AI 引擎 | - | - | - | - | - | - | 472 |
- | - | - | 472 | - |
DSP 引擎 | 1140 | 1572 | 1904 | 3984 | 2672 | 7440 | 7392 | 7392 | 10896 | 14352 | 14304 | 6864 |
VP1002 | VP1052 | VP1102 | VP1202 | VP1402 | VP1502 | VP2502 | VP1552 | VP1702 | VP1802 | VP2802 | VP1902 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
系统逻辑单元 (K) | 833 | 1186 | 1575 | 1969 | 2233 | 3763 | 3738 | 3837 | 5558 | 7352 | 7326 | 18507 |
LUT | 380800 | 542080 | 719872 | 900224 | 1020928 | 1720448 | 1708672 | 1753984 | 2540672 | 3360896 | 3349120 | 8460288 |
VP1002 | VP1052 | VP1102 | VP1202 | VP1402 | VP1502 | VP2502 | VP1552 | VP1702 | VP1802 | VP2802 | VP1902 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
GTY 收发器 (32.75 Gb/s) | 20 | 20 | - | - | - | - | - | - | - | - | - | |
GTYP 收发器1 (32.75 Gb/s) | - | - | 8 | 281 | 8 | 281 | 281 | 681 | 281 | 281 | 281 | 128 |
GTM 收发器 (58G (112G)) | 24 (12) | 36 (18) | 64 (32) | 20 (10) | 96 (64) | 60 (30) | 60 (30) | 20 (10) | 100 (50) | 140 (70) | 140 (70) | 32 (16) |
支持 DMA (CPM4) 的 PCIe® | 2 x Gen4x4 | 2 x Gen4x4 | - | - | - | - | - |
- | - | - | - | - |
支持 DMA (CPM5) 的 PCIe | - |
- |
- | 2 x Gen5x8 | - |
2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | - |
PCI Express® | 1 x Gen4x8 | 1 x Gen4x8 | 2 x Gen5x4 | 2 x Gen5x4 | 2 x Gen5x4 | 2 x Gen5x4 | 2 x Gen5x4 | 8 x Gen5x4 | 2 x Gen5x4 | 2 x Gen5x4 | 2 x Gen5x4 | 16 x Gen5x4 |
100G 多速率以太网 MAC | 3 | 5 | 6 | 2 | 6 |
4 | 4 | 4 | 6 | 8 | 8 | 12 |
600G 以太网 MAC | 2 | 3 | 7 | 1 | 11 | 3 | 3 | 1 | 5 | 7 | 7 | 4 |
600G Interlaken | 1 | 2 | 0 | 0 | 0 | 1 | 1 | 0 | 2 | 3 | 3 | 0 |
400G 高速加密引擎 | 1 | 1 | 3 | 1 | 4 | 2 | 2 | 2 | 3 | 4 | 4 | 0 |
1.16 GTYP 收发器专门用于 CPM5,主要针对 PCI Express 的使用情况。
AMD 提供优秀的软件开发环境以供开发者利用自适应 SoC 和 FPGA 开展设计工作,其中包括各种工具(编译器、仿真器等)、IP 和解决方案。
该环境不但可以帮助开发者缩短开发时间,还可以助力实现更出色的性能功耗比。这些工具可帮助AI 科学家、应用与算法工程师、嵌入式软件以及传统硬件等各类开发者使用 AMD 自适应计算解决方案。
利用该套件提供的经过验证的硬件、软件支持、工具、设计示例和文档,快速启动您的设计周期,并实现快速上市。
在功耗优化的灵活应变平台上实现网络 IP 的突破性集成
加入 Versal 通知列表,即可第一时间获取最新信息。