Versal AI Core-Serie

Bahnbrechende KI-Inferenz und drahtlose Beschleunigung durch integrierte KI-Engines, die eine herausragende Rechnerleistung gewährleisten

Höchstes Computing des Portfolios für maximale KI- und Auslastungsbeschleunigung

Versal™ AI Core Series block diagram

Hauptmerkmale

abstract processor
Verarbeitungssystem

In den adaptiven Versal SoCs stehen drei skalare Prozessortypen zur Verfügung, um unterschiedliche Anwendungsanforderungen zu unterstützen. Die Anwendungsverarbeitungseinheit ist ideal für von einem Betriebssystem unterstützte komplexe Anwendungen, und die Echtzeitverarbeitungseinheit eignet sich hervorragend für Anwendungen, die niedrige Latenz, Determinismus und Echtzeitsteuerung erfordern. Über einen separaten Plattform-Management-Controller werden Systemstart, Sicherheit und Fehlersuche verwaltet.

abstract processor
Programmierbare Logik

Die programmierbare Logik ermöglicht die Entwicklung benutzerdefinierter Berechnungsblöcke für sich ständig ändernde Algorithmen. Die neu konzipierte Logik in den adaptiven Versal SoCs bietet die 4-fache Dichte pro CLB, was den Bedarf an kostenintensivem globalem Routing reduziert. Ausgestattet mit einer Vielzahl an Speicherelementen und eng gekoppelt mit programmierbarem E/A ermöglicht die programmierbare Logik den Benutzern, leistungsstarke Beschleuniger für beliebige Anwendungen zu erstellen.

wave texture
KI-Engines und DSP-Engines

KI-Engines bieten bis zu 5-mal höhere Computing-Dichte für vektorbasierte Algorithmen. Optimiert für DSP- und KI-/ML-Berechnung in Echtzeit, bieten KI-Engines deterministische Performance.

Erweiterte DSP-Engines bieten Unterstützung für neue Vorgänge und Datentypen, u. a. einfache und halbgenaue Gleitkomma- und komplexe 18 x 18-Vorgänge.

generic processor image
E/A der nächsten Generation

Die Versal Prime-Serie kombiniert PCIe®-Gen5/Gen4-Compliance, High-Performance-GPIO, 400G High-Speed-Crypto-(HSC-)Engines* und Multirate-Ethernet-MACs, die verschiedene Ethernet-Konfigurationen zur Maximierung der Konnektivität und Flexibilität unterstützen. Zusätzlich verfügen die Versal Prime-Serie Geräte über neu konzipierte 32,75 GB/s Transceiver mit niedriger Latenz. Bestimmte Geräte unterstützen 58 GB/s und 112 GB/s* PAM4-Transceiver.

* Nur das VM2152 Gerät unterstützt 400G HSC-Engines und 112 GB/s PAM4-Transceiver

Programming code abstract technology background of software developer and  Computer script
Videodekodierungseinheit

Leistungsoptimierte gehärtete Videodekodierungseinheiten (VDUs) beinhalten mehrere Videodekodierungs-Engines (VDEs), die H.264 und H.265 von einem einzelnen 4Kp60-Stream bis hin zu 32 720p15-Streams pro Engine unterstützen. Videodekodierungseinheiten sind ideal für viele Bildbearbeitungsanwendungen, bei denen mehrere Videoeingänge einen zentralen Hub speisen, der fortschrittliche ML-Algorithmen sowohl dekodiert als auch ausführt.

3D rendering of AI. Circuit board.
Programmierbares Network-on-Chip

Das programmierbare Network-on-Chip (NoC) bietet eine optimierte Multi-Terabit-Verbindung zwischen den verschiedenen Computing-Engines und integrierte IP-Blöcke, die in der Architektur des adaptiven Versal SoC vorhanden sind. Dies vereinfacht den Timing-Closure und spart Logikressourcen. Der NoC-Compiler stellt ein optimiertes Programmiererlebnis bereit und ermöglicht den Benutzern, Latenz und QoS zu verwalten, um sicherzustellen, dass kritische Datenpfade priorisiert werden.

Anwendungen und Branchen

5G-Funk und Beamforming

Beamforming führt zu enormen Signalverarbeitungsanforderungen, die in Echtzeit verarbeitet werden müssen. Während anpassungsfähige Engines die Statuskontrolle und die Datenformatierung übernehmen, verarbeiten KI-Engines und DSP-Engines feste und Gleitkomma-Signalverarbeitungsauslastungen für eine parallele Verarbeitung mit hoher Performance.

Rechenzentrums-Computing

Da sich Convolutional Neural Networks (gefaltete neuronale Netzwerke) immer weiterentwickeln, kann die Herausforderung, mit den steigenden Anforderungen an die Rechendichte Schritt zu halten, nur durch die Geräte der Versal AI Core-Serie bewältigt werden. Diese enthalten KI-Engines, die optimiert wurden, um sowohl kosteneffizient als auch stromsparend eine hohe Rechendichte zu erreichen.

Videoverarbeitung für intelligente Städte

Geräte der Versal AI Core-Serie ermöglichen die Bereitstellung einer Fülle neuer Videoverarbeitungsanwendungen am Edge für intelligente Städte. Diese nutzen KI-Engines zur Kennzeichenerkennung, Gesichtserkennung oder Objektklassifizierung in Echtzeit sowie Videodekodierungseinheiten zur Videotranskodierung, aber auch anpassungsfähige Engines für die Videoskalierung, -komprimierung und -anpassung.

Bildbearbeitung in der Medizin

Die Versal AI Core-Serie beschleunigt paralleles Beamforming und Bildbearbeitung in Echtzeit, um Bilder in höherer Qualität und maschinenbasierte Bildanalyse zu erstellen, damit Ärzte und Radiologen schnellere und genauere Diagnosen stellen können.

Radarverarbeitung

Die Kombination von leistungsstarken vektorbasierten DSP-Engines und KI-Engines in einer kleinen Bauform ermöglicht fortschrittliches Radar, wie z. B. Active Electronically Scanned Arrays. Geräte der AI Core-Serie stellen Terabits pro Sekunde an Antennenbandbreite in einem einzigen Paket bereit.

Drahtlos-Test-Equipment

Echtzeit-DSP wird in großem Umfang in Test-Equipment für die Drahtloskommunikation eingesetzt. Die Versal AI Engine Architektur eignet sich sehr gut für alle Arten von Protokollimplementierungen, einschließlich 5G vom digitalen Frontend bis zum Beamforming und Basisband.

Produkt-Spezifikationen

Verarbeitungssubsystem – Funktionen

  VC1502 VC1702 VC1802 VC1902 VC2602 VC2802
Anwendungsverarbeitungseinheit Dual-Core Arm® Cortex®-A72, 48 KB/32 KB L1-Cache mit Parität und ECC; 1 MB L2-Cache mit ECC
Echtzeitverarbeitungseinheit Dual-Core Arm Cortex-R5F, 32 KB/32 KB L1-Cache und 256 KB TCM mit ECC
Speicher 256 KB On-Chip-Memory mit ECC 
Konnektivität Ethernet (x2); USB 2.0 (x1); UART (x2); SPI (x2); I2C (x2); CAN-FD (x2)

KI-Engine und DSP-Engine – Funktionen

  VC1502 VC1702 VC1802 VC1902 VC2602 VC2802
KI-Engines 198 304 300 400 0 0
KI-Engines – ML 0 0 0 0 152 304
DSP-Engines 1.032 1.312 1.600 1.968 984 1.312

Programmierbare Logik –Funktionen

  VC1502 VC1702 VC1802 VC1902 VC2602 VC2802
Systemlogikzellen (K) 815 981 1.586 1.968 820 1.139
LUTs  372.352 448.512 725.000 899.840 375.000 520.704

Grundlegende Plattformfunktionen

  VC1502 VC1702 VC1802 VC1902 VC2602 VC2802
NoC-Master-/NoC-Slave-Ports 21 21
28 28 21 21
DDR-Speicher-Controller 3 3
4 4 3 3
PCIe® mit DMA (CPM) 1 x Gen4x16
1 x Gen4x16
1 x Gen4x16
1 x Gen4x16
2 x Gen5x8
2 x Gen5x8
PCI Express® 4 x Gen4x8 4 x Gen4x8 4 x Gen4x8 4 x Gen4x8 4 x Gen5x4 4 x Gen5x4
100G Multirate-Ethernet-MAC 3 4 4 4 2 2
Videodekodierungs-Engines (VDEs) - - - - 2 4
GTY-Transceiver 32 44 44 44 0 0
GTYP-Transceiver 0 0 0 0 321 321

1. 16 GTYP-Transceiver sind vorgesehen für CPM5 für die Verwendung von PCI Express.

Für alle Entwickler

AMD präsentiert die führende Softwareentwicklungsumgebung für Konstruktionen mit adaptiven SoCs und FPGAs. Die Plattform umfasst Tools (Compiler, Simulatoren usw.), IP und Lösungen.

Diese Umgebung hilft, die Entwicklungszeit zu verkürzen, und ermöglicht es Ihren Konstrukteuren, eine höhere Performance pro Watt zu erzielen. Diese Tools sind unverzichtbar für alle Entwickler, die mit adaptiven Computing-Lösungen von AMD arbeiten – KI-Forscher, Anwendungstechniker und Algorithmusinformatiker, Embedded Software-Entwickler und Konstrukteure traditioneller Hardware.

Erste Schritte

Starten Sie direkt Ihren Designzyklus und erzielen Sie eine schnelle Markteinführung mit bewährter Hardware, Software-Support, Tools, Konzeptbeispielen und für das Kit verfügbarer Dokumentation.

Sapphire Edge+ VPR-4616

Entwicklung mit dem Versal AI Core-Serie VCK190 Evaluierungs-Kit starten

Beginnen Sie noch heute mit der Evaluierung der Fähigkeiten der Versal AI Core-Serie. Nutzen Sie dazu das VCK190 Evaluierungs-Kit, das das VC1902 Gerät beinhaltet. Diese Plattform nutzt die für Signalverarbeitung und ML-Inferenz optimierten On-Chip-KI-Engines und ist ideal für die Entwicklung rechenintensiver, latenzempfindlicher DSP- und ML-Anwendungen. Starten Sie direkt Ihren Designzyklus und erzielen Sie eine schnelle Markteinführung mit bewährter Hardware, Software-Support, Tools, Konzeptbeispielen und für das Kit verfügbarer Dokumentation.

Ressourcen

Online-Schulungskurse

Mit den Schulungs- und Lernressourcen von AMD können Sie die praktischen Fähigkeiten und grundlegenden Kenntnisse erwerben, um Ihre Produktivität beim nächsten Entwicklungsprojekt zu maximieren.

Immer informiert bleiben

Melden Sie sich für die E-Mail-Liste an, um die neuesten Nachrichten und Meldungen zu adaptiven Versal SoCs zu erhalten.