Produktvorteile
Die Versal HBM-Serie beinhaltet eine heterogene Integration von schnellem Speicher, sicherer Konnektivität und adaptivem Computing, um Verarbeitungs- und Speicherengpässe für speichergebundene, rechenintensive Auslastungen, wie z. B. maschinelles Lernen, Datenbankbeschleunigung, Firewalls der nächsten Generation und erweiterte Netzwerktester, zu beseitigen. Sie wurde von Grund auf so konzipiert, dass sie sich an die sich ständig weiterentwickelnden Algorithmen, Protokolle und Datenraten anpasst. Weitere Informationen erhalten Sie in diesem Übersichtsvideo .
Mit der Integration von HBM2e DRAM liefert die Versal HBM-Serie bis zu 6-mal mehr Bandbreite bei 65 % weniger Stromverbrauch pro Bit im Vergleich zur Versal Premium-Serie.* Die Versal HBM-Serie basiert auf einer produktionserprobten Grundlage des adaptiven Versal Premium-Serie SoC und integriert ein umfassendes Set vernetzter, leistungsoptimierter Konnektivitätskerne mit mehreren Terabit sowie 112 GB/s PAM4-Transceiver, um sich an neue Netzwerkprotokolle und -module anpassen zu können. Durch Verdopplung der Transceivergeschwindigkeit sichert die Versal HBM-Serie jede Ebene der Netzwerkinfrastruktur über integrierte Verschlüsselungs-Engines. Mit dem programmierbaren Network-on-Chip (NoC) schwächt die On-Chip-Konnektivität mit bis zu 2,2 TB/s die Überlastung im Routing bei den Komponenten in der Architektur ab. Zudem bietet die Versal HBM-Serie eine doppelt so hohe logische Dichte wie die HBM Lösung der vorherigen Generation, um die Performance für die sich ständig weiterentwickelnden Algorithmen und Protokolle zu maximieren.
* Basierend auf einer AMD-internen Analyse im Mai 2023, bei der ein einzelnes Versal HBM VH1542 Gerät mit paketinternem HBM2E mit einer Versal Premium VP1502 Gerätimplementierung mit vier LPDDR4-4266 Komponenten verglichen wurde. Sequentielle Speicherzugriffe mit 40 % Lese-/Schreibtransaktionen vorausgesetzt. Berechnung des Stromverbrauchs mithilfe des AMD Power Design Manager und eines Drittanbieter-Stromverbrauchsrechners. Konfigurationen können abweichen und führen zu unterschiedlichen Ergebnissen. (VER-013)

Hauptmerkmale
- Integrierter HBM2e
- Skalierbare serielle Bandbreite
- Leistungsoptimiertes, vernetztes IP
- Programmierbare Logik
- DSP-Engines
- Verarbeitungssystem

Integrierter HBM2e
Die Integration der HBM2e Technologie liefert bis zu 819 GB/s Speicherbandbreite und 32 GB Kapazität, um den Stromverbrauch, den Platzbedarf und die Latenz rechenintensiver Anwendungen zu minimieren. Im Vergleich zu herkömmlichen Speicherlösungen (DDR5) liefert das adaptive Versal HBM SoC bis zu 6-mal mehr Bandbreite bei 65 % geringerem Stromverbrauch pro Bit gegenüber der Versal Premium-Serie1 , indem der gestapelte Speicher direkt neben der Computing-Fabric platziert wird. Der integrierte HBM ist von überall auf dem Gerät über das programmierbare NoC global zugänglich. Mithilfe eines integrierten Speichercontrollers und erweiterter Hardened-Switch-Funktion ist jede Speicherposition von jedem Port aus erreichbar.
1. Basierend auf einer AMD-internen Analyse im Mai 2023, bei der ein einzelnes Versal HBM VH1542 Gerät mit paketinternem HBM2E mit einer Versal Premium VP1502 Gerätimplementierung mit vier LPDDR4-4266 Komponenten verglichen wurde. Sequentielle Speicherzugriffe mit 40 % Lese-/Schreibtransaktionen vorausgesetzt. Berechnung des Stromverbrauchs mithilfe des AMD Power Design Manager und eines Drittanbieter-Stromverbrauchsrechners. Konfigurationen können abweichen und führen zu unterschiedlichen Ergebnissen. (VER-013)

Skalierbare serielle Bandbreite
Das adaptive Versal HBM SoC besteht aus 58 G/112 GB/s PAM4- und 32 GB/s NRZ-Transceivern und hat äußerst skalierbare Transceiver, die bis zu 5,6 TB/s serieller E/A-Bandbreite liefern. Mithilfe dere 112 GB/s PAM4-Transceiver kann die Branche eine 800G- und Single-Lane-100G-fähige Infrastruktur aufbauen. Für die Einführung und die Bereitstellung von 400G ermöglichen 58 GB/s PAM4-Transceiver die Schnittstellen der neuesten Generation für maximale Bandbreitendichte. Für leistungsoptimierte 100G-Mainstream-Schnittstellen sind die 32 GB/s NRZ-Transceiver ideal.

Leistungsoptimiertes, vernetztes IP
High-Performance-Konnektivität ist für Netzwerke und die Cloud-Infrastruktur der nächsten Generation von grundlegender Bedeutung. Die Versal HBM-Serie bietet eine beispiellose Integration von leistungsoptimiertem Hard IP, die äquivalente logische Dichte von 14 Virtex™ UltraScale+™ FPGAs. Die Kombination aus High-Speed-Ethernet, Interlaken und PCIe® Gen5 mit DMA des adaptiven Versal HBM SoC stellt Multi-Terabit-Konnektivität mit Flexibilität für eine Reihe von Protokollen und Datenraten bereit. Der Netzwerk-Traffic kann über High-Speed-Crypto-Engines mit Leitungsgeschwindigkeit vollständig gesichert werden.

Programmierbare Logik
Das Herzstück für die Flexibilität der Versal Architektur ist die programmierbare Logik, die die Entwicklung benutzerdefinierter Berechnungsblöcke zur Differenzierung, Zukunftssicherheit und die Fähigkeit zur Anpassung an sich weiterentwickelnde Algorithmen und Protokolle ermöglicht. Die programmierbare Logik beinhaltet eine Vielzahl von On-Chip-Speicherelementen und ist eng mit programmierbaren E/A gekoppelt. So stellt sie eine massive parallele Verarbeitung und Anpassungsfähigkeit bereit, die für viele rechenintensive Auslastungen mit großen Datensätzen entscheidend sind.

DSP-Engines
Die DSP-Engines bieten Unterstützung für eine Vielzahl von Vorgängen und Datentypen, u. a. einfache und halbgenaue Gleitkomma- und komplexe 18 x 18-Vorgänge. Als Erweiterung der Technologie der vorherigen Generation sind die DSP-Engines rückwärtskompatibel mit UltraScale+ FPGA und SoC Designs. Benutzer können entweder ihre bestehenden Bibliotheken nutzen oder ihre Konzepte für maximale Computing-Performance aktualisieren.

Verarbeitungssystem
Drei Prozessortypen sind für verschiedene Anwendungsanforderungen verfügbar. Die Anwendungsverarbeitungseinheit ist ideal für von einem Betriebssystem unterstützte komplexe Anwendungen, und die Echtzeitverarbeitungseinheit eignet sich hervorragend für latenzempfindliche Anwendungen. Über einen separaten Plattform-Management-Controller werden Systemstart, Sicherheit, Energieverwaltung und Fehlersuche verwaltet.
Versal HBM-Serie – Produktübersicht
Die Versal HBM-Serie ermöglicht die Konvergenz von schnellem Speicher, anpassbarem Computing und sicherer Konnektivität in einer einzigen Plattform.

Anwendungen und Branchen

Beschleunigung des maschinellen Lernens
Künstliche Intelligenz und maschinelles Lernen (KI/ML) entwickeln sich schnell. Komplexe Algorithmen müssen riesige Mengen an Daten verarbeiten, die eine enorme Speicherbandbreite erfordern. Wenn in der herkömmlichen Rechenarchitektur mehrere CPU-Kerne gleichzeitig arbeiten, wird das System blockiert, da die Daten nicht schnell genug vom externen Speicher übertragen werden können und schließlich das Limit erreicht wird. Im Gegensatz dazu bietet die Versal HBM-Serie sowohl massive parallele Verarbeitungsfunktionen über anpassungsfähige Engines und intelligente Engines als auch enorme Speicherbandbreite über integrierten HBM. Dadurch ermöglicht die Versal HBM-Serie genaue und schnellere Datenerkenntnisse für viele KI/ML-Prozesse wie Kosinus-Ähnlichkeit und Louvain-Modularität. Mit einem umfangreichen Set performanceoptimierter Bibliotheken der Vitis™ Unified Software Platform kann die Lösung, die auf dem adaptiven Versal HBM SoC basiert, höhere KI/ML-Performance und -Effizienz für sich schnell entwickelnde KI für Rechenzentren und die Cloud bereitstellen.
Computing für Vorverarbeitung und Pufferung
Die Vorverarbeitung von Daten ist wesentlich, um die besten Ergebnisse aus Computing-Geräten mit fester Funktion zu erhalten. Die Größe der Datensätze für ML-Modelle für die reale Welt kann schnell den Terabyte-Bereich übertreffen. Deshalb benötigt der Zielbeschleuniger Frameworks für die Datenvorverarbeitung, um diese Datensätze effizient zu bearbeiten. Mit den anpassungsfähigen Engines und 819 GB/s HBM-Bandbreite entfernt die Versal HBM-Serie unerwünschte Daten, wandelt die gewünschten Daten um und ergänzt Daten, um leistungsstarke Vorhersagen für den Zielbeschleuniger zu schaffen. Ausgestattet mit 112G High-Speed-PAM4-Transceivern maximiert die Versal HBM-Serie den Durchsatz und die System-Performance mit niedriger Latenz.


Firewall der nächsten Generation
Netzbetreiber wünschen sich eine ununterbrochene, intelligente Verwaltung und eine stabile Netzwerkverfügbarkeit, um Daten zu sichern und Angriffe auf Unternehmensnetzwerke zu verhindern.
Die Versal HBM-Serie ermöglicht unübertroffene Skalierbarkeit für die Implementierung einer mehrschichtigen Netzwerksicherheit von den Bitübertragungs- und Sicherungsschichten über VPNs bis hin zu Transportschicht-Sicherheitsebenen mit mehreren 10 Millionen gleichzeitigen Sitzungen mit individuellen Richtlinien und Kontrollen. Zudem kann das System dank mehrerer integrierter 400G High-Speed Crypto (HSC) Engines den Leitungsdurchsatz und die niedrige Latenz ohne Kompromisse bei der Performance aufrechterhalten. Mit 32G HBM können Firewalls der nächsten Generation mehrere Wertetabellen ohne Zugriff auf externe Speicher für die Pufferung und Neuordnung der Netzwerkabläufe verwalten. 112G PAM4-Transceiver ermöglichen die Unterstützung der neuesten optischen Standards und Protokolle für die Skalierbarkeit auf einen höheren Durchsatz, der von den Firewalls der nächsten Generation benötigt wird. Anpassungsfähige Engines unterstützen ML-Algorithmen dabei, die Sicherheitsarchitektur zum Schutz vor neuen Bedrohungen zu modernisieren.
Testausrüstung für die Anwendungs-Performance
Da sich Rechenzentrums-, Cloud- und KI-Netzwerke auf optische 800G-Konnektivität eingestellt haben, müssen viele Anbieter von Rechenzentrumsnetzwerken und Cloud-Anbieter topaktuelle Testausrüstung einsetzen, um Interoperabilität und eine stabile Netzwerkinfrastruktur für rechenintensive Anwendungen sicherzustellen.
112G PAM4-Transceiver in Versal HBM Geräten sind einer der wichtigsten Bausteine für Anbieter von Rechenzentrumsnetzwerken und Cloud-Anbieter, um Netzwerke aufzubauen, die sich an neue Protokolle und die Interoperabilität mit optischen Geräten anpassen können. Dedizierte kanalisierte Multirate-Ethernet-Kerne verfügen über einzeln zugängliche HSC-, MAC-, PCS- und FEC-Blöcke für 32G HBM sowie ein programmierbares NoC, um die komplexeste Testlogik für massive Traffic-Pufferung, effiziente Datenübertragung, intelligente Datenflusssteuerung, Verfolgung und Berichterstellung für L4-L7 Testausrüstung zu implementieren.

Produkt-Spezifikationen
Speicherfunktionen
VH1522 | VH1542 | VH1582 | VH1742 | VH1782 | |
---|---|---|---|---|---|
HBM-DRAM (GB) | 8 | 16 | 32 | 16 | 32 |
Block-RAM gesamt (MB) | 89 | 89 | 89 | 132 | 132 |
UltraRAM (MB) | 366 | 366 | 366 | 541 | 541 |
PL-Speicher insgesamt (MB) | 509 | 509 | 509 | 752 | 752 |
DSP-Engines – Funktionen
VH1522 | VH1542 | VH1582 | VH1742 | VH1782 | |
---|---|---|---|---|---|
DSP-Engines | 7.392 | 7.392 | 7.392 | 10.848 | 10.848 |
Programmierbare Logik – Funktionen
VH1522 | VH1542 | VH1582 | VH1742 | VH1782 | |
---|---|---|---|---|---|
Systemlogikzellen (K) | 3.837 | 3.837 | 3.837 | 5.631 | 5.631 |
LUTs | 1.753.984 | 1.753.984 | 1.753.984 | 2.574.208 | 2.574.208 |
Verarbeitungssubsystem – Funktionen
VH1522 | VH1542 | VH1582 | VH1742 | VH1782 | |
---|---|---|---|---|---|
Anwendungsverarbeitungseinheit | Dual-Core Arm® Cortex®-A72, 48 KB/32 KB L1-Cache mit Parität und ECC; 1 MB L2-Cache mit ECC | ||||
Echtzeitverarbeitungseinheit | Dual-Core Arm Cortex-R5F, 32 KB/32 KB L1-Cache und 256 KB TCM mit ECC | ||||
Speicher | 256 KB On-Chip-Memory mit ECC | ||||
Konnektivität | Ethernet (x2); UART (x2); CAN-FD (x2); USB 2.0 (x1); SPI (x2); I2C (x2) |
Plattform – Funktionen
VH1522 | VH1542 | VH1582 | VH1742 | VH1782 | |
---|---|---|---|---|---|
GTYP-Transceiver (32,75 GB/s) | 681 | 681 | 681 | 681 | 681 |
GTM-Transceiver (56G (112G)) | 20 (10) | 20 (10) | 20 (10) | 60 (30) | 60 (30) |
PCIe® mit DMA (CPM5) | 2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 | 2 x Gen5x8 |
PCI Express (PLPCIE5) | 8 x Gen5x4 | 8 x Gen5x4 | 8 x Gen5x4 | 8 x Gen5x4 | 8 x Gen5x4 |
400G High-Speed-Crypto-Engines | 2 | 2 | 2 | 3 | 3 |
100G Multirate-Ethernet-MAC | 4 | 4 | 4 | 6 | 6 |
600G Ethernet-MAC | 1 | 1 | 1 | 3 | 3 |
600G Interlaken | 0 | 0 | 0 | 1 | 1 |
1. 16 GTYP-Transceiver sind vorgesehen für CPM5 für die Verwendung von PCI Express.
Für alle Entwickler
AMD präsentiert die führende Softwareentwicklungsumgebung für Konstruktionen mit adaptiven SoCs und FPGAs. Die Plattform umfasst Tools (Compiler, Simulatoren usw.), IP und Lösungen.
Diese Umgebung hilft, die Entwicklungszeit zu verkürzen, und ermöglicht es Konstrukteuren, eine höhere Leistung pro Watt zu erzielen. Diese Tools sind unverzichtbar für alle Entwickler, die mit adaptiven Computing-Lösungen von AMD arbeiten – KI-Forscher, Anwendungstechniker und Algorithmusinformatiker, Embedded Software-Entwickler und Konstrukteure traditioneller Hardware.

Erste Schritte
Starten Sie direkt Ihren Designzyklus und erzielen Sie eine schnelle Markteinführung mit bewährter Hardware, Software-Support, Tools, Konzeptbeispielen und für das Kit verfügbarer Dokumentation.

Entwicklung mit dem Versal HBM-Serie VHK158 Evaluierungs-Kit starten
Beginnen Sie noch heute mit der Evaluierung der Fähigkeiten der Versal HBM-Serie. Nutzen Sie dazu das VHK158 Evaluierungs-Kit, das das VH1582 Gerät beinhaltet. Diese Plattform nutzt den integrierten HBM und ist ideal für die Entwicklung rechenintensiver, speichergebundener Anwendungen. Starten Sie direkt Ihren Designzyklus und erzielen Sie eine schnelle Markteinführung mit bewährter Hardware, Software-Support, Tools, Konzeptbeispielen und für das Kit verfügbarer Dokumentation.
Ressourcen

Immer informiert bleiben
Melden Sie sich für die E-Mail-Liste an, um sofort über Versal Neuigkeiten benachrichtigt zu werden.