Versal Série HBM

Hyper-intégration d'une mémoire rapide, de données sécurisées et du calcul adaptatif

Avantages du produit

La série Versal HBM présente une intégration hétérogène d'une mémoire rapide, d'une connectivité sécurisée et du calcul adaptatif, permettant d'éliminer les goulots d'étranglement liés au traitement et à la mémoire, et convient parfaitement aux charges de travail gourmandes en mémoire et en ressources de calcul, telles que l'apprentissage automatique, l'accélération des bases de données, les pare-feu de nouvelle génération et les testeurs de réseau avancés. Elle a été entièrement élaborée pour s'adapter à des algorithmes, des protocoles et des débits de données en constante évolution. Regardez la vidéo de présentation  pour obtenir des informations détaillées.

Grâce à l'intégration de la DRAM HBM2e, la série Versal HBM offre jusqu'à 6 fois plus de bande passante pour une consommation par bit réduite de 65 % par rapport à la série Versal Premium*. Conçue sur la base du SoC adaptatif Versal Premium éprouvé en production, la série Versal HBM intègre un ensemble complet de cœurs de connectivité en réseau, multi-térabits et optimisés en termes d'alimentation, ainsi que des émetteurs-récepteurs PAM4 à 112 Gbit/s pour s'adapter aux protocoles et modules réseau émergents. Tout en doublant la vitesse des émetteurs-récepteurs, la série Versal HBM sécurise chaque couche de l'infrastructure réseau grâce à des moteurs de cryptage intégrés. Avec le réseau sur puce (NoC) programmable, une connectivité sur puce allant jusqu'à 2,2 Tbit/s permet de réduire la congestion du routage entre les composants architecturaux. En outre, la série Versal HBM offre une densité logique deux fois supérieure à celle de la solution HBM de la génération précédente, afin de maximiser les performances pour des algorithmes et des protocoles en constante évolution.

*D'après une analyse interne d'AMD réalisée en mai 2023, comparant un seul composant Versal HBM VH1542 avec technologie HBM2e intégrée à une implémentation Versal Premium VP1502 avec quatre composants LPDDR4-4266. En supposant des accès séquentiels à la mémoire avec 40 % de transactions de lecture/écriture. Les calculs de puissance ont été effectués à l'aide du logiciel AMD Power Design Manager et d'un calculateur de puissance de système tiers. Les configurations peuvent varier et donc donner des résultats différents. (VER-013) 

Versal HBM Series block diagram

Fonctionnalités clés

HBM2e intégrée

L'intégration de la technologie HBM2e offre jusqu'à 819 Gbit/s de bande passante mémoire et 32 Go de capacité afin de minimiser la consommation d'énergie, la surface et le temps de latence pour les applications gourmandes en ressources de calcul. Par rapport aux solutions de mémoire de base (DDR5), le SoC adaptatif Versal HBM offre jusqu'à 6 fois plus de bande passante pour une consommation par bit réduite de 65 % par rapport à la série Versal Premium1 en plaçant la mémoire empilée à proximité immédiate de la structure de calcul. La mémoire HBM intégrée est globalement accessible depuis n'importe quel endroit de l'appareil grâce au NoC programmable. Avec un contrôleur de mémoire intégré et une fonction de commutation renforcée, n'importe quel emplacement de mémoire est accessible à partir de n'importe quel port.

1. D'après une analyse interne d'AMD réalisée en mai 2023, comparant un seul composant Versal HBM VH1542 avec HBM2e intégrée à une implémentation Versal Premium VP1502 avec quatre composants LPDDR4-4266. En supposant des accès séquentiels à la mémoire avec 40 % de transactions de lecture/écriture. Les calculs de puissance ont été effectués à l'aide du logiciel AMD Power Design Manager et d'un calculateur de puissance de système tiers. Les configurations peuvent varier et donc donner des résultats différents. (VER-013)

Bande passante série évolutive

Le SoC adaptatif Versal HBM est doté d'émetteurs-récepteurs PAM4 à 58G/112 Gbit/s et NRZ à 32 Gbit/s. Ces émetteurs-récepteurs sont très évolutifs et fournissent jusqu'à 5,6 Tbit/s de bande passante d'E/S en série. Les émetteurs-récepteurs PAM4 à 112 Gbit/s permettent aux acteurs du secteur de déployer des infrastructures 800G et 100G à voie unique. Pour la montée en puissance et le déploiement du 400G, les émetteurs-récepteurs PAM4 à 58 Gbit/s permettent d'utiliser les interfaces de dernière génération pour une densité de bande passante maximale. Les émetteurs-récepteurs NRZ à 32 Gbit/s sont idéaux pour les interfaces 100G à consommation optimisée grand public. 

digital shield image
IP en réseau à puissance optimisée

La connectivité hautes performances est fondamentale pour les réseaux de nouvelle génération et l'infrastructure cloud. La série Versal HBM offre une intégration sans précédent d'IP renforcée et optimisée en termes de puissance, avec une densité logique équivalente à celle de 14 FPGA Virtex™ UltraScale+™. La combinaison d'Ethernet à haut débit, d'Interlaken et de PCIe® Gen5 avec le DMA du SoC adaptatif Versal HBM offre une connectivité multi-térabits flexible prenant en charge un large éventail de protocoles et de débits de données. Les moteurs cryptographiques à haut débit permettent de sécuriser entièrement le trafic réseau.

abstract processor
Logique programmable

Au cœur de la flexibilité de l'architecture Versal se trouve sa logique programmable, qui permet le développement de blocs de calcul personnalisés à des fins de différenciation, de pérennité et d'adaptation à des algorithmes et des protocoles en constante évolution. Avec une grande variété d'éléments de mémoire sur puce et un couplage étroit avec des E/S programmables, la logique programmable offre un traitement parallèle et une capacité de personnalisation massifs, ce qui est essentiel pour de nombreuses charges de travail gourmandes en ressources de calcul avec de grands ensembles de données.

wave texture
Moteurs DSP

Les moteurs DSP prennent en charge un large éventail d'opérations et de types de données, y compris les opérations à virgule flottante en simple et demi-précision et les opérations complexes 18x18. Ces moteurs, qui constituent une amélioration de la technologie de la génération précédente, sont rétrocompatibles avec les designs de SoC et de FGPA UltraScale+. Les utilisateurs peuvent soit exploiter leurs bibliothèques existantes, soit mettre à jour leurs designs pour obtenir des performances de calcul maximales.

abstract processor
Système de traitement

Trois types de processeurs sont disponibles pour répondre aux différents besoins des applications. L'unité de traitement des applications est idéale pour les applications complexes prises en charge par un système d'exploitation, et l'unité de traitement en temps réel est parfaite pour les applications sensibles au temps de latence. Un contrôleur de gestion de plateforme distinct gère le démarrage du système, la sécurité, la gestion de la consommation énergétique et le débogage.

Fiche produit de la série Versal HBM

La série Versal HBM favorise la convergence d'une mémoire rapide, d'un calcul adaptable et d'une connectivité sécurisée au sein d'une seule et même plateforme. 

Versal HBM Series Product Brief

Applications et secteurs

Accélération de l'apprentissage automatique

L'intelligence artificielle et l'apprentissage automatique (IA/ML) évoluent rapidement ; des algorithmes complexes doivent traiter d'énormes quantités de données, ce qui nécessite une bande passante mémoire considérable. Dans l'architecture de calcul traditionnelle, lorsque plusieurs cœurs de CPU fonctionnent simultanément, le système se bloque car les données ne peuvent pas se déplacer suffisamment rapidement depuis la mémoire externe et finissent par atteindre la limite. En revanche, la série Versal HBM offre à la fois une capacité de traitement parallèle considérable grâce aux moteurs adaptables et aux moteurs intelligents, et une énorme bande passante mémoire grâce à la mémoire HBM intégrée. Par conséquent, la série Versal HBM offre un aperçu précis et plus rapide des données pour de nombreux processus d'IA/ML tels que la similarité cosinus et la modularité de Louvain. Grâce à un ensemble complet de bibliothèques optimisées pour les performances de la plateforme logicielle unifiée Vitis™, la solution basée sur le SoC adaptif Versal HBM peut fournir des performances et une efficacité plus élevées en matière d'IA/ML, adaptées à l'évolution rapide de l'IA pour les centres de données et le cloud.

Prétraitement et mise en mémoire tampon du calcul

Le prétraitement des données est essentiel pour obtenir les meilleurs résultats des appareils de calcul à fonction fixe. La taille des ensembles de données pour les modèles ML réels peut facilement dépasser plusieurs téraoctets. L'accélérateur cible a donc besoin de structures de prétraitement des données à grande échelle pour traiter efficacement ces ensembles de données. Grâce aux moteurs adaptables et à une bande passante HBM de 819 Gbit/s, la série Versal HBM supprime les données indésirables, transforme des données sélectionnées et augmente les données pour créer des entrées prédictives performantes pour l'accélérateur cible. Équipée d'émetteurs-récepteurs PAM-4 112 Gbit/s à haute vitesse, la série Versal HBM maximise le débit et les performances du système avec un faible temps de latence.

Pare-feu de nouvelle génération

Les opérateurs de réseaux veulent une gestion intelligente et ininterrompue, ainsi qu'une disponibilité robuste du réseau pour sécuriser les données et éviter les attaques sur les réseaux d'entreprise.
La série Versal HBM offre une évolutivité inégalée pour la mise en œuvre d'une sécurité réseau multicouche, depuis les couches physique et de liaison de données jusqu'aux niveaux de sécurité de la couche transport, en passant par les VPN, avec des dizaines de millions de sessions simultanées grâce à des règles et des contrôles personnalisés. De plus, les multiples moteurs de cryptage à grande vitesse (HSC) intégrés à 400G permettent au système de maintenir un débit de ligne et un faible temps de latence sans compromettre les performances. Avec le HBM 32G, les pare-feu de nouvelle génération peuvent gérer plusieurs tables de consultation sans accéder à des mémoires externes pour la mise en mémoire tampon et le réordonnancement des flux du réseau. Les émetteurs-récepteurs PAM-4 112 Gbit/s permettent la prise en charge des normes et protocoles optiques les plus récents pour une évolutivité vers le débit plus élevé requis par les pare-feu de nouvelle génération. Les moteurs adaptables permettent aux algorithmes ML de moderniser l'architecture de sécurité pour lutter contre les menaces émergentes.

Équipement de test des performances applicatives

Alors que les réseaux de centres de données, de cloud et d'IA ont commencé à se préparer à la connectivité optique 800G, de nombreux fournisseurs de réseaux de centres de données et de cloud ont besoin de s'appuyer sur des équipements de test de pointe pour garantir l'interopérabilité et la robustesse de l'infrastructure réseau pour les applications gourmandes en ressources de calcul.
Les émetteurs-récepteurs PAM-4 112 Gbit/s des composants Versal HBM comptent parmi les éléments de base les plus importants pour les fournisseurs de réseaux de centres de données et de cloud computing, indispensables pour construire des réseaux capables de s'adapter aux protocoles émergents et à l'interopérabilité avec les systèmes optiques. Les cœurs Ethernet multirate en canaux dédiés disposent de blocs HSC, MAC, PCS et FEC accessibles individuellement avec un HBM 32G et un NoC programmable pour mettre en œuvre la logique de test la plus complexe en vue d'une mise en mémoire tampon du trafic massif, d'un mouvement efficace des données, d'un contrôle intelligent du flux de données, d'un suivi et de la génération de rapports pour l'équipement de test L4-L7.

Spécifications de produits

Fonctions de mémoire

  VH1522 VH1542 VH1582 VH1742 VH1782
DRAM HBM (Go) 8 16 32 16 32
RAM en bloc totale (Mo) 89 89 89 132 132
UltraRAM (Mo) 366 366 366 541 541
Mémoire PL totale (Mo) 509 509 509 752 752

Fonctionnalités des moteurs DSP

  VH1522 VH1542 VH1582 VH1742 VH1782
Moteurs DSP 7 392 7 392 7 392 10 848 10 848

 Fonctionnalités de la logique programmable

  VH1522 VH1542 VH1582 VH1742 VH1782
Cellules logiques du système (K) 3 837 3 837 3 837 5 631 5 631
LUT 1 753 984 1 753 984 1 753 984 2 574 208 2 574 208

Fonctionnalités du sous-système de traitement

  VH1522 VH1542 VH1582 VH1742 VH1782
Unité de traitement d'application ARM® Cortex-A72 double cœur, 48 Ko/32 Ko de cache L1 avec parité et ECC ; 1 Mo de cache L2 avec ECC
Unité de traitement en temps réel ARM Cortex-R5F double cœur, 32 Ko/32 Ko de cache L1 et TCM 256 Ko avec ECC
Mémoire Mémoire sur puce 256 Ko avec ECC
Connectivité Ethernet (x2) ; UART (x2) ; CAN-FD (x2) ; USB 2.0 (x1) ; SPI (x2) ; I2C (x2)

Fonctionnalités de la plateforme

  VH1522 VH1542 VH1582 VH1742 VH1782
Émetteurs-récepteurs GTYP (32,75 Gbit/s) 681 681 681 681 681
Émetteurs-récepteurs GTM (56 G [112 G]) 20 (10) 20 (10) 20 (10) 60 (30) 60 (30)
PCIe® avec DMA (CPM5) 2 x Gen5x8 2 x Gen5x8 2 x Gen5x8 2 x Gen5x8 2 x Gen5x8
PCI Express (PLPCIE5) 8 x Gen5x4 8 x Gen5x4 8 x Gen5x4 8 x Gen5x4 8 x Gen5x4
Moteurs de cryptographie haute vitesse 400G 2 2 2 3 3
MAC Ethernet multirate 100G 4 4 4 6 6
MAC Ethernet 600G 1 1 1 3 3
Interlaken 600G 0 0 0 1 1

1. 16 émetteurs-récepteurs GTYP sont dédiés à CPM5 pour une utilisation PCI Express.

Pour tous les développeurs

AMD fournit un environnement de développement logiciel de pointe pour le design avec des FPGA et des SoC adaptatifs, incluant notamment des outils (compilateurs, simulateurs, etc.), des IP et des solutions.

Cet environnement permet aux développeurs de réduire le temps de développement tout en atteignant des performances/watt élevées. Ces outils permettent à tous les développeurs , des scientifiques en IA aux ingénieurs d'applications et d'algorithmes en passant par les développeurs de logiciels intégrés et les développeurs de matériel traditionnels, d'utiliser les solutions de calcul adaptatives AMD.​

Démarrer

Lancez votre cycle de design et accélérez la mise sur le marché grâce au matériel éprouvé, à l'assistance logicielle, aux outils, aux exemples de conception et à la documentation disponibles avec le kit.

Versal HBM Series VHK158 Evaluation Kit

Commencez à développer sur le kit d'évaluation VHK158 de la série Versal HBM

Commencez à évaluer les capacités de la série Versal HBM dès aujourd'hui avec le kit d'évaluation VHK158, qui comprend le composant VH1582. Tirant parti de la mémoire HBM intégrée, cette plateforme est idéale pour le développement d'applications gourmandes en calcul et en mémoire. Lancez votre cycle de design et accélérez la mise sur le marché grâce au matériel éprouvé, à l'assistance logicielle, aux outils, aux exemples de conception et à la documentation disponibles avec le kit.

Ressources

Formations en ligne

Les ressources de formation et d'apprentissage AMD vous offrent les compétences pratiques et les connaissances fondamentales dont vous avez besoin pour être pleinement productif dans votre prochain projet de développement.

Tenez-vous au courant

Inscrivez-vous à la liste de notification sur Versal pour recevoir les mises à jour en avant-première.