Versal HBM 시리즈

고속 메모리, 보안 데이터, 적응형 컴퓨팅을 고도로 통합

제품의 장점

Versal HBM 시리즈는 고속 메모리, 보안 연결 및 적응형 컴퓨팅의 이종 통합을 특징으로 하여 머신러닝, 데이터베이스 가속, 차세대 방화벽, 고급 네트워크 테스터와 같은 컴퓨팅 집약적인 메모리 바운드 워크로드의 처리 및 메모리 병목 현상을 제거합니다. 처음부터 끊임없이 진화하는 알고리즘, 프로토콜 및 데이터 속도에 적응하도록 제작되었습니다. 자세한 내용을 확인하려면 개요 동영상을 시청하세요.

HBM2e DRAM이 통합된 Versal HBM 시리즈는 Versal Premium 시리즈*에 비해 65% 더 낮은 비트당 전력으로 최대 6배 더 많은 대역폭을 제공합니다. 생산으로 입증된 Versal Premium 적응형 SoC 기반에 구축된 Versal HBM 시리즈는 네트워크로 연결된 광범위한 멀티 테라비트 전력 최적화 연결 코어 세트와 112Gb/s PAM4 트랜시버를 새로운 네트워크 프로토콜 및 모듈에 적응할 수 있도록 통합합니다. Versal HBM 시리즈는 트랜시버 속도를 배가하면서 빌트인 암호화 엔진으로 네트워크 인프라의 모든 계층을 보호합니다. 프로그래밍 가능한 네트워크 온 칩(NoC)을 통해 최대 2.2Tb/s의 온칩 연결로 아키텍처 구성 요소 간의 라우팅 혼잡이 완화됩니다. 또한 Versal HBM 시리즈는 이전 세대 HBM 솔루션 대비 두 배의 로직 밀도를 제공하여 끊임없이 진화하는 알고리즘과 프로토콜의 성능을 극대화합니다.

*패키지 내 HBM2E가 포함된 단일 Versal HBM VH1542 장치와 4개의 LPDDR4-4266 구성 요소가 포함된 Versal Premium VP1502 장치 구현을 비교한 2023년 5월 AMD 내부 분석에 기초한 것입니다. 40% 읽기/쓰기 트랜잭션의 순차 메모리 액세스를 가정합니다. 전력 계산은 AMD Power Design Manager 및 타사 시스템 전력 계산기를 사용하여 생성되었습니다. 구성에 따라 다른 결과가 나올 수 있습니다. (VER-013) 

Versal HBM Series block diagram

주요 특징

통합 HBM2e

HBM2e 기술의 통합은 최대 819GB/s의 메모리 대역폭과 32GB의 용량을 제공하여 컴퓨팅 집약적 애플리케이션의 전력, 공간, 지연율을 최소화합니다. 상용 메모리 솔루션(DDR5)에 비해 Versal HBM 적응형 SoC는 스택형 메모리를 컴퓨팅 패브릭 바로 옆에 배치하여 Versal Premium 시리즈1보다 65% 낮은 비트당 전력으로 최대 6배 더 많은 대역폭을 제공합니다. 통합 HBM은 프로그래밍 가능한 NoC를 통해 장치의 어느 곳에서나 전역적으로 액세스할 수 있습니다. 통합 메모리 컨트롤러와 강화된 스위치 기능을 통해 모든 포트에서 모든 메모리 위치에 액세스할 수 있습니다.

1. 패키지 내 HBM2E가 포함된 단일 Versal HBM VH1542 장치와 4개의 LPDDR4-4266 구성 요소가 포함된 Versal Premium VP1502 장치 구현을 비교한 2023년 5월 AMD 내부 분석에 기초한 것입니다. 40% 읽기/쓰기 트랜잭션의 순차 메모리 액세스를 가정합니다. 전력 계산은 AMD Power Design Manager 및 타사 시스템 전력 계산기를 사용하여 생성되었습니다. 구성에 따라 다른 결과가 나올 수 있습니다. (VER-013)

확장형 직렬 대역폭

58G/112Gb/s PAM4 및 32Gb/s NRZ 트랜시버로 구성된 Versal HBM 적응형 SoC는 최대 5.6Tb/s의 직렬 I/O 대역폭을 제공하는 탁월한 확장형 트랜시버를 갖추고 있습니다. 112Gb/s PAM4 트랜시버를 통해 업계는 800G 및 단일 레인 100G 지원 인프라를 출시할 수 있습니다. 400G 램프 및 배포의 경우 58Gb/s PAM4 트랜시버는 최대 대역폭 밀도를 위한 최신 세대 인터페이스를 지원합니다. 메인스트림 전력 최적화 100G 인터페이스의 경우 32Gb/s NRZ 트랜시버가 이상적입니다. 

digital shield image
전력 최적화된 네트워크 연결 IP

고성능 연결은 차세대 네트워크 및 클라우드 인프라의 기본입니다. Versal HBM 시리즈는 14개 Virtex™ UltraScale+™ FPGA의 동급 로직 밀도인 전력 최적화된 하드 IP의 유례없는 통합을 제공합니다. Versal HBM 적응형 SoC는 고속 이더넷, Interlaken, PCIe® Gen5와 DMA를 혼합하여 다양한 프로토콜 및 데이터 속도에 유연하게 대응할 수 있는 멀티 테라비트 연결을 제공합니다. 회선 속도 고속 암호화 엔진을 통해 네트워크 트래픽을 완벽하게 보호할 수 있습니다.

abstract processor
프로그래밍 가능 로직

Versal 아키텍처 유연성의 핵심은 차별화, 미래 지향성 그리고 끊임없이 변화하는 알고리즘 및 프로토콜에 대한 적응력을 위한 맞춤형 전산 블록의 개발을 가능하게 하는 프로그래밍 가능 로직입니다. 다양한 온칩 메모리 요소와 프로그래밍 가능 I/O가 밀접하게 연계된 프로그래밍 가능 로직은 대량 데이터 세트가 포함된 많은 컴퓨팅 집약적 워크로드에 중요한 대규모 병렬 처리 및 커스텀화 기능을 제공합니다.

wave texture
DSP 엔진

DSP 엔진은 단정도 및 반정도 부동 소수점 및 복잡한 18x18 연산을 비롯한 다양한 연산 및 데이터 유형에 대한 지원을 지원합니다. 이전 세대 기술의 개선으로 DSP 엔진은 UltraScale+ FPGA 및 SoC 설계와 하위 호환됩니다. 사용자는 기존 라이브러리를 활용하거나 설계를 업데이트하여 컴퓨팅 성능을 극대화할 수 있습니다.

abstract processor
처리 시스템

다양한 애플리케이션 요구에 맞게 세 가지 프로세서 유형을 사용할 수 있습니다. 애플리케이션 처리 장치는 OS에서 지원하는 복잡한 애플리케이션에 이상적이며, 실시간 처리 장치는 지연율에 민감한 애플리케이션에 이상적입니다. 별도의 플랫폼 관리 컨트롤러가 시스템 부팅, 보안, 전원 관리, 디버그를 관리합니다.

Versal HBM 시리즈 제품 브리핑

Versal HBM 시리즈는 단일 플랫폼에서 고속 메모리, 적응형 컴퓨팅, 보안 연결의 융합을 지원합니다. 

Versal HBM Series Product Brief

응용 분야 및 산업

머신러닝 가속

인공지능 및 머신러닝(AI/ML)은 급속도로 발전합니다. 복잡한 알고리즘은 엄청난 양의 데이터를 처리해야 하므로 막대한 메모리 대역폭이 필요합니다. 기존 컴퓨팅 아키텍처에서는 여러 CPU 코어가 동시에 작동하는 경우 데이터가 외부 메모리에서 충분히 빠르게 이동할 수 없어 결국 한계에 도달하기 때문에 시스템이 정지됩니다. 반면, Versal HBM 시리즈는 적응형 엔진과 지능형 엔진을 통한 대규모 병렬 처리 기능과 통합 HBM을 통한 막대한 메모리 대역폭을 모두 제공합니다. 결과적으로 Versal HBM 시리즈는 Cosine Similarity 및 Louvain Modularity와 같은 수많은 AI/ML 프로세스에 대한 정확하고 빠른 데이터 통찰력을 제공합니다. Vitis™ 통합 소프트웨어 플랫폼의 성능 최적화된 광범위한 라이브러리 세트를 갖춘 Versal HBM 적응형 SoC 기반 솔루션은 빠르게 진화하는 데이터 센터 및 클라우드용 AI에 대해 더 높은 AI/ML 성능과 효율성을 제공할 수 있습니다.

컴퓨팅 전처리 및 버퍼링

고정 기능 컴퓨팅 장치에서 최상의 결과를 얻으려면 데이터 전처리가 중요합니다. 실제 ML 모델의 데이터 세트 크기는 테라바이트를 쉽게 능가할 수 있습니다. 따라서 대상 가속기는 이러한 데이터 세트를 효율적으로 처리하기 위해 대규모 사전 데이터 처리 프레임워크가 필요합니다. 적응형 엔진과 819GB/s의 HBM 대역폭을 갖춘 Versal HBM 시리즈는 불필요한 데이터를 제거하고, 선택한 데이터를 변환하며, 데이터를 보강하여 대상 가속기에 대한 강력한 예측 입력을 생성합니다. 고속 112G PAM4 트랜시버를 장착한 Versal HBM 시리즈는 낮은 지연율로 처리율과 시스템 성능을 극대화합니다.

차세대 방화벽

네트워크 운영자는 데이터를 보호하고 엔터프라이즈 네트워크에 대한 공격을 피하기 위해 중단 없는 지능형 관리와 강력한 네트워크 가용성을 원합니다.
Versal HBM 시리즈는 맞춤형 정책 및 제어를 통해 수천만 개의 동시 세션으로 물리적 및 데이터 링크 계층에서 VPN, 전송 계층 보안 수준에 이르는 다중 계층 네트워크 보안을 구현하기 위한 탁월한 확장성을 지원합니다. 또한 여러 400G 통합 고속 암호화(HSC) 엔진을 통해 시스템이 성능 저하 없이 회선 속도 처리율과 낮은 지연율을 유지할 수 있습니다. 32G HBM을 통해 차세대 방화벽은 네트워크 흐름을 버퍼링하고 재정렬하기 위해 외부 메모리에 액세스하지 않고도 여러 조회 테이블을 관리할 수 있습니다. 112G PAM4 트랜시버는 차세대 방화벽에 필요한 더 높은 처리율로의 확장성을 위해 최신 광학 표준 및 프로토콜에 대한 지원을 가능하게 합니다. 적응형 엔진을 통해 ML 알고리즘은 새로운 위협에 대응하여 보안 아키텍처를 현대화할 수 있습니다.

애플리케이션 성능 테스트 장비

데이터 센터, 클라우드, AI 네트워크가 800G 광학 연결을 위한 준비를 시작했기 때문에 많은 데이터 센터 네트워킹 및 클라우드 제공업체는 컴퓨팅 집약적 애플리케이션을 위한 상호 운용성 및 강력한 네트워크 인프라를 보장하기 위해 최첨단 테스트 장비를 활용해야 합니다.
Versal HBM 장치의 112G PAM4 트랜시버는 데이터 센터 네트워킹 및 클라우드 제공업체가 새로운 프로토콜 및 광학과의 상호 운용성에 적응할 수 있는 네트워크를 구축하는 데 있어 가장 중요한 구성 요소 중 하나입니다. 전용 채널화된 다중 속도 이더넷 코어는 32G HBM 및 프로그래밍 가능한 NoC와 함께 개별적으로 액세스할 수 있는 HSC, MAC, PCS, FEC 블록을 갖추고 있어 L4-L7 테스트 장비에 대한 대규모 트래픽 버퍼링, 효율적인 데이터 이동, 지능형 데이터 흐름 제어, 추적, 보고를 위한 가장 복잡한 테스트 로직을 구현합니다.

제품 사양

메모리 기능

  VH1522 VH1542 VH1582 VH1742 VH1782
HBM DRAM(GB) 8 16 32 16 32
총 블록 RAM(MB) 89 89 89 132 132
UltraRAM(MB) 366 366 366 541 541
총 PL 메모리(Mb) 509 509 509 752 752

DSP 엔진 기능

  VH1522 VH1542 VH1582 VH1742 VH1782
DSP 엔진 7,392 7,392 7,392 10,848 10,848

 프로그래밍 가능 로직 기능

  VH1522 VH1542 VH1582 VH1742 VH1782
시스템 로직 셀(K) 3,837 3,837 3,837 5,631 5,631
LUT 1,753,984 1,753,984 1,753,984 2,574,208 2,574,208

처리 서브시스템 기능

  VH1522 VH1542 VH1582 VH1742 VH1782
애플리케이션 처리 장치 듀얼 코어 Arm® Cortex®-A72, 48KB/32KB L1 캐시(패리티 및 ECC 포함), 1MB L2 캐시(ECC 포함)
실시간 처리 장치 듀얼 코어 Arm Cortex-R5F, 32KB/32KB L1 캐시 및 256KB TCM(ECC 포함)
메모리 256KB 온칩 메모리(ECC 포함)
연결 이더넷(x2), UART(x2), CAN-FD(x2), USB 2.0(x1), SPI(x2), I2C(x2)

플랫폼 기능

  VH1522 VH1542 VH1582 VH1742 VH1782
GTYP 트랜시버(32.75Gb/s) 681 681 681 681 681
GTM 트랜시버(56G(112G)) 20(10) 20(10) 20(10) 60(30) 60(30)
PCIe®(DMA 포함)(CPM5) 2 x Gen5x8 2 x Gen5x8 2 x Gen5x8 2 x Gen5x8 2 x Gen5x8
PCI Express(PLPCIE5) 8 x Gen5x4 8 x Gen5x4 8 x Gen5x4 8 x Gen5x4 8 x Gen5x4
400G 고속 암호화 엔진 2 2 2 3 3
100G 다중 속도 이더넷 MAC 4 4 4 6 6
600G 이더넷 MAC 1 1 1 3 3
600G Interlaken 0 0 0 1 1

1. 16개 GTYP 트랜시버는 PCI Express 사용을 위한 CPM5 전용입니다.

모든 개발자용

AMD는 Adaptive SoC 및 FPGA를 사용하는 설계를 위한 선도적인 소프트웨어 개발 환경을 제공합니다. 여기에는 도구(컴파일러, 시뮬레이터 등), IP, 솔루션이 포함됩니다.

이 환경에서는 개발자가 높은 와트당 성능을 달성하는 동시에 개발 시간을 단축할 수 있습니다. 이러한 도구를 통해 AI 과학자, 애플리케이션 및 알고리즘 엔지니어, 내장형 소프트웨어 개발자 및 기존 하드웨어 개발자 등 모든 유형의 개발자가 AMD 적응형 컴퓨팅 솔루션을 사용할 수 있습니다.

시작하기

키트에 제공되는 입증된 하드웨어, 소프트웨어 지원, 도구, 디자인 예제, 문서를 통해 디자인 주기를 바로 시작하고 빠른 시장 출시를 달성할 수 있습니다.

Versal HBM Series VHK158 Evaluation Kit

Versal HBM 시리즈 VHK 158 평가 키트에서 개발 시작하기

VH1582 기기를 갖춘 VHK158 평가 키트로 Versal HBM 시리즈 기능에 대한 평가를 지금 바로 시작해 보세요. 통합 HBM을 활용하는 이 플랫폼은 컴퓨팅 집약적인 메모리 바운드 애플리케이션 개발에 이상적입니다. 키트에 제공되는 입증된 하드웨어, 소프트웨어 지원, 도구, 디자인 예제, 문서를 통해 디자인 주기를 바로 시작하고 빠른 시장 출시를 달성할 수 있습니다.

리소스

새로운 정보를 놓치지 마세요

Versal 알림 목록에 가입하여 새로운 소식을 가장 먼저 받아 보세요.