AI イノベーションの確かな基盤
AI の新しい用途が急激に広がりつつある現在、AI は次世代コンピューティングを形作る決定的なテクノロジであると言えます。ゲームやエンターテイメント用のリアルな仮想環境の構築から、科学者による病気の処置や治癒への貢献、人類の気候変動対策のサポートに至るまで、AI は世界で最も重要な課題を解決する可能性を秘めています。生成 AI と大規模言語モデル (LLM) が爆発的に普及し、AI アプリケーションのイノベーションが急速に進んだことで、演算リソースへの需要が著しく高まり、パフォーマンス、電力効率、普及性に優れ、クラウドからエッジ、エンドポイントまで拡張可能なソリューションが求められるようになりました。
AI プラットフォームの幅広いポートフォリオを持つ AMD は独自の地位を築いています。AMD は、AMD XDNA™ (AI エンジンを搭載したアダプティブ データ フロー アーキテクチャ)、AMD CDNA™ (データセンターにおける GPU アクセラレーションのための画期的なアーキテクチャ)、AMD RDNA™ (ゲーマー向けの AI アクセラレーション アーキテクチャ) などの革新的なアーキテクチャを基盤として、CPU、GPU、FPGA、アダプティブ SoC、その他のアクセラレータの包括的な基盤を提供し、最も要求の厳しい AI ワークロードにエクサスケール レベルのパフォーマンスで対応することができます。
AMD Instinct™ アクセラレータ
AMD は長年、データセンター アクセラレータ市場に投資してきました。生成 AI と LLM の普及により、トレーニングと推論の両方において、演算性能の向上を求める声が急激に高まっています。生成 AI を実現する中心的な役割を担っているのが GPU です。すでに、AI を活用したがん研究の加速や、数十億のパラメーターを持つ最先端 LLM の作成に使われている最速のスーパーコンピューターの多くに AMD Instinct™ GPU が搭載されており、世界中の科学コミュニティで使用されています。
AMD Instinct™ アクセラレータは HPC や AI ワークロードを大幅に加速するよう設計されています。AMD Instinct™ MI300A アクセラレータは、革新的な AMD CDNA™ アーキテクチャを基盤として、エクサスケール レベルのパフォーマンスと電力効率を実現するために最適化された、HPC および AI のための世界初のアクセラレーテッド プロセッシング ユニット (APU) です。24 基の "Zen 4" CPU コアと 128 GB の HBM3 メモリを CPU と GPU の両方で共有することで、驚異的なパフォーマンスを実現します。
AMD Instinct™ MI300X GPU は 1,530 億個のトランジスタで構成されたアクセラレータで、AI コンピューティングの未来を実現するパフォーマンスを持っています。AMD Instinct™ MI300A アクセラレータと同じプラットフォームを基盤とする AMD Instinct™ MI300X GPU は、生成 AI アクセラレーションを中心に再構築されています。AMD Instinct™ MI300X GPU は、3 つの AMD EPYC™ プロセッサ コンピュート ダイの代わりに 2 つの GPU チップレットを追加することで、プラットフォームのメモリを 64 GB 増加し、合計 192 GB という圧倒的なサイズの HBM3 メモリを搭載しています。競合製品の最大 2.4 倍の密度、最大 1.6 倍のメモリ帯域幅 (5.2 TB/秒) を誇ります。1
最新の AMD Instinct™ プラットフォームは、最大 8 つの AMD Instinct™ MI300X GPU を業界標準の設計に搭載することができ、データセンター向けに最大 1.5 TB の HBM3 メモリを持つシンプルなドロップイン ソリューションを実現します。オープンソース言語、コンパイラ、ライブラリ、ツールを特徴とするオープンで実績のあるソフトウェア プラットフォームである AMD ROCm™ を搭載した AMD Instinct™ MI300X アクセラレータは、AI インフラストラクチャにおける大幅なアップグレードとなります。
AI アクセラレーション用のプロセッサ
AI で成果を上げるには、クラウドからエッジ、エンドポイントに至るまで、複数の AI エンジンが必要です。AMD Instinct™ アクセラレータだけでなく、AMD EPYC™ プロセッサも、データセンターにおける幅広い AI ワークロードをサポートし、TPCx-AI (10 の異なるユース ケースと多数の異なるアルゴリズムにわたってエンドツーエンドの AI パイプラインのパフォーマンスを測定) をはじめとする業界標準のベンチマークに基づいた競争力のあるパフォーマンスを提供します。2
第 4 世代 AMD EPYC™ プロセッサ 1 基あたり最大 96 コアを備えた既製のサーバーは、カスタマー サポート、リテール、自動車、金融サービス、医療、製造などのさまざまなデータセンターおよびエッジ アプリケーションを高速化できます。
AMD AI ポートフォリオに追加された製品
AMD はこのほど、コンシューマーおよびビジネス PC 向け AMD Ryzen™ 7040 シリーズ プロセッサを発表しました。これには世界初の専用 AI エンジンを搭載した x86 プロセッサも含まれます。3 AMD XDNA™ テクノロジを搭載したこの新しい AI アクセラレータは、1 秒あたり最大 10 兆回の AI オペレーション (TOPS) を実行することができ、驚異的なバッテリ ライフとスピードでシームレスな AI 体験を実現し、ユーザーに将来への安心感を提供します。
また、多くの業界で AMD Alveo™ アクセラレータ、Versal™ アダプティブ SoC、業界をリードする FPGA が採用されています。たとえば、航空宇宙分野では NASA の火星探査機による AI ベースの画像検出の高速化に貢献しており、自動車分野ではパワー ドライバー アシスト機能や高度な安全機能に AMD のテクノロジが使われています。また、AMD のテクノロジは産業用途の AI 支援ロボット工学の実用化や、医療における迅速で正確な診断にも貢献しています。
オープン エコシステムにおけるイノベーションを加速する AMD
AMD は、最も要求の厳しい AI ワークロードに対応可能なハードウェア ポートフォリオを提供するだけでなく、オープンで利用しやすい AI ソフトウェアの開発にも取り組んでいます。AMD ソフトウェア ツールを活用することで、開発者やパートナーは AMD のハードウェア上で AI アプリケーションを最適化できます。現在、そのスタックには AMD Instinct™ GPU アクセラレータ用の AMD ROCm™ と、アダプティブ アクセラレータ/SoC/FPGA 用の AMD Vitis™ AI、さらに AMD EPYC™ プロセッサ用 AMD オープンソース ライブラリが含まれています。
また、AMD はハードウェア、オープン ソフトウェア、ツール、ライブラリ、モデルを含む AI エコシステムを構築しており、開発者や研究者が参入しやすい環境を整えています。AMD が最近実施した共同開発の例として、PyTorch Foundation と Hugging Face の 2 つをご紹介します。
今年初め、人気のある AI フレームワークの PyTorch は 2.0 安定版を発表して大きな前進を遂げ、ユーザーは以前より高いパフォーマンスを利用できるようになりました。AMD は PyTorch Foundation の創設メンバー企業として、PyTorch 2.0 のリリースで AMD Instinct™ と AMD Radeon™ グラフィックスがサポートされることになったことを喜ばしく受け止めています。これらは AMD ROCm™ オープン ソフトウェア プラットフォームでサポートされています。
Hugging Face は、50 万以上のモデルとデータセットを提供する、オープンソース AI プラットフォームのリーディング カンパニーです。AMD との戦略的提携関係により、個人およびビジネスの顧客がさまざまな用途に使用する数千もの LLM のパフォーマンスと互換性を最大限に高めることを発表しました。AMD 側も、Hugging Face とそのユーザーから提供されたモデルでパフォーマンスと生産性を向上させるために、自社製品を最適化する予定です。この提携により、AI イノベーションを加速する優れたエンドツーエンドの選択肢をオープンソース コミュニティに提供することができるようになり、開発者たちの間で AI モデルを使ったトレーニングと推論がさらに普及することになります。
まとめ
AMD は、AI 導入に挑戦するお客様のハードルを下げるとともに、AI エンジンを搭載したプロセッサやアダプティブ SoC から、エッジ推論、データセンターにおける大規模な AI 推論やトレーニングまで、幅広い用途に拡張可能なソリューションを提供することで、AI のメリットを広く行き渡らせています。
現在提供されているソリューション、および今年後半に市場に投入予定の新しいソリューションの詳細については、地域の AMD 担当者にお問い合わせください。
脚注
- MI300-005: 2023 年 5 月 17 日に AMD パフォーマンス ラボで以下のシステムを使用してテストを実施しました。AMD CDNA™ 3 5 nm FinFet プロセス テクノロジを使用して設計された AMD Instinct™ MI300X OAM アクセラレータ 750 W (192 GB HBM3) では、192 GB の HBM3 メモリ容量と 5.218 TFLOPS の持続ピーク メモリ帯域幅パフォーマンスが得られました。AMD Instinct™ MI300X のメモリ バス インターフェイスは 8,192 ビット、メモリ データ レートは 5.6 Gbps、持続可能なピーク メモリ帯域幅の合計は 5.218 TB/秒 (8,192 ビットのメモリ バス インターフェイス * 5.6 Gbps のメモリ データ レート/8) * 0.91 (調整値) です。 NVIDIA Hopper H100 (80 GB) SXM GPU アクセラレータの公開結果で最高の値は以下のようになっています。HBM3 メモリ容量は 80 GB、GPU メモリの帯域幅パフォーマンスは 3.35 TB/秒。
- SP5-005C: SPECjbb® 2015-MultiJVM Max の比較は、2022 年 11 月 10 日時点で公開されている結果に基づいています。構成: 2P AMD EPYC™ 9654 (815459 SPECjbb®2015 MultiJVM max-jOPS、356204 SPECjbb®2015 MultiJVM critical-jOPS、合計 192 コア、http://www.spec.org/jbb2015/results/res2022q4/jbb2015-20221019-00861.html)、対 2P AMD EPYC™ 7763 (420774 SPECjbb®2015 MultiJVM max-jOPS、165211 SPECjbb®2015 MultiJVM critical-jOPS、合計 128 コア、http://www.spec.org/jbb2015/results/res2021q3/jbb2015-20210701-00692.html)。 SPEC® および SPECrate® は、Standard Performance Evaluation Corporation の登録商標です。詳細については、www.spec.org をご覧ください。
- PHX-3a: 2023 年 5 月現在、AMD は、x86 Windows プロセッサで動作する最初で唯一の専用 AI エンジンを提供しています。ここで "専用 AI エンジン" とは、AI 推論モデルの処理以外の機能を持たない AI エンジンを指し、x86 プロセッサ ダイの一部です。詳細については、 https://www.amd.com/ja/technologies/xdna.html をご覧ください。
- MI300-005: 2023 年 5 月 17 日に AMD パフォーマンス ラボで以下のシステムを使用してテストを実施しました。AMD CDNA™ 3 5 nm FinFet プロセス テクノロジを使用して設計された AMD Instinct™ MI300X OAM アクセラレータ 750 W (192 GB HBM3) では、192 GB の HBM3 メモリ容量と 5.218 TFLOPS の持続ピーク メモリ帯域幅パフォーマンスが得られました。AMD Instinct™ MI300X のメモリ バス インターフェイスは 8,192 ビット、メモリ データ レートは 5.6 Gbps、持続可能なピーク メモリ帯域幅の合計は 5.218 TB/秒 (8,192 ビットのメモリ バス インターフェイス * 5.6 Gbps のメモリ データ レート/8) * 0.91 (調整値) です。 NVIDIA Hopper H100 (80 GB) SXM GPU アクセラレータの公開結果で最高の値は以下のようになっています。HBM3 メモリ容量は 80 GB、GPU メモリの帯域幅パフォーマンスは 3.35 TB/秒。
- SP5-005C: SPECjbb® 2015-MultiJVM Max の比較は、2022 年 11 月 10 日時点で公開されている結果に基づいています。構成: 2P AMD EPYC™ 9654 (815459 SPECjbb®2015 MultiJVM max-jOPS、356204 SPECjbb®2015 MultiJVM critical-jOPS、合計 192 コア、http://www.spec.org/jbb2015/results/res2022q4/jbb2015-20221019-00861.html)、対 2P AMD EPYC™ 7763 (420774 SPECjbb®2015 MultiJVM max-jOPS、165211 SPECjbb®2015 MultiJVM critical-jOPS、合計 128 コア、http://www.spec.org/jbb2015/results/res2021q3/jbb2015-20210701-00692.html)。 SPEC® および SPECrate® は、Standard Performance Evaluation Corporation の登録商標です。詳細については、www.spec.org をご覧ください。
- PHX-3a: 2023 年 5 月現在、AMD は、x86 Windows プロセッサで動作する最初で唯一の専用 AI エンジンを提供しています。ここで "専用 AI エンジン" とは、AI 推論モデルの処理以外の機能を持たない AI エンジンを指し、x86 プロセッサ ダイの一部です。詳細については、 https://www.amd.com/ja/technologies/xdna.html をご覧ください。