AMD Pensando™ Pollara 400 AI NIC

スケールアウト AI インフラストラクチャの強化

AMD Pensando™ Pollara 400 AI NIC は、業界初の Ultra Ethernet Consortium (UEC) 対応 AI ネットワークインターフェイスカード (NIC) であり、メガスケールやギガスケールのデータセンターの AI ノードで実行されるアプリケーションを高速化し、最大 400 ギガビット/秒 (Gbps) のイーサネット速度を実現するように設計されています。

完全にハードウェアでプログラム可能として実績ある第 3 世代の Pensando P4 エンジンをベースにした AMD Pensando Pollara 400 AI NIC は、業界をリードするパフォーマンスを発揮。将来の要件に応じて柔軟にプログラム可能で、ハイパースケーラー、クラウドサービスプロバイダー、企業にとってインフラ投資効果を最大限に高めることができる選択肢です。

製品概要を読む

AI パフォーマンスを大幅に向上

最大

8% AI ジョブが完了するまでの時間を短縮 ¹

GPU 間の通信速度が最大 400 Gbps の Pensando™ Pollara 400 AI NIC は、競合製品と比較して AI ジョブの完了時間を最大 8% 短縮可能であり、AI トレーニングと生成 AI ワークロードの本番稼働までの時間を短縮できます。

最大

50% クラスターの稼働率が向上 ²

RAS (信頼性、可用性、保守性) 機能が強化され、クラスターの実質的な稼働率が最大 50% 向上します。AMD Pensando™ Pollara 400 AI NIC が輻輳時の収束と損失回復を高速化するため、大規模な AI ワークロードの中断を減らし継続的に実行できるようになります。

最大

58% 設備投資コストの削減 ³

AMD Pensando™ Pollara 400 AI NIC は、現在および将来の AI ワークロードのニーズを満たすように設計されており、オープンなマルチプレーンイーサネットアーキテクチャを実現できるため、ネットワークの設備投資を最大 58% 削減すると同時に、AI インフラストラクチャの進化に合わせて柔軟に拡張できます。

オペレーショナルエクセレンスの向上

ハードウェアとソフトウェアで完全にプログラム可能な AMD Pensando™ Pollara 400 AI NIC は、ダウンタイムの最小化、クラスターの健全性の検証、高度なテレメトリの提供、AI インフラストラクチャの本番環境への移行を可能にします。

将来を見据えた AI インフラストラクチャのスケールアウト

AI クラスターの規模が拡大するにつれて、輻輳、テールレイテンシ、障害伝搬がシステムの効率性、コスト、信頼性を決定付ける要因となるため、パフォーマンスはネットワークの挙動にますます依存するようになっています。

この製品ガイドをお読みいただくと、AI インフラストラクチャのスケールアウト時に、AMD Pensando™ Pollara 400 AI NIC がどのように予測可能なスケーリング、使用率の向上、持続的なパフォーマンスを実現するのかをご理解いただけます。

ガイドをダウンロード

Multi-page brochure spread with AMD Pensando NIC, charts, and text on scaling AI infrastructure and performance benefits

注目の AMD Pensando™ Pollara 400 AI NIC

AI 向けデータセンターネットワークのスケールアウトにおける NIC のプログラマビリティの重要な役割

AI ワークロードのホスティングに必要なインフラストラクチャの構築が進められています。効果的なスケールアウトを実現するためには、ネットワークが重要な役割を果たし、そのネットワークはイーサネットが主流となっています。それでも、効果的なネットワーキングは、スイッチだけではなく、ネットワークインターフェイスカードに高度な機能を組み込むことも、設計上の重要な戦略となります。TechTarget の Enterprise Strategy Group に所属するエンタープライズネットワーキング担当プリンシパルアナリストである Jim Frey 氏が、なぜ AMD のプログラム可能な NIC が成功への最適な道筋と考えているのか、その見解について説明します。

概要をダウンロード

Ultra Ethernet Consortium (UEC) 機能に対応する業界初の AI NIC

AMD Pensando™ Pollara 400 AI NIC は、UEC トランスポート機能をイーサネットに統合し、UEC RDMA が AI ワークロードに対してより一貫したパフォーマンスを提供できるようにしています。完全にプログラム可能な P4 エンジンを搭載した AI NIC は、ソフトウェアを通じて UEC 機能の継続的な導入と改良をサポートするため、ハードウェアを交換することなく、新しい標準に合わせてネットワークを進化させることができます。

UEC の詳細を読む

AI ワークロード向けにネットワークパフォーマンスを強化

イーサネット AI の集合通信パフォーマンスにおける競争上の優位性

どちらの場合も、標準イーサネットを介した RoCEv2 を使用することで、ROCm™ ソフトウェアを実行する AMD Pensando™ Pollara 400 AI NIC は、RCCL を実行する NVIDIA と比較して、AI の集合通信パフォーマンスが最大 10% 向上します。⁴

AMD Pensando™ Pollara 400 AI NIC

NVIDIA 400G RDMA NIC

RoCEv2 のパフォーマンスを最大 10% 向上

+10 パーセント

AMD AI NIC における UEC 対応 RDMA: AI 集合通信のパフォーマンスが大幅に向上

UEC 対応 RDMA を備えた AMD Pensando™ Pollara 400 AI NIC は、RoCEv2 と比較して集合通信処理パフォーマンスが最大 25% 向上。⁵

AMD Pensando™ Pollara 400 AI NIC UEC-RDMA - UEC 対応 RDMA

AMD Pensando™ Pollara 400 AI NIC UEC-RDMA - RoCEv2

UEC RDMA によりパフォーマンスが最大 25% 向上

+25%

機能

インテリジェントなネットワーク監視と負荷分散

インテリジェントなパケットスプレー
アウトオブオーダーパケットの処理とインオーダーメッセージ配信
選択的な再送信
パス認識型輻輳制御
迅速な障害検出

インテリジェントなパケットスプレー

インテリジェントなパケットスプレーにより、チームは、負荷分散を強化し、全体的な効率性とスケーラビリティを向上させることで、ネットワークパフォーマンスをスムーズに最適化できます。ネットワークパフォーマンスの向上により、GPU 間の通信時間を大幅に短縮できるため、作業の完了時間が短縮され、運用効率が向上します。

アウトオブオーダーパケットの処理とインオーダーメッセージ配信

マルチパス技術やパケットスプレー技術を用いた場合でも、メッセージが正しい順序で確実に配信されるようにします。高度なアウトオブオーダーメッセージ配信機能は、順番通りには到着しない可能性があるデータパケットを効率的に処理し、バッファリングなしで GPU メモリにシームレスに直接並べます。

Programming code abstract technology background of software developer and Computer script

選択的な再送信

選択確認応答 (SACK) による再送により、ドロップしたパケットまたは破損したパケットのみを再送信。ネットワークパフォーマンスが向上します。SACK は、損失または破損したパケットを効率的に検出して再送信することで、帯域幅の使用率を最適化します。これにより、パケット損失の回復時のレイテンシが抑えられ、冗長的なデータ伝送を最小限に抑えられるため、効率が非常に高くなります。

パス認識型輻輳制御

リアルタイムのテレメトリおよびネットワーク対応アルゴリズムにより、ネットワーク監視ではなくワークロードに重点を置きます。パス認識型の輻輳制御機能により、ネットワークパフォーマンス管理が簡素化され、チームは重要な問題を迅速に検出して対処できるようになると同時に、インキャストシナリオの影響も軽減できます。

迅速な障害検出

迅速な障害検出により、チームはごく短時間で問題を特定できるため、ほぼ瞬時にフェイルオーバーを復旧し、GPU のダウンタイムを大幅に削減できます。ほぼリアルタイムのレイテンシメトリクス、輻輳、およびドロップ統計情報による高度なネットワーク監視機能を利用できます。