AMD、「AMD Instinct™ MI200」シリーズ・アクセラレーターを発表
HPCパフォーマンスで競合と比較して4.9倍の性能を実現(注1) —
初のマルチダイGPUで128GBのHBM2eメモリーに対応 -
AMD(米国本社:米カルフォルニア州サンタクララ、社長兼CEO:リサ・スー)は本日、初となるエクサスケールクラスのGPUアクセラレーター「AMD Instinct™ MI200」シリーズ・アクセラレーターを発表しました。このシリーズには、世界最速のハイパフォーマンス・コンピューティング(HPC)および人工知能(AI)向けアクセラレーター「AMD Instinct™ MI250X」が含まれています(注1)。
「AMD CDNA™ 2」アーキテクチャーを採用したAMD Instinct MI200シリーズ・アクセラレーターは、幅広いHPCワークロードに対応する最先端のアプリケーション性能を提供します(注2)。また、「AMD Instinct MI250X」アクセラレーターは、倍精度(FP64)のHPCアプリケーションにおいて、他社製品と比較して最大4.9倍の性能を発揮し、AIワークロードではピーク時半精度(FP16)で380テラフロップスを超え、データ駆動型の研究をさらに加速させることが可能になりました(注1)。
AMDによるエクサスケールクラスの取り組み
AMDは、米国エネルギー省、オークリッジ国立研究所、HPEと共同で、ピーク時に1.5エクサフロップス以上のコンピューティング性能を実現するスーパーコンピューター「Frontier」を設計しました。最適化された第3世代「AMD EPYC™」とAMD Instinct MI250Xアクセラレーターを搭載したFrontierは、AI、分析、シミュレーションの性能の大幅な向上を達成しています。これにより、科学者は演算処理能力を強化できるだけでなく、データの新しいパターンを特定し、新たなデータ分析手法を開発して、研究の速度を加速させることができます。
HPCの未来を支える性能
AMD Instinct MI200シリーズ・アクセラレーターは、第3世代AMD EPYCとROCm™ 5.0オープン・ソフトウェア・プラットフォームの組み合わせにより、エクサスケール時代の新たな研究を推進し、気候変動からワクチン開発に至るまで、我々の最も差し迫った課題に取り組むことができるように設計されています。
AMD Instinct MI200シリーズ・アクセラレーターの特長は以下の通りです。
· AMD CDNA 2アーキテクチャー:第2世代マトリックス・コアがFP64とFP32マトリックス演算を高速化し、前世代のAMD GPUと比較して、ピーク時FP64演算性能を最大4倍に高めます(注1、3、4)。
· 業界を牽引するパッケージング・テクノロジー:「2.5D Elevated Fanout Bridge(EFB)」テクノロジーを採用した業界初のマルチダイGPU設計により、前世代のAMD GPUと比較してコア数が1.8倍、メモリー帯域幅が2.7倍に強化され、業界最高レベルの最大メモリー帯域幅(3.2テラバイト/秒)を実現します(注4、5、6)。
· 第3世代AMD Infinity Fabric™テクノロジー:最大8本のInfinity Fabric Linkが、AMD Instinct MI200をノード内の第3世代EPYCやその他のGPUと接続することで、CPU/GPUメモリー・コヒーレンシーを統合し、システムのスループットを最大化するため、CPUコードがアクセラレーターの能力を活用しやすくなります。
エクサスケール・サイエンスを実現するソフトウェア
AMD ROCm™は、研究者がAMD Instinct™アクセラレーターを活用して、科学的な研究を推進するためのオープン・ソフトウェア・プラットフォームです。ROCmプラットフォームは、複数のアクセラレーター・ベンダーやアーキテクチャーの環境をサポートするオープン・ポータビリティーを基盤としています。ROCm 5.0では、AMD Instinct MI200シリーズ・アクセラレーターで、トップレベルのHPCやAIアプリケーションを強化するオープン・プラットフォームを拡張し、ROCmへのアクセス性を改善するとともに、主要なワークロードで優れた性能を発揮します。
研究者、データサイエンティスト、エンドユーザーは、AMD Infinity Hubを通じて、AMD InstinctアクセラレーターとROCmに最適化済みのコンテナ化されたHPCアプリケーションやMLフレームワークを簡単に見つけ、ダウンロードしてインストールすることができます。このAMD Infinity Hubでは現在、Radeon Instinct™ MI50、AMD Instinct™ MI100、AMD Instinct MI200のいずれかに対応したさまざまなコンテナを提供しており、これにはChroma、CP2k、LAMMPS、NAMD、OpenMMなどのアプリケーションだけでなく、人気の高いMLフレームワークであるTensorFlowやPyTorchなどが含まれています。また、AMD Infinity Hubには、継続的に新しいコンテナが追加されています。
提供時期
AMD Instinct MI250XとAMD Instinct MI250は、オープン・ハードウェアのコンピュート・アクセラレーター・モジュール、あるいはOCPアクセラレーター・モジュール(OAM)で利用可能です。AMD Instinct MI210は、PCIe®カード・フォームファクターでOEMサーバーに搭載される予定です。
また、AMD Instinct MI200シリーズ・アクセラレーターは、2022年第1四半期に、ASUS、ATOS、Dell Technologies、Gigabyte、HPE、Lenovo、Penguin Computing、Supermicroなど、エンタープライズ市場の主要なOEMおよびODMパートナーのシステムに搭載される予定です。
MI200シリーズの仕様
製品モデル | ComputeUnit | ストリーム・プロセッサー | FP64 | FP32 Vector(ピーク時) | FP64 | FP32 Matrix(ピーク時) | FP16 | bf16(ピーク時) | INT4 | INT8(ピーク時) | HBM2e ECC メモリー | メモリー帯域幅 | フォームファクター |
AMD Instinct MI250x | 220 | 14,080 | ~47.9 TF | ~95.7 TF | ~383.0 TF | ~383.0 TOPS | 128GB | 3.2 TB/sec | OCP Accelerator Module |
AMD Instinct MI250 | 208 | 13,312 | ~45.3 TF | ~90.5 TF | ~362.1 TF | ~362.1 TOPS | 128GB | 3.2 TB/sec | OCP Accelerator Module |
AMDについて
AMDは、ゲームや没入型プラットフォーム、データセンターに欠かせない要素である、ハイパフォーマンス・コンピューティング、グラフィックスと視覚化技術において50年にわたり革新をもたらしてきました。世界中の何億人もの消費者、フォーチュン500企業、最先端の科学研究施設が、日常の生活、仕事、遊びを向上させるために、AMDのテクノロジーに頼っています。世界中のAMD社員は可能性の限界を押し上げる優れた製品開発に注力しています。日本AMD株式会社は、AMDの日本法人です。