Характеристики серверов с ускорителями AMD Radeon Instinct MI100 и сравнение производительности с NVIDIA A100 и V100S

AMD готовится к показу не только настольных процессоров Ryzen 4000, серверных EPYC Milan и видеокарт Radeon RX 6000 (условно), но и профессиональных ускорителей вычислений Radeon Instinct, основанных на графическом процессоре AMD Arcturus и архитектуре CDNA.

Ресурс AdoredTV опубликовал несколько слайдов с закрытой презентации AMD, которые показывают производительность AMD Radeon Instinct MI100 и сравнивают ускоритель с NVIDIA A100 (Ampere) и V100S (Volta). Вся информация не является официальной и является не более, чем слухом от достоверного источника, поэтому и относиться к ней стоит соответственно.

Итак, AMD готовит два вида специальных серверов: 1U и 3U. Они будут отличаться не только количеством ускорителей Radeon Instinct MI100, но и характеристиками в целом.

Начнем с первого. Сервер 1U включает в себя два процессора AMD EPYC Rome или Milan, каждый процессор имеет в распоряжении по 2 ускорителя Radeon Instinct MI100. Для общения между процессором и ускорителями используется шина Infinity Fabric второго поколения. Четыре ускорителя обеспечивают производительность 136 TFLOPS в операциях FP32 (SGEMM), то есть каждый ускоритель способен выдать производительность до 34 TFLOPS.

Полные характеристики не рассекречиваются, но некоторые сведения все-таки имеются. Пропускная способность интерфейса PCI Express 4.0 составит 256 Гбайт/с. Общая пропускная способность памяти ускорителей составляет 4.9 Тбайт/с, что указывает на использование памяти HBM2E. Общий объем памяти составляет 128 Гбайт или 32 Гбайта на каждый ускоритель. Энергопотребление каждого ускорителя Radeon Instinct MI100 составляет 300 Вт. Данный сервер появится в продаже в декабре этого года.

Второй сервер или 3U может похвастаться не только увеличенным количеством ускорителей Radeon Instinct MI100, но и улучшенными характеристиками в целом. Сервер будет оснащаться двумя процессорами AMD EPYC Rome или Milan, однако количество ускорителей будет увеличено до 8 штук или по 4 на каждый процессор. Пиковая производительность в операциях FP32 (SGEMM) составит 272 TFLOPS.

Пропускная способность интерфейса PCI Express 4.0 увеличится до 512 Гбайт/с, общая пропускная способность памяти составит 9.8 Тбайт. Весь сервер получит 256 Гбайт видеопамяти типа HBM2E. Общее энергопотребление сервера составит 3 кВт. Данный сервер будет доступен с марта 2021 года.

На сервера с ускорителями AMD Radeon Instinct MI100 посмотрели, однако про сравнение с NVIDIA A100 и V100S совершенно забыли. Стоит сразу отметить, что на представленном слайде AMD сравнивает свой ускоритель с ускорителем NVIDIA A100, теплопакет которого равен 300 Вт, однако в действительности теплопакет ускорителя 400 (SXM4) или 250 (PCI Express) Вт.

Слайд со сравнением производительности ускорителя AMD Radeon Instinct MI100 c NVIDIA A100 и V100S показывает, что “красный” ускоритель на ~13% производительней A100 и более чем в два раза производительней V100S в операциях FP32 (SGEMM). Что касается производительности на ватт, то и здесь Radeon Instinct MI100 обходит конкурентов: A100 – в полтора раза, V100S – в 2.4 раза.

Закончить хотелось бы тем, в каких сферах AMD рекомендует использовать сервера с ускорителями Radeon Instinct MI100. Судя по слайду, наилучшие сценарии для использования данного ускорителя будут нефтегазовая отрасль, академические исследования и машинное обучение. Там, где необходимо интенсивное использование операции FP32. В других задач решение от конкурента в лице A100 будет предпочтительней.