NVIDIA представила серверные ускорители A10, A30 и A16

На GTC 2021 компания NVIDIA представила не только ARM-процессор Grace собственной разработки, но и представила несколько серверных ускорителей для работы с искусственным интеллектом. Всего было представлено три ускорителя: A10, A30 и A16.

NVIDIA A10 занимает один слот расширения. Он получил 72 RT-ядра и 24 Гбайта видеопамяти типа GDDR6 с пропускной способностью 600 Гбайт/с. Это позволяет демонстрировать производительность 31.2 TFLOPS при работе с операциями одинарной точности FP32, а производительность тензорных ядер при работе с TF32, BFLOAT16 и FP16 достигает значений 62.5 и 125 TFLOPS соответственно. Теплопакет 150 Вт.

NVIDIA A30 занимает два слота расширения, количество CUDA, RT и тензорных ядер остается загадкой, в то время как видеопамять представлена стеками HBM2 общим объемом 24 Гбайта. Производительность ускорителя при работе с операциями одинарной точности FP32 достигает 10.3 TFLOPS. Производительность тензорных ядер при работе с TF32, BFLOAT16 и FP16 достигает 82 и 165 TFLOPS соответственно. Теплопакет 165 Вт. Ускоритель можно разделить на несколько отдельных ускорителей при помощи Multi-Instance GPU: на 4 инстанса по 6 Гбайт видеопамяти или на 2 по 12 Гбайт.

Последним представленным серверным ускорителем стал NVIDIA A16. Он получил четыре графических процессора, каждый из которых насчитывает 16 Гбайт видеопамяти GDDR6 с пропускной способностью 236 Гбайт/с. Его теплопакет равен 250 Вт.

Все вышеперечисленные ускорители охлаждаются при помощи серверных вентиляторов, получили поддержку интерфейса PCI Express 4.0 и совместимы с программным обеспечением Virtual GPU.