Intel Architecture Day 2021: подробности и строение ускорителя Ponte Vecchio

На Intel Architecture Day 2021 было рассказано не только про центральные процессоры Alder Lake и графические процессоры Xe HPG. Компания не забыла рассказать о своем одном из самых больших достижений за последнее время в лице ускорителя высокопроизводительных вычислений Ponte Vecchio.

Он состоит из 47 плиток, изготавливаемых по 5 различным технологических процессам, и насчитывает 100 миллиардов транзисторов. Его производительность достигает 45 TFLOPS при работе с вычислениями одинарной точности FP32. Это значительно больше производительности конкурентов.

Для создания Intel Ponte Vecchio используется большое количество плиток, таких как Compute, Rambo, Base, HBM, Xe Link, Multi Tile Package и EMIB, некоторые элементы соединяются при помощи Foveros.

В основе ускорителя расположилось ядро Xe. Оно насчитывает 8 векторных и 8 матричных движков, что в два раза меньше игровой реализации ядра, однако с более широкой шиной. 16 таких ядер создают Xe HPC Slice, он насчитывает 8 Мбайт L1 кэша, 16 блоков трассировки лучей, 128 векторных и матричных блоков.

Слайсы, в свою очередь, объединяются в стеки. Каждый стек насчитывает 4 слайса, 64 ядра Xe, 512 векторных и матричных блоков, а также 64 блока трассировки лучей, общий L2 кэш, 4 HBM2e контроллера, 1 медийный движок и 8 Xe Links. Два стека можно объединить.

Поставляться ускоритель высокопроизводительных вычислений Intel Ponte Vecchio будет в форм-факторе OAM, в виде готовых плат с четырьмя ускорителями и в виде готовой системы с четырьмя ускорителями Ponte Vecchio и двумя серверными процессорами Sapphire Rapids. Официальный выход состоится в следующем году.