NVIDIA поделилась подробностями строения графического процессора GH100

Прошло некоторое время с момента официального представления графического процессора GH100 производства NVIDIA, лежащего в основе ускорителя высокопроизводительных вычислений нового поколения H100 на микроархитектуре Hopper, и компания только сейчас решила раскрыть его более детальные подробности.

NVIDIA GH100 изготавливается по технологическому процессу TSMC 4N, насчитывает 80 миллиардов транзисторов на площади 814 мм², то есть имеет плотность размещения транзисторов на уровне 98.3 миллионов на квадратный миллиметр. NVIDIA GA100, к слову, имеет 54.2 миллиона транзисторов на площади 826 мм², что дает плотность около 65.6 миллионов транзисторов на квадратный миллиметр. Более тонкий технологический процесс дает о себе знать.

Внутри графического процессора расположилось 144 потоковых мультипроцессора, 12 из которых являются неактивными, 18432 CUDA-ядра FP32 и 9216 CUDA-ядер FP64. Также имеется 576 тензорных ядер четвертого поколения и отдельные ускорители тензорной памяти в каждом потоковом мультипроцессоре. За подсистему памяти процессора отвечает 80 Гбайт HBM3 с 6144 битной шиной и пропускной способностью более 3 Тбайт/с. Теплопакет ускорителя NVIDIA H100 на основе GH100 достигает значения 700 Вт, что на 300 Вт больше GA100.

Здесь мы рассмотрели ключевые подробности графического процессора NVIDIA GH100. Если есть желание досконально изучить новинку, то рекомендуем ознакомиться с официальной документацией.