NVIDIA рассказала о строении процессора GB10 Grace Blackwell Superchip

NVIDIA раскрыла, хоть и не все, но значительное количество подробностей о процессоре GB10 Grace Blackwell Superchip, над которым она работала совместно с MediaTek. Он является производным от GB100, но с тем отличием, что включает центральные ядра на архитектуре ARM.

Процессор состоит из двух соединённых между собой кристаллов: S-DIE и G-DIE. На первом расположены центральные ядра и основные блоки, тогда как на втором – графические ядра и связанные с ними компоненты. Оба производятся по 3-нм технологическому процессу TSMC.

Всего процессор насчитывает 20 центральных ядер ARM 9.2, организованных в двух кластерах по 10 ядер. Каждое ядро имеет собственный кэш второго уровня, а для каждого кластера предусмотрено 16 Мбайт кэша третьего уровня, что в сумме составляет 32 Мбайта на весь процессор.

NVIDIA предпочитает не раскрывать количество CUDA-ядер в новинке, но, по некоторым данным, процессор насчитывает 6144 CUDA-ядра. Из известного можно отметить наличие тензорных ядер пятого поколения, RT-ядер четвёртого поколения и 24 Мбайта кэша второго уровня. Теоретическая производительность достигает 31 TFLOPS для FP32 и 1000 TOPS для FP4 (NVFP4).

Процессор работает со 128 Гбайтами унифицированной оперативной памяти LPDDR5X со скоростью 9400 MT/s и 256-битной шиной, обеспечивающей пропускную способность 301 Гбайт/с, а кристалл GPU связан с памятью интерфейсом NVLink-C2C со скоростью 600 Гбайт/с.

NVIDIA GB10 Grace Blackwell Superchip предназначен для создания миниатюрного «суперкомпьютера» DGX Spark, позволяющего выполнять задачи, связанные с искусственным интеллектом, любому пользователю.