NVIDIA поделилась архитектурными подробностями видеокарт GeForce RTX 3000

Во время представления игровых видеокарт NVIDIA GeForce RTX 3000 компания ничего не упомянула об изменениях, произошедших внутри графических процессоров, а именно в новой микроархитектуре Ampere.

К счастью для нас, компания обещала рассказать больше подробностей о видеокартах в ближайшие дни и, по всей видимости, она уже начала этим заниматься, так как на просторах Reddit представители NVIDIA пообщались с простыми пользователями и давали ответы на интересующие вопросы.

Самыми интересными стали вопросы о приросте производительности. Пользователи просили дать больше информации о том, как компании удалось осуществить прирост производительности и двукратно увеличить количество CUDA-ядер.

Ответить на вопрос решился Тони Тамаси (Tony Tamasi). По его словам, основной целью разработки SM блока (Streaming Multiprocessor) являлось увеличение количества выполняемых операций FP32. В Turing каждый SM блок делился на четыре идентичных раздела. Каждый раздел оснащался 16 блоками FP32 и 16 блоками INT32. В Ampere каждый SM блок по-прежнему делится на четыре идентичных раздела, однако количество FP32 блока увеличилось с 16 до 32, но с некоторыми оговорками.

Теперь каждый раздел SM блока может выполнять или 32 операции PF32, или 16 операций FP32 и 16 операций INT32 за такт, исключая вариант одновременного выполнения 32 операций FP32 и 16 операций INT32 за такт. Весь же SM блок может одновременно выполнять или 128 операций FP32, или 64 операции FP32 и 64 операции INT32 за такт. Именно такой подход позволил двукратно увеличить количество CUDA-ядер.

Помимо двукратного увеличения количества CUDA-ядер, микроархитектура Ampere принесла изменения и в L1 кэш. По словам того же Тони, L1 кэш был увеличен с 64 байт/такт (Turing) до 128 байт/такт (Ampere), что увеличило пропускную способность L1 кэша с 116 Гбайт/с до 219 Гбайт/с. Сравнение актуально между видеокартами GeForce RTX 3080 и RTX 2080 SUPER.

Также были даны ответы на другие распространенные вопросы, такие как использование интерфейса PCI Express 4.0, работа технологий NVIDIA RTX IO и DLSS 2.1, новый кодировщик и NVIDIA Reflex, однако они достаточно размыты или их можно найти на официальном сайте компании, поэтому нет смысла о них расписывать.

Как уже говорилось выше, компания продолжит отвечать на вопросы пользователей и рассказывать о новых видеокартах NVIDIA GeForce RTX 3000 в ближайшее время.