NVIDIA объяснила использование 128-битной шины в GeForce RTX 4060/Ti

NVIDIA представила игровые видеокарты GeForce RTX 4060 и RTX 4060 Ti с 8 и 16 Гбайтами видеопамяти. Все эти модели объединяет использование 128-битной шины, что вызвало много вопросов со стороны общественности, так как столь узкая шина может стать узким местом в производительности. В связи с этим компания выпустила материал, объясняющий, почему она решила использовать такую ширину шины и почему в этом нет ничего плохого.

Для начала нам объясняют, как система памяти у видеокарты работает в принципе. Графические процессоры GeForce имеют кэш первого уровня, предлагающего максимально высокую скорость работы и маленький объем, кэш второго уровня с уменьшенной скоростью работы и значительно большим объемом, а также микросхемы видеопамяти, распаянные на печатной плате и соединенные с графическим процессором при помощи шины, в данном случае 128-битной.

Доступ к информации в памяти происходит с разной скоростью в зависимости от уровня кэша: как уже написано выше, выше уровень – больше задержка, так как если данные не находятся в первом уровне, то происходит “промах кэша”, который требует перехода на следующий уровень для поиска нужных данных. Если и там нет нужного, то происходит очередной промах и переход в видеопамять. Эти промахи негативно влияют на производительность, заставляя графический процессор ожидать нахождения данных.

Решить эту проблему инженеры NVIDIA решили при помощи увеличения кэша именно второго уровня, объясняя это тем, что первый уровень находится в самих ядрах, то есть не является общим и не может занимать много места, а использовать кэш третьего уровня оказалось не так эффективно, поэтому увеличение второго уровня оказалось самым действенным вариантом для уменьшения промахов кэша.

Если у RTX 3060 Ti присутствует всего 4 Мбайта L2 кэша, то у RTX 4060 Ti имеется 32 Мбайта, что в 8 раз больше. Это позволяет графическому процессору меньше производить промахов кэша, так как нужные данные уже находятся в кэше, из-за чего не только увеличивается производительность, но и используется на 50% меньше трафика видеопамяти для каждого игрового кадра.

За счет столь серьезного снижения трафика видеопамяти для каждого кадра у компании получилось, по сути, удвоить пропускную способность памяти: в рекламных материалах NVIDIA указывает как “рабочие“ 288 Гбайт/с, которые применяются в случае микросхем со скоростью 18 Гбит/с и 128-битной шины, так и “эффективные” 554 Гбайта/с, полученные за счет уменьшения трафика видеопамяти.

Получается, что эффективная пропускная способность видеокарт NVIDIA GeForce RTX 4060 и RTX 4060 Ti превышает пропускную способность GeForce RTX 3060 Ti с 256-битной шиной и все благодаря значительному увеличению кэша второго уровня.