Тест GEAR1 vs GEAR2 на Intel и AMD

На примере Neo Forza FAYE 16GB (2 x 8GB) NMUD408E82-5000IG20 и FAYE 32GB (2 x 16GB) NMUD416E82-4600CG20

В сегодняшнем материале поговорим о делителях контроллера памяти. Долгое время мы о них не задумывались, так как память и контроллер работали на одной частоте, но с появлением 3000 линейки Ryzen на микроархитектуре Zen 2 в биосах материнских плат появился выбор 1:1 и 2:1.

Позже и Intel с выходом Rocket Lake сделал нам неприятный сюрприз. Но всё ли так плохо? Давайте выясним под конец эпохи DDR4, есть ли жизнь за пределами делителя 1:1. Ведь это будущее, и кроме делителя 2 с ддр5 нас ждёт ещё и 4.

Тестовый стенд:

  • Видеокарта: Palit GeForce RTX 3080 Ti GameRock OC
  • Процессор #1: AMD Ryzen 7 5800X
  • Процессор #2: Intel Core i5-11600K
  • Материнская плата #1: ASRock B550 Taichi Razer Edition
  • Материнская плата #2: ASUS ROG Maximus XIII Hero
  • Оперативная память #1: Neo Forza FAYE 16GB (2 x 8GB) NMUD408E82-5000IG20
  • Оперативная память #2: Neo Forza FAYE 32GB (2 x 16GB) NMUD416E82-4600CG20
  • Система охлаждения: Arctic Cooling Liquid Freezer II-360
  • Накопитель: Crucial P5 Plus 1ТБ
  • Блок питания: Deepcool DQ850-M-V2L
  • Корпус: Open Stand

О XMP

Поговорим немного об XMP. Это отличная опция для людей не склонных к ручному разгону, но когда речь заходит о высокочастотных модулях, то смысл немного меняется. Шанс получить нестабильную систему без вмешательства в тайминги или напряжения в разы выше. Например, память на чипах hynix DJR очень капризна на AMD Ryzen, в нашем случае 5000 МГц не то чтобы нестабильны, они даже не запускаются. С Intel они дружат куда лучше. И как несложно заметить, тайминги сильно завышены.

Это - болезнь любой высокочастотной памяти. Для многих XMP является определяющей бининга чипов в рамках линейки производителя. Это помогает понять потенциал чипов. Помимо основного профиля есть дополнительный на 3600 МГц, который без проблем будет работать с делителем 1:1 на обеих платформах. Не будем тратить много времени, давайте быстренько сравним эти два варианта на примере 11600K.

Например, рендер силами процессора в Adobe Premiere Pro лишь на 4% быстрее.

А в бенчмарке Photoworks более высокочастотный вариант XMP оказался всего на 5% быстрее. Позже вы поймёте, насколько это слабый результат.

Если говорить об играх, то в Киберпанке производительность с XMP в режиме Gear 1, а именно так именуется делитель 1:1 на Intel, выше. И это при том, что тайминги с такой большой разницей в частоте не сильно-то и отличаются. Вариант XMP слева даёт очевидную фору, без которой всё было бы ещё хуже.

Разгон платформ на Intel и AMD

Поэтому основные тесты будут в разгоне. Перейдём же к нему.

В случае с 11600К и Gear 1 разгон был ограничен частотой в 3733 МГц с первым таймингом 15. Ядра процессора были зафиксированы на частоте 5 ГГц, а кольцевая шина на 4.5 ГГц. В режиме Gear 2 пришлось снизить частоту, так как при выставлении сочетания таймингов RRD_S и FAW в привычное значение command rate 1 приводил к нестабильности из-за повышенной нагрузки во время стресс-теста. Так как CR1 важен, позже поймёте, почему мы остановились на частоте 4714 МГц с первым таймингом 19.

У Ryzen с делителем 1:1 всё типично (3800 МГц с первым таймингом 15), из чего следует, что Gear Down Mode удалось отключить.

Как упоминалось ранее, 5000 МГц даже не запускаются, как бы мы не старались, поэтому вновь пришлось снизить частоту до 4733 МГц, но command rate 1 всё же был нестабилен без GDM.

В случае с Intel более высокая частота памяти с меньшей частотой её контроллера позволила получить на 13 Гбайт/сек более высокую скорость чтения и записи. Копирование подросло слабее - на 9.5 Гбайт/сек. Латентность тоже увеличилась на 6 нс, что уже является негативным последствием.

У Ryzen числа выглядят куда менее оптимистично. Скорость чтения слегка снизилась, запись без изменений и лишь копирование ускорилось на 4 гбайта/сек. Задержка памяти также увеличилась на 7 нс. Выглядит так, что у Ryzen всё плохо.

Идём проверять в Corona Benchmark. Как и ожидалось, переход на делитель 2:1 оказался критичней для 5800X, однако не так сильно, как это сулила аида. Обратим ваше внимание, что процентное соотношение внутри столбцов здесь посчитано внутри каждой группы, а не относительно результата первого столбца. Intel сравнивается с Интелом, Ryzen с Райзеном.

В Adobe Premiere Pro оба процессора отрендерили сцену на 4% быстрее в обоих случаях. Хотя, казалось бы, почему Intel не ускорился сильнее?

В Photoworxx режим Gear 2 позволил i5-ому набрать на 15% более высокую скорость, в то время как Ryzen почти не улучшил свой результат.

Не менее важной составляющей являются игры, где борьба ведётся за каждый FPS.

Киберпанк 2077. Максимальный пресет графики, DLSS - ультра производительность, плотность толпы на максимум.

Паритет. Это слово будет более верным, чем проигрыш. Речь идёт об 1 и 2% падении производительности при переходе на делитель 2:1 для i5 и R7 соответственно. Если тенденция сохранится, то всё не так уж и плохо, ведь в предыдущих задачах у нас был более существенный прирост, но всё же хотелось бы увеличить FPS, а не потерять.

Far Cry 6, ультра пресет со всей возможной трассировкой, 1080p. Наконец встроенный бенчмарк в Far Cry стал отображать реальную картину происходящего в игре. То бишь статтеры и подлагивания, а не идеальный фреймтайм. Хотелось бы наоборот, чтобы в игре стало, как было в бенчмарках.

Ни слева, ни справа снова не наблюдается преимущества высокой частоты памяти над куда более низкой, но с равным делителем. И даже в случае более хорошего разгона мы лишь покрыли бы отставание, а нам прирост нужен.

Тень лары, наивысший пресет, 1080р. Начало сцены, где требовалось мало данных для отрисовки, позволило набрать более высокий средний FPS на конфигурациях с делителем 1:1. Однако, когда камера опустилась к рынку, упал FPS из-за увеличения количества передаваемых данных в секунду, чаша весов стала склоняться в сторону высокой пропускной способности памяти. Особенно это заметно на Ryzen. На протяжении некоторого времени FPS справа выше. Но даже так речь идёт лишь об 1-2 кадрах в секунду.

Watch Dogs Legion, ультра пресет графики, DLSS - производительность. Прослеживается следующая тенденция: в масштабных играх с необходимостью перегонять большое количество данных наши конфигурации практически равны с перевесом в сторону классического выбора делителя. Watch Dogs - не исключение. Чем проще или старей игра, тем больше будет разрыв.

Total War Saga TROY, ультра пресет, размер отрядов и качество травы на максимум. Модификатор разрешения - 50%. Многим известно, что "Троя" требовательна к скорости памяти. Это мы и наблюдаем. Восьмиядерный Ryzen с делителем 2:1 оказывается более предпочтительным решением в таких условиях. В случае Intel имеем паритет с отличием в рамках погрешности.

Что дает увеличение частоты в 2 раза?

Перед тестом двухранговой памяти давайте проясним для себя, насколько велика потеря производительности от двукратного снижения частоты контроллера памяти. Также добавим в тест варианты с command rate 2. Выходит 4 варианта для Intel. Переключение CR с единицы на двойку при сохранении делителя 1:1 повышает латентность памяти всего ничего, а остальные показатели отличаются в рамках погрешности.

Смена делителя частоты контроллера памяти немного сокращает скорость копирования, а также увеличивает латентность на 9 нс. И сразу видно, почему не стоит включать CR2 с делителем 2:1. Помимо чуть возросшей латентности скорости чтения, записи и копирования заметно просели, чего не было в случае делителя 1:1.

И даже более высокая частота, с которой мы изначально планировали тестирование, не компенсирует этого.

В Premiere Pro переход на Gear 2 приводит к потере всего 1% производительности, что полностью развязывает руки для дальнейшего разгона. Главное, не переключайтесь в CR2.

В PhotoWorxx ситуация похожа, но снижение скорости куда более серьёзно. Целая треть производительности теряется от сокращения частоты подачи команд контроллером.

Рассмотрим две игры по-быстренькому, так как приросты и потери от проекта к проекту весьма схожи. В отличии от синтетических тестов, в играх разница в FPS между двумя центральными конфигурациями по сравнению с левыми не идентична. Переключение делителя более негативно сказывается на производительности. Однако одновременное применение Gear 2 и CR2, сокращающее подачу команд контроллером по сути в 4 раза, также приводит к существенному падению производительности.

Far Cry лишь подтверждает всё вышесказанное. При делителе 1:1 вас не должно сильно беспокоить отсутствие возможности переключения в CR1, если такая проблема имеется. А вот понижать частоту контроллера ради потенциальных пары сотен мегагерц точно не стоит, а уж тем более включать CR2 для лучшего разгона в Gear 2.

С Ryzen чуть сложнее. Ведь у него есть Gear Down Mode. Но сравнивать 6 вариантов мы явно не будем. В режиме делителя 1:1 нам хватит одной конфигурации с CR1, а с альтернативным делителем рассмотрим разницу между всеми тремя вариантами. Однако есть небольшая проблема. В биосе нашей материнской платы нельзя задать делитель напрямую, поэтому пришлось слегка поднять частоту памяти, заодно округлив CL до чётного (так как при включении GDM это всё равно произойдёт). В любом случае все эти махинации компенсируют друг друга и не испортят нам результаты.

Интересная ситуация выходит. Переключение делителя приводит к большому увеличению латентности памяти, но скорости упали несильно. Причём Command Rate 2 или Gear Down Mode тоже их не снижают, а лишь добавляют половину наносекунды к латентности.

Выходит, разгон памяти до 4733 МГц увеличил в основном только скорость копирования. Остальные показатели едва выросли, они сильно ограничены пропускной способностью Infinity Fabric.

В Premiere Pro не имеет значения, отключите ли вы GDM и какой Command Rate выберите.

Также как и в PhotoWorxx’е. Вы теряете 3-4% производительности от переключения делителя, и только.

В играх иная ситуация. Киберпанк сообщает, что потеря FPS в процентном соотношении при переключении делителя сильнее, чем в софте (около 6% по среднему показателю), но режимы Command Rate снова едва отличаются (по сравнению с CR1 теряется 1% FPS).

В Far Cry 6 то же самое. Двукратное снижение частоты контроллера памяти лишает вас 6% FPS в среднем, а отключение GDM ничего не даст, как и выбор частоты подачи команд контроллером.

Краткие итоги

Каковы итоги применения делителя 2:1 в случае одноранговой памяти? Поведение системы на процессорах 11-го поколения Intel и 5000 серии Ryzen сильно отличается, но местами есть сходство. В играх можно достичь равных результатов, но для получения чего-то заметно более производительного нужно сделать что-то невообразимое. В премьере мы получили прирост в обоих случаях около 4%. Это откровенно слабый результат, недостойный старания. А вот в случае PhotoWorXX на Intel был отличный прирост, на Ryzen же его почти не было, так как скорость памяти сильно ограничена частотой infinity fabric, поэтому смысл в делителе 2:1 имеет место быть, скорее, в случае системы на Intel.

Если у вас есть желание попробовать такой вариант разгона, но есть сомнения, к какой группе ваша задача ближе (к таким, как Photoworxx или же Corona Benchmark), то есть, как минимум, два способа это узнать. Первый и самый надёжный - это взять и проверить, как мы это сегодня и сделали. Второй, менее затратный, требует наличие свежего процессора Ryzen у вас или вашего товарища и программы HWiNFO64. В последнем вам понадобится два датчика: DRAM Read и Write Bandwidth.

В случае Corona Benchmark, где мы получили потерю производительности от перехода к неравному делителю, величина показателя первого датчика насчитывает около 10 Гбайт/сек.

В премьере, где вариант с высокочастотной памятью показал себя лучше на 4%, в среднем уже 25 Гбайт/сек на чтение и 16.5 - на запись.

Наибольший прирост был получен в Photoworxx. Ожидаемо здесь самые высокие показатели, особенно максимальные.

В "Киберпанке" было 20 Гбайт/сек на чтение и 5 на запись, что находится между короной и премьером.

А в "Трое", где 5800X с делителем 2:1 оказался чуть быстрее, показатели близки к таковым в премьере.

Стриминг силами процессора на пресете Medium без дополнительных сцен в OBS перегоняет данные как Corona Benchmark, то есть в нём мы прирост, по всей видимости, не получим. И таким образом можно примерно оценить каждую задачу.

Двуранговые модули

Остались двухранговые модули. Пробежимся по ним быстренько. Ни для кого не секрет, что в среднем они берут меньшую частоту, нежели одноранговые. С другой стороны, покорить на них Command Rate 1 с делителем 1:1 тоже является невероятно сложной задачей. Переходим к практике на примере i5-11600К.

Как и ожидалось, с равной частотой контроллера и памяти запуститься с command rate 1 не вышло. В остальном тайминги схожи с оными на одноранговых модулях. С делителем 2:1 всё тоже совпало с ожиданиями. Частота вышла ниже - 4437 МГц с первым таймингом 19.Благо CR1 вышло взять, хоть и странным способом: его нужно было поставить в авто. Вручную запуска уже не было.

Бенчмарки

Соответственно, пропускная способность выросла слабее, чем на одноранговых модулях, а вот латентность примерно также.

В премьере вместо 4% рендер ускорился лишь на 1%. Это наводит на мысли, что всё же на двухранговых модулях смысл в этой затее утрачивается.

Но PhotoWorXX в Aida 64 доказывает обратное. Здесь имеем 17-процентное преимущество высокочастотного режима над низкочастотным вместо 15%, как это было на однорангах.

Тесты в играх

В играх же всё по-прежнему. В случае "Киберпанка" разгон в Gear 2 режиме отстаёт на пару процентов от классического. Ни рыба, ни мясо.

В "Фаркрае" отставание выше. Целых 3%! С оптимистической точки зрения, если в чём-то вы получили хороший прирост производительности, то не потерять много FPS в играх не так уж и плохо.

А если взять B-Die?

Остаётся открытым последний вопрос. А не проще ли просто приобрести память на чипах samsung b-die и настроить её с делителем 1:1? Отчасти можно спроецировать результаты тестов, увеличив их в равной степени для каждой конфигурации, однако практика подсказывает, что в среднем взять высокую частоту на “бидаях” сложнее. Но если нужно получить большую эффективность в задачах по типу PhotoWorxx, то это имеет смысл.

И на этом всё. Не болейте и до новых встреч!

31 мая 2019
Что может предложить любителям оверклокинга 6-ядерный Intel Core i5-9600k, и до какой частоты можно разогнать этот процессор на материнской плате среднего уровня? Ответы на эти и другие вопросы в материале редакции I2HARD.ru.