DDR5 на Intel: Ранги или частота?

Пришло время плотно потестить DDR5, благо цены стали более адекватными. В этом видео сравним два модуля по 16 ГБ с четырьмя, а ещё с парой по 32 ГБ. Так сказать, проверим ранги на ФПС. На закуску всё разгоним и сравним на пределе.

Сообщество энтузиастов сильно беспокоит производительность появившихся в продаже двуранговых комплектов DDR5 2 по 32 ГБ, слышны посылы, что они разрывают одноранги, и за ними будущее. Начнём с небольшого экскурса в историю: не так давно про двуранги ддр4 также разгорались и тухли диспуты, только там всё оказалось довольно просто и виноваты в заметных различиях оказались автотайминги.

С DDR5 начнём тоже с автоматических режимов, но сперва познакомимся с тестовым стендом.

Тестовый стенд

В наличии у нас два комплекта недорогой одноранговой памяти Teamgroup T-Create expert и один комплект двуранговой памяти этой же серии. Материнская плата Z790 CARBON WIFI от MSI , процессор Intel Core i5-13600K в разгоне, P-ядра 5,7 ГГц, E-ядра - 4,5 ГГц, Кольцевая шина 5 ГГц.

Вот так в лоб сравнить варианты с разным исходным xmp будет не только нечестно, но и почти бессмысленно в рамках исследования зависимостей производительности от рангов памяти. Поэтому выберем какой-то компромиссный вариант. Возьмём лучшее от комплектов, от однорангов оставим RCD 40, а от двурангов выберем CL 34, тем более в линейке T-Force есть комплекты на 64 ГБ с частотой 6400 МГц и там как раз используется такой CL.

Итого, имеем 6400 МГц и основные тайминги 34-40-40-84, напряжение 1,35 В, похожих или чуть хуже XMP много. Все остальные тайминги в авто, заодно посмотрим нюансы для различных конфигураций, а их сразу приходит на ум минимум три: 2 по 16 одноранговыми модулями, 2 по 32 двурангов и 4 по 16 однорангов. Кроме этого, добавим одну двуранговую планку на 32 ГБ, исключительно ради любопытства, выяснить что могут два узких канала памяти и два ранга на одном модуле DDR5.

XMP

Тайминги и синтетические тесты

Оценивая автоматические значения таймингов сразу находим интересные особенности. CWL для двуранговых модулей выставляется равным CL, а для одноранговых в зависимости от их количества на 2 или на 4 ниже CL. На драгих материнских платах автоматика может работать по-другому.

RFC для двурангов Z790 Carbon решил применить на 30 ниже, чем для однорангов, а REFI наоборот получился немного лучшим у однорангов.

В синтетике наверняка сильнее всего проявит себя чуть более высокий RDRD_DD у четырех модулей памяти.

В целом это все сколь-либо значимые отличия. Несущественные расхождения некоторых других таймингов не должны вылиться в измеримые различия. Получается в автоматическом режиме новые материнские платы с DDR5 не позволяют себе таких вольностей, как прошлые платформы с памятью предыдущего поколения, по крайней мере на используемой в тесте Z790 Carbon. Кроме того, вторичные и третичные тайминги уже выглядят почти нормально, чего стоит только нормальные RRD и FAW.

Для начала обратимся к бенчмаркам разной степени синтетичности. Любимая многими Aida64 показывает преимущество в скорости операций записи и копирования для большего суммарного количества рангов, что более чем логично, именно в этом сила чередования рангов. Чуть завышенный RDRD_DD ставит палки в колёса четырём модулям по 16 ГБ. Меньшее количество каналов очевидным образом уполовинивает ПСП одного модуля, но замечаем преимущество этого варианта по измеренный аидовым методом задержке. В сравнении разных платформ на различия в этом параметре нет смысла делать акцент, но без смены процессора 1 нс может уже где-то в синтетике выстрелить.

В CPU-Z получаем практически идентичные результаты для всех конфигураций, совсем немного многопоточные баллы ниже на одной планке в 32 ГБ. Зато однопоток там фактически лучший, возможно сработала та самая наносекунда или погрешность измерений, разница минимальна и не стоит внимания. Из дальнейшего сравнения этот тест можно вычёркивать, такое безразличие к подистеме памяти нам не подходит.

Geekbench 5, наблюдаем совсем небольшие отличия, можно отметить задатки четырёх суммарных рангов памяти обеспечить чуть большую многопоточную производительность, а один модуль на 32 ГБ уже ограничивает в этом соревновании даже не самый многоядерный процессор.

Cinebench R23 ожидаемо тоже выбывает из годящихся к тесту подсистемы памяти бенчмарков. Все четыре конфигурации равны, номинально одна планка даже выбилась в лидеры!

Другой 3Д-рендер, Corona Benchmark уже показывает зачатки различий, его пока придержим для репрезентативности.

Переходим к более чувствительным тестам, например, photoworxx из пакета Aida64. Результат почти полностью зависит от пропускной способности памяти, отсюда и двукратное отставание одного модуля от остальных. Однако, интереснее другое, два двуранга наконец-то заметно опережают аналогичное количество однорангов. 4 модуля отстают от лидера совсем немного, RDRD_DD и тут немного портит результат.

Где ПСП точно не будет лишней - это в архивировании. В бенчмарке 7-Zip сжатие на двух двурангах происходит быстрее, чем на двух однорангах. Различие чуть меньше, чем в предыдущем тесте, около 5%, 4 модуля отстают на 1%.

В WinRAR различия конфигураций и того меньше, тут даже один модуль не сильно отстаёт.

Тесты в играх

С таким багажом наблюдений переходим к игровым тестам, начнём с FarCry 6, 1080p, ультра пресет без HD текстур, обе настройки RT включены, масштаб 0,5. После невразумительных различий в синтетике ждать драматических различий в менее интенсивной игровой нагрузке было бы наивно. Их и нет, однако 2 по 32 ГБ всё же как-то реализуют свои сильные стороны и вырываются в лидеры. Интереснее другое, один модуль держится молодцом.

Переходим к чуть более интенсивной нагрузке - Cyberpunk 2077, 1080p, пресет трассировка лучей ультра, DLSS ультрапроизводительность. Однако, вместо увеличения отрыва комплектов по 64 ГБ мы получаем меньшие различия на уровне 1-2%. Больше всех пострадал ФПС у конфигурации с одним модулем. Отставание от полноценных вариантов с хотя бы одним модулем на канал превысило 10%.

Повышаем накал процессора максимально, Троя с экстремальным размером отрядов и качеством травы. 1080p, максимальный пресет, масштабирование 50%. Но и тут увеличения различий не наблюдается, тяжелее стало только варианту с одним модулем, а в остальном те же 2-3% между двумя и четырьмя суммарными рангами для вариантов с планками в каждом канале материнской платы.

Ударимся в другую крайность, просмотр повтора на очень быстрой скорости в Starcraft 2. 1080p максимальные настройки. К концу отрезка практически все различия испаряются, причём один модуль не отстаёт и даже не худший, наносекунда в деле!

Без эталонной Лары Крофт сравнение было бы не полным, 1080p, максимальный пресет, 20% масштабирование, сглаживание отключено. Игры выбирались по стабильности и повторяемости полученных результатов, чтобы нащупать минимальные различия, и вот мы опять обращаемся к теням прошлого. Что характерно, в этой игре получаем усреднённые значения различий для предыдущих. Комплекты по 64 ГБ примерно на 2% быстрее, чем два одноранговых модуля по 16 ГБ, при этом 2 по 32 имеет гомеопатическое преимущество над 4 по 16, из-за небольших различий в таймингах скорее всего.

Выравниваем частоты и тайминги

Синтетические тесты

Что ж, даже авто значения не дают весомых различий, есть подозрения, что на одинаковых таймингах результаты станут ещё ближе. По-хорошему с этого стоило бы начать, но тщательное исследование требует наличия обоих вариантов в сравнении.

Итак, выравниваем все тайминги для всех тестируемых комбинаций. Нет, это не предел для модулей, хотелось получить чуть поджатые значения с минимумом узких мест, главное - идентичность. Напряжение чуть поднято, Power Down выключен.

Как говорится, “Миша, всё не так, давай по-новой”. “Сверхточный” в кавычках тест Aida64 указывает на общее выравнивание пропускной способности у полноценных конфигураций, в чтении из памяти выделился вариант 2 по 16 ГБ. при этом преимущество по Latency переходит от одного модуля к комплектам объёмом 64 ГБ.

Сразу обращаемся к тесту Photoworxx, он показывал наибольшие отличия. Теперь же два и четыре суммарных ранга разделяют всего 2 процента вместо семи из первого забега. 2 по 32 и 4 по 16 вообще не отличаются. Один модуль в этом тесте не может рассчитывать на что-то серьёзное.

В GeekBench 5 номинальное лидерство по однопотоку перетекло к многоранговым комплектам. В многопотоке 2 по 16 снова получил чуть больший прирост и теперь всего на процент, а точнее на шесть десятых, отстаёт от более ёмких вариантов.

Выявлять различия в десятые процента отправляемся в Corona Render, хотя можно утверждать, что отличий нет вовсе, кроме одного модуля на 32 ГБ, он всё же чуть отстаёт.

Вся надежда на архиваторы. В 7-Zip 2 по 16 ГБ опять получили самый большой прирост, но весомое отставание в 3% от комплектов 2 по 32 и 4 по 16 всё же набирается.

В WinRAR 2 по 16 ГБ тоже прибавили больше всех, и теперь три полноценных конфигурации почти не отличаются. Еле заметное преимущество многоранговых комплектов можно и не отмечать.

Предугадать расклад в играх уже не так сложно, но предположения без подтверждения экспериментами немного стоят. Порядок тот же, сначала FarCry 6, не так эффективно нагружающий все ядра, но хорошо откликающийся на ускорение памяти. В отличие от синтетики, в играх все конфигурации ускорились на близкое значение, около 6-7%, но распределение этого +- одного процента позволило всем вариантам с несколькими планками фактически сравняться. 0,1% за комплектом 2 по 32. Отставание одинокого модуля увеличилось.

Тесты в играх

В Cyberpunk 2077 ситуация похожая. Комплект двурангов прибавил чуть меньше других, поэтому по среднему ФПС три правых варианта почти сравнялись. Преимущество комплектов объёмом 64 ГБ испарилось. Одна планка на 32 ГБ увеличила отставание, 0,1% снова за двумя двурангами.

В Трое один модуль держится молодцом, отрыв полноценных конфигураций не увеличился, в остальном опять констатируем почти одинаковые измерения ФПС у вариантов с хотя бы одним модулем в каждом канале. 0,1% чуть лучше у комплектов с четырьмя суммарными рангами.

Старкрафт совершенно безразлично отнёсся к разным комплектам в xmp, но с подтянутыми таймингами один модуль измеримо отстал, три правых варианта снова на равных.

И только безотказная Лара уверенно показывает, кто лидер. Комплект 2 по 32 снова показывает 2%-е преимущество над преследователями. Как-то подытожить все эти замеры можно только утверждением, что отличий в игровой производительности между вариантами с разным количеством суммарных рангов минимум. 4 ранга дают иногда чуть выше 0,1% меньших и редко чуть больше средних ФПС.

С немного затянутыми таймингами разница в повседневном использовании испарилась почти полностью. Это в задачах где не используется преимущество в объёме оперативной памяти. Про единственный модуль на 32 ГБ говорить особого смысла нет, замеры были сделаны из любопытства, тем не менее его результаты вполне адекватны и не тянут на провал.

Разгон

Теперь, после очередного разрушения мифов, нам захотелось проверить ещё несколько волнующих многих энтузиастов вопросы: как оно там с нормальным разгоном, заборят ли двуранги на частоте близкой к 7000 МГц одноранги на гигагерц более быстрые? Сильно ли помогает более низкий RFC чипам Hynix ревизии M компенсировать аналогичное отставание по частоте? Можно ли сейчас уже нормально погнать 4 модуля по 16 ГБ?

Начнём с последнего, MSI Z790 Carbon позволила завести и успешно использовать 4 модуля на частоте вплоть до 6800 МГц, выше отыскать стабильность оказалось сложно, возможно проблема в не самых лучших модулях, уж какой-то из 4х вполне может подкидывать проблем. Из нюансов - RDRD_DD всё же пришлось немного повысить, до 18, а REFI не хотел стабильно работать на высоких значениях.

С разгоном двурангов на той же материнской плате возникли некоторые трудности выше частоты 6400 МГц, поэтому пришлось привлечь двухслотовый EVGA Z690 Dark. С ним вышло добиться аналогичной однорангам частоты в 6800 МГц, но REFI поддался чуть выше, RFC тоже вышел немногим лучше, как и некоторые несущественные улучшения в других таймингах.

Одноранговые модули T-Create EXPERT оставили смешанное впечатление, с одной стороны они действительно очень доступные по цене и по всем выкладкам и отчётам пользователей в них должны использоваться чипы Hynix ревизии A, однако частоты выше 7400 сложно достижимы, а для частоты 6800 МГц позволительны значения RFC ниже 400, что свойственно ревизии M.

В дальнейших тестах решено было использовать более классические OEM планки Hynix с чипами ревизии как M, так и A. Настройка DDR5 имеет очень много “если”: тут и планки нужны хорошие, и материнская плата, и контроллер памяти процессора необходим выдающийся для достижения частот 8000 и выше. Возможности перебирать железки не было, ограничимся тем, что есть.

Высокие частоты оказались ограничены 7800 стабильных МГц для Hynix ревизии A, CL 34, RCD 46, RFC 496. Частоты выше доступны для удачных или отборных экземпляров, у нас таких нет.

Ревизия M в OEM планках оказалась чуть более удачной, не 7200, конечно, но достойные 6933 МГц, CL 32, RCD 40, RFC 352.

Напряжения везде вполне нормальные при наличии прямого обдува, для 4х планок повышение не давало результата, потому финальные значения у них самые низкие.

Синтетические тесты

Пропускная способность в Aida 64 стремительно достигла 100 и более ГБ в секунду, для 7800 МГц значения даже более внушительные. Намерянные Аидой задержки для однорангов опустились ниже 50 нс, у ревизии A и вовсе до 48. 4 суммарных ранга показывают более скромные результаты, около 51 нс. C таким-то разбросом по памяти наверняка натестим кучу различий, приступаем.

На всякий пожарный проверим исключение CPU-Z из сравнения, нет, не ошиблись, разницы нет, тут ему не место.

В Geekbench 5 результаты относительно 6400 МГц с не самыми зажатыми таймингами выросли совсем немного у всех, кроме 7800 МГц планок, и они лидируют, речь про многопоток, конечно. В однопотоке разницы нет.

В Corona Render ожидаемо зарешали более низкие задержки, Rev.A впереди, но различия между конфигурациями минимальны.

В Photoworxx определяющую роль играет ПСП, что прекрасно видно по результатам, 7800 МГц вне досягаемости.

У архиваторов зависимость результатов чуть сложнее, в 7-Zip можно выделить две пары с близкими результатами по сжатию - ревизию A и два двуранга, и ревизиию M и 4 одноранга. Распаковка, как обычно, почти везде одинакова быстра, почти, 7800 МГц всё же на 1% впереди.

В WinRAR чуть по-другому, кроме лидера, естественно. 4 одноранга проигрывают всем, низкая задержка двух модулей с чипами ревизии M перевешивает достоинства большего количества рангов у комплекта 2 по 32.

Теперь игры. В Far Cry 6 попробуем сначала посчитать прирост по сравнению с имитированным XMP 6400 МГц. Получаем заметные 10-12% для однорангов и чуть более скромные 9 и 7% для двух других конфигураций. В итоге Hynix ревизии A лидируют по всем параметрам, но преимущество сложно назвать устрашающим, не более 2%. По средним ФПС остальные варианты невероятно близки, в редких событиях чуть лучше комплекты с большим количеством рангов.

Тесты в играх

В Киберпанке ситуация похожая, около 10% рост ФПС у однорангов и чуть меньше у комплектов на 64 ГБ. Различия в производительности даже немного сократились по сравнению с Far Cry. 4 одноранга снова позади всех, в этот раз подвёл ещё и 0,1%, солидные 7800 МГц впереди.

Не будем томить, в Трое не самому большому количеству ядер 13600К возможностей оперативной памяти и до разгона хватало, разницы существенной нет, но номинально 7800 МГц снова впереди всех.

То же самое в Старкрафте.

Лара снова умудряется подытожить и подтвердить выведенные множеством повторений закономерности, потому тесты без неё - почти не тесты. Рост ФПС по сравнению с XMP для комплектов из двух однорангов - 10-12%, для двурангов и варианта 4 по 16 - 9 и 7% соответственно. Самый высокочастотный вариант 7800 МГц лидирует по средним ФПС и не отстаёт от двурангов по редким событиям, но все различия настолько ничтожны, что их можно было бы и проигнорировать.

Однако, соберём все ФПС в кучу и посчитаем усреднённое положение всех конфигураций в разгоне. Без созерцания сотен кадров в секунду итог сравнения выглядит довольно скучно. Процент туда, процент сюда, если бы не множество повторений, то вообще всё можно было бы списать на погрешность.

Получается правы были те, кто говорил, что настроенные двуранги не отстанут сильно от раскочегаренных на гигагерц выше однорангов? Да! Кроме того в догонку надо кричать, что вообще всё разогнанное и настроенное будет показывать в играх почти идентичную производительность.

Итоги

Давайте попробуем почерпнуть из этой тонны цифр что-то полезное. Изначально, в имитированном XMP двуранги и 4 планки по 16 ГБ были всё же немного быстрее парных однорангов.

Если посчитать средний прирост производительности в играх от лёгкой настройки таймингов на частоте 6400 МГц, то все конфигурации прибавили почти одинаково.

Теперь прикинем, сколько дал финальный разгон, если считать от этих значений, а не от XMP. Выходит, что парные одноранги увеличили производительность заметнее, особенно получившие дополнительные 1400 МГц Hynix ревизии A. А оба комплекта объёмом 64 ГБ прибавили всего по 2%.

Используя эти вычисления можно прийти к выводу, что для двурангов не потребуется обязательно выжимать высокие частоты, чтобы получить близкую к максимуму производительность, условных 6400 МГц уже достаточно. А на такой частоте требования к контроллеру памяти и материнской плате меньше, бонусом - увеличенный объём оперативной памяти.

Конечно, хотелось бы посмотреть на результаты однорангов на частоте 8200+ МГц и двурангов на 7200+ МГц, но сейчас это выйдет дороговато, если вообще выйдет, может позже. Ешё не стоит забывать, что на условном 13900К в хорошем разгоне различия в производительности для сравниваемых в видео конфигураций может увеличиться и достичь, допустим, разгромных 3-х процентов.

Бонус!

Для дочитавших до конца предложим бонусный контент: Киберпанк, боевые условия, 1440p, пресет трассировки лучей ультра с выключенным DLSS, 13600K в разгоне и 4090. Полная уравниловка, это кстати и ответ на многие комментарии, почему не тестируем процессоры или память в разрешении 4К. Причём запись сделана на прошлой версии Киберпанка, без новых модных трассировок.

В портированном на пк ремастере игры 2014 года Last of Us Part I для 1440p и максимального пресета тоже видим похожую картину, но тут загрузка видеокарты иногда даже отлипает от 99%.

Так что если у вас нет видеокарты уровня RTX 4090, то необходимости обязательно получить 8000 МГц на DDR5 нет абсолютно никакой, кроме спортивного энтузиазма и, может быть, для достижения преимущества в некоторых киберспортивных дисциплинах. Официально разрешаем спать спокойно с 6400-7000 МГц и затянутыми таймингами, а если нужен большой объём - смело брать двуранги, в производительности не потеряете.