Гайд по разгону DDR5 на AMD Ryzen 7000
Прежде чем сравнить разные по объёму, количеству и ранговости модули DDR5, мы задумались: “А как оценить важность того или иного тайминга, если они окажутся разными?” Поэтому в первую очередь нужно изучить эти самые тайминги, обнаружить наиболее важные из них, а это уже тянет на целый гайд, что неплохо было бы оформить в отдельную статью. И вот вы здесь, нацелены выявить формулы, оптимальные тайминги, важность частоты памяти и не только. Мы же постараемся оправдать ваши надежды, так что не спешите уходить.
Тестовый стенд
В качестве подопытного выступит классический и оптимальный по общему мнению комплект из двух 16 ГБ модулей DDR5 T-Create Expert на чипах Hynix Rev.A с XMP 6000 МГц и 38 таймингами. Обрабатывать поступающие данные будет Ryzen 7 7700X с фиксированной на 5.2 ГГц частотой, а в качестве связующего звена выступит материнская плата ASUS ROG Crosshair X670E Gene. Остальные комплектующие ниже.
- Процессор: AMD Ryzen 7 7700X
- Материнская плата: ASUS ROG Crosshair X670E Gene
- Видеокарта: Palit GeForce RTX 4090 GameRock
- Оперативная память: DDR5 T-Create Expert [CTCED532G6000HC38ADC01] 2x16 ГБ
- Система охлаждения: ARCTIC Cooling Liquid Freezer II-360
- Накопитель: Crucial MX500 2 TB
- Блок питания: MSI MPG A1000G PCIE5
- Корпус: BC1 Open Benchtable
- Операционная система: Windows 11
О частотах и напряжениях
Частоты MCLK, UCLK
С чего начнём? Пожалуй, с частот. Связанных с памятью три: MCLK - это частота самой DDR5, UCLK - частота контроллера памяти и FCLK - частота Infinity Fabric.
На UCLK можно повлиять только делителем, то бишь на выбор режим 1:1 или 1:2. Его влияние мы уже демонстрировали давно, выходит меньше 5%.
Использовать щадящий режим нет смысла, поэтому просто выставьте равный делитель, так как зависимости максимально доступной частоты DDR5 на ryzen от него нет.
Помогает взять частоту памяти повыше лишь увеличение напряжения SoC, которое, как вы могли слышать, в последнее время рекомендуют ограничить 1.3 В, дабы повысить выживаемость процессоров. Куда большее влияние на максимальные частоты оказывает удачность экземпляра. Например, нашему 7700X для частоты 6400 МГц потребовалось 1.35 В на SoC (да, мы откатились на старую версию BIOS), а для 7800X3D всего 1.175 В. В то же время наши 7600X и 7900X нестабильны на этой частоте вовсе.
О напряжениях
И раз уж заговорили про напряжения, поговорим об остальных. Здесь попроще, чем на intel ввиду низких частот. Как правило, помимо SoC нужно подобрать VDD и VDDQ. Оба этих напряжения относятся именно к модулям и влияют на нагрев. Для финального разгона нам потребовалось только 1.39 и 1.3 В для VDD и VDDQ соответственно, что считается скромным напряжением по меркам оверклокеров, но это с вентилятором над памятью. Что будет без него?
Охлаждение и температура DDR5
Температуру самих чипов не узнать, нам доступен только датчик SPD Hub и снимок радиатора с тепловизора. На последнем температура модулей находится в районе 50 °С. В случае же отключения вентилятора даже повышение CL не спасает от нестабильности, нужно повышать все первички на шаг. Эта жертва позволяет в условиях открытого стенда сохранить стабильность без повышения напряжения, но ценой будет возрастание температуры на 20 °С. На максимальный показатель не смотрите, он сбоит.
В редких случаях может понадобится покрутить напряжение VDDIO / MC, безопасные пределы которого мы вам, к сожалению, не подскажем.
Infinity Fabric (FCLK)
Возвращаемся к частотам. На сдачу разгоняем FCLK, в отличии от ryzen'ов предыдущих поколений частота фабрики не привязана к MCLK, поэтому повышайте её, пока стабильно и пока производительность не начнёт падать. Да, здесь есть своего рода коррекция ошибок, приводящая к пропуску тактов. Стабильность FCLK и частоты памяти рекомендуем проверять с помощью теста Y-Cruncher, в котором нужно выбрать подтест VST, а потерю производительности лучше отслеживать по количеству флопсов в LinX.
Частота или тайминги?
Извечный вопрос. Давайте сейчас и проверим. Берём за основу 6400 МГц с настроенными таймингами, 6000 МГц с теми же таймингами, чтобы оценить влияние изменения только частоты, и далее 6000 МГц с ужатыми под эту частоту таймингами, что как раз покажет разницу с близкими по абсолютному значению таймингами, но разной частотой; и в конце снова 6400 МГц, как в первом варианте, но без разгона фабрики, которая по умолчанию равна 2000 МГц.
В AIDA64 снижение частоты повлияло только на скорость записи и латентность, в то же время FCLK влияет на оставшиеся скорости чтения и копирования, в связи с чем у нас есть все основания полагать, что это всё-таки не AIDA виновата в низких скоростях, а особенность одночиплетных 7000 ryzen'ов.
В другом подтесте аиды, PhotoWorxx, как частота памяти, так и infinity fabric оказывает куда более значимое влияние на результат, нежели тайминги, возвращающие лишь один процент из пяти потерянных.
В PYPrime 2.0 снижение частоты памяти на 400 МГц приводит к 3% замедлению в вычислениях, а с поджатыми таймингами результат всё равно на 2% хуже, несмотря на священные для многих 6000 МГц.
Скорость вычисления числа Pi в бенчмарке Y-Cruncher практически не зависит от частоты памяти, зато фабрика в этой задаче важна.
В более реальном Adobe Premiere Pro пропускная способность памяти тоже немаловажна, но, видимо, только записи, ведь уменьшение частоты Infinity Fabric, влияющее на чтение и копирование, здесь никак не сказалось.
Киберпанк, пресет: трассировка лучей ультра, FSR: ультра производительность, плотность толпы высокая. Заранее предупреждаем, что игры выбирались на основе повторяемости среднего значения FPS, ибо всякие Лары Крофт склонны к рандому, но статистика очень редких событий здесь имеет высокую погрешность, особенно в киберпанке, поэтому на неё лучше не смотреть. Итак, в весьма требовательной к памяти игре потеря от снижения частоты памяти на 400 МГц настолько невелика, что беспокоиться о ней нет смысла, к тому же более низкие тайминги позволяют сократить разницу до одного процента. Столько же даёт разгон фабрики.
Одни из нас: часть первая. Ультра пресет, 1080р. Разница та же. И если вспомнить, что для 6400 МГц нам потребовалось подать 1.35 В на SoC, в то время как 6000 МГц требуют всего 1.05 В, риск явно не оправдан. О промежуточных 6200 МГц тоже не забываем.
Star Wars Jedi: Survivor, эпический пресет с трассировкой, 1080р. Ничего нового не обнаружилось. Снижение частоты забрало 3% вместо двух, но соответствующие ей тайминги вновь сократили отставание до 1%, как и сброшенная Infinity Fabric.
Настройка таймингов
CL, RCD, RP, RAS
Переходим к следующему этапу: тайминги. Если попробовать их посчитать, то можно ужаснуться от предстоящей работы, но уверяем вас, к концу гайда вы убедитесь, что действительно надо настраивать не так и много. Начнём с первичек. Точкой отсчёта послужит разгон всех частот с выставленными с запасом первичными таймингами. По счастливой случайности все из них них завышены на 10 единиц, поэтому будет удобно оценить, насколько тот или иной полезен. Что касаемо формул, их нет. На форумах можно встретить оную для последнего тайминга RAS, равному сумме RTP и RCD, но по факту она нужна больше для удобства, а не извлечению наибольшей производительности. Сейчас убедитесь.
- CL - меньше - лучше
- RCD - меньше - лучше
- RP - меньше - лучше
- RAS = RCD + RTP
На пропускную способность памяти повлиял только RP, ускоривший запись на 1 ГБ/с. Что касаемо задержки памяти, её неплохо сократил первый тайминг CL, к которому невидимой нитью привязан CWL, а также RCD уменьшил латентность. RAS в этом квартете оказался самым незначимым.
В фотоворксе отличились CL и RC, улучшив результат по 2% каждый, RP и RAS в сумме едва процент наскребли.
В PYPrime тенденция сохраняется. Первые два тайминга по 3% сократили время вычислений, а от ужатия двух других толку почти нет.
Y-Cryncher куда более апатично отнёсся к первичным таймингам, даже в сумме они дали меньше 2%.
В Premiere Pro повторяется результат фотоворкса. 5 секунд позволил сэкономить на 10 единиц ужатый CL и ещё на 3 секунды рендер был ускорен за счёт RCD.
В играх мы даже не стали вставлять футаж с ужатым RAS, т.к. его результат повторяет достигнутый после настройки RP. В киберпанке CL и RCD дали по 3 FPS, то бишь каждые 3 единицы этих таймингов дают по одному FPS, если так прикинуть.
В The Last of US прирост ещё меньше, RP в этот раз ничего не дал. Причём мы видели на скриншотах в интернетах, что у некоторых он ужимается и ниже 30, что поначалу даже расстроило, но теперь можно выдохнуть, имея понимание, что ничего не потеряли.
Ещё один интересный факт касательно нашего комплекта памяти. Для CL 30 понадобилось подать 1.39 В на VDD напряжение, в то же время CL 28 требует уже более 1.5 В. Понимаете, да? Если 10 CL дали всего 2% FPS в Джедаях, то такое дикое повышение напряжение ради одного тайминга даст всего 0.4%.
RC, REFI, RFC, WR/RTP
Итак, следующая четвёрка, а точнее пятёрка таймингов. Какие здесь правила? RC должен быть равен сумме RAS и RP, это даже в мануалах micron указано. Но, как вы могли заметить, при их несоблюдении спокойно всё работает - или формулы с перестраховкой, или применяются фактически некие другие значения. REFI можно ставить максимальный, хотя есть утверждения, что 65528 является настоящим предельным значением. Мы разницы не увидели. И да, это единственный тайминг, для которого больше значит лучше.
RFC тоже привязывают к необязательному правилу: он должен быть кратен 32, RFC2 и RFCsb на 7000 ryzen'ах не учитываются, можно единички поставить. От себя добавим интересный факт: повышение RFC с 400 до 416 позволило снизить напряжение VDD с 1.47 В до 1.39 В. Так что сильно пережимать не стоит. WR и RTP связаны четырёхкратным соотношением. И так как значение первого не может быть ниже 48, то второй ставим равным 12 и забываем. Нужно ещё поискать модули памяти, которые на этих значениях будут нестабильны.
- RC = RP + RAS
- REFI - больше - лучше
- RFC1 - меньше - лучше
- RFC2, RFCsb - не учитываются
- WR = 4 x RTP
Логика сравнения та же, что и ранее. Чтобы оценить прирост от конкретного тайминга или связки, нужно сравнивать не с самой первой конфигурацией, а с соседней.
Итак, на всю пропускную способность ощутимо повлиял REFI, RFC ещё немного ускорил чтение и копирование, а пара WR и RTP ускорила запись. Следом за ними сокращалась латентность, в сумме упавшая на 10%.
PhotoWorxx лучше отреагировал на ужатие RC, улучшив результат на 900 Мп/с, но REFI, давший более 2.5 тысяч, выделяется куда сильнее.
Этот тайминг не перестаёт удивлять. Понятное дело, что если бы мы поменяли его местами с RFC, то прирост был бы не столь впечатляющим, ведь они связаны. Если простым языком, то REFI указывает, сколько память будет работать, а RFC - сколько отдыхать в перерывах.
Y-Cruncher снова не демонстрирует реакцию на настройку памяти по сравнению с предыдущими бенчмарками, но даже в нём REFI выделяется.
Если задуматься, то вторичные тайминги не очень-то и соответствуют своему названию, так как сами по себе дают больше, чем первичные. Те нам в сумме приносили 4% прирост в премьере, а REFI сам по себе 5% даёт.
В этот раз не оказавшей никакого влияния в играх стала связка WR/RTP, поэтому они будут только столбиком. Остальные же тайминги не изменяют свою значимость. В киберпанке сокращение RC почти в 2 раза дало всего 1 FPS, максимальный REFI ещё 6%, а RFC чуть больше процента.
The Last of US вновь хуже отреагировала на настройку таймингов. Оно и неудивительно: трассировки здесь нет, да и игра по сути своей не новая, вот и данных гоняется меньше.
Выживший джедай, в свою очередь, остро отреагировал на пару REFI и RFC, только два этих тайминга обеспечили 10% прирост в этой игре. А если окунуться в омут памяти, то можно вспомнить, что на старте AM5 REFI был недоступен на большинстве материнских плат, и только потом его уже добавили.
RRD_S/L, FAW, WTR_S/L, RDRDSCL/WRWRSCL, GDM
Переходим к третьей четвёрке игроков. С RRD и FAW всё просто: оба RRD ставьте равными 8, а FAW должен быть в 4 раза больше RRD_s, то бишь 32. WTR_s, WTR_l имеют классический закон: меньше - лучше, но как и с RRD, тот, что с окончанием _l не должен быть меньше того, что с _s на конце. RDRD-/WRWRSCL 8/8 не являются предельным разгоном в нашем случае, но более низкие значения прироста уже не дают.
- RRD_S ≤ RRD_L
- FAW = 4 x RRD_S
- WTR_S ≤ WTR_L
- RDRDSCL - меньше - лучше
- WRWRSCL - меньше - лучше
Gear Down Mode ещё с DDR4 воспринимался негативно, так повышал латентность памяти. Вы по-прежнему можете его отключить, но это может потребовать повышения первичных таймингов, кроме CL. Тем не менее, в аиде только он и дал хоть какой-то прирост по латентности.
В PhotoWorxx отличились тайминги с окончанием SCL, давшие пару процентов, а от остальных толку мало.
В PYPrime даже в сумме все эти тайминги еле наскребли процент.
Y-Cruncher себе не изменяет. Если в предыдущих бенчмарках результат едва отличался, то в нём и подавно с лупой не найти отличий.
В премьере пару секунд всё же удалось выдавить из оставшихся таймингов, но после предыдущего заезда “вау” эффектом даже и не пахнет.
В киберпанке WTR и отключение GDM дали по одному кадру, но вот что иронично. После всех этих разгонов мы обнаружили, что цепочка экспериментов привела к тому, что мы посчитали, что первичные тайминги, равные 38, максимально ужаты, но нет. Ранее упомянутое повышение RFC, позволившее снизить напряжение на память, косвенно дало доступ к стабильным RC, RP со значением на единицу ниже, но отключение GDM вновь запретило ужимать их ниже 38. Так что по факту от шевеления GDM вообще толку нет, т.к. повышение первичек из-за него сводит прирост на нет.
“Одни из нас” даже не отреагировали на GDM, зато от настройки WTR выхлоп больше одного процента.
В Jedi: Survivor без новшеств, процент WTR’ы дали, полпроцента GDM.
И это весь разгон?
“Подожди, подожди! Как весь?”- слышим мы вас. “А как же эти, эти и эти тайминги? А эта настройка? А Power Down отключить забыл что ли?”
Power Down
Начнём с последнего. Отключение энергосберегайки Power Down, как и GDM, имеет две стороны медали. С одной, приятные циферки латентности и даже полпроцента прироста в играх можно встретить. Иногда.
Но с другой стороны, вы не сможете включить Memory Context Restore. А он влияет на скорость загрузки системы. При включенной перезагрузка занимает 31 с в нашем случае, а с выключенной - 53 с.
Остальные тайминги
Прироста от ужатия RDWR и WRRD мы нигде не нащупали. Тайминги с окончанием SD предназначены для двуранговых модулей, а DD для четырёх. Мы упомянем их важность, когда будем экспериментировать с разными по количеству и ранговости модулями памяти в следующий раз.
Также мы попробовали разом ужать эти группы таймингов, надеясь увидеть суммарный эффект на производительность, но, увы, только отключение Power Down дало упомянутый ранее гомеопатический эффект.
Итого что мы имеем? Перед нами изначально было 36 таймингов и 4, назовём их “переключателя”. Однако на 8 из них вы повлиять не можете, RDRD- и WRWR SD/DD не нужны для двух одноранговых модулей. RFC2 и RFCsb не работают, а RDWR и WRRD ничего не дают. От GDM толку нет, Power Down тоже не стоит того, а BGS тем более не трогайте, от включения падает пропускная способность.
То есть после того, как вы нашли максимальные частоты, вы можете выставить 3 эти группы заранее, найти минимальный CL, разом подобрать минимальный RCD и RP, а RAS и RC будет достаточно выставить за ними хвостиком по упомянутым формулам. И останется проверить максимальный REFI, отыскать наименьший, но не пережатый RFC и поочерёдно ужать WTR_S и WTR_L. То есть вместо 36 таймингов по факту подбирать придётся только шесть групп.
Оптимальный разгон DDR5 для Ryzen 7000
- WR/RTP = 48/12
- RRD_S/L = 8/8
- FAW = 32
- RDRDSCL = 8
- WRWRSCL = 8
- CL/RCD=RP - меньше - лучше
- RAS = RCD + RTP
- RC = RP + RAS
- REFI - больше - лучше
- RFC1 - меньше - лучше
- WTR_S/L - меньше - лучше
Лучшие чипы памяти DDR5 для Ryzen 7000
Теперь, когда мы знаем, какие тайминги важны, давайте ответим на вопрос, какие чипы лучше всего подходят для 7000 ryzen'ов. И ответ вас не удивит: это - Hynix “A-Die”. Если опираться на наш разгон Hynix “M-Die”, то можно узнать, что мы были довольно безбашенными, подавая на SoC 1.4 В, а также, что у M-Die хуже tRFC и WTR_L. Вспоминая результативность этих таймингов, можно прийти к заключению, что разница будет едва заметна.
А что насчёт Samsung? Ну, это был, можно сказать, наш первый опыт, задокументированный в не самом лучшем качестве только на стриме, и, судя по нашему (и не только) разгону, Samsung’и отличаются меньшим RCD, но куда большими RC и RFC, что играет явно не в их пользу. Поэтому Hynix более оптимальный вариант.
Прирост от частичного и полного разгона
В заключении давайте оценим прирост от разгона памяти по сравнению XMP, а также в очередной раз с осуждением посмотрим на псевдоразгоны, ограниченные частотой памяти и первичными таймингами.
В Аиде повышение частоты и настройка первичек благоприятно сказалось на скорости записи, однако полноценный разгон превосходит начальный почти на 10 ГБ/с по всем показателями и сокращает задержку на ещё на 8 нс.
В фотоворкcе начальный разгон дал 6%, в то время как полноценный - все 26%. Причём если задуматься, эти разгоны не сказать, что на порядок отличаются. Первоначальная настройка уже 50% усилий потребует, вторая половина явно стоит того.
PYPrime подтверждает наше суждение. Результативность конечного разгона в 4.5 раза выше ограниченного частотой памяти и первичками.
Даже инфантильный Y-Cryncher в 7 раз лучше отозвался на вторички, нежели на частоту памяти и первички.
В Adobe Premiere Pro 14% прирост лишним не будет, в то время как 5%-й вы даже не заметите.
В Киберпанке 16% прирост тоже ощутить можно, а вот 4% что есть, что нет. Конечно, это всё без упора в видеокарту, так что держим в уме.
“Одни из нас” хуже отреагировали на разгон - 11% не внушают энтузиазма и побуждают найти комплект памяти с XMP получше нашего.
Однако Джедаи возвращают веру в оверклокинг, ведь 20% на дороге не валяются, а вот от 5% ни горячо ни холодно.
И на этом всё
Если мы что-то упустили или вы можете поделиться полезной информацией, ждём вас в комментариях, попутно не забудьте поставить лайк. Это будет вашей лучшей благодарностью за проделанную работу, состоящей из кучи, огромной кучи проведённых тестов.