Изучаем фреймгенератор от NVIDIA - DLSS 3.0

Волшебный переключатель, повышающий FPS до 4 раз при большей отзывчивости управления и без потери качества - именно так и никак иначе мы должны видеть DLSS 3.0 по мнению Nvidia. Но мы же образованные люди и с детства знаем пословицу о бесплатном сыре и мышеловке, не так ли? Настало время и нам, спустя год форы, поведать, чего стоит эта технология, когда конкурент, в лице FSR 3, уже на пороге.

Содержание:

Что такое DLSS 3.0

Да кто такой этот ваш DLSS 3? Всё просто, это общее названий для трёх технологий: Nvidia Reflex, DLSS 2 и Frame Generation, он же генератор кадров. Как раз о третьей составляющей мы и поговорим. К слову, недавно вышедший DLSS 3.5 - это тот же DLSS 3, плюс новая технология Ray Reconstruction, обеспечивающая лучшее качество трассировки лучей, если вкратце.

Вернёмся к DLSS 3. Если Reflex в нём сокращает задержку ввода, а DLSS 2 отвечает за реконструкцию изображения из меньшего разрешения с попутным сглаживанием, что и несёт в себе аббревиатура deep learning super sampling, то генератор кадров имеет другой принцип, знакомый многим из вас, пытавшимся посмотреть или даже создать фильм, или мультик в 60 FPS.

Да, генерация кадров использует тот же самый Optical Flow, что многие годы существует в программах для монтажа.

Суть проста. На основе векторов движения от движка игры и оптического потока, используя два смежных кадра вычисляется промежуточный, и вуаля, у вас в 2 раза больше FPS.

Тогда почему же он доступен только для 4000 серии Nvidia? Ведь до её прихода как-то же всё работало в этих самых “монтажках”. По сути всё дело в вычислительной мощности. Микроархитектура Ada Lovelace привнесла четвёртое поколение тензорных ядер и ускоритель оптического потока, за счёт которых вычисление промежуточных кадров осуществляется значительно быстрее по сравнению с RTX прошлых поколений, на которых использование генерации кадров теряло бы смысл.

Правда, генератор от AMD на них спокойно работает, от чего возникают вопросики. Но об этом позже.

Так что же не так с этим промежуточным кадром? А много чего. Артефакты, задержка, влияние на производительность, тиринг. Вот с этим мы и будем разбираться.

Тестовый стенд

  • Видеокарта: Palit GeForce RTX 4090 GameRock
  • Процессор #1: AMD Ryzen 7 7800X3D
  • Процессор #2: AMD Ryzen 5 7600X
  • Материнская плата: Asus ROG Crosshair X670E Gene
  • Оперативная память DDR5: G.SKILL Trident Z5 [F5-7600J3646G16GX2-TZ5RK] 2x16 ГБ
  • Система охлаждения: ARCTIC Cooling Liquid Freezer II-360
  • Накопитель: Crucial MX500 2 TB
  • Блок питания: MSI MPG A1000G PCIE5
  • Корпус: BC1 Open Benchtable
  • Операционная система: Windows 11

Так как на 4090 результаты в Full, Quad и Ultra HD едва отличаются, ограничимся последним.

Изучаем прирост FPS от включения DLSS 3.0

Начинаем с тяжёлой артиллерии. Киберпанк, пресет трассировка лучей: перегрузка с выключенным размытием, аберрациями и прочим. Сравнивать будем попарно первый столбец со вторым, а третий с четвёртым. Таким образом мы оценим прирост от генерации кадров с выключенным DLSS и включенным. Например, в этом случае без апскейлера прирост достигает 82%, а с DLSS в режиме производительность уже 56%. Это не значит, что генератор видит больший FPS с DLSS и реже добавляет кадры. Нет. Это значит, что в первом случае его включение просаживает средний FPS с 22 до 20, а затем удваивает. Во втором же случае средний FPS снижается с 70 до 55, и потом тоже удваивается. Причина большей просадки, вероятно, заключается в том, что обе технологии делят между собой вычислительные мощности тензорных ядер.

Атомное сердце, атомный пресет. Треклятый статтер во время употребление лимонада преследует все видеокарты Nvidia, и генератор от него никак не спасает, только повышает FPS. Как правило, в играх без трассировки результативность генератора падает, в случае атомика до 30% в нативном 4К и до жалких 6% с использованием DLSS. На 4060 так и вовсе было небольшое падение FPS.

Hogwarts Legacy, ультра пресет графики и трассировки лучей. Сценарий всё тот же. С лучами эффективность генератора выше, а с DLSS ниже. Тем не менее, понятно, почему они объединены в одно название, ведь сама по себе работа генератора даёт 67% прирост, а в сумме выходит аж трёхкратный. В киберпанке так и вовсе почти в 5 раз FPS вырос.

Ведьмак 3, пресет: трассировка лучей ультра. Занятно, что на 4090 использование DLSS снижает энергопотребление видеокарты, как и генерация кадров, пусть и едва заметно. Вот вам ещё один плюс технологии, получается. Мало того, что FPS и отзывчивость управления растёт, так ещё и своеобразный андервольт вышел. Прям сказка. Чё вам не нравится?

Starfield, ультра пресет. По умолчанию, здесь нет ни DLSS, ни генератора, ни рефлекса. Однако пользовательские модификации делают Starfield более играбельным во всех смыслах. Причём видеть 59% прирост от генератора в игре без трассировки лучей очень даже приятно.

В среднем по 5 играм генератор кадров даёт 61% прирост на 4090 в нативном разрешении, и 42%, если использовать DLSS-производительность. Статистика редких и очень редких событий тоже выросла, но от статтеров это не спасает, о чём позже.

На RTX 4060, видеокарте, где эта технология куда актуальней, мы провели больше тестов, и результаты вышли иными. В среднем по 7 играм прирост выходил чуть ниже 50% в нативном Full HD и Quad HD. С лучами же в 1080р 67%, а в 4К с апскейлерами на уровне баланс или производительность генератор был полностью бесполезным.

Тестируем DLSS 3.0 с упором в процессор

Тем не менее, он может вдохнуть вторую жизнь в процессор. Ведь если у вас упор в него, то свободные ресурсы видеокарты позволят получить тот самый двукратный прирост на ровном месте. Воспользуемся для этого помощью Ryzen 7600X с памятью в JEDEC и пробежимся в Full HD разрешении по ЦПУ-интенсивным играм. Не придирайтесь к выбранному железу, в нашем случае не важно: Xeon + 4060 у нас, или 7600 + 4090.

В киберпанке трассировка пути всё равно удерживает загрузку видеокарты близ 90%, из-за чего результативность генератора в среднем достигает только 74%.

В Хогвартсе пробежка по городу позволяет видеокарте расслабиться, т.к. процессору здесь куда тяжелее, нежели во время прогулок по лесной тропинке. Однако обратите внимание, что статтеры никуда не делись. FPS вырос, игра стала плавнее, но это не панацея. Рваный фреймтайм так не лечится.

Старфилд, пожалуй, как раз тот лучший сценарий для генератора. Иронично, что здесь его как раз и нет по умолчанию. Фреймтайм в игре более-менее ровный, а значит единственная проблема слабого процессора, низкий FPS, будет решена. Причём вышел даже более чем двухкратный прирост. Пишите ваши догадки, откуда лишние 14% взялись.

Артефакты DLSS 3.0

Позитивную сторону Frame Generation мы узнали, теперь пора и на обратную сторону медали глянуть. Первым делом артефакты. Если вспомнить принцип работы технологии, то легко понять, где искать её недостатки. Раз построение изображение основывается на двух соседних, то чем сильнее они отличаются, тем сложнее понять, как должен выглядеть промежуточный. Легко ли этого добиться? Очень! Во время резких движений и при низком FPS вы вдоволь сможете насмотреться артефактами. Второй случай обладает даже двойным действием, т.к. время кадра выше, а значит и заметить легче.

То на то и выходит, что в медленной кат-сцене киберпанка даже с четырёхкратным замедлением найти артефакты сложно. Однако как только начинается экшн, генератор сразу даёт о себе знать.

Да и вообще, в шутерах от первого лица его всегда выдаёт область вокруг оружия, та самая область, куда игрок зачастую и смотрит.

Также не стоит забывать, что без всяких DLSS и генераторов в играх существуют собственные визуальные артефакты, которые будут только усилены.

В Атомном Сердце мало того, что субтитры и другие элементы интерфейса мерцают, так и деревья присоединились к дискотеке.

Здесь можете посмеяться над тем, как стекло не успевает за дверью москвича.

При пробежке по поляне двоение картинки достигает апогея при 60 суммарных кадрах в секунду, что куда менее выражено при 120 суммарных.

В хогвартсе волшебные искры вокруг головы есть при любых условиях, а вот мерцающие деревья на фоне расслаиваются только с генератором.

Самое “палевное” место в играх от третьего лица находится вокруг персонажа, особенно в районе ног. Будете ли вы на них смотреть во время игрового процесса - другой вопрос.

Но порой всё это настолько бросается в глаза, что некоторые решат в 30 FPS поиграть, чем в 60 интерполированных.

В Ведьмаке область вокруг рукояток мечей артефачит даже без генератора, можно сказать, что в этой сцене его работа едва заметна.

Однако если вы любитель высокой резкости, то со сглаживаниями, отличными от TAAU, трава будет мерцать почти как в атомике.

В старфилд первый забег с генерацией кадров выглядел настолько плохо, что на этом чуть ли не завершился его тест, но загрузка сохранения всё исправила.

Ужасная резкость модифицированного DLSS, породившая море шумов, смотрится гораздо хуже встроенного FSR, особенно в сочетании с генератором, который в искусственных кадрах всё это дело замыливает.

Также досталось и лестнице. Только с настоящими 60 FPS она не мерцает, а при подъёме вокруг оружия будто ореол возникает. Помимо этого страдает указатель миссии.

К сожалению, это болячка была исправлена только в киберпанке, а в том же хогвартсе или атомном сердце при вращении камеры её сильно “колбасит”, особенно это заметно при полёте на звездолёте в Starfield’e, где этих указателей много.

И говоря об интерфейсе, в некоторых играх вы будете наблюдать проблемы, лазая по меню, как например в Remnant II.

Во время стрельбы пламя из дула имеет куда меньшую яркость, если половина из 60 кадров в секунду созданы оптическим потоком. Бросается ли это в глаза? Ну как-то же мы догадались именно эту сцену записать.

Подводя итог по артефактам, можно сказать, что они совершенно другие по сравнению с тем, что дают апскейлеры. Их попеременное отображение осознаётся как не что-то конкретное, а как мерцания, тряса, двоение и тому подобное.

Увеличение изначального FPS делает их куда менее заметными, для чего, по идее и предназначен DLSS, но это палка о двух концах. С одной стороны мы уменьшаем артефакты генератора, с другой добавляем новых от апскейлера. Шило на мыло какое-то, но иногда работает в плюс. К слову, во многих играх можно использовать генератор Nvidia с FSR или XESS. Бывают и исключения, например, в Returnal генератор не появится, пока DLSS не включите, как и в Хогварте, но в нём хотя бы можно выбрать режим “выключен”.

Замеры input lag (задержки ввода)

Третьим болезненным аспектом генератора кадров является увеличение задержки. Если мы говорим о совокупности технологий, то включенный в общее понятие “DLSS 3”, Nvidia Reflex как раз способствует сокращению инпут лага, но со своими оговорками, поэтому давайте сравним, насколько он улучшает отзывчивость, и насколько генератор её ухудшает. Методика тестирования донельзя проста. Берём смартфон, способный писать видео в 960 FPS, то бишь почти каждую миллисекунду, и клавиатуру с шустрыми светодиодами Num, Caps и Scroll Lock.

Назначаем выстрел на одну из этих кнопок и мерим общую задержку.

Начнём со Starfield, на примере которого мы объясним, почему с недоверием относимся к родному оверлею Nvidia, тоже измеряющему задержку. Если уменьшение латентности на 3 с лишним мс, благодаря Reflex’у, выглядит логично, то её 40% уменьшение за счёт включение генератора, наоборот, ничего общего с реальностью не имеет, ведь ему как раз нужен буфер кадров для построения промежуточного.

Наши тесты в замедленной съёмке это лишь подтверждают. Включение рефлекса снижает её всего на миллисекунду, а вот активация генератора подкидывает почти 10 мс.

В другом месте, где упор в видеокарту более явный и FPS ниже, польза от Reflex’а сильно выше, и он полностью компенсирует увеличенную задержку генератора.

В то же время внутренний мониторинг сообщает о её двукратном уменьшении при включении виртуальных кадров. Так что опираться на него не стоит.

В киберпанке рефлекс даёт колоссальный прирост в отзывчивости управления, в то время как генератор подкидывает 5 мс, что не так уж и много.

Куда сильнее инпут лаг вырастает от включения трассировки пути: на 86 и 80% без Reflex’а и с ним соответственно, даже с генератором на 64%. Вот где настоящее зло таится!

В атомном сердце генератор кадров собрал в себе много негатива. Мало того, что он даёт малый прирост и сильные артефакты, так ещё и увеличивает задержку прилично.\

К слову, вылет при первом запуске тоже так и не починили. Вам каждый раз нужно будет запускать игру повторно через send and restart.

Ситуацию с упором в процессор снова воспроизведём в Starfield’е. Рефлекс, сокращающий задержку путём уменьшения числа очереди рендеринга, в таком случае бесполезен, т.к. с упором в процессор её и не будет. А вот дополнительная задержка от генератора никуда не делась.

Немного о личном опыте

Перед подведением итогов добавим в наш бульон щепотку личного опыта. Dmitryaga, кто, собственно, и готовил это видео, озвученное Максимом, по вечерам потихоньку проходил Remnant II. Эта игра знаменита своими необоснованными требованиями, а также по счастливой случайности обладает нелучшей реализацией генератора кадров, сейчас поясним.

Иметь 70-80 FPS в Quad HD на 4090 в игре без лучей как-то не комильфо. 4060 на минимальных настройках так и вовсе до 40 FPS проседала в Quad HD.

Решений в этой ситуации 5:

  • Продолжать играть на 144 Гц мониторе с этим FPS
  • • Пройти ещё раз первую часть Remnant
  • Снизить настройки
  • Включить DLSS
  • И последний вариант, выбранный в тему, - активация генератора кадров

К тому же только в этой игре Reflex в виде отдельной опции отсутствует и активируется только с генератором, а переключатель минимизации задержки ввода ничего не делает. Как думаете, с какими неприятностями в игре столкнулся Dmitryaga? С низким приростом? С высокой задержкой? С артефактами? Нет. Артефакты были, конечно, в главном меню, а в самой игре куда заметней родной гостинг, нежели следствия использования оптического потока.

Тиринг. В нём была проблема. Дело в том, что Remnant блокирует FPS на уровне частоты обновления вашего монитора, но делает это так криво, из-за чего даже с включенной адаптивной синхронизацией разрывы видны, и очень даже.

Внутриигровой ограничитель кадров становится недоступен после включения генератора, а вертикальная синхронизация несовместима с генератором от зелёных.

Если ограничить FPS с помощью Riva Tuner, то эта технология будет сходить с ума. К слову разработчик уже создал новую версию, исправляющую этот недочёт, и уже в скором времени она будет доступна. В нашем же случае пришлось ограничивать FPS с помощью панели nvidia, что делается несложно, но осадочек остался.

Бонус - немного о FSR 3

Ну и под конец глянем, что там у AMD. В понятие FSR 3 тоже впихнули сразу кучу технологий. FSR 2, FSR Native AA (аналог DLAA), Antilag, Antilag+, Frame Gameration, а также Fluid Motion.

На бумаге FSR 3 чуть ли не всем лучше. Доступна куда большему списку видеокарт, влияние на производительность меньше, интерфейс не подвержен артефактам, работает с вертикальной синхронизацией, а поверх всего этого можно ещё раз удвоить FPS, включив Fluid Motion на уровне драйвера.

Причём он будет доступен в большинстве современных игр. Правда, работает только на 6- и 7000 линейке радеонов, не взаимодействует с движком игры, а значит качество с ним должно быть сильно хуже. Потому и выключается автоматически при резких движениях.

Первыми играми, получившими встроенный генератор кадров от красных стали Forspoken и Immortals of Aveum. Да, AMD умеет в маркетинг, выбрав две провалившиеся новинки. Полноценное сравнение мы выпустим, когда игр станет больше, и, может, Nvidia чем-то ответит, но быстрый осмотр Forspoken сделать можно уже сейчас. На 4090 DLSS блокируется при включении генератора, а Reflex не завезли, но они совместимы, зато доступен Vsync. Прирост производительности в 4К с лучами выглядит обычным, разве что включение FSR в режиме “производительность” не так сильно просаживает, как DLSS ослабляет пользу генератора зелёных.

Задержка, ожидаемо, вырастает на 10 мс, что на общем фоне не так уж и много.

Артефакты тоже вполне ожидаемые, но, как и было обещано, интерфейс не страдает.

С упором в процессор получаем заветный двукратный прирост.

Фреймтайма не пугайтесь, такой вид образуется из-за постоянных сочетаний длинный-короткий кадр, т.к. сгенерированный идёт за обычным с минимальной задержкой. AMD предупреждала об этом. Вы что? Перед игрой документацию не читали.

Итоги

Подводим итог. Почему к генератору кадров игроки проявили куда больше негатива, по сравнению с DLSS 2? Рассмотрим на примере “за” и “против”.

Включая DLSS 2 вы повышаете FPS, якобы ускоряя видеокарту, за счёт чего вырастает и плавность, и отзывчивость управления. Взамен вы получаете гостинг, мерцания или другие артефакты. В плане резкости это явно лучше, чем снижение модификатора разрешения.

В случае с генератором кадров вы обретаете большую плавность даже с упором в процессор. Взамен вам дают артефакты и повышенную задержку управления, т.к. рефлекс можно включить в любой игре отдельно (за исключением Remnant II), а также проблемы с тирингом. И всё это кратно усиливается при изначально низком FPS. 

Как-то невыгодно получается. Отсюда и нелюбовь к новой технологии. Люди не слепые, всё-таки. Видимо поэтому её и представили в виде целого блюда технологий, которые в сумме дают и меньшую задержку, и больший прирост FPS.

И на этом всё. Делитесь своим опытом взаимодействия с генерацией кадров, не болейте, и до новых встреч!