Обзор архитектуры AMD Zen 5 и AMD Ryzen 9000
На прошедшей в Лос-Анжелесе серии технических презентаций, организованных компанией AMD, ведущие инженеры подробно рассказывали о микроархитектуре новых процессоров Zen 5. Это пятое поколение микроахритектур успешной серии Zen, которая вернула конкурентоспособность некогда списанной с рынка процессоров компании. Кажется, что прошла всего пара лет, но AMD Zen существует уже седьмой год, и компания представила два настольных сокета, пять серий чипсетов и семь линеек процессоров. Новая микроархитектура Zen 5 обеспечивает работу новых процессоров AMD Ryzen серии 9000 Granite Ridge для настольных ПК, важнейших процессоров Ryzen AI 300 серии Strix Point для ноутбуков и серверных процессоров EPYC 5-го поколения Turin. AMD планирует выпустить новые серверные процессоры чуть позже в этом году, но посвятила лето 2024 года своему клиентскому сегменту — настольным компьютерам и ноутбукам.
Архитектура
Новая микроархитектура Zen 5 основана на проверенной AMD технологии процессорных ядер и не использует ничего необычного, у готовящегося к выходу конкурента в лице Arrow Lake, например, используются P-ядра Lion Cove. Zen 5 по-прежнему обещает обеспечить двузначный процентный прирост IPC по сравнению с предыдущим поколением и предлагает несколько улучшений эффективности по сравнению с Zen 4 благодаря не только новому 4 нм техпроцессу, но и множеству других инноваций. AMD даже удалось увеличить тактовую частоту и снизить TDP для некоторых представителей линейки процессоров для настольных ПК, добившись при этом хорошего прироста производительности.
Серия процессоров для ноутбуков особенно важна для AMD, поскольку данный сегмент переживает потрясения в виде введения стандарта Microsoft Copilot+ и необходимости иметь в процессоре NPU класса 40 TOPS, чтобы соответствовать этому стандарту. Новый мобильный процессор серии Ryzen AI 300 на базе монолитного процессора Strix Point как раз подходит. В нём объединены не только до 12 ядер ЦП на базе Zen 5 или его производной Zen 5c, но и мощный iGPU на базе новой графической архитектуры RDNA 3.5, что значительно повышает производительность на ватт по сравнению к RDNA 3, а NPU с производительностью 50 TOPS на базе архитектуры XDNA 2 превосходит требования к производительности Copilot+, сохраняя при этом потребляемую NPU мощность.
Что касается настольных компьютеров, то процессоры AMD Ryzen 9000 Granite Ridge продолжают использовать инфраструктуру Socket AM5 и обратно совместимы со всеми материнскими платами на чипсете AMD 600-й серии (после обновления BIOS). Компания AMD также представила новые наборы микросхем чипсетов 800-й серии, которые немного меняют распределение чипсетов по оснащённости интерфейсами. AMD сохранила количество ядер в процессорах на уровне последних нескольких поколений — доступны 6-ядерные, 8-ядерные, 12-ядерные и 16-ядерные варианты. Это не гибридные или гетерогенные процессоры. Здесь нет энергоэффективных ядер, каждое ядро представляет собой "P-ядро".
Этим летом AMD планирует выпустить процессоры Ryzen 9000 для настольных компьютеров и процессоры Ryzen AI 300 для ноутбуков. Некоторые из первых ноутбуков на базе серии Ryzen AI 300 должны быть анонсированы OEM-производителями ноутбуков уже на этой неделе; а процессоры для настольных ПК серии Ryzen 9000 будут доступны покупателям с 31 июля 2024 года. Компания еще не определила цены на свои процессоры для настольных ПК. В этой статье подробно будут рассмотрены эти процессоры и лежащие в их основе технологии Zen 5, RDNA 3.5 и XDNA 2, а также обновление платформы в целом, наборы функций и собственные заявления AMD о производительности.
Модельный ряд настольных ПК серии Zen 5
Линейка настольных ПК AMD Ryzen серии 9000 Granite Ridge очень похожа на предыдущие предложения Ryzen 7000 Raphael и Ryzen 5000 Vermeer; по одному процессору для каждого числа ядер, которые AMD планирует вывести на рынок: 6-ядерные, 8-ядерные, 12-ядерные и 16-ядерные. AMD не изменила схему нумерации моделей своих процессоров для настольных ПК. Лидером серии является 16-ядерный Ryzen 9 9950X, за ним следуют 12-ядерный Ryzen 9 9900X, 8-ядерный Ryzen 7 9700X и 6-ядерный Ryzen 5 9600X. Эти четыре модели являются прямыми преемниками моделей 7950X, 7900X, 7700X и 7600X предыдущего поколения.
Интересно, что AMD обновила ограничения TDP процессоров по сравнению с Ryzen 7000. Для x950X лимит по-прежнему составляет 170 Вт, TDP младших процессоров стал значительно ниже, особенно Ryzen 5 и Ryzen 7, у которых лимит теперь всего 65 Вт, что впечатляет и выглядит невероятно с точки зрения требований к охлаждению и мощности VRM.
Как и ожидалось, все процессоры Ryzen 9000 поставляются без системы охлаждения. Учитывая TDP 9950X 170 Вт, AIO будет хорошей идеей. Ryzen 9 9900X, вероятно, должен нормально работать с приличным воздушным охлаждением, что является довольно большим улучшением по сравнению с 7900X.
Запуск всех четырёх моделей процессоров на рынок запланирован на 31 июля 2024 года, но точных цен AMD ещё не озвучила.
Ryzen 9 9950X
Ryzen 9 9950X |
Ryzen 9 7950X |
Core i9-14900K |
|
Архитектура |
Zen 5 / Granite Ridge |
Zen 4 / Raphael |
Raptor Lake |
Техпроцесс |
4 нм / 6 нм |
5 нм / 6 нм |
10 нм |
Сокет |
AM5 |
AM5 |
LGA 1700 |
Ядер /Потоков |
16 / 32 |
16 / 32 |
8+16 / 32 |
Макс. частота |
5.7 Ггц |
5.7 Ггц |
6.0 / 4.4 Ггц |
Базовая частота |
4.3 Ггц |
4.5 Ггц |
3.2 / 2.4 Ггц |
Кэш L3 |
64 МБ |
64 МБ |
36 МБ |
TDP |
170 Вт |
170 Вт |
125 Вт |
Цена |
Требует уточнения |
$540 |
$550 |
Ryzen 9 9950X — это флагманская 16-ядерная/32-поточная модель, в которой используются два 4 нм CCD, при этом все 8 ядер включены на обоих. Процессор бустится до 5,7 ГГц и имеет общий кэш 80 МБ. Это 1 МБ кэша L2 на ядро и 32 МБ кэша L3 на CCD. TDP процессора не изменился и составляет 170 Вт, как и у 7950X.
Учитывая, что AMD обогнала Intel в выпуске нового поколения процессоров, а процессоры Intel Core Ultra Arrow Lake-S для настольных ПК выйдут не раньше октября, AMD должна сравнивать процессоры с текущим поколением Intel. 9950X и 9900X будут сравнивать с Core i9-14900K, 9700X — с Core i7-14700K, 9600X — с Core i5-14600K. AMD сильно отстает от Intel по количеству ядер ЦП, поскольку у них нет E-ядер; но производительность и игровые тесты AMD основаны на превосходном IPC ядер Zen 5, помимо их тактовой частоты.
Ryzen 9 9900X
Ryzen 9 9900X |
Ryzen 9 7900X |
Core i9-14900K |
|
Архитектура |
Zen 5 / Granite Ridge |
Zen 4 / Raphael |
Raptor Lake |
Техпроцесс |
4 нм / 6 нм |
5 нм / 6 нм |
10 нм |
Сокет |
AM5 |
AM5 |
LGA 1700 |
Ядер /Потоков |
12 / 24 |
12 / 24 |
8+16 / 32 |
Макс. частота |
5.6 Ггц |
5.6 Ггц |
6.0 / 4.4 Ггц |
Базовая частота |
4.4 Ггц |
4.7 Ггц |
3.2 / 2.4 Ггц |
Кэш L3 |
64 МБ |
64 МБ |
36 МБ |
TDP |
120 Вт |
170 Вт |
125 Вт |
Цена |
Требует уточнения |
$360 |
$550 |
Все становится интереснее с Ryzen 9 9900X, 12-ядерным/24-поточным процессором. 7900X редко замечали в линейке, но его преемник новый 9900X увеличил частоту до 5,6 ГГц и имеет пониженный TDP на уровне 120 Вт по сравнению с 170 Вт у 7900X, что должно привлечь некоторое внимание. Этот чип имеет 6 ядер, включенных на каждом CCD, и общий кэш 76 МБ: 12 МБ кэша L2 и по 32 МБ кэша L3 в каждом CCD.
Ryzen 7 9700X
Ryzen 7 9700X |
Ryzen 7 7700X |
Core i7-14700K |
|
Архитектура |
Zen 5 / Granite Ridge |
Zen 4 / Raphael |
Raptor Lake |
Техпроцесс |
4 нм / 6 нм |
5 нм / 6 нм |
10 нм |
Сокет |
AM5 |
AM5 |
LGA 1700 |
Ядер /Потоков |
8 / 16 |
8 / 16 |
8+12 / 28 |
Макс.частота |
5.5 Ггц |
5.4 Ггц |
5.6 / 4.3 Ггц |
Базовая частота |
3.8 Ггц |
4.5 Ггц |
3.4 / 2.5 Ггц |
Кэш L3 |
32 МБ |
32 МБ |
33 МБ |
TDP |
65 Вт |
105 Вт |
125 Вт |
Цена |
Требует уточнения |
$300 |
$400 |
Интересное продолжается и с Ryzen 7 9700X. Этот 8-ядерный/16-поточный чип оснащен одним CCD с общим объемом кэш-памяти 40 МБ (1 МБ кэш-памяти L2 на ядро и 32 МБ кэш-памяти L3). Ядра процессора достигает частоты 5,5 ГГц. AMD значительно снизила TDP этого чипа до 65 Вт по сравнению со 105 Вт у Ryzen 7 7700X - процессора, который он должен заменить.
Говорят, что AMD внесла в последний момент изменения в спецификации, тестировался увеличенный до 120 Вт TDP 9700X. Вероятно, было уже слишком поздно что-то менять, и AMD придётся выпустить «9800X» для подобного эксперимента и рискнуть оказаться в ситуации, аналогичной с 3700X и 3800X, где 65-ваттный 3700X был почти таким же производительным, а продажи 3800X никогда не были высокими.
Ryzen 5 9600X
Ryzen 5 9600X |
Ryzen 5 7600X |
Core i5-14600K |
|
Архитектура |
Zen 5 / Granite Ridge |
Zen 4 / Raphael |
Raptor Lake |
Техпроцесс |
4 нм / 6 нм |
5 нм / 6 нм |
10 нм |
Сокет |
AM5 |
AM5 |
LGA 1700 |
Ядер /Потоков |
6 / 12 |
6 / 12 |
6+8 / 20 |
Макс. частота |
5.4 Ггц |
5.3 Ггц |
5.3 / 4.0 Ггц |
Базовая частота |
3.9 Ггц |
4.7 Ггц |
3.5 / 2.6 Ггц |
Кэш L3 |
32 МБ |
32 МБ |
24 МБ |
TDP |
65 Вт |
105 Вт |
125 Вт |
Цена |
Требует уточнения |
$200 |
$300 |
Наконец, есть Ryzen 5 9600X, 6-ядерный/12-поточный процессор с частотой до 5,4 ГГц, общим объемом кэш-памяти 38 МБ и TDP 65 Вт. Будет интересно посмотреть, как AMD ограничит модели 9700 и 9600, которые, скорее всего, будут иметь тот же TDP 65 Вт, если такие процессоры вообще будут.
Ryzen 9000 X3D с 3D V-кэшем
В преддверии презентации в Лос-Анджелеса компания AMD сделала несколько противоречивых заявлений, сообщив, что первые четыре Ryzen 9000 не совсем превзойдут Ryzen 7 7800X3D (на данный момент их самый быстрый игровой процессор) в игровых нагрузках, но точно опередят 7800X3D в области рабочих нагрузок. Компания также заявила, что продолжит развивать технологию 3D V-кэша, что в значительной степени подтверждает появление серии Ryzen 9000X3D в будущем. К сожалению, это означает, что геймеры, вероятно, захотят дождаться моделей с 3D V-кэш, прежде чем принимать решение об апгрейде. Заявлено, что 3D V-кэш будет реализован точно так же, как и в серии 7000X3D, дополняя встроенный кеш L3 и не изменяя размеры кэша L2, но с упоминанием возможной доступности разгона ядер — тем, чего X3D-процессоры были до этого лишены.
Если мельком взглянуть на историю 3D V-кэша на настольных компьютерах, то становится понятно, что Ryzen 7 5800X3D был выпущен в качестве временного решения для конкуренции с Core i9-12900K в играх, а в итоге превзошёл его, предоставив пользователям сокета AM4 надежный вариант обновления в пределах своей платформы. При этом 5800X3D немного отставал от 7700X. Поэтому несколько удивительно, что судя по слайдам AMD Ryzen 7 7800X3D будет быстрее Ryzen 7 9700X в игровых нагрузках, если уж и 5800X3D почти ему равен. В играх 7800X3D иногда быстрее, чем Core i9-14900K, но эту позицию лучшего игрового процессора, вероятно, займёт процессор Core Ultra 9 Arrow Lake, с которым 9000X3D действительно должен будет конкурировать. Это столкновение можно будет наблюдать где-то в первом квартале 2025 года.
Архитектура Zen 5
В отличии от Intel, AMD не меняла радикально архитектуру своих процессорных ядер на протяжении последних пяти поколений Zen, начиная с первого из 2017 года. Zen проектировался с высоким запасом для внесения модификаций и у AMD есть возможность масштабировать различные компоненты ядра, способ и пропускную способность их подключения. В сочетании с новыми техпроцессами это давало двузначные процентные увеличения IPC с каждым поколением. Компания добилась последовательного успеха в этом направлении от Zen до Zen 4, и кажется, что обещания компании по увеличению IPC для Zen 5 окажутся правдивыми.
Фотография https://www.techpowerup.com/
Вот фотография крупным планом ядер Zen 5 на двух CCD инженерного образца Ryzen 9 9950X, который был представлен на выставке AMD. CCD произведены TSMC по 4 нм техпроцессу, немного более продвинутому, чем 5 нм техпроцесс, на котором построены CCD Zen 4; и можно сказать, что у Zen 5 довольно большие ядра.
AMD внесла улучшения во все три ключевые области конвейера, фронтальную часть, исполнительные блоки и бэкэнд загрузки/сохранения. С каждым новым поколением Zen компания AMD совершенствует блок прогнозирования ветвлений, поскольку он вносит значительный вклад в прирост IPC за поколение. AMD утверждает, что с Zen 5 снизилась задержка в блоке прогнозирования, повысилась точность прогнозирования как для инструкций L1, так и для кеша операций. В этом поколении AMD удвоила каналы декодирования.
Исполнительные блоки претерпели значительные изменения в Zen 5. Во-первых, AMD расширила очереди вывода сообщений с 6 до 8. Движок Integer имеет 6 ALU с 3 блоками умножения, улучшенный планировщик ALU и увеличенное окно выполнения. Возможно, самым большим изменением в исполнительном блоке является модуль с плавающей запятой (FPU), который имеет физический 512-битный канал FP для AVX-512 с полным 512-битным каналом данных. AMD реализовала AVX-512 в Zen 4, используя 256-битный FPU с двойной накачкой, что в то время рассматривалось как энергоэффективный способ сделать это. 512-битный FPU должен дать Zen 5 значительное улучшение производительности AVX-512 по сравнению с Zen 4. Для клиентских процессоров это должно улучшить ускорение искусственного интеллекта.
Модуль загрузки/хранения имеет несколько улучшений пропускной способности. AMD увеличила размер кэша данных L1 до 48 КБ (12-поточный) по сравнению с 32 КБ (8-поточный) в Zen 4. Пропускная способность от FPU до кэша L1D увеличена вдвое по сравнению с Zen 4. Выделенный кэш L2 остается размером 1 МБ и 16-поточным.
AMD предоставила свои измерения IPC для Zen 5. Это среднее значение серии однопоточных тестов, проведенных AMD, в которых сравниваются процессоры Zen 5 и Zen 4, работающие на идентичных тактовых частотах.
AMD заявляет об увеличении IPC на 16% по сравнению с Zen 4. Это измерено в ходе серии тестов, обозначенных на графике выше. Оно может варьироваться от +10% для игрового теста, такого как Far Cry 6, и до 35% в Geekbench 5.4 (который использует AVX-512). Говоря об этом, приложения и тесты, использующие инструкции AVX-512, должны увидеть самый большой прирост производительности поколения с Zen 5 благодаря физическому 512-битному FPU, заменяющему 256-битный FPU с двойной накачкой в Zen 4. Этот прирост варьируется от 32 % для рабочих нагрузок машинного обучения и 35 % для шифрования AES-XTS (512-битная рабочая нагрузка с плавающей запятой).
Вот разбивка того, как улучшения в каждой области способствуют увеличению IPC на 16%. Интересно видеть, что выборка и предсказание ветвления играют меньшую роль по сравнению с исполнительным движком и декодированием/OpCache.
Zen 6 иZen 7
На презентации AMD впервые представила микроархитектуру Zen 6 и ее компактный вариант Zen 6c. AMD делает такие слайды с дорожными картами, чтобы показать, как они последовательно и без задержек реализуют их. Это возможно, потому что TSMC придерживается своего плана развития благодаря таким крупным клиентам, как Apple и Qualcomm. В ходе обсуждения представитель AMD упомянул «Zen 7», но без каких-либо подробностей.
Ядра Zen 5 и Zen 5c будут реализованы по 4 и 3 нм техпроцессу. И CCD Zen 5 на Granite Ridge, и монолитный процессор Strix Point построены по 4 нм техпроцессу, однако AMD работает над наборами микросхем высокой плотности для EPYC 5-го поколения, в которых AMD будет использовать 3 нм техпроцесс. Хоть на слайде присутствуют Zen 6 и Zen 6c, их размеры не указаны. Если догадаться, они могли бы работать на TSMC 2 нм и 1,8 нм. AMD также устно упомянула Zen 7 во время своей презентации. Вероятно, компания продолжит разработку Zen в 10-й рыночный год, поскольку Zen 7 может стать основой процессоров AMD примерно в 2027 году.
Разгон
Тактовые частоты и TDP процессоров серии Ryzen 9000 в спецификациях выглядят довольно сдержанно. Вероятно, это связано с тем, что процессоры достигают желаемой конкурентоспособности для AMD, и компания хотела оставить некоторый запас по разгону, чтобы заинтересовать энтузиастов, а также, возможно, и по причинам энергопотребления.
Одной из таких областей является скорость памяти. Процессоры серии Ryzen 7000 поставлялись с встроенной поддержкой памяти DDR5-5200, причем DDR5-6000 является «оптимальной» скоростью разгона — самой высокой гарантированно рабочей скоростью памяти, которую можно достичь при равенстве 1:1 между тактовыми доменами FCLK и MCLK. Есть пара обновлений для Ryzen 9000. Поддерживаемая скорость DDR5 была увеличена до DDR5-5600, а также добавлена поддержка разогнанной памяти, такой же быстрой, как DDR5-8000. Для этого между FCLK и MCLK включается делитель тактовой частоты 1:2, как только тактовая частота памяти устанавливается выше, чем DDR5-6000. Можно вручную установить делитель 1:1, «и, если повезет», можно использовать DDR5-6400 — в основном так же, как и раньше. Поддержка DDR5-8000 реализована AMD как обновление микрокода AGESA, позволяющее производителям материнских плат интегрироваться даже со своими более старыми продуктами на чипсете AMD 600-й серии. Должна появиться новая волна памяти для ПК для энтузиастов с профилями AMD EXPO для DDR5-8000 и всего, что ниже (например, DDR5-7200, DDR5-6800 и т. д.). С точки зрения производительности будет интересно посмотреть, сможет ли DDR5-8000 1:2 превзойти DDR5-6000 1:1 в широком диапазоне сценариев, что сделает вложение выгодным.
Побочным эффектом предоставления таким моделям процессоров, как 9900X (120 Вт), 9700X (65 Вт) и 9600X более низкого TDP, чем у их предшественников, 7900X (170 Вт) и 7700X (105 Вт), является то, что Precision Boost Overdrive ( PBO) теперь обеспечивает бОльшую производительность, поскольку увеличивает мощность процессоров. AMD заявляет, что прирост производительности составит 6% для 9900X и до 15% для 9700X (что показывает, что 65 Вт было слишком консервативно для этого SKU).
AMD также поработала над физическими характеристиками охлаждения кристаллов процессора: тепловое сопротивление снижено на 15 %, что привело к впечатляющему снижению температуры на 7°C при том же TDP. В теплораспределительную крышку или термоинтерфейс не было внесено никаких изменений. Улучшения связаны с лучшим управлением «hotspot» и другим размещением термодатчика. В Zen 4 датчик был расположен довольно далеко от hotspot, поэтому для учета этого был добавлен довольно большой тепловой запас. Теперь размещение стало более идеальным, что приводит к более реалистичной оценке фактической температуры в самой горячей части кристалла. В некоторых материалах презентации было упоминание о «100°C», но AMD не пожелала подтвердить или опровергнуть, было ли скорректировано целевое значение температуры в 95°C и существует ли способ теперь разрешить более высокий температурный предел.
Granite Ridge — это процессор на базе чиплета, как и Raphael. AMD в значительной степени перенесла 6 нм клиентский кристалл ввода-вывода (cIOD) из предыдущего поколения, хотя подложка претерпела множество изменений из-за разных размеров 4 нм CCD Zen 5 по сравнению с 5 нм CCD Zen 4. AMD не прокомментировала, идентичен ли кристалл ввода-вывода кристаллу Zen 4.
Теплораспределительная крышка выглядит идентично Ryzen 7000 — никаких изменений.
Фотография https://www.techpowerup.com/
AMD организовала сеанс ручного разгона, в ходе которого она достигла впечатляющего разгона всех ядер на частоте 6,90 ГГц на 16-ядерном процессоре 9950X с напряжением ядра 1,492 В и охлаждаемым жидким азотом. Фактический потолок процессоров намного выше, на хорошем образце достижима частота «существенно более 7 ГГц». В этом сеансе разгона AMD продемонстрировала побитие нескольких мировых рекордов очень тривиальным способом: просто охладите процессор, задайте ему напряжение и тактовую частоту и запустите Cinebench — бум — мировой рекорд. Учитывая это, а также улучшения в разгоне памяти, данных чипов достаточно, чтобы привлечь к ним конкурентоспособных оверклокеров. Высокое напряжение ядра было описано как намеренно чрезмерное, чтобы обеспечить возможность продолжения демонстрации в разумные сроки без множества перезагрузок для поиска оптимального напряжения.
Curve Shaper (Формирователь кривых)
Curve Shaper — это новая функция, представленная в процессорах серии Ryzen 9000. Она является частью AMD CBS, что означает, что её можно настроить в программе установки UEFI, если производитель материнской платы решит использовать графический интерфейс или использовать Ryzen Master в Windows. Curve Optimizer обеспечивает пониженное напряжение с учетом PBO и PMFW, а Curve Shaper позволяет конечным пользователям изменять форму базовых кривых напряжения, чтобы улучшить их пониженное напряжение.
Фотография https://www.techpowerup.com/
AMD показала пример программы настройки UEFI на материнской плате ASRock, которая отображает Curve Shaper как серию ручных значений — не очень графически. Список настроек: от «Минимальная частота — Низкая температура» до «Низкая частота», «Средняя частота», «Высокая частота» и «Максимальная частота», каждая из которых имеет три варианта «Низкая частота». Температура», «Средняя температура» и «Высокая температура». Остаётся надеяться, что производители материнских плат реализуют графические версии Curve Shaper, которые позволят пользователям визуализировать кривые V/F на основе введенных вручную данных.
Платформа и чипсеты
AMD выпустила серию Ryzen 7000 предыдущего поколения вместе с чипсетом AMD 600-й серии в 2022 году. Тогда PCIe Gen 5 был гораздо большей новинкой, чем сейчас, поскольку наблюдается рост популярности твердотельных накопителей NVMe Gen 5 в основных ценовых категориях; и по слухам NVIDIA следующего поколения «Blackwell» реализует Gen 5. AMD сделала PCIe пятого поколения (слот x16) отличительным признаком серии 600 и создала X670E и B650E, чтобы они отличались от X670 и B650, при этом оставшиеся операции ввода-вывода, включая подключенный к ЦП NVMe пятого поколения, остались без изменений. Это создало беспорядок, когда люди выбирали либо B650 (не-E) для массовых сборок, либо топовый X670E для сборок для энтузиастов, в то время как X670 (не-E) и B650E были сведены к новшествам. AMD надеется избежать подобной ситуации с помощью своего нового чипсета AMD 800-й серии для настольных ПК. Непроданные чипсеты означают непроданные запасы материнских плат, и партнерам AMD это не нравится.
В серии 800 топовые модели X870E и X870 отличаются не поколением PCIe (на обоих наборах микросхем используется Gen 5), а нисходящим подключением PCIe GPP. X870E имеет больше нисходящих линий PCIe. У X870 их меньше. По сути, X870E — это переименованный X670E, а X870 — обновленный B650E. Новым является то, что и X870E, и X870 поддерживают USB4, и AMD заставляет производителей материнских плат реализовать его на этих двух чипсетах.
B850, по сути, является переименованием популярного B650 (не E); вы получаете Gen 4 PCIe, хотя производители материнских плат могут свободно использовать Gen 5 PCIe, если захотят. Слот NVMe, подключенный к процессору, должен оставаться Gen 5. USB4 не является обязательным, что действительно отличает B850 от X870. B840 — это новый чипсет начального уровня. Вы получаете только PCIe Gen 3 и теряете возможность разгона процессора. Это слегка доработанный A620.
К сожалению, эти новые материнские платы НЕ будут доступны при запуске Ryzen 9000, но появятся на рынке гораздо позже этим летом. Существующие материнские платы с разъемом сокета AM5 совместимы с Ryzen 9000 после обновления BIOS.
Серия Ryzen AI 300
Процессоры AMD Ryzen AI 300 серии станут наиболее значимыми процессорами AMD в клиентском сегменте на годы. Это связано с тем, что это первая серия мобильных процессоров с NPU, которая соответствует требованиям Microsoft Copilot+ и охватывает весь спектр мобильных платформ, от тонких и легких до обычных ноутбуков, в отличии от серии Intel Core Ultra 200V Lunar Lake, которая удовлетворяет требованиям конкретного сегмента рынка — тонкие и легкие, а также некоторые массовые сегменты, но не бюджетные или для энтузиастов. Intel делает ставку на мобильные варианты своих процессоров Core Ultra Arrow Lake для этой роли, но ходят слухи, что первая версия Arrow Lake имеет только NPU класса 16 TOPS и не соответствует требованиям Copilot+ — большое упущение со стороны Intel — и компания планирует исправить это в будущей версии Arrow Lake, поскольку это требует физического изменения конструкции SoC.
Позиция AMD в отношении серии Ryzen AI 300 Strix Point такова, что анонсы первых ноутбуков на их базе должны начаться в этом месяце. Intel создала NPU как дискретный компонент процессора Core Ultra Meteor Lake, AMD лишь играла в догонялки, а теперь кажется, что у AMD есть жизненно важное преимущество при выходе на рынок, если она сможет извлечь из этого выгоду.
Процессор Strix Point представляет собой монолитный кремний, в отличии от Meteor Lake, Arrow Lake и Lunar Lake. Он полностью построен на узле TSMC N4X, а также оснащен большим комплексом ядер ЦП (CCX) с двумя типами ядер ЦП — четырьмя Zen 5 и восемью Zen 5c, которые совместно используют кэш-память третьего уровня объемом 24 МБ. Ядра Zen 5 удерживают самые высокие частоты разгона. AMD работала над улучшением возможностей повышения частоты своих компактных ядер Zen 5c (по сравнению с Zen 4c), поэтому они должны разгоняться лучше, хотя все еще не дотягивают до уровня ядер Zen 5. Оба типа ядер имеют одинаковый IPC и ISA, а также поддерживают SMT, так что на самом деле это 12-ядерный/24-поточный процессор с базовой пометкой предпочтительного ядра UEFI CPPC, позволяющей ОС отдавать приоритет работе ядрам Zen 5.
Производительость Ryzen AI 300
Вот официальные заявления AMD о производительности процессора Ryzen AI HX 370 по сравнению с Core Ultra 9 185H и Snapdragon X Elite.
И вот как он ведет себя в игровых нагрузках. Эти цифры сравнивают iGPU трёх процессоров и очевидно, что AMD теперь имеет определённое лидерство в игровой производительности iGPU.
AMD RDNA 3.5
Максимально мощный процессор Ryzen AI HX 370 поставляется с графической моделью AMD Radeon 890M, максимальным вариантом iGPU на Strix Point, работающим на новой графической архитектуре RDNA 3.5.
AMD предпочитает называть это RDNA 3.5, а не чем-то вроде «RDNA 4», потому что физический механизм SIMD практически не изменился по сравнению с RDNA 3, но AMD внесла несколько обновлений в графический конвейер для повышения производительности/Ватт, что она может обменять на чистую производительность.
AMD удвоила количество TMU в конструкции. Это оказывает почти универсальное влияние на производительность игр, поскольку текстуры управляют современными играми. Компания также удвоила скорость операций интерполяции и сжатия. Наконец, AMD поработала над управлением памятью iGPU, чтобы максимально эффективно использовать доступную пропускную способность памяти, особенно в сценариях с нехваткой пропускной способности, например, в сочетании с LPDDR5. При этом используется комбинация пакетной обработки, уменьшения количества обращений к памяти и более эффективных методов сжатия.
Обратите внимание на этот график — AMD заявляет о приросте производительности на +32% в Time Spy и на +19% в Night Raid по сравнению с Radeon 780M iGPU процессора Ryzen 8040 Hawk Point. Здесь важно отметить, что AMD увеличила количество вычислительных блоков в Strix Point до 16 с 12 в Hawk Point — числовое увеличение на 33%, что отражает линейное увеличение производительности Time Spy. Однако AMD может сделать это при том же энергопотреблении в 15 Вт. Таким образом, линейный прирост производительности не происходит при пропорциональном увеличении мощности. Вот где RDNA 3.5 творит свое волшебство.
Машинный/Обучающийся ИИ
AMD увидела, что ускорение клиентского ИИ на ПК появится еще в 2019 году, когда генеративный ИИ еще не появился на суше, а клиентские приложения для ИИ включали размытие фона, шумоподавление и тому подобное. В последующие годы AMD приобрела Xilinx - столь же важное для компании, как и приобретение ATI в середине 2000-х годов. Это дало AMD богатую инфраструктуру Xilinx, включая FPGA и вычислительные элементы, лежащие в основе архитектуры XDNA и управляющие её NPU. С новыми процессорами серии Ryzen AI 300 компания AMD представляет новую архитектуру NPU XDNA 2, пытаясь создать NPU класса 50 TOPS, отвечающий требованиям Microsoft Copilot+ в пределах своего TDP 15 Вт.
Теперь AMD ускоряет ИИ по всему стеку вычислений: от облака до предприятия и периферии ПК с искусственным интеллектом, поэтому она может обслуживать оба типа рынков — облачные и клиентские.
AMD перечисляет преимущества искусственного интеллекта с локальным ускорением перед искусственным интеллектом с облачным ускорением, а теперь и о NPU 50 TOPS на процессорах Ryzen AI 300. «Опыт Северной звезды» — это то, что, по их мнению, потребуется будущим моделям ИИ для лучшего опыта, но до этого ещё далеко..
Процессор Ryzen AI 300 Strix Point поддерживает ИИ-ускорение на всех трех своих вычислительных механизмах: ядра Zen 5 с 512-битным FPU ускоряют ISA, соответствующие AI, такие как AVX-512 и VNNI; iGPU RDNA 3.5 имеет 1024 потоковых процессора и 32 собственных ускорителя искусственного интеллекта; а еще есть NPU.
Однако интересно то, что у Ryzen 9000 Granite Ridge отсутствует NPU, поскольку процессор повторно использует cIOD Ryzen 7000 Raphael, у которого отсутствует NPU. Это может стать проблемой для AMD в будущем, поскольку конкурирующие чипы Intel Arrow Lake для настольных ПК будут иметь как минимум 16 NPU класса TOPS, чего недостаточно для Copilot+, но, по крайней мере, хватает для Copilot.
Архитектура XDNA 2
NPU XDNA 2 с производительностью TOPS 50 в Ryzen AI 300 может обеспечить колоссальный прирост производительности/Ватт в 35 раз для модели искусственного интеллекта по сравнению с ядром ЦП, поэтому Microsoft делает упор на наличие NPU, чтобы претендовать на Copilot+, даже iGPU с восьмикратным увеличением производительности/Ватт не подойдет.
NPU XDNA 2 процессора Ryzen AI 300 первым достиг показателя TOPS 50. Microsoft не сильно отстает: NPU 4 Lunar Lake достигает максимальной скорости TOPS 48, а Apple M4 — TOPS 40.
Архитектура AMD XDNA предусматривает развертывание чувствительной к памяти логики, наиболее оптимальной для нейронных сетей глубокого обучения ИИ.
Первоначальный NPU XDNA на Phoenix и Hawk Point содержал 20 тайлов движка ИИ для TOPS 10 на Phoenix и TOPS 16 на Hawk Point (благодаря увеличению тактовой частоты). NPU XDNA 2 на Strix Point увеличивает количество тайлов AIE до 32 с удвоением количества MAC-адресов на тайл, увеличением встроенной памяти на 60% и поддержкой нового Block Float 16 (не путать с BFloat16). Эти изменения приводят к пятикратному увеличению производительности искусственного интеллекта по сравнению с Phoenix и двукратному увеличению производительности на единицу мощности.
Block FP16
Block Float 16 — это числовой формат данных, используемый для представления чисел таким образом, чтобы вычисления выполнялись быстрее и эффективнее. Обратите внимание, что Block Float 16 — это НЕ BFloat16.
Традиционно числа с плавающей запятой хранятся либо в 64-битном (FP64, двойное), 32-битном (FP32, с плавающей запятой) или 16-битном (FP16, половинное значение), но это относительно медленно. Блок Float 16 использует 16 бит для хранения числа, как и FP16, но вместо хранения показателя степени для каждого числа (количества цифр) он создает группы из восьми чисел и использует общий показатель степени для всех них. Пример (немного упрощенный) — сохранение чисел 1 000 000, 2 000 000, 3 000 000, 4 000 000, 5 000 000, 6 000 000, 7 000 000, 8 000 000. Block Float 16 хранит их как 1, 2, 3, 4, 5, 6, 7, 8 и «x1 000 000 для всех чисел». Это требует значительно меньше памяти, что не только снижает требования к объему памяти, но и требуемую пропускную способность памяти — очень важное улучшение, особенно для устройств NPU.
Точные требования к памяти составляют 9 бит для каждого значения Block Float 16, что почти на 50 % лучше, чем в FP16. Каждое значение хранит 8 бит точности (так называемое значимое значение, мантисса или дробь), а также общие 8 бит показателя степени для каждой группы из восьми чисел. Таким образом, группа из восьми Block FP16 использует 8 (чисел) x 8 (бит на число) + 8 (общая экспонента битов) = 72 бита = 9 бит на B;ock Float 16.
Хотя альтернативные способы хранения данных не являются чем-то новым, наиболее известным, вероятно, остается INT8, который использует всего восемь бит для хранения чисел; большинство из них требуют, чтобы ваша модель была квантована для этого конкретного типа данных. Квантование — это трудоемкий процесс, которого каждый хочет избежать. Особенно мелким производителям аппаратного обеспечения искусственного интеллекта, таким как AMD, будет непросто убедить разработчиков программного обеспечения оптимизировать свои модели для конкретного оборудования — реальность такова, что все будут оптимизироваться под NVIDIA и, вероятно, не будут заботиться об остальном. Block Float 16 решает эту проблему, позволяя вам использовать модели, оптимизированные для FP16, без какого-либо квантования, и результаты по-прежнему будут очень хорошими, практически неотличимыми от результатов с собственным FP16, но с почти вдвое большей производительностью.
Программное обеспечение Ryzen AI
Любое оборудование для ускорения искусственного интеллекта настолько хорошо, насколько хорош его программный стек. AMD это знает, поэтому она начала свой путь к тому, чтобы стать компанией, ориентированной на программное обеспечение. AMD поддерживает все распространённые модели и алгоритмы, инструменты оптимизации и квантования, а также выполнение через среду выполнения ONNX.
Заключение
Когда AMD Zen вышла на рынок в 2017 году, никто не ожидал, что компания останется конкурентоспособной с Intel в течение более чем пары поколений, но AMD постоянно доказывала, что все ошибались. Она придерживалась своей дорожной карты, обещала только то, что могла выполнить, и выполнила эти обещания. Для каждого нового поколения Zen был предоставлен постоянный двузначный прирост IPC, и каждые два поколения AMD переходила на новый класс технологичных узлов. В каком-то смысле AMD и TSMC смогли имитировать пошаговый цикл разработки продуктов Intel гораздо лучше, чем сама Intel.
Достаточно ли этого для геймеров? Конечно, если вы обновляетесь с процессора более старого поколения, такого как Ryzen 5000 Zen 3, но не если вы используете что-то вроде серии Ryzen 7000X3D. Технология 3D V-кэш творит чудеса с производительностью в играх, и, учитывая, что 7800X3D, как ожидается, продержится на лидирующих позициях еще немного, если вы геймер, вам действительно стоит дождаться неизбежной серии Ryzen 9000X3D, хоть пока и не известно, когда AMD планирует её запустить.
Если вы в основном заинтересованы в производительности и немного в играх, Zen 5 предлагает вам достаточную производительность. Компания значительно улучшила возможности математических вычислений ядра, что должно улучшить создание контента, транскодирование мультимедиа и производительность тяжелых вычислительных нагрузок. В частности, 512-битные рабочие нагрузки SIMD должны выиграть от нового толстого FPU, который представляет собой не просто 256-битный блок с двойной накачкой, как в Zen 4.
Число ядер ЦП AMD Ryzen серии 9000 варьируется от 6 до 16 ядер, и это не изменилось для AMD со времен Ryzen 3000 Zen 2. AMD необходимо поработать над этим, потому что Intel Arrow Lake вот-вот поразит AMD не только ядрами Lion Cove с высоким IPC, но и E-ядрами Skymont, где Intel удалось сотворить чудо, увеличив IPC на 50% по сравнению с предыдущим E-ядром. Какое бы количество ядер Intel ни придумала для Arrow Lake, оно может оказаться конкурентоспособным по сравнению с Granite Ridge. Рано или поздно AMD придется пересмотреть количество ядер.
Это также важно для сегмента начального уровня, где Intel продает четырехъядерные и двухъядерные процессоры менее чем за $100. Стоимость предложений AMD Ryzen в настоящее время начинается от 140 долларов и маловероятно, что Ryzen 9000 изменит эту ситуацию. Без сомнения, вы можете получить лучшее соотношение цены и производительности от AMD, но есть много людей, которым не нужна высокая вычислительная производительность и которые предпочитают сэкономить деньги и иметь возможность потратить их в другом месте.
Strix Point серии Ryzen AI 300 — это мощный монолитный мобильный процессор, сочетающий в себе самые последние разработки AMD. Учитывая, что сроки поставки Lunar Lake перенесены на конец третьего или четвертого квартала 2024 года, а также то, что AMD может продвигать эти чипы уже сейчас, компания может насладиться моментом под солнцем с этим чипом, вызвав самую первую волну ноутбуков, которые будут соответствовать требованиям Copilot+ AI к ПК. AMD сбалансировала свой NPU класса TOPS 50 мощным 12-ядерным процессором на базе ядер Zen 5 и Zen 5c; и проработала мощный iGPU с 1024 потоковыми процессорами на базе архитектуры RDNA 3.5. На данный момент похоже, что Copilot+ будет эксклюзивом Qualcomm еще много месяцев, а его версия x86 появится не раньше четвертого квартала 2024 года.
Настоящим кормильцем для AMD с Zen 5 обязательно станет EPYC Turin 5-го поколения, в котором количество ядер процессора вырастет до ошеломляющих 192. Пока AMD способна выдавать достаточно высокий IPC чисто за счёт количества ядер, она останется конкурентоспособной по сравнению с поколением процессоров Intel Xeon 6 со всеми его встроенными ускорителями.
Мобильные процессоры Ryzen AI 300-й серии радуют взор. Процессоры Ryzen 9000 для настольных ПК тоже интересны, но хотелось, бы чтобы они были оснащены NPU и превзошли 7800X3D, потому что Arrow Lake-S, вероятно, будет делать и то, и другое, хотя на неизвестных уровнях мощности.
По материалам https://www.techpowerup.com/