Обзор архитектуры Intel Arrow Lake на примере Intel Core Ultra
10 октября компания Intel сняла эмбарго с информации о новом семействе процессоров Core Ultra 200 архитектуры Arrow Lake-S для настольных ПК. Это первое новое поколение процессоров, показанное Intel с момента выпуска 13-го поколения Raptor Lake в конце 2022 года. 14 серия процессоров была только обновлением предыдущей архитектуры, что мы и увидели в кодовом названии Raptor Lake Refresh. Архитектура Arrow Lake для Intel не новая, впервые она появилась в Core Ultra 100 Meteor Lake в конце 2023 года на мобильных платформах. Intel стремится реализовать многие технологические инновации, включая ускорение искусственного интеллекта, новые ядра процессора, усовершенствования в области питания и охлаждения, а также новую платформу для I/O. Core Ultra 200 серии Arrow Lake-S представлена с новым сокетом LGA1851, поэтому нам понадобится новая материнская плата. Intel представила новый чипсет для настольных ПК 800 серии пока только лидером платформы - Z890.
Запуск новой серии процессоров Intel не отличается от ранее вышедших. Так, сначала мы увидим процессоры с разблокированным множителем K и KF, направленным на энтузиастов и геймеров на материнских платах с Z890 чипсетом, который поддерживает разгон процессора. В 2025 году линейка расширится с выходом более доступным процессоров и других чипсетов 800 серии.
В новой архитектуре Arrow Lake Intel сделали акцент на энергопотреблении. С момента перехода на TSMC и 7 нм с Ryzen 3000 Zen 2 AMD постоянно опережает Intel по энергоэффективности, поскольку Intel пришлось тянуть 14 нм еще два поколения (Comet Lake и Rocket Lake), а к моменту появления ее 10 нм процесса (позже переименованного в Intel 7) AMD уже разработала эффективный Zen 3 на 7 нм и готовилась к переходу на 5 нм и Zen 4. Ryzen теперь использует 4 нм с Zen 5. Intel сохранила свои производственные мощности на Intel 4 (7 нм) на архитектуре Meteor Lake, но решила выбрать TSMC для серии Ultra 200. Arrow Lake — первая высокопроизводительная клиентская архитектура Intel, использующая TSMC при производстве ядер ЦП, а вычислительная часть кристалла построена 3 нм TSMC — более совершенной производственной линии, чем 4 нм, который использует Zen 5.
В результате с выходом Arrow Lake Intel планирует вернуть себе лидерство в области эффективных клиентских настольных процессоров. В любом случае цель будет достигнута, даже если мы получим скромный прирост по IPC, при условии значительного снижения энергопотребления, поскольку тогда это открывает другие возможности для пользователей, такие как разгон — то, в чем процессоры Intel, как правило, изначально хороши.
Мы постараемся рассмотреть все аспекты новых процессоров Core Ultra 200 архитектуры Arrow Lake для настольных ПК, которая предоставила компания Intel и с нетерпением ждём их появления на полках зарубежных магазинов в конце этого месяца.
Процессоры Core Ultra 200 Arrow Lake
По традиции Intel представила три основные линейки процессоров Core Ultra 9, Core Ultra 7 и Core Ultra 5. Название претерпело изменение, начиная с Core Ultra Meteor Lake, вышедших на мобильной платформе, которые пришли на смену традиционным названиям Core i9, Core i7 и Core i5 соответственно. Пока Core Ultra 9 представлен в виде единственного Core Ultra 9 285K. Процессор без интегрированной графики, который мог бы называться как «285KF» представлен не был.
Core Ultra 9 285K - это максимальная конфигурация процессоров на архитектуре Arrow Lake-S по схеме 8P+16E. 8 производительных ядер под кодовым названием «Lion Cove», 16 энергоэффективных ядер «Skymont» и кэш уровня L3, объемом 36 МБ. E-ядра имеют базовую частоту 3,20 ГГц и буст до 4,60 ГГц. P-ядра имеют базовую частоту 3,70 ГГц, частоту Turbo Boost 5,50 ГГц, Turbo Boost Max 3.0 5,60 ГГц (распространяется на четыре ядра) и частоту Thermal Velocity Boost (TVB) 5,70 ГГц (до двух ядер, если есть запас по температурам).
Далее следует Core Ultra 7 265K и вариант без интегрированной графики Core Ultra 7 265KF. Он представлен в конфигурации 8P+12E, аналогичной его предшественнику Core i7-14700K. Интересно, что общий размер кэша L3 в сравнении с прошлым поколением уменьшился до 30 МБ с 33 МБ у i7-14700K. У 265K частота E-ядер 3,30 ГГц с бустом 4,60 ГГц, базовая частота P-ядер 3,90 ГГц, частота Turbo Boost 5,40 ГГц и Turbo Boost Max 3.0 5,50 ГГц. Для данных процессоров TVB не представлен.
Замыкает линейку представленных процессоров Core Ultra 5 245K и Core Ultra 5 245KF без интегрированной графики. Они повторяют конфигурацию ядер своих предшественников Intel Core i5-14600K и 14600KF в виде 6P+8E и 24 МБ кэша L3. У 265K самая высокая частота E-ядер в серии — 3,60 ГГц, но с аналогичной максимальной частотой буста E-ядер 4,60 ГГц. Процессоры также имеет самую высокую базовую частоту P-ядер 4,20 ГГц, которая увеличивается до 5,20 ГГц. Кроме этого отсутствуют технологии Turbo Boost Max 3.0 и TVB.
Во всех 5 моделях у P-ядер 3 МБ выделенного кэша L2. Это выше на 2,5 МБ на ядро, чем у P-ядер "Lion Cove" в мобильных процессорах Core Ultra 200V Lunar Lake. E-ядра "Skymont" организованы в кластеры по 4 ядра в каждом. Каждый кластер делит кэш L2 объемом 4 МБ между четырьмя ядрами.
Интегрированная графика обозначается просто как "Intel Graphics". Она основана на архитектуре Xe-LPG (аналогичная используется в мобильных процессорах семейства Meteor Lake). В состав входит 4 ядра Xe или 64 исполнительных блока (EU), что составляет 512 унифицированных шейдеров. Все три модели процессоров имеют базовую частоту графического процессора 300 МГц. У 285K и 265K частота буста доходит до 2,00 ГГц, в то время как 245K максимальная частота ограничена 1,90 ГГц.
Кроме этого в процессорах присутствует отдельный блок NPU 3. Он оснащен двумя NCE Gen 3 (нейронными вычислительными движками) и обеспечивает пиковую производительность 13 TOPS (Trillions of operations per second - триллион операций в секунду), что значительно меньше 40 TOPS, требуемых сертификацией Microsoft Copilot+ AI PC, и сопоставимо с NPU 3, используемым в процессорах Meteor Lake.
Intel придерживается своей линейки энергопотребления, которую она начала с 12-го поколения Core «Alder Lake». Все пять моделей процессоров имеют базовое энергопотребления 125 Вт. 285K, 265K и 265KF в режиме буста доходят до значения 250 Вт. С другой стороны, у 245K и 245KF максимальное значение энергопотребления снижено до 159 Вт. Как мы видим, значение уменьшилось в сравнении с 181 Вт для его предшественников Core i5, таких как i5-14600K и i5-13600K.
Что касается цен, то Core Ultra 9 285K - самый дорогой процессор в линейки с рекомендуемой ценой в 589 долларов. За ним следует Core Ultra 7 265K по цене 394 доллара. 265KF можно приобрести за 379 долларов. Core Ultra 5 245K стоит 309 долларов, за ним следует 245KF по цене 294 доллара. Это те же самые ценовые ориентиры, по которым Intel выпустила предыдущее поколение i9-14900K, i7-14700K/KF и i5-14600K/KF соответственно.
Все процессоры поступят в продажу 24 октября 2024 года.
Микроархитектура Arrow Lake
Intel разработала микроархитектуру Arrow Lake для двух своих крупнейших сегментов рынка клиентских процессоров: настольных ПК и обычных ноутбуков. Для ультрапортативных ноутбуков без дискретной графики компания разработала новую микроархитектуру Lunar Lake. Lunar Lake разделяет многие IP блоки с Arrow Lake, особенно ядра процессора, но есть и несколько отличий. Intel использует обозначение форм-фактора «S» для обозначения массовых настольных ПК и, следовательно, архитектуру «Arrow Lake-S» применяемую в представленных процессорах. Компания планирует выпустить процессоры с архитектурой «Arrow Lake-H» для ноутбуков массового сегмента и «Arrow Lake-HX» для энтузиастов в первом квартале 2025 года.
В микроархитектуре "Arrow Lake" компания Intel сохраняет конструкцию процессора на основе плиток, которую она начала с "Meteor Lake" в клиентском сегменте. В данном случае Intel назвала технологию Foveros Advanced 3D. Основная идея здесь заключается в том, что вам не нужно строить большой монолитный чип, а скорее определить конкретные IP-блоки, которые больше всего выигрывают от монолитного производства, такие как ядра процессора и интегрированной графики. Остальная часть процессора, в основном имеющая дело с интерфейсами ввода-вывода, может быть построена на плитке с старым тех. процессом, тем самым позволяя Intel увеличить скорость производства на последнем тех. процессе, поскольку плитки, которые она строит на данных линиях производства стали меньше.
В основе "Arrow Lake" находится 5 плиток. Первоначально располагается базовая плитка Foveros. Это кремниевый интерпозер, который располагается на подложках из стекловолокна и устанавливает другие плитки сверху. Интерпозер обеспечивает высокоплотную микроскопическую проводку между плитками или чиплетами, уложенными поверх него, что в противном случае было бы невозможно на подложке из стекловолокна. Это ключевое отличие процессора Intel на основе плиток от процессоров AMD на основе чиплетов, которые полагаются на подложку корпуса для соединения сложных кристаллов процессора (CCD) с кристаллом ввода-вывода (cIOD). Преимущества интерпозера заключается в физической близости плиток, выигрыш в задержке и меньшую мощность, необходимую для перемещения данных между плитками.
Вычислительная плитка
Первая и самая важная плитка — вычислительная. Она построена на 3-нм процессе TSMC N3B и содержит ядра ЦП. Комплекс ядер состоит из восьми производительных ядер «Lion Cove» (P-ядер) и шестнадцати эффективных ядер «Skymont» (E-ядер). E-ядра организованы в четыре кластера по 4 ядра в каждом. Восемь P-ядер и четыре кластера E-ядер организованы вдоль кольцевой шины и совместно используют кэш L3 последнего уровня объемом 36 МБ. Небольшое отличие от «Alder Lake» и «Raptor Lake», которое можно увидеть в вычислительной плитке «Arrow Lake», заключается в физическом расположении P-ядер и кластеров E-ядер. В «Raptor Lake» восемь P-ядер расположены на одном конце вычислительного комплекса, а два или четыре кластера E-ядер — на другом конце. В «Arrow Lake» они организованы поочередно, как показано на слайде выше. Intel утверждает, что это сделано для снижения концентрации тепла, выделяемого P-ядрами в сценариях с большими вычислительными нагрузками, например, в играх. Кроме того, каждый кластер E-ядер располагается всего в одной кольцевой остановке от ядра P, что должно сократить задержки потоков, мигрирующих между P и E ядрами.
SoC плитка
Следующая по важности плитка - SoC. Она занимает большинство места в центре чипа и построена на 6 нм узле TSMC N6. В этой плитке нет островка энергоэффективных E-ядер в отличии от "Meteor Lake" в мобильных процессорах. Только тяжелый логический компонент - NPU 3. Данная плитка содержит двухканальный контроллер памяти DDR5, физический уровень PHY памяти DDR5 и корневой комплекс PCI-Express процессора.
Не считая шины чипсета DMI 4.0 x8, у процессора в наличии 20 линий PCIe Gen 5. 16 из них выделены для PEG интерфейса (дискретной графики) и четыре для выделенного слота M.2 NVMe, подключенного к ЦП. Фактически есть два слота M.2, подключенных к ЦП. Помимо PCIe Gen 5 x4, есть второе соединение Gen 4 x4 от процессора. Это соединение исходит от плитки ввода-вывода, которая также содержит интегрированный контроллер Thunderbolt 4 40 Гбит/с. Плитка SoC содержит три компонента встроенной графики: Display Engine, Media Acceleration engine и Display I/O.
Двухканальный контроллер памяти DDR5 "Arrow Lake-S" поддерживает до 192 ГБ двухканальной памяти с 48 ГБ 1 слот DIMM. Поддержка стандарта JEDEC DDR5-6400 и Intel заявляет, что DDR5-8000 является "sweetspot" скоростью разгона памяти. Также процессоры могут работать с более высокой частотой оперативной памяти. Уже есть анонсы DDR5-9600, и в течение 2025, возможно, мы увидим скорости на уровне 10000 MT/с с использованием модулей памяти на чипах CKD (CUDIMM или CSODIMM). У архитектуры появилась поддержка ECC, но это не относится к чипсету Z890 и представленным процессорам.
В плитку SoC интегрирован NPU 3 блок, с виду ничем не отличающийся от аналогичного в "Meteor Lake." Он основан на 3 поколении архитектуры Intel NPU, по сравнению с 4-м поколением NPU в «Lunar Lake». NPU 3 имеет пиковую пропускную способность 13 TOPS AI, что означает, что он не достигает требования 40 TOPS для локального ускорения Microsoft Copilot+. Блок содержит два NCE (нейронных вычислительных движка) с двумя MAC-массивами INT8/FP16, четырьмя SHAVE DSP и 4 МБ оперативной scratchpad (“блокнотной”) памяти.
Графическая плитка
Третья ключевая плитка «Arrow Lake» — это графическая плитка, построенная на графической архитектуре Xe-LPG, которая на поколение старше архитектуры Xe2, на которой в сою очередь работает встроенная графика «Lunar Lake». Графическая плитка построена на 5-нм узле TSMC N5P. Она содержит только вычислительную и графическую отрисовку в виде одного среза рендеринга Xe с четырьмя ядрами Xe, эквивалентного 64 исполнительным блокам (EU) или 512 унифицированным шейдерам. Ядра Xe графической плитки Arrow Lake не имеют блоков XMX. Любое ускорение ИИ осуществляется в форме DP4a, а не XMX. Мобильный вариант архитектуры «Arrow Lake-HX» использует ту же графическую плитку. С другой стороны, «Arrow Lake-H» поставляется с более крупной графической плиткой с восемью ядрами Xe (128 EU, 1024 унифицированных шейдера), а ядра Xe там оснащены блоками XMX. Несмотря на наличие всего 4 ядер Xe, графические плитки «Arrow Lake-S» и «Arrow Lake-HX» оснащены блоками трассировки лучей, по одному на ядро Xe, что дает им полную поддержку DirectX 12 Ultimate. Intel также снабдила встроенную графику довольно большим кэшем L2 объемом 4 МБ, который смягчает передачу данных между ним и плиткой SoC.
Media Engine "Arrow Lake-S" обеспечивает аппаратное ускорение для видео до 8K @ 60 Гц с 10-битным HDR, с поддерживаемыми форматами, включая VP9, AVC, HEVC, AV1 и SSC. Аппаратно-ускоренное кодирование поддерживается для разрешений до 8K @ 120 Гц с 10-битным HDR, с поддерживаемыми форматами, включая VP9, AVC, HEVC и AV1. Display Engine поддерживает до четырех каналов отображения с четырьмя маломощными каналами и поддерживает до 5 портов отображения. Поддерживаемые стандарты включают HDMI 2.1, DisplayPort 2.1 и eDP 1.4. Поддерживаемые разрешения включают 8K @ 60 Гц HDR или четыре 4K @ 60 Гц HDR или 1080p @ 360 Гц или 1440p @ 360 Гц.
Ядра процессора Arrow Lake
Lion Cove P-ядра
Новые P-ядра "Lion Cove" заменяет ядра "Raptor Cove" предыдущего поколения, как основная вычислительная сила архитектуры Arrow Lake. Как P-ядра в мобильных процессорах "Lunar Lake", так и P-ядра в Arrow Lake расположены вдоль кольцевой шины с кэшем L3, общим для P-ядер. Однако есть небольшое отличие: выделенный кэш L2 был увеличен до 3 МБ по сравнению с 2,5 МБ в P-ядрах Lunar Lake. Восемь P-ядер совместно используют кэш L3 объемом 36 МБ по сравнению с 12 МБ в "Lunar Lake".
Intel заявляет, что IPC (Instructions Per Cycle) «Lion Cove» у архитектуры «Arrow Lake» увеличилось на 9% по сравнению с ядром «Raptor Cove» у «Raptor Lake-S». Если говорить о мобильной версии процессоров на архитектуре «Lunar Lake», то компания заявила о 14%-ном увеличении IPC, но в сравнении участвовали P-ядра «Redwood Cove» 15-ваттной модели мобильной архитектуры «Meteor Lake» прошлого поколения. Это было сделано по причине того, что «Lunar Lake» — это единственный в своем роде полностью интегрированный чип, у которого нет предшественников, кроме как процессоров на «Meteor Lake».
Как и в «Lunar Lake», P-ядро «Lion Cove» в «Arrow Lake» не поддерживает Hyper-Threading (HT), Intel физически удалила компоненты ядра, необходимые для гиперпоточности. Это было сделано с целью уменьшения размера ядра и с прицелом на то, что IPC и повышение энергоэффективности превзойдут необходимость в HT вместе с физическими потоками на E-ядрах. Получив большую площадь кристалла и запас по мощности по причине отказа от гиперпоточности, Intel перешла к капитальной перестройке самой микроархитектуры. Улучшения коснулись всех ключевых компонентов, включая переработанный front-end с блоком предсказания ветвлений, увеличенным в 8 раз. Блок выборки и пропускная способность декодирования были увеличены. Кэш микроопераций увеличился в емкости и Intel представила концепцию «наноопераций» - группы схожих разбитых микрооперационных задач, которые могут выполняться в тандеме.
Целочисленные и векторные домены, которые образуют механизм внеочередного выполнения, теперь разделены с индивидуальным доступом к очереди микроопераций и независимыми планировщиками. Механизм внеочередного выполнения видит очередь переименования/удаления выделения шириной 8 по сравнению с шириной 6 в Redwood Cove. Очередь изъятия расширена на 50% до ширины 12 с 8. Глубина окна инструкций увеличилась с 512 до 576. Порты выполнения увеличились с 12 до 18.
Количество АЛУ (арифметико-логическое устройство) Integer увеличилось с 5 до 6, с 3 единицами перехода вместо 2, 3 единицами сдвига вместо 2 и тремя единицами MUL вместо 1. Механизм векторного выполнения видит 4 АЛУ SIMD (single instruction, multiple data — одиночный поток команд, множественный поток данных) вместо 3, два блока FMA (Fused Multiply-Add, умножение-сложение с однократным округлением), 4 цикла и 2 блока делителя. Подсистема загрузки-хранения имеет размер 128 DTLB (Data Translation Lookaside Buffer - это кэш памяти, в котором хранятся последние преобразования виртуальной памяти в физическую память) вместо 96 и 3 генератора адресов STE вместо 2.
Intel также переделала подсистему кэширования на уровне ядра, введя промежуточный кэш данных между 48 КБ L1 и L2. Кэш L1D теперь называется кэшем L0 D, который переходит в кэш L1 D объемом 192 КБ. Он взаимодействует с кэшем L2. В Arrow Lake это ядро получает 3 МБ (3072 КБ) L2 выделенного кэша L2. Intel развернула новую систему управления питанием на основе ИИ для P-ядер, которая контролируется SMU самих ядер. Тактовая частота процессора P-ядер теперь имеет тонкую гранулярность 16,67 МГц.
E-ядра Skymont
Новые E-ядра "Skymont" - это самая большая тема для разговора о архитектуре "Lunar Lake". Intel достигла 38% прироста IPC по сравнению с E-ядрами "Crestmont" архитектуры "Meteor Lake" в целочисленных рабочих нагрузках и колоссального прироста IPC в 68% по сравнению с "Crestmont" в рабочих нагрузках с плавающей точкой. Однако не все так просто. E-ядра в "Lunar Lake" не являются частью кольцевой шины с P-ядрами (т.е. совместно используют свой кэш L3), а отделены в маломощный кластер островных E-ядер, и поэтому Intel проводила эти сравнения IPC с маломощными островными E-ядрами "Crestmont" в "Meteor Lake", расположенными в ячейке SoC. В "Arrow Lake" теперь все кластеры E-ядер "Skymont" являются частью кольцевой вычислительной шины и совместно используют кэш L3 с P-ядрами. По этой причине сравнение сделано с E-ядрами "Gracemont" в "Raptor Lake-S." При всем при этом компания заявляет о 32%-ном повышении IPC по сравнению с "Gracemont", что по-прежнему является весьма впечатляющим приростом за поколение.
32% повышение IPC E-ядер "Skymont" в "Arrow Lake" играет решающую роль в многопоточной производительности, несмотря на то, что P-ядра больше не поддерживают гиперпоточность. 16 E-ядер в "Arrow Lake" организованы в кластеры по 4 ядра в каждом и каждый кластер разделяет кэш L2 объемом 4 МБ между своими ядрами. Intel утверждает, что удвоила пропускную способность этого общего кэша L2 по сравнению с кластерами E-ядер "Gracemont" в "Raptor Lake-S".
Особенность Skymont начинается с блока выборки и предсказания ветвлений, который теперь предугадывает на 128 байт вперед для возможных ветвлений, что ускоряет выборку инструкций. До 96 байт инструкций извлекаются параллельно. Интерфейс получил новое 9-разрядное декодирование (по сравнению с 6-разрядным в Crestmont), поддержку нанокода (похожие сегменты микрокода объединяются для большего параллелизма) и более широкую очередь микроопераций из 96 записей вместо 64 в предыдущем поколении.
Движок внеочередного исполнения видит суть обновлений. Очередь распределения имеет ширину 8 (вместо 6), а очередь удаления — 16 (вместо 8). За прерыванием зависимостей отвечает интеллект. Внеочередной промежуток расширен до 416 записей вместо 256, как и физические регистровые файлы, станции резервирования и буферизация блока загрузки-хранения.
Движок выполнения имеет 26 портов отправки, что приводит к 8 целочисленным ALU с 3 портами перехода и 3 загрузками за цикл (увеличение на 50%).
Векторный движок оснащен четырьмя 128-битными FPU, что удваивает GigaFLOPS. Задержки FMUL, FADD и FMA уменьшены. Округление FP теперь использует собственное аппаратное ускорение. Дополнительные блоки выполнения также должны повысить производительность ИИ. Блок загрузки/хранения увеличивает производительность загрузки и генерации адреса хранения на 33–50%. Размер L2 TLB увеличился с 3096 до 4192 записей.
3 поколение Intel Thread Director
С "Arrow Lake" Intel представляет третье поколение Thread Director - своего аппаратного планировщика, который распределяет разного рода нагрузку между необходимыми ядрами процессора. Новая версия получила более точный аппаратный механизм обратной связи производительности E-ядер, который сообщает ей тип доступных ресурсов E-ядер. Intel также представила новую телеметрию производительности P-ядер для более точного направления потоков для P-ядер. Intel также предоставила Thread Director - свою самую точную модель прогнозирования.
Ядра "Skymont" получили значительную прибавку IPC, Thread Director на "Arrow Lake-S" отдает приоритет всем неигровым производительным рабочим нагрузкам на E-ядра и обновляет потоки на P-ядрах только по мере необходимости. Thread Director играет важную роль в повышении общей энергоэффективности процессора.
Сокет Intel LGA1851 и платформа Z890
В Core Ultra 200 "Arrow Lake-S" Intel дебютирует с новым сокетом LGA1851. По этой причине готовимся к приобретению новой материнской платы. Все модели процессоров, представленные Intel с разблокированными множителем серий K или KF и единственной доступной моделью чипсета материнской платы на старте продаж будет Intel Z890. Intel расширит свою линейку моделей процессоров в 2025 году и вместе с ним выпустит более доступные чипсеты материнских плат.
Плитка SoC "Arrow Lake-S" содержит двухканальный интерфейс памяти DDR5, о котором мы писали ранее. Он также оснащен 48 линиями PCIe (процессорные + чипсет). Intel увеличила количество линий PCIe Gen 5, выдаваемых процессором, до 20 — это 16 линий, предназначенных для PEG (слот x16 для видеокарт) и один подключенный к процессору слот M.2 NVMe, который работает на скоростях Gen 5, не занимая 16 линий PEG. ЦП выдает второй набор Gen 4 x4, который может быть подключен как слот M.2 или использоваться для управления высокоскоростными встроенными устройствами, такими как дискретный контроллер Thunderbolt 5. В сам процессор полностью интегрирован контроллер Thunderbolt 4, рассчитанный на пару портов 40 Гбит/с.
Процессор соединен с чипсетом Z890 через шину чипсета DMI 4.0 x8 (пропускная способность сопоставима с PCI-Express 4.0 x8). Он содержит 24 линии PCI-Express Gen 4. Это значительное увеличение по сравнению с Z790, чипсет которого выделял 16 линий Gen 4 и 8 линий Gen 3. Интегрированный комплекс USB состоит из 32 последовательных USB 3.2 5 Гбит/с, которые могут быть сконфигурированы проектировщиками материнских плат в пять портов 20 Гбит/с, десять портов 10 Гбит/с и десять портов 5 Гбит/с. Также имеется 14-портовый концентратор USB 2.0. Intel отказалась от аудиоинтерфейса HDA "Azalia" в Z890, что означает, что встроенным аудиокодекам придется использовать более новые интерфейсы MIPI SoundWire и USB 3.2 (которые уже используют такие кодеки, как Realtek ALC4080 и ALC4082).
В чипсете мы получаем 1 GbE MAC и Wi-Fi 6. Кроме этого, подключив к PCIe и USB 3.2, производители материнских плат могут дооснастить модулями Wi-Fi 7 и 2.5 GbE или даже 5 GbE и 10 GbE. Вендоры могут выбрать сетевой пакет Intel Killer, объединяющий существующий сетевой PHY Intel с усовершенствованным механизмом приоритетов Killer и DoubleShot Pro, которые работают вместе для сокращения сетевой задержки во время игр.
В «Arrow Lake» Intel обновила архитектуру безопасности для своих клиентских процессоров, предоставив им три отдельных аппаратных модуля безопасности, включая специально разработанный Converged Security and Manageability Engine (по сути, Intel ME, но с дополнительными ролями безопасности), Silicon Security Engine, который представляет собой усиление на уровне микроархитектуры для новых ядер процессора Lion Cove и Skymont, новый выделенный контроллер безопасности для встроенной графики и соответствие стандарту Microsoft Secured Core.
Разгон и потребление
Основная идея Arrow Lake — предложить прирост производительности за поколение соответствующий ожиданиям, а также повышением энергоэффективности за счет новой компоновки процессора на основе плиток и переходом на новый 3-нм техпроцесс для ключевых логических компонентов чипа. Как следствие, увеличение энергоэффективности должно дать нам больший запас для разгона.
Arrow Lake представляет архитектуру с двумя базовыми доменами тактовой частоты. Теперь есть два независимых домена BCLK: один для вычислительной плитки, а другой для плитки SoC. Это имеет решающее значение для обеспечения того, чтобы разгон на основе BCLK не дестабилизировал другие домены, такие как тактовая частота PCIe, которая будет придерживаться домена BCLK плитки SoC.
Далее Intel добавила гранулярность 16,67 МГц для тактовых частот P-ядер и E-ядер, что позволяет вам еще лучше настраивать разгон. Структура «плитка-плитка» имеет собственный домен синхронизации, который можно разогнать либо с помощью статической настройки частоты, либо в соотношении с тактовой частотой процессора. Обход DLVR (digital linear voltage regulator - цифровой линейный регулятор напряжения) позволяет некоторым материнским платам премиум-класса переопределять внутреннее управление напряжением процессора с помощью интеллектуальных дискретных контроллеров регулирования напряжения для максимального разгона. Arrow Lake поддерживает управление кривой V/f на основе кластера P-ядер и E-ядер. SMU процессора может обнаруживать низкотемпературные системы охлаждения при разгоне и обходить ограничения напряжения по мере охлаждения чипа. Наконец, «Arrow Lake» предлагает встроенную поддержку CUDIMM и CSODIMM. Это модули памяти DDR5 с CKD (клиентскими драйверами тактовой частоты), которые позволяют использовать более высокие частоты. Некоторые новые наборы памяти с частототой свыше 8000 MT/с XMP, как правило, являются CUDIMM.
Используя Core i9-14900K в качестве базовой модели, Intel заявляет о снижении энергопотребления всей системы до 165 Вт при использовании Core Ultra 9 285K в игровых рабочих нагрузках.
Обновленное управление питанием, переход на новый узел TSMC 3 нм (там, где это важно) и другие оптимизации означают, что помимо более низкого энергопотребления, средняя температура 285K снизилась примерно на 13°C, чем у i9-14900K. В сценариях использования с небольшим количеством потоков Intel заявляет о снижении энергопотребления до 58% по сравнению с i9-14900K.
Информация о производительности от Intel
Игровая производительность
Intel заявляет о соразмерной игровой производительности, как у Core i9-14900K, для флагманского Core Ultra 9 285K при усреднении по 12 игровым тестам. В некоторых играх компания заявляет о приросте производительности до 15%, но в некоторых играх также наблюдается ухудшение на 13%. В целом прирост игровой производительности составляет в среднем +3%, но ключевым моментом здесь является снижение энергопотребления всей системы до 165 Вт по сравнению с i9-14900K.
Intel сравнила Core Ultra 285K с текущим флагманом AMD Ryzen 9 9950X и Ryzen 9 7950X3D. Intel утверждает, что в сравнении с 9950X паритет на ее тестовом стенде, но в играх, демонстрирующих прирост производительности, разница может достигать 28% в пользу Intel или 13% в пользу AMD.
Хотя сравнение с 7950X3D не столь обширно, Intel отдает преимущество 7950X3D, заявляя 15% в пользу Intel в некоторых играх или 21% в пользу AMD в других. 285K предсказуемо превосходит 7950X3D в многопоточных тестах производительности. В своем предварительном звонке Intel признала, что чипы AMD X3D, как правило, превосходят его в игровых тестах.
Общая производительность
Общая производительность — вот где Intel показывает лидерство. Прирост IPC E-ядер «Skymont» по сути делает 285K 24-ядерным процессором, состоящим только из «P-ядер» по стандартам производительности предыдущего поколения. По сравнению с Ryzen 9 9950X Intel заявляет о 4%-ном приросте однопоточной производительности, который достигает 8% по сравнению с i9-14900K.
Intel заявляет о 15%-ном приросте производительности в многопоточном режиме по сравнению с i9-14900K и 13%-ном приросте по сравнению с Ryzen 9 9950X, что позволяет нивелировать недостаток гиперпоточности.
Помимо производительности не стоит забывать о повышении энергоэффективности при переходе на новый 3 нм техпроцесс.
Аннотации к слайдам Intel.
Выводы
Intel продолжает развитие. Хотя 14 поколение получилось не столь интересным, как нам хотелось бы, в Core Ultra проделана большая работа, что в сумме дало увеличение IPC для P и E - ядер, увеличение энергоэффективности. Отказ от гиперпоточности не должен сказаться на снижении общей производительности по заявлениям Intel. Кроме этого плиточная компоновка позволила применить новый 3нм техпроцесс TSMC только там, где это будет иметь наиболее высокий прирост. Всё это немного напоминает Zen 5 в сравнении с Zen 4, где мы получили небольшой прирост в играх, но значительный прирост общей производительности.
По новому чипсету Intel Z890 революции не случилось, мы получили логическое развитие. Отдельные процессорные линии для PCIe Gen 5 M.2 NVMe, отказ от PCIe Gen 3. Очередное обновление системы питания, что скорее всего и потребовало изменение сокета и появлению LGA1851. Добавление поддержки новой памяти стандарта CUDIMM и новая “сладкая точка” в разгоне памяти на величине 8000, что прошлым поколениям давалось не особо и легко.
Всё бы хорошо, если не смотреть на игровую производительность. Прирост игровой производительности по информации от Intel находится на уровне 14900K. Скорее всего, Intel не сможет удержать корону игровой производительности по причине надвигающегося выпуска 9800x3d от AMD.
Еще один сомнительный момент от Intel — это NPU. Примечательно, что компания развернула 13 TOPS NPU от Meteor Lake, однако это не NPU 4 или Copilot+, что будет ощущаться, особенно учитывая, что Copilot находится в центре практически всего, что Microsoft в настоящее время делает с Windows. С другой стороны, по сравнению с Ryzen 9000, в которой полностью отсутствует NPU, а вместо этого есть инструкции уровня ядра ЦП, относящиеся к рабочим нагрузкам ИИ, вариант от Intel смотрится более предпочтительным.
Intel находится не в самом лучшем положении, если смотреть на текущее изменение рынка. Конечно, покупатели и центры обработки данных, которые приобретали Intel продолжат также покупать данные процессоры, но больший интерес представляют основные инвесторы.
Сможет ли новая архитектура Arrow Lake вернуть успех Intel? Посмотрим после выхода процессоров в продажу и многочисленных тестов в различных сценариях.