История развития десктопных процессоров Intel

История учит нас, что за большими свершениями часто стоят маленькие люди. Пользуясь интернетом, сложно было представить, что идея его зародилась у одного человека. А ещё сложней понять, что персональный компьютер ещё недавно был размером с комнату и даже не одну. И только спустя десятилетия, пройдя череду ошибок и неудач, мы получили одно из величайших достижений человечества - микропроцессор.

Данный материал будет посвящён пути одной из компании, чьи процессоры по сей день радуют своих покупателей - INTEL.

Глава 1. Начало

Человечество испокон веков пыталось облегчить себе труд, особенно в области вычислений, где нельзя было воспользоваться грубой силой и требовался особый подход. Начиная с палочек “Непера”, логарифмической линейки и арифмометра, механические вычислительные машины стали вытесняться более современными компьютерами на электровакуумных лампах, но всё изменилось с изобретением транзистора.

«Вероломная восьмерка» - эпитет, с которого ещё в далёком 1968 году и началась долгая история компании «Intel». Восемь сотрудников, а по существу инженеров, работающих с 1957 года в компании «Fairchild semiconductor» с кремниевыми транзисторами, решили уйти, а после основать свою собственную компанию. Хотя сразу после образования компания и называлась «NM Electroronics», прижиться названию не удалась. За привычное нам сокращение стоит поблагодарить Гордома Мура - одного из восьми основателей, который предложил использовать название «Integral Electronics», а после сокращения привычное нам «Intel».

Вскоре в команду добавился новый член - Энди Гроув, также бывший работник «Fairchild», разработчик, известный благодаря появлению метода OKR, используемого в менеджменте для управления проектами. Компании не хватало денег, поэтому для получения кредита был написан бизнес-план размером всего в один печатный лист, который в дальнейшем и помог получить начальный капитал. Успех больших корпораций всегда начинается с малого. 


В первую очередь Гордон Эрл Мур известен как основатель корпорации "Intel", а также как "создатель" закона, названного в свою же честь. В 1965 году был опубликован первоначальный вариант “закона Мура”, который гласил, что количество транзисторов в кристалле микропроцессора будет удваиваться каждый год. Но уже в 1967 увеличил продолжительно его на каждые два года. Но и это был не последний вариант, далее он сократил его до 18 месяцев. Хотя в реальности развитие пошло по другому пути и в 2007 году Мур сообщил о невозможности его исполнений, что не помешало данному закону стать знаковым.

Работа закипела. Но началась она не с процессоров, а с полупроводниковой памяти, которая на то время была слишком дорогой. Разработчики массово пользовались дешевой памятью на магнитных сердечниках. Тогда же Роберт Нойс сказал: «Нам нужно снизить стоимость в сто раз и этим завоевать рынок». Этому и суждено было сбыться. Компания стала расти и уже насчитывала более ста сотрудников. Успех в данном направление был замечен японским производителем калькуляторов «Busicom», сделавшим заказ на изготовление микросхем. И в 1971 году свет увидела первая 4-хбитная микросхема "Intel" 4004, права на которую оставались у заказчика. Поняв что за этим будущее, компания решила выкупить их и заплатила огромные по тем временам деньги. В 1978 году был выпущен уже 16-битный микропроцессор со знакомой нам архитектурой x86, а в 1989 году был представлен "Intel" 80486, ставший первым процессором, который оборудован модулем для операций с плавающей точкой. На то время число сотрудников уже насчитывало более 15000 человек.

Для общего развития изучим строение материнской платы персонального компьютера тех времён. Это была печатная плата с набором микросхем, что в совокупности называют набором системной логики или чипсетом. Центральное место занимал процессорный сокет, с которым связь осуществлялась посредством системной шины (FSB). К ней же был подключен генератор тактовых импульсов, формирующий заданную частоту. Сам же чипсет представлял собой северный и южный мост, соединенный внутренней шиной. Первый из них служил для связи с видеокартой посредством высокоскоростной шины PCI-Express (в прошлом AGP) и слотами оперативной памяти. С южного моста была связана шина PCI, звуковой контроллер, сетевая карта и последовательный интерфейс. Так же к нему посредством шины LPC подключалась микросхема BIOS, хранившая набор микропрограмм для работы с аппаратурой компьютера, его устройствами и I/O controller hub (ICH) для работы периферийных устройств. Впоследствии северный мост и генератор тактовых импульсов переехали в процессор, а роль южного моста стал исполнять Platform Controller Hub.

Глава 2. Реклама - двигатель прогресса

Шёл 1993 год, стоимость процессора настолько снизилась, что персональный компьютер уже не казался роскошью. Вливание больших денег в программу "Intel Inside”, существующей и в наши дни, позволило добиться известности среди простых пользователей, а реклама стала появляться на телеэкране. Синий цвет букв на белом фоне с тех пор стал визитной карточкой компании. Но разработка не прекращалась. Появление линейки Pentium было омрачено аппаратной ошибкой, из-за которой пришлось поменять все бракованные процессоры на новые. Зато данная линейка была на основе новой суперскалярной архитектуры, возможностью которой стало выполнение нескольких инструкций за такт, что увеличивало производительность до пяти раз.

Следующим процессором стал Intel Pentium Pro P6, который запомнился появлением кэш памяти L2, расположенной на отдельном кристалле. Экспериментируя, компания выпускает Pentium II - новый вид процессоров с отдельным слотом, куда вставлялся кэш L2. Наконец в 1999 году компания выпускает Intel Pentium III. Из его особенностей можно выделить частоту до 1133 МГц (это был первый процессор, перешагнувший планку 1 ГГц), а также добавление набора инструкций SSE. Следом выходит Pentium 4, где была опробована технология Hyper-Threading, позволяющая одному ядру исполнять два потока данных. Она хоть и позволяла ускорить обработку данных, но работала в программах, которые были написаны под эту способность и оказалась почти бесполезной для простых пользователей.

Следующим этапом развития стал 2003, когда в процессоры добавляются наборы команд x86-64. Из-за трудностей их создания было решено лицензировать уже готовые 64-битные расширения команд, разработанные AMD. До этого момента процессоры для массового пользования были одноядерные, что ограничивало их производительность сложностью в наращивании частот. Поэтому в 2005 году с конвейеров сходит Intel Pentium D, прозванный в народе двухъядерным монстром из-за горячего нрава (очень горячий) и получивший два кристалла на одной подложке и 90-нм техпроцесс.

Глава 3. Тик-так, тик-так

На следующий 2006 год “Intel” представила стратегию «Тик-так», которая заключалась в делении разработки процессоров на две стадии. «Тик» означал уменьшение технологического процесса на текущий архитектуре, а «так» - выпуск новой архитектуры на прежнем техпроцессе.

Также была представлена архитектура “Intel Core" восьмого поколения процессоров, в котором уже два ядра смогли уместить на одном кристалле. Техпроцесс при этом был уже 65-нм, и компания сделала ставку на эффективность и увеличение ядер. На следующий год выходит уже четырехъядерный Core 2 Quad с увеличенным L2 кешем до 8 Мб. В 2008 выпущена новая архитектура Intel Nehalem уже на 45-нм, которая пусть и основана на прошлой, но имеет значительные изменения. Среди них - встроенный контроллер на 2 или 3 канала DDR3 памяти, добавление L3 кеша и видеоядра. Появилась последовательная шина Direct Media Interface (DMI) первого поколения, которая разработана собственными силами "Intel", позволяющая передавать данные со скоростью 1 Гб/с в обе стороны (но в реальности она была заметно ниже). Тогда же был представлен Platform Controller Hub ( PCH ) - набор микросхем, выполнявших роль южного моста, северный же с тех пор переехал в процессор. 

Глава 4. Народный успех

Следующим заметным шагом в истории стал выпуск новой микроархитектуры “Sandy Bridge” ("Так") уже на новом 32-нм технологическом процессе в 2011 году и сокета LGA 1155. Большим прогрессом стало увеличение до 20% роста IPC, что в купе с ростом частотного потенциала выливалось уже в 30-40% превосходства в разных задачах над “Nehalem”. Впервые появился L0 кеш, улучшена точность предсказателя переходов, введена поддержка AVX инструкций, а встроенное видеоядро получило технологию Quick Sync для ускорения видеообработки. Была представлена вторая версии шины DMI 2.0, служившая для соединения процессора с PCH микросхемой на скорости до 2 Гб/с в обе стороны. Интегрированный в процессор двухканальный контроллер памяти работал на частоте до 1333 МГц. Каждое ядро получило по 32 Кб первого, 256 Кб второго и до 8 Мб общего кэша третьего уровня.

Для требовательных пользователей компания выпустила серию процессоров под маркой Core i7, которые имели уже до 15 Мб L3 кэша и поддержку четырёх каналов памяти с частотой 1600 МГц. Теперь же процессоры могли разгонятся дополнительно сверх номинальных частот с помощью технологии Turbo Boost 2.0, которая отслеживала нагрузку и в зависимости от этого увеличивала частоту загруженных ядер. Тогда же появилось разделение на простых пользователей и энтузиастов, которые могли покупать особые версии с литерой “К”, имевшие разблокированный множитель, что позволяло с рабочих 3700 МГц на модели 2500К поднять до безумных на то время 5000 МГц при воздушном охлаждении. Такие возможности давала пайка теплораспредительной крышки к кристаллу, что в дальнейшем поменялось не в лучшую сторону. Просуществовав всего год, компания предложила на рынок улучшенную версию прежний архитектуры.

Глава 5. Закрепляй

В феврале 2012 года на рынке появляется “Ivy Bridge” (“Тик”) уже на 22-нм техпроцессе с применением новых трёхмерных FinFET-транзисторов, которые должны были снизить энергопотребление, но из-за снижения размера самого кристалла вызвало повышенный нагрев. Кроме этого значимых изменений архитектура не получила. Сокет при этом остался прежним, как и совместимость со всеми выпущенными ранее материнскими платами, требовалось только обновить BIOS, что порадовало покупателей. Кэш всех уровней остался прежним, а контроллер памяти стал поддерживать режим 1600 МГц, что положительно сказалось на производительности. Появилась поддержка PCI Express 2.0, удвоившая пропускную способность линии. Встроенное ядро обновилось до третьего поколения Quick Sync, ставшее до 70% быстрее, чем в Sandy Bridge.

Это давало увеличение производительности на 2-5% и до 12% в криптографических приложениях относительно все того же Sandy Bridge. Но главный недостаток пришёл откуда не ждали. Ради экономии было решено отказаться от бесфлюсовой пайки и перейти  на копеечную термопасту, которая еще долго оставалась под крышками процессоров “Интел”. Частота в бусте держалась на уровне 3.9 ГГц по всем ядрам. Разгон же процессоров с разблокированным множителем теперь стал более приземлённым и получение 4500-4600 МГц было уже успехом. Но даже более низкие частоты не могли компенсировать горячий нрав, что выливалось покупкой более дорогих систем охлаждения. 

В середине 2013 года выходит уже четвертое поколение “Intel Core” на архитектуре Haswell с использованием тех же транзисторов с трехмерным затвором. Техпроцесс не изменился и составил 22-нм, что было по плану разработки. Процессоры вышли на новый LGA 1150 сокет и принесли довольно значимые изменения. Среди них был полностью переработан дизайн кэша, улучшена выборка и ветка предсказаний, оптимизированы механизмы энергосбережения, а также добавлен набор инструкций AVX2. Контроллер памяти остался прежним и поддерживал два канала с частотой 1600 МГц. Но главной особенностью стало размещение на кристалле регулятора напряжения, что по мнению компании должно было в лучшую сторону отразится на энергопотреблении. Все эти изменения на бумаге должны были ускорить производительность до 30%, но по факту выливалось во все те же 2-5%. Одним из факторов столь низких результатов стал доставшийся по наследству от “Ivy Bridge” декодер x86-кода. Частотный потенциал тоже не изменился и держался на уровне 3.9 ГГц в турбобусте без ручного разгона.

Беда пришла откуда не ждали. Трудности перехода на новый техпроцесс вынудили компанию на следующий год выпустить по второму кругу прошлую линейку “Haswell Refresh”. Суть изменений полностью отражает название, ничего нового кроме увеличения на 100-200 МГц она не принесла. Сокет оставался прежним и для работы могло требоваться только обновление BIOS. Также была представлена топовая линейка “Devil’s Canyon” процессоров, имевших более высокие частотные показатели и державших частоту в бусте до 4.4 ГГц и пару новых чипсетов, основной сутью которых была поддержка следующего поколения.

Глава 6. Переходные трудности

Испытывая трудности с переходом на 14-нм техпроцесс, компания выпускает пятое поколение прцессоров “Broadwell”. Домашний сегмент компьютеров получает их в 2015 году, хотя мобильные версии вышли годом ранее. Сокет хоть и остался прежним, но для работы требовались материнские платы на чипсетах H97 и Z97, получившие улучшенную систему питания. Самым заметным изменением стал четвертый уровень L4 кэша на отдельном кристалле, который имел 128 Мб и делился между процессором и графическим ядром. Его пропускная способность могла достигать 102 Гб/с при 256-битной шине, что должно было положительно сказаться при обработке больших баз данных, но при этом L3 кэш пришлось урезать с 8 до 6 Мб, хотя каких-то заметных ухудшений это не принесло. Сама же архитектура получила увеличенное окно планировщика, скорость операций умножения и деления также возросла. Все это принесло до 5% повышения производительности по сравнению с Haswell на одной частоте. Хотя частота - это болезненная тема данного поколения, ведь теперь даже в турборежиме она не превышала 3.7 ГГц, а при ручном разгоне предел уже был 4.2 ГГц.

Спустя всего три месяца в том же 2015 году выходит уже шестое поколение Skylake на новом LGA1151 сокете, сохранившем 14-нм технологический процесс. Сама же архитектура подверглась глубоким изменениям и получила увеличенный внутренний буфер, был усовершенствован блок предсказаний переходов, скорость L2 и L3 кэша выросла при снижениях задержки, объем его при этом остался прежним , а также скорость кольцевой шины, связывающей процессорные ядра, была увеличена вдвое.

Теперь процессоры работали с новой DDR4 памятью с заявленной частотой 2133 МГц, хотя ещё и сохранялась возможность использования DDR3 памяти, но ограничивало её напряжение 1.35 V, так как более высокое могло повредить встроенный контроллер памяти. Частота подросла и авторазгон держал уже 4.2 ГГц, хотя это и было меньше, чем в линейке “Devil’s Canyon”. Шина DMI получила версию 3.0, что принесло почти двукратное увеличение производительности до 3.9 Гб/с в обоих направлениях. Выросла и PCI Express 3.0, также получившая двухкратное увеличение скорости, при этом сохранившая совместимость с предыдущими версиями. Серьезные изменения позволили ускорить Skylake до 8% по сравнению с поколением Haswell на такт. Надо отметить, что небольшая часть процессоров имела аппаратную ошибку, приводящую к зависанию при сложных вычислениях, но оперативно была исправлена выпуском обновления микрокода BIOS.

Самое интересное заключалось в том, что на платформе 1151 официально была возвращена возможность изменения тактовой частоты генератора, о чем только можно было мечтать с 2011 года, когда разгон процессоров без индекса “К” был невозможен. Теперь любой процессор можно было подвергнуть разгону, даже если изначально для этого он не подходил. Хотя по началу “Intel” и заблокировала данную способность, но производители материнских плат быстро выпустили прошивки, разблокировавшие эту технологию для всех. Как мы знаем, частота процессора строится из умножения двух параметров: множителя и базовой частоты (BCLK). В прошлых поколениях эта частота была привязана ко многим другим шинам системы, что делало её нестабильной даже при увеличении на 2-3 такта. В “Skylake” инженеры отвязали её, оставив только подвязанными ядра, кэш и встроенную графику, что позволило добиться стабильности, хотя и не без минусов. Во-первых, перестала отслеживаться температура ядер и все функции энергосбережений, также перестали работать технологии разгона. Под раздачу попадет и графическое ядро с невозможностью установить драйвера. И не столь существенные для геймеров AVX/AVX2 инструкции начинают работать в полсилы. Теперь даже самый дешёвый процессор можно было разогнать до 4.5 ГГц при хорошей системе охлаждения.

Глава 7. Перевыпускай

Выход следующего поколения оказался не таким радужным для компании. Испытывая сложности с переходом на более низкий 10-нм техпроцесс и застой у конкурентов, было решено отказаться от текущей системы разработки “тик-так”. В 2017 году выходит Kaby Lake на том же 14+ нм техпроцессе - плюс в названии показывает обновление, направленное на внутреннюю компоновку, включая увеличение рёбер транзисторов и расстояния между ними. Хотя это и уменьшало токи утечки, частота выросла на пару сотен мегагерц и в бусте держалась на отметке 4.5 Ггц, а при ручном разгоне -  все 4.8 ГГц. Хотя контроллер памяти и стал поддерживать уже частоту 2400 МГц, сами же процессоры обошлись без серьёзных изменений и предлагали ту же производительность на такт.

Для энтузиастов ещё оставался разгон по шине, хотя и давал куда меньшие частоты. И пока основная масса процессоров "Intel" для домашнего сегмента была четырехъядерная, рынок уже стал наполняться шести- и более ядерными процессорами. Следуя новым тенденциям, компания делает первые шаги в этом направлении.

Уже зимой того же 2017 года появляется “Coffee Lake” - восьмое поколение процессоров, работающих на новом Z370 чипсете. Оправданием перехода стало увеличение требований для системы питания. Хотя сокет и оставался прежним, но в народе получил обозначение 1151v2 из-за несовместимости с прошлой линейкой процессоров для 1151. Традиционно техпроцесс остаётся без изменений и это всё те же 14++нм. Второй плюс появился за счет оптимизации полупроводников кристалла, что дало улучшение тепловых и частотных показателей, хотя технологический процесс оставался прежним. Контроллер памяти стал работать уже на DDR4-2667 частоте. 

Теперь для массового сегмента компания представляет шестиядерные процессоры, работающие на частоте 4.7 ГГц в бусте, а с разгоном вручную - все 5.0 ГГц. Увеличение коснулось и L3 кэша, которого стало на 2 Мб больше за каждое ядро и в сумме давало 12 Мб. Дополнительные ядра заметно ускорили производительность, хотя на такт она осталась прежней со времён “Skylake”. Заметным прогрессом стало увеличение количества ядер при том же тепловом пакете. Для ценителей была выпущена модель 8086K, которая уже из коробки работала на частоте 5.0 Ггц, что делало её первым процессором, который достиг таких высот без ручного разгона. 

Всё шло замечательно, пока в 2018 не грянул гром. Специалисты по безопасности из нескольких IT компаний обнаружили, что процессоры "Intel" имеют аппаратную уязвимость, которая позволяла злоумышленникам получить несанкционированный доступ на чтение памяти, используемой ядром операционной системы пользователя, названную “Meltdown”. Как мы знаем, беда не приходит одна, и тут же ими была представлена “Spectre” уязвимость, которой теперь была не нужна память ядра, она сама с помощью ветвления предсказаний читала данные атакуемого приложения, через которое получала доступ к произвольным местам памяти других приложений или проникала из одного приложения в другое, обходя изоляцию памяти между ними. Также имелась возможность с помощью JavaScript-программы получить доступ к памяти браузера, что позволяло получить данные, сохранённые в нём.

Для борьбы с данными эксплойтами на операционные системы выходят обновления, частично убирающие лазейки в них, а для программного обеспечения - новый компилятор с заменой уязвимого кода. Сам же "Intel" выпускает обновление BIOS, направленное на исправление уязвимости и сообщает, что следующая линейка процессоров будет полностью лишена их.

Хотя данные меры и были направлены на исправления ситуации, результат оказался не таким радужным. Были представлены публичные тесты, где скорость обработки после данных исправлений падала до 15%, а некоторых случаях приходилось отключать hyper-threading, что почти в половину замедляло процессор. Из хороших новостей стало известно, что игровая производительность почти не пострадала из-за этого.

Под конец 2018 года был представлен “Coffee Lake Refresh” - третья вариация на тему архитектуры Skylake. Хотя глобальных изменений она и не получила, но прибавила в частотах. А самое важное стало возвращение бесфлюсового припоя под теплораспределительную крышку. И хотя это было сделано только для процессоров с индексом “К”, общественность приняла данную инициативу на ура. Это должно было уменьшить температуру и поднять разгонный потенциал на том же 14++нм техпроцессе. Теперь уже флагманский чип обладал не шестью, а восемью ядрами, способными работать на частоте 5.0 ГГц. Для любителей разгона хороших новостей было мало, дальнейший рост требовал повышения напряжения, приводящего к перегреву и огромному энергопотреблению, что делало данный процесс нецелесообразным.

Глава.8 Наши дни

Спустя два года в 2020 году выходит линейка “Comet Lake”. Это последнее поколение на 14++нм техпроцессе, которое уже изрядно надоело и в последнее время предлагало только увеличение численности ядер без заметных улучшений архитектуры. Производительность на такт уже третье поколение не менялось и весь прогресс был в наращивание ядер. Самым важным изменением стало появление Hyper-Threading почти на всех процессорах.

Топовый сегмент получил новую систему авторазгона Thermal Velocity Boost (TVB), которая ещё больше, чем Turbo Boost 3.0 повышала частоту процессора, если температура его не превышала 70 градусов. Теперь обладатели более дорогих систем охлаждения получали не только низкую температуру работы, но и более высокую частоту, а это - немалые 5.3 ГГц, которые процессор может удерживать при работе одного ядра или 4.9 ГГц для всех. Частоту памяти установили на уровне DDR4-2933 для i9/i7, остальные довольствовались только 2666, но и это лучше чем 2400 для i3, как было в прошлом поколении. Кэш L3 остался 2 Мб на ядро и достигал 20 Мб для десятиядерных процессоров. Для сдерживания роста температур компания продолжила использование припоя и увеличила толщину теплораспределительной крышки. Любителям разгона дали возможность индивидуального отключения Hyper-Threading для каждого из ядер. Оверклокерам предложили воспользоваться страховкой, дающей право один раз поменять процессор со свободным множителем, который вышел из строя, доплатив всего 20$ к его стоимости.

Глава без цифры

Подводя итог написанному, можно заметить как бурный технологический рост в начале сменился застоем последнего времени. Быстрая смена техпроцессов переросла в оптимизацию и наращивание многоядерности без серьёзных изменений архитектуры. Сохраняя лидерство многие годы, компания переставала вносить какие-либо серьёзные изменения и занималась перевыпуском процессоров под новыми названиями, начиная с долгоживущих сокетов, как например 775, который на протяжение пяти лет (с 2004 по 2008 год) оставался актуальным и не требовал смены материнской платы. С 2009 года все последующие сокеты были актуальны уже не более трех лет. Рассматривая промежуток между 2011 годом архитектуры Sandy Bridge и 2020 годом на Comet Lake, можно заметить, что увеличение производительности на такт выросло только до 18% в приложениях, не использующих технологии AVX, и только наращивание количества ядер дало ощутимый буст, которой без этого можно было и не заметить. Предложение повторного выпуска процессоров без заметных изменений, но требующих замену сокета и покупки новых материнских плат, только раздражало и вызывало недоумения покупателей. Сложности с уменьшением технологического процесса вынуждают компанию долгие годы оставаться на 14-нм литографии. Замена галлиевого припоя на более дешевую термопасту, вынудила энтузиастов заниматься скальпированием процессоров для замены термоинтерфейса на жидкий металл, позволяя отыграть не один десяток градусов. Это показывало хороший потанцевал процессоров, который был перечеркнут ради копеечной экономии. Нельзя забыть и скандал с уязвимостями, когда в экстренной мере пришлось закрывать дыры, снижая при этом производительность. Хотя она и падала не столь существенно, но всё же это отражалась на репутации. И теперь, спустя многие годы, компания стала исправлять допущенные ошибки прежних лет. Так, под теплораспределительную крышку вернулся припой, а технология Hyper-Threading появилась на всей линейке процессоров. Уже следующее поколение обещают перевести на новый 10-нм техпроцесс с обновлением архитектуры, что так долго ждали пользователи. Всё это позволяет с оптимизмом смотреть на будущее компания. Мне только остаётся пожелать ей успехов на поприще высоких технологий.