Основные эксплуатационно-технические характеристики современных процессорных систем


Оценка любой технической системы осуществляется на основе анализа ее эксплуатационно-технических характеристик и параметров.

К основным эксплуатационно-техническим характеристикам процессорных систем относятся следующие.

Микроархитектура ядра процессорной системы. Как было определено на предыдущей лекции под архитектурой вычислительной машины (ядра процессорной системы) подразумевается концептуальная структура ядра процессорной системы, определяющая проведение обработки информации и включающая методы преобразования информации в данные и принцип взаимодействия технических средств и программного обеспечения.

На сегодняшний день будем рассматривать процессорные системы наиболее широко представленные на современном рынке. Это процессоры, выпускаемые фирмой Intel. Стратегия разработки микропроцессоров Intel до 2016 года подразумевала чередование стадий миниатюризации технологического процесса(«тик») и выпуска процессоров на новой микроархитектуре с уже существующим техпроцессом («так»). Однако проблемы с переходом на технологический процесс 10 нм вынудили компанию Intel изменить свою стратегию «Тик-Так» на стратегию «Тик-Так-Так» (рисунок 1).

Рисунок 1 – Стратегия компании Intel

В настоящее время можно сказать, что взятые на себя обязательства компания Intel в этом году выполнить уже не смогла. Здесь существенную роль сыграли сразу два фактора: это серьезные производственные проблемы, неминуемо возникающие при внедрении все более «тонких» технологических процессов, так и возросшая сложность микроархитектуры самих современных центральных микропроцессорных элементов

Кроме того в конце 2016 года проявился существенный недостаток процессоров Skylake связанный с толщиной основания, на котором расположен кристалл процессора. Толщина этого основания существенно меньше, чем у предыдущих архитектур. В связи с чем в процессе работы основание начинает нагреваться сильнее и на кроях происходит его механическая деформация, приводящая к снижению теплоотвода. Процессор начинает перегреваться и отключаться в процессе работы.

Технические преимущества процессоров

Технологический процесс. Эта характеристика показывает размер наименьшего отдельного элемента процессора – транзистора. Уменьшение размера одного транзистора приводит к увеличению их количества на кристалле процессора, а, следовательно, и к повышению разрядности обрабатываемых слов. Последнее должно обеспечить увеличение общей производительности системы. Как уже было сказано ранее в настоящее время самые производительные процессоры выпускаются по 14 нм процессу. Динамика развития технологического процесса представлена на рисунке 2.

Рисунок 2 – Динамика развития технологического процесса

Однако постоянное уменьшение размера транзистора приводит к некоторым затруднениям. Так толщина диэлектрика затвора полевого транзистора процессора становится такой тонкой, что не в состоянии удержать ток утечки. Для устранения этой проблемы вместо диоксида кремния стали применять так называемый изолятор higt-k изготовленный на основе гафния и обладающий высокой степенью диэлектрической проницаемости. При использовании диэлектрика high-k получилось достичь увеличения полевого эффекта транзистора и уменьшить слой диэлектрика, вместе с уменьшением тока утечки через затвор.

Вместе с уменьшением транзистора сокращаются и размеры кристалла, в результате чего отводить тепло становится труднее, так как поверхность рассеивания то же уменьшается.

Следует отметить и сложность структуры процессорной системы. Сложность кроме снижения надежности функционирования системы увеличивает количество проектных ошибок, а также сроки проектирования процессоров, даже при использовании современных средств автоматизации. Сложность процессорных кристаллов имеет следующую зависимость, чем больше транзисторов в процессоре, тем меньше выход годных кристаллов.

Для определения основных параметров процессора используют специальные утилиты. К одной из них относится бесплатная прикладная программа CPU-Z, предназначенная для отображения технической информации о персональном компьютере пользователя и работающая под операционной системой Windows.

Внешний вид заглавной страницы сайта изображен на рисунке 3.

Количество ядер. Самый главный элемент центрального процессора. Оно представляет собой часть процессора, способное выполнять один поток команд. Необходимость создания мультиядерных систем на одном кристалле во многом была обусловлена желанием обслуживать несколько потоков одновременно, что в априори обуславливало повышение быстродействия и производительности процессорной системы. Ядро по своей сути – аппаратная часть процессорной системы. Следовательно, их количество определяется заранее, а сами они изготавливаются в процессе производства центрального процессорного элемента. К основным достоинствам мультиядерных процессоров можно отнести:

- возможность распределения работы программ по нескольким ядрам;

- увеличение скорости работы программ;

- снижение энергопотребления, требуемого для работы одного ядра.

Современные центральные процессорные элементы имеют в своей структуре до 8 физических ядер.

Рисунок 3 – Внешний вид сайта, распространяющего утилиту CPU-Z

Однако погоня за мультиядерностью без ожидания выхода в свет кристаллов с требуемым количеством ядер привела к появлению и широкому использованию технологии сверхпоточной обработки данных Hyper Threading Technology (HTT). Эта технология позволяет каждому ядру процессора выполнять две задачи одновременно, по сути, делая из одного реального ядра два виртуальных (рисунок 4). Это возможно из-за того, что в таких ядрах сохраняется состояние сразу двух потоков, так как у ядра есть свой набор регистров, свой счетчик команд и свой блок работы с прерываниями для каждого потока. В результате, операционная система видит такое ядро, как два отдельных ядра, и будет с ними работать так же, как работала бы с двуядерным процессором.

В связи с этим, в графе количество ядер для всех процессоров указываю два значения. Первое, при отключенной технологии Hyper Threading – то есть реальное количество физических ядер и второе – с учетом их виртуального увеличения. Например, 8/16.

 

В качестве недостатков многоядерных процессоров можно отметить следующие:

- высокая себестоимость производства мультиядерных процессоров;

- необходимость постоянного использования специальных программных модулей, обеспечивающих раздельное обращение к оперативной памяти;

- увеличенное энергопотребление всего процессорного элемента;

- наличие мощной системы охлаждения центрального процессорного элемента.

Тактовая частота.Под тактовой частотой процессора понимается параметр, который напрямую связан с количеством вычислений, производимых в секунду. Различают две разновидности тактовой частоты: внутреннюю и внешнюю. Внешняя тактовая частота обеспечивает обмен данными между оперативной памятью и процессором. Внешнюю тактовую частоту еще называют частотой шины данных (Front Side Bus или FSB). Внутренняя тактовая частота определяет скорость вычислительного процесса внутри процессора. Обе эти частоты связаны между собой параметром, который носит название коэффициент умножения. Так для определения тактовой частоты процессора необходимо тактовую частоту шины умножить на коэффициент умножения. Например, тактовая частота шины равна 150 МГц, коэффициент умножения составляет 20 единиц. Отсюда частота процессора равна 3 ГГц. В большинстве случаев коэффициент умножения является заблокированным на уровне ядра и не поддается изменению.

 

Рисунок 4 – Алгоритм работы технологии Hyper Threading

Долгое время повышение производительности процессоров происходило за счет последовательного увеличения тактовой частоты (около 80% производительности процессора определяла тактовая частота). Однако безгранично это значение увеличивать невозможно из-за ограничений, которые накладывают физические принципы функционирования транзисторов. В частности:

- увеличение тактовой частоты при одновременном уменьшении размеров транзисторов приводит к увеличению тока утечки, что приводит к повышению потребляемой мощности и увеличению выделения тепла;

- повышение потребляемой мощности приводит к возникновению электромагнитных помех, которые существенно влияют на работу шины данных, что приводит к росту ошибок и как следствие к снижению объема передаваемых данных;

- преимущества увеличения тактовой частоты частично сводятся на нет из-за задержек при обращении к памяти, так как время доступа к памяти не соответствует увеличившемся значениям частоты.

Для снижения потребляемой центральным процессорным элементом мощности при увеличении количества физических ядер уменьшают тактовую частоту процессора. Например, для четырехядерного процессора тактовая частота лежала в пределах 3,4 – 3,8 ГГц, а для восьмиядерного – от 3 до 3,5 ГГц.

В настоящее время все современные процессоры имеют такую функцию как авторазгон. В зависимости от производителя она называется по-разному: Turbo Boost (Intel) или Turbo Core (AMD). В соответствии с этой технологией частота процессора может динамически изменяться, причем автоматически без вмешательства пользователя. Необходимость применения такой технологии обусловлена тем, что многоядерность современных процессоров стала нормой, а вот многопоточность современных приложений, к сожалению, пока нет. Операционная система, видя, что одно из ядер процессора загружено значительно сильнее остальных, самостоятельно увеличивает частоту этого ядра, при этом стараясь оставить процессор в пределах его родного термопакета (рисунок 5).

Рисунок 5 – Динамическое изменение коэффициента умножения

Термопакет (TDP, Thermal Design Power). Это величина тепловой мощности, выделяемая на процессоре во время его работы. Чем выше энергопотребление процессора, тем больше он выделяет тепла, которое может привести к перегреву и выходу его из строя. Для снижения тепловой нагрузки, выделяемой на кристалле процессора, используют различные способы и средства от технических решений и до специальных жидкостных систем охлаждения.

Кеш память. Несмотря на все технологии и уловки разработчиков, производительность процессора все-таки напрямую зависит от скорости выборки команд и данных из памяти. И даже, если процессор имеет сбалансированный и продуманный конвейер, использует технологию Hyper Threading и так далее, но не обеспечивает должную скорость выборки данных и команд из памяти, то, в результате, общая производительность процессора не оправдает ожиданий.

Поэтому один из важнейших параметров устройства процессора – это кэш-память, призванная сократить время выборки команд и данных из основной оперативной памяти и выполняющая роль промежуточного буфера с быстрым доступом между процессором и основной оперативной памятью.

Кэш-память строится на базе дорогой SRAM-памяти (Static random access memory), обеспечивающей доступ к ячейкам памяти гораздо более быстрый, чем к ячейкам DRAM-памяти (Dynamic random access memory), на базе которой построена оперативная память. К тому же SRAM-память не требует постоянной регенерации, что так же увеличивает ее быстродействие. Под регенерацией памяти понимается периодическое обновление информации, хранящейся в оперативной памяти. Без реализации процесса регенерации информация в оперативной памяти будет потеряна.

Кэш-память делится на несколько уровней. В современных процессорах, обычно, бывает три уровня, а в некоторых топовых моделях процессоров иногда встречается и четыре уровня кэш-памяти.

Кэш-память более высокого уровня всегда больше по размеру и медленнее кэш-памяти более низкого уровня (рисунок 6).

Самая быстрая и самая маленькая кэш-память – это кэш-память первого уровня. Она обычно работает на частоте процессора, имеет объем несколько десятков килобайт и располагается в непосредственной близости от блоков выборки данных и команд. При этом она может быть единой (Принстонская архитектура) или разделяться на две части (Гарвардская архитектура): на память команд и память данных. В большинстве современных процессоров используют разделенную кэш-память первого уровня, так как это позволяет одновременно с выборкой команд осуществлять выборку данных, что крайне важно для работы конвейера.

Кэш-память второго уровня – более медленная (время доступа, в среднем, 8-20 тактов процессора), но зато имеет объем несколько сотен килобайт.

Кэш-память третьего уровня – еще медленнее, но имеет сравнительно большой объем. Встречаются процессоры с кэш-памятью третьего уровня больше 24 Мб.

В многоядерных процессорах, обычно, последний уровень кэш-памяти делают общим для всех ядер. Причем, в зависимости от нагрузки на ядра, может динамически изменяться отведенный ядру объем кэш-памяти последнего уровня. Если ядро имеет высокую нагрузку, то ему выделяется больше кэш-памяти, за счет уменьшения объема кэш-памяти для менее нагруженных ядер. Не все процессоры обладают такой возможностью, а только поддерживающие технологию Smart Cache.

Рисунок 6 – Технические характеристики кеш-памяти процессоров Intel i7

5.5 Состав и принцип функционирования мультиядерных процессоров фирмы Intel

Упрощенная схема современного многоядерного процессора представлена на рисунке 7.

Рисунок 7 – Упрощенная структурная схема многоядерного процессора

Рассмотрение устройства процессора начнем с его основной части – ядра.

Ядро процессора – это его основная часть, содержащая все функциональные блоки и осуществляющая выполнение всех логических и арифметических операций. Как видно из рисунка 7 ядро процессора состоит из нескольких функциональных блоков.

Блок выборки инструкций осуществляет считывание инструкций по адресу, указанному в счетчике команд. Количество считываемых инструкций обусловлено количеством блоков декодирования. Для того чтобы блок выборки инструкций работал оптимально, в ядре процессора имеется предсказатель переходов.

Предсказатель переходов пытается определить, какая последовательность команд будет выполняться после совершения перехода. Это необходимо, чтобы после условного перехода максимально нагрузить конвейер ядра процессора.

Блоки декодирования инструкций занимаются декодированием инструкций, то есть определяют, что нужно сделать процессору и какие дополнительные данные нужны для выполнения инструкций. Задача эта достаточно сложная, потому что часто отдельные сложные команды приходится заменять микрокодом – серией простых инструкций, в совокупности выполняющих то же действие, что и одна сложная команда. Набор микрокода прошит в постоянном запоминающем устройстве, встроенном в процессоре. К тому же микрокод упрощает разработку процессора, так как отпадает надобность в создании сложноустроенных блоках ядра при выполнении отдельных команд, да и исправить микрокод гораздо проще, чем устранить ошибку в функционировании блока.

Блоки выборки данных осуществляют выборку данных из КЭШ-памяти или оперативного запоминающего устройства, необходимых для выполнения таких инструкций. Обычно, каждое процессорное ядро содержит несколько блоков выборки данных.

Управляющий блокна основе декодированных инструкций управляет работой блоков выполнения инструкций, распределяет нагрузку между ними, обеспечивает своевременное и верное выполнение инструкций. Это один из наиболее важных блоков ядра процессора.

Блоки выполнения инструкций включают в себя несколько разнотипных блоков:

ALU (Arithmetic Logic Unit) – арифметическое логическое устройство.

FPU (Floating Point Unit) – устройство для выполнения операций с плавающей запятой.

Блоки для обработки расширения наборов инструкций. Дополнительные инструкции используются для ускорения обработки потоков данных, шифрования и дешифрования, кодирования видео и так далее. Для этого в ядро процессора вводят дополнительные регистры и наборы логики. На данный момент наиболее популярными расширениями наборов инструкций являются:

MMX (Multimedia Extensions) – набор инструкций разработанный компанией Intel, для ускорения кодирования и декодирования потоковых аудио и видео-данных.

SSE (Streaming SIMD Extension, (Single Instruction) Multiple Data stream processing) – набор инструкций разработанных компанией Intel, для выполнения одной и той же последовательности операции над многими данными с распараллеливанием вычислительного процесса. Эта команда выбирается из памяти центральным контроллером SIMD-системы, но работает она над разными элементами данных (чаще всего элементами массива). Для этого каждый процессор имеет ассоциированную с ним память для хранения массивов однородных данных. В эту категорию попадают, в частности, векторные процессоры. Термин введён американским ученым Майклом Флинном.

Наборы команд постоянно совершенствуются, и в настоящий момент их уже известно следующее количество: SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2.

ATA (Application Targeted Accelerator) – набор инструкций, разработанный компанией Intel, для ускорения работы специализированного программного обеспечения и снижения энергопотребления при работе с такими программами. Эти инструкции могут использоваться, например, при расчете контрольных сумм или поиска данных;

3DNow – набор инструкций, разработанный компанией AMD, для расширения возможностей набора инструкций MMX;

AES (Advanced Encryption Standard) – набор инструкций, разработанный компанией Intel, для ускорения работы приложений, использующих шифрование данных по одноименному алгоритму.



Дата добавления: 2018-11-26; просмотров: 1696;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.016 сек.