Потоки, симметричная многопроцессорная обработка и микроядра


 

В этой главе изучаются концепции современных операционных систем, связанные с управлением процессами. Мы узнаем, что концепция процессов на самом деле сложнее и тоньше, чем можно себе представить исходя из материа­ла предшествующих глав. По сути, эта концепция объединяет в себе две отдельные, потенциально независимые концепции, одна из которых имеет отношение к владе­нию ресурсами, а другая — к выполнению процессов. В некоторых операционных системах это различие привело к появлению конструкции, известной под названием поток (thread). После рассмотрения потоков мы обратимся к изучению симметрич­ной многопроцессорности (symmetric multiprocessing — SMP). В системе с несколь­кими процессорами операционная система должна выполнять одновременное плани­рование выполнения на разных процессорах нескольких процессов. И наконец, мы ознакомим читателя с концепцией микроядра (microkernel), которое является эф­фективным средством структурирования операционной системы для управления процессами и решения других задач.

До сих пор концепцию процесса можно было охарактеризовать двумя параметрами.

• Владение ресурсами (resource ownership). Процесс включает виртуальное адресное пространство, в котором содержится образ процесса, и время от времени может владеть такими ресурсами, как основная память, каналы и устройства ввода-вывода, или файлы, или же получать контроль над ними.
Операционная система выполняет защитные функции, предотвращая неже­лательные взаимодействия процессов на почве владения ресурсами.

• Планирование/выполнение (scheduling/execution). Выполнение процесса осуществляется путем выполнения кода одной или нескольких программ; при этом выполнение процесса может чередоваться с выполнением других процессов. Таким образом, процесс имеет такие параметры, как состояние (выполняющийся процесс, готовый к выполнению процесс и т.д.) и теку­щий приоритет, в соответствии с которым операционная система осуществ­ляет его планирование и диспетчеризацию.

В большинстве операционных систем эти две характеристики являются сущностью процесса. Однако, немного подумав, читатель может убедиться, что они являются независимыми, и что операционная система может рассматривать их отдельно друг от друга. В некоторых операционных системах (в особенности в недавно разработанных) так и происходит. Чтобы различать две приведенные выше характеристики, единицу диспетчеризации обычно называют потоком (thread) или облегченным процессом (lightweight process), а единицу владения ресурсами — процессом (process) или заданием (task).1

1 Увы, последовательность в использовании терминологии не выдерживается даже в такой степени. В операционной системе OS/390, предназначенной для мейнфреймов IBM, концепции адресного пространства и задания примерно соответствуют концеп­циям процесса и потока, описанным в этом разделе. Кроме того, термин упрощенный процесс (lightweight process) используется в трех значениях: (1) он эквивалентен тер­мину поток (thread), (2) обозначает поток особого вида, известный как поток на уров­не ядра (kernel-level thread) или (3) (в операционной системе Solaris) элемент, отобра­жающий потоки на уровне пользователя в потоки на уровне ядра.

Многопоточность

 

Многопоточностью (multithreading) называется способность операционной сис­темы поддерживать в рамках одного процесса выполнение нескольких потоков. Тра­диционный подход, при котором каждый процесс представляет собой единый поток выполнения, называется однопоточным подходом. Две левые части рис. 4.1 иллюст­рируют однопоточные подходы. MS DOS является примером операционной системы, способной поддерживать не более одного однопоточного пользовательского процесса. Другие операционные системы, такие, как разнообразные разновидности UNIX, под­держивают процессы множества пользователей, но в каждом из этих процессов мо­жет содержаться только один поток. В правой половине рис. 4.1 представлены мно­гопоточные подходы. Примером системы, в которой один процесс может расщеп­ляться на несколько потоков, является среда выполнения Java. В этом разделе нас будет интересовать использование нескольких процессов, каждый из которых под­держивает выполнение нескольких потоков. Подобный подход принят в таких опе­рационных системах, как OS/2, Windows 2000 (W2K), Linux, Solaris, Mach, и ряде других. В этом разделе приведено общее описание многопоточного режима, а в по­следующих разделах будут подробно рассмотрены подходы, использующиеся в опе­рационных системах W2K, Solaris и Linux.

 

В многопоточной среде процесс определяется как структурная единица рас­пределения ресурсов, а также структурная единица защиты. С процессами свя­заны следующие элементы.

• Виртуальное адресное пространство, в котором содержится образ процесса.

• Защищенный доступ к процессорам, другим процессам (при обмене информацией между ними), файлам и ресурсам ввода-вывода (устройствам и каналам).

 

В рамках процесса могут находиться один или несколько потоков, каждый из которых обладает следующими характеристиками.

• Состояние выполнения потока (выполняющийся, готовый к выполнению и т.д.).

• Сохраненный контекст не выполняющегося потока; один из способов рас­смотрения потока — считать его независимым счетчиком команд, работающим в рамках процесса.

• Стек выполнения.

• Статическая память, выделяемая потоку для локальных переменных.

• Доступ к памяти и ресурсам процесса, которому этот поток принадлежит этот доступ разделяется всеми потоками данного процесса.

На рис. 4.2 продемонстрировано различие между потоками и процессами с точки зрения управления последними. В однопоточной модели процесса в его представление входит управляющий блок этого процесса и пользовательское адресное про­странство, а также стеки ядра и пользователя, с помощью которых осуществляются вызовы процедур и возвраты из них при выполнении процесса. Когда выполнение процесса прерывается, содержимое регистров процессора сохраняется в памяти. В многопоточной среде с каждым процессом тоже связаны управляющий блок и ад­ресное пространство, но теперь для каждого потока создаются свои отдельные стеки, а также свой управляющий блок, в котором содержатся значения регистров, при­оритет и другая информация о состоянии потока.

 

Таким образом, все потоки процесса разделяют между собой состояние и ресурсы этого процесса. Они находятся в одном и том же адресном пространстве и имеют доступ к одним и тем же данным. Если один поток изменяет в памяти какие-то данные, то другие потоки во время своего доступа к этим данным имеют возможность отследить эти изменения. Если один поток открывает файл с правом чтения, другие потоки данного процесса тоже могут читать из этого файла.

Перечислим основные преимущества использования потоков с точки зрения производительности.

1. Создание нового потока в уже существующем процессе занимает намного меньше времени, чем создание совершенно нового процесса. Исследования, проведенные разработчиками операционной системы Mach, показали, что скорость создания процессов по сравнению с такой же скоростью в UNIX-совместимых приложениях, в которых не используются потоки, возрастает в 10 раз [TEVA87].

2. Поток можно завершить намного быстрее, чем процесс.

3. Переключение потоков в рамках одного и того же процесса происходит намного быстрее.

4. При использовании потоков повышается эффективность обмена информацией между двумя выполняющимися программами. В большинстве операционных систем обмен между независимыми процессами происходит с участием ядра, в функции которого входит обеспечение защиты и механизма, необходимого для осуществления обмена. Однако благодаря тому, что различные потоки одного итого же процесса используют одну и ту же область памяти и одни и те же файлы, они могут обмениваться информацией без участия ядра.

Итак, если приложение или функцию нужно реализовать в виде набора взаимосвязанных модулей, намного эффективнее реализовать ее в виде набора потоков, чем в виде набора отдельных процессов.

Примером приложения, в котором можно удачно применить потоки, явля­ется файловый сервер. При получении каждого нового файлового запроса про­грамма управления файлами может порождать новый поток. Из-за того, что сер­веру приходится обрабатывать очень большое количество запросов, за короткий промежуток времени будут создаваться и удаляться множество потоков. Если такая серверная программа работает на многопроцессорной машине, то на раз­ных процессорах в рамках одного процесса могут одновременно выполняться не­сколько потоков. Кроме того, из-за того, что процессы или потоки файлового сервера должны совместно использовать данные из файлов, а следовательно, ко­ординировать свои действия, рациональнее использовать потоки и общую об­ласть памяти, а не процессы и обмен сообщениями.

Потоковая конструкция процесса полезна и на однопроцессорных машинах. Она помогает упростить структуру программы, выполняющей несколько логиче­ски различных функций.

В [LETW88] приводится четыре следующих примера использования потоков в однопользовательской многозадачной системе.

• Работа в приоритетном и фоновом режимах. В качестве примера можно привести программу электронных таблиц, в которой один из потоков может отвечать за отображение меню и считывать ввод пользователя, а другой — выполнять команды пользователя и обновлять таблицу. Такая схема часто увеличивает воспринимаемую пользователем скорость работы приложения, позволяя пользователю начать ввод следующей команды еще до завершения выполнения предыдущей.

• Асинхронная обработка. Элементы асинхронности в программе можно реализо­вать в виде потоков. Например, в качестве меры предосторожности на случай отключения электричества можно сделать так, чтобы текстовый редактор каждую минуту сбрасывал на диск содержимое буфера оперативного запоминающе­го устройства. Можно создать поток, единственной задачей которого будет создание резервной копии и который будет планировать свою работу непосредст­венно с помощью операционной системы. Это позволит обойтись без помещения в основную программу замысловатого кода, обеспечивающего проверку соблю­дения временного графика или координацию ввода и вывода.

• Скорость выполнения. Многопоточный процесс может производить вычисления с одной порцией данных, одновременно считывая с устройства ввода-вывода следующую порцию. В многопроцессорной системе несколько пото­ков одного и того же процесса могут выполняться одновременно.

• Модульная структура программы. Программы, осуществляющие разнооб­разные действия или выполняющие множество вводов из различных источ­ников и выводов в разные места назначения, легче разрабатывать и реализовывать с помощью потоков.

Планирование и диспетчеризация осуществляются на основе потоков; таким образом, большая часть информации о состоянии процесса, имеющей отношение к его выполнению, поддерживается в структурах данных на уровне потоков. Однако есть несколько действий, которые затрагивают все потоки процесса и которые операционная система должна поддерживать именно на этом уровне. Если процесс приостанавливается, то при этом предполагается, что его адресное пространство будет выгружено из основной памяти. Поскольку все потоки процесса используют одно и то же адресное пространство, все они должны одновременно перейти в состояние приостановленных. Соответственно прекращение процесса приводит к прекращению всех составляющих его потоков.



Дата добавления: 2016-06-05; просмотров: 1758;


Поиск по сайту:

Воспользовавшись поиском можно найти нужную информацию на сайте.

Поделитесь с друзьями:

Считаете данную информацию полезной, тогда расскажите друзьям в соц. сетях.
Poznayka.org - Познайка.Орг - 2016-2024 год. Материал предоставляется для ознакомительных и учебных целей.
Генерация страницы за: 0.011 сек.