Многопоточное параллельное программирование (547925), страница 2
Текст из файла (страница 2)
Библиотека POSIX Threads является частью нового единого стандартаспецификаций UNIX (Single UNIX Specifications Standard) и включена в набор стандартовIEEE, описывающих интерфейсы ОС для UNIX (IEEE Std. 1003.1-2001).За исключением параллелизма на уровне инструкций, единственным способом достиженияпараллелизма с помощью C++ является разбиение программы на потоки или процессы.Именно эти средства и предоставляет новый стандарт. Разработчик может использовать:•••библиотеку POSIX Threads (или Pthreads);POSIX-функцию spawn ();семейство функций exec ().Сторонние фирмы-изготовители придерживаются стандарта POSIX в реализациях, которыеименуются библиотеками потоков Pthread или POSIX. Библиотека Pthread содержит более 60функций, которые можно разделить на следующие категории.1.
Функции управления потоками.o Конфигурирование потоков.o Отмена потоков.o Стратегии планирования потоков.o Доступ к данным потоков.o Обработка сигналов.o Функции доступа к атрибутам потоков.o Конфигурирование атрибутов потоков.o Конфигурирование атрибутов, относящихся к стекам потоков.o Конфигурирование атрибутов, относящихся к стратегиям планированияпотоков.2. Функции управления мьютексами.o Конфигурирование мьютексов.o Управление приоритетами.o Функции доступа к атрибутам мьютексов.o Конфигурирование атрибутов мьютексов.o Конфигурирование атрибутов, относящихся к протоколам мьютексов.o Конфигурирование атрибутов, относящихся к управлению приоритетамимьютексов.3.
Функции управления условными переменными.o Конфигурирование условных переменных.o Функции доступа к атрибутам условных переменных.o Конфигурирование атрибутов условных переменных.o Функции совместного использования условных переменных.Библиотека Pthread может быть реализована на любом языке, но для соответствия стандартуPOSIX она должна быть согласована со стандартизированным интерфейсом. БиблиотекаPthread - не единственная реализация потокового API-интерфейса.
Существуют другиереализации, созданные сторонними фирмами производителями аппаратных и программныхсредств. Например, среда Sun поддерживает библиотеку Pthread и собственный вариантбиблиотеки потоков Solaris.1.3 Изменение парадигмы – проблемы координацииВ базовой последовательной модели программирования инструкции компьютернойпрограммы выполняются поочередно. Разработчик программы разбивает основную задачу наподзадачи. Разработчик представляет каждую программу в виде линейнойпоследовательности задач.В параллельных программах сразу несколько инструкций могут выполняться в один и тот жемомент времени. Программа разбивается на множество параллельных задач.
Программаможет состоять из сотен или даже тысяч выполняющихся одновременно подпрограмм. Впараллельном программирования последовательность и местоположение составляющих ПОне всегда предсказуемы. Несколько задач могут одновременно начать выполнение на любомпроцессоре, без какой бы то ни было гарантии того, что задачи закреплены заопределенными процессорами, или такая-то задача завершится первой, или все онизавершатся в определённом порядке.Несколько задач может выполняться на одном процессоре даже при наличии в компьютеренескольких процессоров. Такая ситуация создается системными стратегиями планирования.На длительность выполнения задач, подзадач и инструкций оказывают влияние выбранныестратегии планирования, приоритеты процессов, потоков, быстродействие устройств вводавывода. Основное различие в моделях состоит в переходе от строго упорядоченнойпоследовательности задач к лишь частично упорядоченной (или вовсе неупорядоченной)коллекции задач.
Параллелизм превращает ранее известные величины (порядок выполнения,время выполнения и место выполнения) в неизвестные. Любая комбинация этих неизвестныхвеличин является причиной изменения значений программы, причем зачастуюнепредсказуемым образом.Декомпозиция работ определяет, что должны делать разные части ПО. Когда множествокомпонентов ПО работают в рамках одной задачи, их функционирование необходимокоординировать.
При этом возникает множество проблем. Каким двум (или больше) потокамнеобходим доступ к одному и тому же ресурсу? Кто имеет право получить его первым? Еслинекоторые части ПО завершат свою работу гораздо раньше других, то нужно ли им"поручать" новую работу? ДСС (декомпозиция, связь и синхронизация) — это тот минимумвопросов, которые необходимо решить, приступая к параллельному программированию.Если программа содержит подпрограммы, которые могут выполняться параллельно, и этиподпрограммы совместно используют некоторые файлы, устройства или области памяти, тонеизбежно возникают проблемы координации.
Для координации задач, выполняемыхпараллельно, требуется обеспечить связь между ними и синхронизацию их работы. Принекорректной связи или синхронизации обычно возникает четыре типа проблем.Проблема №1: "гонка" данныхЕсли несколько задач одновременно попытаются изменить некоторую общую областьданных, а конечное значение данных при этом будет зависеть от того, какая задача обратитсяк этой области первой, возникнет ситуация, которую называют состоянием "гонок" (racecondition).
В случае, когда несколько задач попытаются обновить один и тот же ресурсданных, такое состояние "гонок" называют "гонкой" данных (data race).Всякий раз когда задачи одновременно используют модифицируемый ресурс, к ресурсномудоступу этих задач должны быть применены определенные правила и стратегии. И еслиокажется, что к одному и тому же ресурсу одновременно обращается сразу несколькопотоков, их необходимо задержать, организовать их выполнение в соответствии с некоторымправилом очередности, а затем предоставлять им доступ к ресурсу по одному (в порядкеочереди).Проблема №2: бесконечная отсрочкаТакое планирование, при котором одна или несколько задач должны ожидать до тех пор,пока не произойдет некоторое событие или не создадутся определенные условия, можетоказаться довольно непростым для реализации.
Если ожидаемое событие или условие,которое должно произойти (или наступить), но в действительности не происходит (или ненаступает), то приостановленные задачи будут вечно находиться в состоянии ожидания.Если приостановить одну или несколько задач до наступления события (или условия),которое никогда не произойдет, возникнет ситуация, называемая бесконечной отсрочкой(indefinite postponement).Пытаясь скоординировать доступ параллельных задач к некоторому общему ресурсу данных,следует предусмотреть все ситуации, в которых возможно создание бесконечной отсрочки.Инструмент, позволяющий программно отлавливать эти ошибки называется Intel ThreadChecker (см.
пп. Отладка многопоточных приложений).Проблема №3: взаимоблокировкаВзаимоблокировка — этот тип ошибок также связан с ожиданием. Взаимоблокировкаобъясняется наличием параллельно выполняемых задач, имеющих доступ к совместноиспользуемым данным, которые им разрешено обновлять.
Возможна ситуация, когда каждаяиз задач будет ожидать до тех пор, пока другая не освободит доступ к общим данным (рис.3).Рис.3. Ситуация взаимоблокировки.В ситуации на рис. 3, если другие задачи ожидают получения доступа к ресурсам 1 или 2, апотоки А и В взаимно блокированы, то другие задачи будут ожидать условия, котороеникогда не выполнится. При координации параллельно выполняемых задач необходимопомнить, что взаимоблокировка и бесконечная отсрочка — это самые опасные преграды,которые нужно предусмотреть и избежать.2.
Отладка параллельных программПри тестировании последовательной программы разработчик может отследить ее логику впошаговом режиме. Программист может отыскать ошибки в программе, используясоответствующие входные данные и исходное состояние программы, путем проверки еелогики в пошаговом режиме. Тестирование и отладка в последовательной модели зависят отстепени предсказуемости начального и текущего состояний программы, определяемыхзаданными входными данными.В параллельных программах трудно воспроизвести точный контекст параллельных задач изза разных стратегий планирования, применяемых в операционной системе, динамическименяющейся рабочей нагрузки, квантов процессорного времени, приоритетов процессов ипотоков, временных задержек при их взаимодействии и собственно выполнении.
Чтобывоспроизвести точное состояние, в котором находилась среда при тестировании и отладке,необходимо воссоздать каждую задачу, выполнением которой была занята операционнаясистема. При этом должен быть известен режим планирования процессорного времени иточно воспроизведены состояние виртуальной памяти и переключение контекстов.