ВКР: Динамический контроль корректности OpenMP-программ
Описание
Московский Государственный Университет им. М. В. Ломоносова
Факультет Вычислительной Математики и Кибернетики
Кафедра Системного Программирования
Дипломная работа
«Динамический контроль корректности
OpenMP-программ»
Научные руководители
профессор, доктор физ.-мат. наук
Крюков Виктор Алексеевич
кандидат физ.-мат. наук
Бахтин Владимир Александрович
Аннотация
Важным этапом процесса создания любого программного продукта является его отладка. При чем данный этап по количеству затраченных на него средств зачастую сопоставим со всеми остальными стадиями разработки программного продукта. Особенно сильно возрастает трудоемкость отладки в случае, если программа была написана с использованием параллельных вычислений. Данная работа посвящена автоматическому нахождению наиболее распространенных ошибок, возникающих при использовании OpenMP конструкций в Fortran-программах. В ходе работы были разработаны и реализованы алгоритмы нахождения таких ошибок, а также проведено сравнение полученного инструмента с существующими аналогами.
Оглавление1 Введение. 4
1.1 Технология OpenMP. 4
1.2 Ошибки, возникающие при использовании OpenMP. 5
1.3 Отладка параллельных программ.. 7
1.4 Цель работы.. 8
2 Постановка задачи.. 9
3 Обзор существующих отладчиков.. 10
3.1 Сравнение отладчиков. 10
3.2 Выводы.. 12
4 Динамический контроль корректности.. 13
4.1 Схема работы отладчика. 13
4.2 Построение дерева контекстов. 14
4.3 Обнаружение ошибок общей памяти. 16
4.3.1 Представление критических областей. 16
4.3.2 Описание алгоритма. 17
4.4 Расширенное дерево контекстов. 20
4.5 Обнаружение ошибок инициализации. 21
5 Практическая реализация. 24
5.1 Интерфейс отладчика. 24
5.2 Объединение алгоритмов. 25
5.3 Оптимизация отладчика. 26
5.4 Результаты тестирования. 27
6 Литература. 32
Технология OpenMP
Стандарт OpenMP[1] создавался для упрощения разработки параллельных программ для вычислительных систем с общей памятью, а так же для распараллеливания уже существующих последовательных программ. Стандартом определены специальные комментарии (команды препроцессору для C/C++) – директивы компилятору, непосредственно управляющие параллелизмом программы, вспомогательные функции, позволяющие создавать алгоритмы, ориентированные на параллельное выполнение, и переменные окружения, управляющие процессом выполнения параллельных областей.
Программа, использующая директивы OpenMP, состоит из последовательных и параллельных участков. В начале ее выполнения создается одна нить, которая существует на протяжении всей программы. Когда какая-либо нить доходит до параллельного участка, то порождаются дополнительные нити, выполняющие вместе с ней этот участок. Группой нитей называется множество нитей, созданных при входе в данную параллельную область, включая породившую их нить, называемую главной. Нить, достигшая конца параллельной области, дожидается всю группу. Когда все нити одной группы дойдут до конца параллельного участка, все нити кроме главной освобождаются, а главная нить продолжает выполнение программы. На рисунке 1 показан пример создания и освобождения нитей в параллельных областях в случае наличия вложенных параллельных участковЛокальная память доступна только одной нити.
Ошибки, возникающие при использовании OpenMP
В 2004-2005 годах в University of Kassel(Германия) проводилось исследование, целью которого было выявление наиболее часто совершаемых ошибок, обусловленных некорректным использованием функций и директив OpenMP, и приводящих к неверному выполнению программы. Эксперимент проводился на студентах этого университета, которые должны были написать некоторую программу с использованием OpenMP версии 2.5 или более ранней. Большинство испытуемых ранее не имели опыта работы с OpenMP, что позволило выявить ошибки, допускаемые начинающими программистами. В результате были обнаружены следующие ошибки [3]:
- Незащищенный доступ к общим переменным.
Данная ошибка возникает, когда несколько нитей работают с общей памятью без какой-либо синхронизации. В этом случае возможны следующие ситуации:
- все нити только читают переменную, тогда ошибки нет, т.к. значение переменной в любой момент времени остается неизменным.
- все нити только пишут в переменную. Поскольку они это делают одновременно, то нельзя определить, какое значение получит переменная после выполнения всех операций записи. И значение данной переменной будет при каждом запуске программы различным.
- часть нитей читают переменную, а часть пишут в нее. Здесь помимо эффекта предыдущего случая, наблюдается аналогичная неопределенность. Когда какая-либо нить пытается прочитать значение переменной, то неизвестно, какое именно значение будет получено.
- Использование механизма замков без директивы flush.
Этот пункт является ошибкой только для ранних версий OpenMP(до версии 2.5).
При работе с общими переменными предполагается, что каждая нить работает с копией этой переменной, расположенной в кэше соответствующего процессора. Директива flush обновляет во всех нитях значения общих переменных, т.е. все нити будут видеть последние изменения. Поэтому, если использовать замки без директивы flush, то возможна ситуация, когда одна нить замок поставит, а другая не увидит никаких изменений, и будет считать, что ресурс свободен, и его можно захватить. В результате будет некорректная ситуация, когда сразу несколько нитей установили один и тот же замок. Начиная с версий OpenMP 2.5, директива flush входит в состав функций для работы с замками.
Файлы условия, демо
Характеристики ВКР
Список файлов
