debugUGr (1158416), страница 3
Текст из файла (страница 3)
Отсутствие ошибок при динамическом контроле не гарантирует правильной работы параллельной программы. Поэтому отладку программы следует продолжить, воспользовавшись командами накопления и сравнения трассировок.
10.4Накопление эталонного файла трассировки DVM-программы
Для этого служит команда:
dvm trc <имя DVM-программы>
По умолчанию запуск управляется параметрами сбора трассировки вычислений из базового файла usrdebug (см.п.11.2) скорректированными следующими параметрами из файла deb_trc.par:
| EnableDynControl=0; | - отключение динамического отладчика; |
| EnableTrace=1; | - подключение накопления трассировки; |
| TraceOptions.TraceMode=1; | - режим накопления трассировки; |
В случае обнаружения ошибок при накоплении трассировки в поток stderr выдается диагностика о наличии таких ошибок. Этот поток может быть направлен либо на экран, либо в файл (см.п.7 и п.11.3).
Сообщения о типе ошибки, строке исходного текста и номерах итераций всех объемлющих циклов так же можно направить либо на экран, либо в файл (см.п.11.2). Структуру накапливаемой трассировки см. в п.14.
Структуру и перечень сообщений об ошибках сбора трассировок см. в п.12.2.
10.5Сравнение эталонной трассировки с результатами выполнения параллельной программы на одном процессоре
При сравнении эталонной трассировки с результатами выполнения параллельной программы на одном процессоре производится контроль корректности описания редукционных операций. Этот контроль осуществляется посредством специального режима выполнения параллельной программы на одном процессоре, при котором вычисление редукционных переменных производится в соответствии с описаниями редукционных операций, заданными программистом. Редукционные переменные вычисляются так, как если бы каждый виток цикла, в котором она подсчитывается, размещался бы на отдельном процессоре. В начале каждого витка редукционной переменной присваивается начальное значение, которое запоминается при входе в цикл. По окончании витка производится обращение к библиотеке Lib-DVM для вычисления конечного результата в соответствии с заданной программистом редукционной функцией. Если редукционная функция задана программистом неправильно, то должно возникнуть расхождение в трассировках при разных режимах вычисления редукции.
Для сравнения трассировок служит команда:
dvm red <имя DVM-программы>
По умолчанию запуск управляется параметрами сравнения трассировки, из базового файла usrdebug (см.п.11.2) скорректированными следующими параметрами, из файла deb_red.par:
| EnableDynControl=0; | - отключение динамического отладчика; |
| EnableTrace=1; | - подключение накопления трассировки; |
| TraceOptions.TraceMode=3; | - режим сравнения трассировок; |
| ManualReductCalc=1; | - вычисление редукционных переменных в соответствии с указаниями пользователя. |
В случае обнаружения ошибок сравнения трассировок в поток stderr выдается диагностика о наличии ошибок сравнения. Этот поток может быть направлен либо на экран, либо в файл (см.п.7 и п.11.3).
Сообщения о типе ошибки, строке исходного текста и номерах итераций всех объемлющих циклов так же можно направить либо на экран, либо в файл (см.п.11.2).
Структуру и перечень сообщений об ошибках сравнения трассировок см. в п.12.2.
10.6Сравнение трассировки параллельного выполнения с эталонной
Производится запуск параллельной программы в режиме имитации многопроцессорной системы на рабочей станции и сравнение трассировки выполнения с эталонной. Для этого служит команда:
dvm dif N1 [N2 [N3]] [<опции_кластера>] <имя DVM-программы>
где N1, N2, N3 - размеры матрицы процессоров (по умолчанию – 1 1 1).
По умолчанию запуск управляется параметрами сравнения трассировки из базового файла usrdebug (см.п.11.2), скорректированными следующими параметрами из файла deb_dif.par:
| EnableDynControl=0; | - отключение динамического отладчика; |
| EnableTrace=1; | - подключение накопления трассировки; |
| TraceOptions.TraceMode=3; | - режим сравнения трассировок; |
| ManualReductCalc=0; | - вычисление редукционных переменных по стандартному алгоритму. |
Редукционные переменные вычисляются обычным способом. Все вычисления редукционной переменной на одном процессоре реализуются операторами программы в витках, выполняющихся на данном процессоре, а вычисление конечного результата по значениям, полученным на каждом процессоре, производится библиотекой Lib-DVM. При этом если программа работает на одном процессоре, то редукция будет вычисляться только операторами программы.
В случае обнаружения ошибок сравнения трассировок в поток stderr выдается диагностика о наличии ошибок сравнения. Этот поток может быть направлен либо на экран, либо в файл (см.п.7 и п.11.3).
Сообщения о типе ошибки, строке исходного текста и номерах итераций всех объемлющих циклов так же можно направить либо на экран, либо в файл (см.п.11.2).
Структуру и перечень сообщений об ошибках сравнения трассировок см. в п.12.2.
Если различий в трассировке не обнаружено, можно переходить к параллельному выполнению программы с реальными данными (см.п.10.8).
Если обнаружены различия, но ошибку в программе не удается определить по эталонной трассировке и диагностике сравнения трассировок, пользователь может накопить трассировку на каждом процессоре при запуске параллельного варианта программы на требуемой матрице процессоров (см.п.10.7).
Если при параллельном выполнении программы (или его имитации на отдельной рабочей станции) на некотором процессоре возникнут аварийные ситуации (или будут обнаружены отличия трассировки от эталонной), то возможно зависание программы. Если завершить ее выполнение с помощью CTRL-C, то направляемые в файлы стандартные выводные потоки могут пропасть. В этом случае поток stderr направлять в файл не следует.
Место зависания или аварийного завершения программы можно определить, включив перед данным запуском системную трассировку программы (см.п.11.4). Последние записи в системной трассировке позволят найти место в программе, после которого произошла аварийная ситуация.
10.7Накопление трассировки параллельной программы
Для этого служит команда:
dvm ptrc N1 [N2 [N3]] [<опции_кластера>] <имя DVM-программы>
где N1, N2, N3 - размеры матрицы процессоров (по умолчанию – 1 1 1).
По умолчанию запуск управляется параметрами сбора пользовательской трассировки, из базового файла usrdebug (см.п.11.2) скорректированными следующими параметрами из файла deb_trc.par:
| EnableDynControl=0; | - отключение динамического отладчика; |
| EnableTrace=1; | - подключение накопления трассировки; |
| TraceOptions.TraceMode=1; | - режим накопления трассировки; |
В случае обнаружения ошибок при накоплении трассировки в поток stderr выдается диагностика о наличии таких ошибок. Этот поток может быть направлен либо на экран, либо в файл (см.п.7 и п.11.3).
Сообщения о типе ошибки, строке исходного текста и номерах итераций всех объемлющих циклов так же можно направить либо на экран, либо в файл (см.п.11.2). Трассировка накапливается для каждого процессора в отдельном файле, например с именами: 0.trd, 1.trd, 2.trd и т.д.
Структуру накапливаемых файлов трассировки см. в п.14.
10.8Параллельное выполнение с реальными данными
Если различий на предыдущих шагах не обнаружено, то можно считать программу отлаженной на тестовых данных и переходить к параллельному выполнению программы на кластере рабочих станций с реальными данными.
Для этого служат команды
компиляции:
dvm c [опции C-DVM конвертора] <имя DVM-программы>
dvm f [опции F-DVM конвертора] <имя DVM-программы>
выполнения:
dvm run [N1 [N2 [N3]]] [<опции_кластера>] <имя DVM-программы>
где N1, N2, N3 - размеры матрицы процессоров (по умолчанию – 1 1 1).
По умолчанию запуск управляется параметрами из наборов, заданных в переменных окружения dvmpar и usrpar.
Если при выполнении программы с реальными данными результаты вычислений не удовлетворяют пользователя, то он может снова получить варианты программы для последовательного и параллельного выполнения для того, чтобы трассировать программу уже с реальными данными. Однако следует учитывать, что:
-
объем трассировки программ может быть очень большим. Поэтому перед выводом трассировки следует оценить ее объем как для всей программы в целом, так и для отдельных ее частей(см.п.10.9 и п.10.10).
-
по умолчанию команды csdeb, fsdeb и cpdeb, fpdeb (см.п.10.2) используют опции конверторов –d4, что может значительно увеличить время выполнения программы. Поэтому для получения отладочных вариантов программ для запуска с реальными данными (например, для накопления и сравнения трассировок вычислений) следует воспользоваться другими опциями (-d1, -d2 или -d3) для всей программы или для ее отдельных фрагментов (см. руководства по использованию компиляторов C-DVM и Fortran-DVM).
10.9Оценка объема трассировки
Для этого служит команда:
dvm size <имя DVM-программы>
По умолчанию запуск управляется параметрами сбора пользовательской трассировки, из базового файла usrdebug (см.п.11.2) скорректированными следующими параметрами из файла deb_size.par:
| EnableDynControl=0; | - отключение динамического отладчика; |
| EnableTrace=1; | - подключение накопления трассировки; |
| TraceOptions.TraceMode=0; | - режим генерации конфигурационного файла трассировки. |
Команда создает так называемый конфигурационный файл трассировки, в котором, в частности, приводятся предполагаемые объемы трассировки исходя из заданных опций DVM-конверторов (см.п.8) и уровней ее сбора (см.п.11.2).
Фактически объемом трассировки управляют только два параметра из базового набора: TraceOptions.TraceLevel и TraceOptions.WriteEmptyIter, а так же конфигурационный файл трассировки, о котором говорится ниже.
10.10 Управление объемом файла трассировки
После создания конфигурационный файл трассировки может быть отредактирован с целью сокращения объема трассировки. Пользователь может полностью или частично отменить накопление трассировки для некоторых (или всех) циклов или областей параллельных задач. После этого ему следует снова выполнить команду dvm size, чтобы произвести оценку объема трассировки. Если полученный объем не устраивает пользователя, процесс следует повторять до получения приемлемых результатов.
Конфигурационный файл трассировки содержит:
-
вычисляемые значения объема всего файла трассировки и количества строк в нем;
-
информацию для каждого цикла программы (последовательного или параллельного) и для каждой области задач с учетом их уровней вложенности.
В качестве отдельной трассируемой единицы выступает цикл программы или область задач. Информация для каждого цикла и области программы содержит:
-
заголовок исполняемой конструкции;
-
вычисляемые значения объема трассировки для данной конструкции, количество строк трассировки данной конструкции и количество трассируемых итераций или задач.
-
конец цикла или области задач.
Заголовок исполняемой конструкциисодержит:
-
тип конструкции – последовательный (SL) или параллельный (PL) цикл или область задач (TR);
-
номер конструкции;
-
номер объемлющей конструкции (для вложенных конструкций);
-
размерность исполняемой конструкции;
-
ссылку на исходный текст программы (имя файла и номер строки начала конструкции);
-
знак равенства (=);
-
параметры управления исполняемой конструкции (могут отсутствовать);
-
комментарий: начинается символом # и до конца строки заголовка конструкции (может отсутствовать).
Параметрами управления исполняемой конструкцией (которые может менять пользователь) являются:
-
Уровень накопления трассировки. Если отсутствует, то принимается уровень, объемлющей конструкции или уровень, действующий для всей программы, который определяется параметром TraceOptions.TraceLevel (см.п.11.2), если конструкция не имеет объемлющей конструкции;
-
Трассируемые итерации или задачи. Если не заданы, то трассируются все итерации цикла и все параллельные задачи. Если какие-то итерации исключены из трассировки, то по ним не трассируются обращения на запись и чтение переменных, но записи, соответствующие началу итерации, помещаются в трассировку, если параметр TraceOptions.WriteEmptyIter равен 1 (по умолчанию равен 0).
Изменения параметров управления исполняемой конструкцией влияют на вычисляемые значения объемов трассировки отдельных конструкций и, следовательно, всей трассировки в целом, на количество строк трассировки и на количество трассируемых итераций циклов и трассируемых задач.
Для всей программы в целом, для каждого цикла и для каждой области задач можно задать один из следующих уровней накопления трассировки:
-
трассировка отключена (уровень NONE);
-
трассировка только циклов, итераций, областей задач и начала самих параллельных задач (уровень MINIMAL);
-
трассировка модификаций переменных (уровень MODIFY);
-
полная трассировка (уровень FULL).
Трассируемые итерации и задачи задаются следующим образом (см.п.13):















