Главная » Просмотр файлов » Пупков К.А., Коньков В.Г. - Интеллектуальные исследования (Современнаяя теория управления)

Пупков К.А., Коньков В.Г. - Интеллектуальные исследования (Современнаяя теория управления) (1072100), страница 21

Файл №1072100 Пупков К.А., Коньков В.Г. - Интеллектуальные исследования (Современнаяя теория управления) (Пупков К.А., Коньков В.Г. - Интеллектуальные исследования (Современнаяя теория управления)) 21 страницаПупков К.А., Коньков В.Г. - Интеллектуальные исследования (Современнаяя теория управления) (1072100) страница 212017-12-28СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 21)

(147)

Критерий эффективности построим на основе вычислительной и коммуникационной загрузок процессоров. Вычислительная загрузка WL (Work Load) процессора определяется суммарным временем выполнения назначенных ему программ

(148)

Коммуникационная загрузка CL (Communication Load) процессора Q - это суммарное время обменов, которые должны выполнить программы, назначенные этому процессору

(149)

В качестве критерия эффективности отображения используем максимальную из суммарных загрузок процессоров МВС

(150)

Ставится задача поиска отображающей матрицы X = X*, доставляющей минимум критерию эффективности (150)

(151)

Заметим, что модель (147) - (151) не учитывает коммуникационную загрузку процессоров МВС, обусловленную транзитными обменами; возможные задержки обменов из-за перегрузки каналов обмена; дополнительное время на организацию обменов. Последнюю составляющую, которая в транспьютерных сетях, например, может быть весьма существенной, легко учесть, если положить

где l, -«расстояние» между процессорами Q, Q ; tst - стартовое время; tcom - время передачи байта данных между соседними процессорами МВС [66].

Точное решение задачи. Входящая в соотношение (151) составляющая (148) линейна, а составляющая (149) нелинейна относительно компонентов отображающей матрицы X. Введем вспомогательную отображающую N2 x n2 – матрицу , компоненты которой представляют собой произведение компонентов матрицы X. С использованием матрицы выражение запишется в виде

где - элемент матрицы , находящейся в строке, соответствующей , , и столбце, соответствующем i, j.

Вычислительная загрузка (148) выражается через матрицу в виде

где

- (n2 x 1) - вектор.

Таким образом, критерий эффективности согласования оказывается линейным относительно матрицы .

Стандартным приемом с помощью вспомогательных переменных задача поиска отображающей матрицы , доставляющей минимум критерию эффективности (см. формулы (150), (151)), сводится к задаче смешанного булева линейного программирования

(152)

с ограничениями

и ограничениями

Задача содержит (n2N2 + N + 1) переменных и (n2 + N2 + N + 2) ограничений.

Теорема. Задача оптимального отображения структуры ИСУ на архитектуру МВС является NP - сложной.

Справедливость теоремы следует из того факта, что задача булева линейного программирования (152) является NP - сложной [70].

Точное решение задачи отображения реализовано в последовательном фортрановском GOMORY - отображателе, использующем программу НО2ВАF решения задачи целочисленного линейного программирования (152) известным методом Гомори из библиотеки численного анализа NAG (National Algorithmic Group).

Проиллюстрированная далее эффективность GOMORY - отображателя может быть значительно повышена за счет использования параллельных алгоритмов метода Гомори.

Приближенное решение задачи на основе метода релаксации. Обозначим алгоритм решения задачи линейного программирования (152) с помощью симплекс-метода (SIMPLEX), а соответствующие значения отображающей матрицы (нецелочисленной) и критерия эффективности Xs, Es. Введем алгоритмы ROUND, UNIFORM, UNIFORM, COMBI.

Алгоритм ROUND заменяет величину (xs),i ее целочисленным значением (xr),i по формуле

(153)

где 0 определяется из условия

(154)

При этом выполнение ограничений (147) обеспечивается автоматически.

Алгоритм UNIFORM1 каждому процессору (кроме Q1 или QN) назначает n1 = [n/N] программ независимо от их вычислительной сложности. Здесь [n/N] - ближайшее целое, меньшее n/N.

Алгоритм UNIFORM2 каждому процессору назначает такое количество программ со смежными номерами, чтобы вычислительная загрузка этого процессора не превышала средней:

Алгоритм COMBI является комбинацией алгоритмов ROUND, UNIFORM1 и UNIFORM2. Выбирается лучший из них по критерию (151).

Эффективность рассматриваемых приближенных алгоритмов решения задачи отображения исследована с помощью статистического моделирования.

Приведем результаты исследования для МВС с архитектурой типа «линейка» [70], в которой Host – процессор Q1 и процессоры Q2, … , QN одинаковы. Положим, что вычислительная сложность p1, p2, …, pn программ определяется случайными величинами, равномерно распределенными в интервале [0, pmax]. При этом обмены происходят только с программой, выполняемой на Host - процессоре, и параметры этих обменов одинаковы.

На рис. 35, 36 представлены результаты исследования при следующих данных: количество процессоров N = 8, количество программ n = 20, при одинаковых значениях параметров обменов c = 1 количество статистических испытаний равно 300. На рис. 35 проиллюстрирован случай, когда средняя вычислительная сложность программ превышает сложность коммуникаций в 5 раз; на рис. 36 - в 50 раз. Символом обозначена оценка математического ожидания критерия эффективности отображения, кривым 1-5 соответствуют алгоритмы GOMORY, COMBI, ROUND, UNIFORM1, UNIFORM2.

Автором были проведены подобные исследования и с другими количествами программ, процессоров и pmax. Во всех случаях результаты были близки к представленным на рис. 35, 36, что дает основание сделать следующие выводы.

При приближенном решении задачи отображения алгоритм релаксации ROUND целесообразно комбинировать с простейшими алгоритмами равномерного распределения UNIFORM1, UNIFORM2, т.е. использовать комбинированный алгоритм COMBI. При этом средняя эффективность отображения повышается на 5 - 10% (в зависимости от соотношения средней вычислительной сложности программ и стоимости коммуникаций).

При некоторых наборах исходных данных стандартные программы, использующие симплекс - метод, могут не давать решения (из-за погрешностей вычислений и представления данных). Алгоритм COMBI обеспечивает решение задачи во всех случаях.

Алгоритм COMBI обеспечивает среднюю эффективность отображения лишь на 5% худшую, чем точный алгоритм целочисленного линейного программирования GOMORY.

Были также рассмотрены более сложные, чем ROUND, алгоритмы округления и более сложные, чем UNIFORM1 и UNIFORM2, алгоритмы равномерного распределения. Так, при округлении компонентов отображающей матрицы X наряду с алгоритмом (153) использовалась величина ; для равномерного распределения был использован алгоритм, близкий к «жадному алгоритму упаковки в контейнеры» [71]. Заметного повышения эффективности алгоритма COMBI эти усложнения не дали.

Приближенное решение задачи отображения с помощью метода релаксации было реализовано в последовательном фортрановском COMBI - отображателе. Алгоритм SIMPLEX в COMBI - отображателе реализован на основе одной из библиотечных программ симплекс - метода.

Рис. 35

Рис. 36

    1. Стохастические методы решения задачи отображения алгоритмов и программ на мультитранспьютерные системы

  1. Графовое представление алгоритмов.

Вычислительные алгоритмы представляются взвешенными ориентированными ациклическими графами [72] (рис. 37). Вершины таких графов соответствуют некоторым частям алгоритма, в дальнейшем называемыми операциями. Дуги графа, соединяющие вершины, означают наличие информационной зависимости между соответствующими операциями алгоритма - результат выполнения одной операции является аргументом для другой. Веса вершин пропорциональны времени выполнения соответствующих операций - будем измерять их числом некоторым элементарных операций, содержащихся в соответствующей данной вершине операции. Под элементарной операцией можно понимать, например, арифметическую операцию (сложения/умножения) или один такт процессора. Дуги графа алгоритма также являются взвешенными, и их вес равен объему (например, в байтах) передаваемой по этой дуге информации.

Будем задавать введенный граф алгоритма, как ГА = <n, c, S>, где n - число вершин в графе, cl={cl, l=1..n} - вектор весов вершин, S - взвешенная матрица смежности графа. Это матрица размерности nxn , элементы sij которой равны 0, если i - ая и j - ая вершины не связаны дугой и весу связывающей их дуги в противном случае.

Каждую дугу графа будем представлять в виде упорядоченной пары номеров вершин (i, j) , которые эта дуга соединяет.

За UA обозначим число элементарных операций алгоритма:

Назовем степенью параллелизма графа алгоритма максимальное число попарно независимых вершин в графе. Степень параллелизма графа определяет максимально возможное число процессоров ВС для эффективного распараллеливания алгоритма при заданной агрегации операций алгоритма в вершины графа. При числе процессоров, большем степени параллелизма, в любой момент времени часть их обязательно будет простаивать.

Ациклические орграфы допускают поярусное разложение. На первый ярус помещаются вершины, которые не имеют входных дуг. На каждый последующий ярус помещаются те вершины, которые не имеют предшественников, за исключением уже распределенных на предыдущие ярусы. Обозначим число таких ярусов за h. А само поярусное распределение буем представлять в виде матрицы Н размерности hxn, элементы Hkj которой равны 1, если j - ая вершина принадлежит k - ому ярусу, и 0 в противном случае. Смысл такого поярусного распределения состоит в том, что операции алгоритма, соответствующие вершинам одного уровня, могут выполняться параллельно.

Рис.37. Пример графого представления алгоритма.

Средней степенью параллелизма назовем отношение h/n, которое для последовательных (h = n) алгоритмов равно 1, а для полностью параллельных (h = 1) алгоритмов - n.

  1. Графовое представление мультитранспьютерных систем.

Под мультитранспьютерной системой (ВС) будем понимать набор, состоящий из транспьютеров, объединенных некоторой системой связи. Такие ВС будем представлять в виде взвешенных ориентированных графов, вершины которых соответствуют процессорам ВС и их число равно p. Каждая вершина является взвешенной, и ее вес равен производительности (оп/с) соответствующего процессора ВС.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6518
Авторов
на СтудИзбе
302
Средний доход
с одного платного файла
Обучение Подробнее