ЭЛЕМЕНТЫ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ (542479)

Файл №542479 ЭЛЕМЕНТЫ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ (Акчурин)ЭЛЕМЕНТЫ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ (542479)2015-08-162015-08-16СтудИзба

Акчурин

Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Регистрация/авторизация

Текст из файла

ЭЛЕМЕНТЫ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ

Оптимизация непрерывных систем.

Выше говорилось о существовании обширного класса экономических и технических задач, в которых необходимо отыскать управление, представляющее собой некоторый многошаговый процесс принятия решения. Примером таких многошаговых процессов является управление дискретными системами, изменяющими свое состояние в соответствии с принятым управлением в некоторые дискретные моменты времени. Для решения задач оптимизации в таких системах предложен разработанный Р. Беллманом метод, получивший название динамического программирования.

Б основу метода положен интуитивно очевидный принцип, названный принципом оптимальности. В соответствии с этим принципом оптимальное управление определяется конечной целью управления и состоянием системы в рассматриваемый момент времени.

Приведем формулировку принципа оптимальности. Оптимальное поведение обладает тем свойством, что каковы бы ни были первоначальное состояние и решение е начальный момент, последующие решения должны составлять оптимальное поведение относительно состояния, получающегося в результате первого решения.

При использовании этого принципа оказывается возможным исходную сложную проблему отыскания многошагового управления заменить последовательным решением некоторого количества существенно более простых одношаговых задач оптимизации.

Смысл принципа оптимальности становится более ясным, если понять, что для любой оптимальной траектории каждый ее участок, связывающий любую промежуточную точку этой траектории с конечной, также является оптимальной траекторией.

Применим принцип оптимальности для оптимизации управления в непрерывных системах.

Рассмотрим задачу о минимизации функционала

(14.1)

для системы, поведение которой описывается совокупностью дифференциальных уравнений вида.

(14.2)

В соотношениях (14.1) и (14.2) использованы следующие обозначения: — вектор из области допустимых значений параметров системы, характеризующий состояние системы в данный момент времени; — вектор управления из области допустимых управлений Ω, В начальный момент времени t= 0, = _н, время Т фиксировано.

Пусть в некоторый момент времени 0<τ<Т состояние системы характеризуется вектором (τ). Начиная с момента времени τ, в течение временного интервала продолжительностью Δτ используем некоторое произвольное управление u_Δ (t) Ω. Тогда в соответствии с (14.2) в момент времени τ + Δτ система будет находиться в точке

Будем считать теперь, что, начиная с момента времени τ + Δτ и до конца, т.е. до t = T, используется оптимальное управление

Обозначим через J*(t) минимальное значение функционала (14.1) при оптимальном управлении *(τ) (при ), т. е.

Тогда значение функционала (14.1) при использовании управления

может быть найдено из соотношения

Понятно, что ввиду неоптимальности управления _Δ (t)

(14.3)

При этом равенство в (14.3) может быть получено только, если в качестве _Δ (t) будет использовано оптимальное управление, т. е.

(14.4)

С точностью до бесконечно малых более высокого порядка, чем Δτ можно считать, что

С учетом этого, меняя τ на t, перепишем (14. 4) в виде

(14.5)

Допустим теперь, что функция J(t) имеет частные производные по всем координатам и по времени t. Тогда, разлагая J*(t) в ряд Тейлора, имеем с точностью до бесконечно малых первого порядка:

(14.6)

(14.7)

Имея в виду (14.7), подставим (14.6) в (14.5). При этом

(14.8)

Принимая во внимание, что J*(t) и, следовательно, δJ*(t)/δt не зависит от (t), получаем

(14.9)

Полученное нелинейное дифференциальное уравнение в частных производных называют уравнением Беллмана. С помощью этого уравнения во многих случаях оптимальные управления и траектории могут быть получены аналитически.

Заметим, что если функционал (14.1) не зависит явно от времени, т. е. δJ/δt=0, то требования для *(t), вытекающие из уравнения Беллмана для отыскания оптимального управления, совпадают с условиями принципа максимума.

В самом деле, в этом случае уравнение (14.9) приобретает вид

(14.10)

Выберем теперь вектор-функцию следующим образом:

(14.11)

Тогда функция Гамильтона запишется в виде

Поскольку

основное условие принципа максимума совпадает с (14.10).

Как вполне очевидно, эквивалентность уравнений динамического программирования и принципа максимума может иметь место, только если существуют частные производные от функционала J*, что является необходимым условием построения уравнения Беллмана (14.9). Поскольку предположение о существовании частных производных от J* справедливо далеко не всегда, область применения динамического программирования для оптимизации непрерывных систем значительно уже области применения принципа максимума.

Вместе с тем, нельзя не отметить, что метод динамического программирования оказывается весьма эффективным при решении дискретных оптимизационных задач.

Оптимизация дискретных систем

Пусть система может находиться в одном из состояний дискретного множества S. Множество S можно трактовать как дискретное фазовое пространство. Для каждого из возможных состояний определим множество допустимых управлений ,. Система может переходить из одного состояния в другое. При этом будем считать, что система обладает марковским свойством, т. е. будущее состояние системы зависит только от состояния, в котором находится система в настоящий момент времени, и используемого в этот момент управления. В соответствии с этим введем функцию переходов, используя которую, запишем рекуррентное соотношение, определяющее эволюцию системы

(14.12)

Здесь — состояние системы на i-м шаге.

Тогда N-шаговому управлению можно поставить в соответствие траекторию движения системы

если задано — начальное состояние-системы.

Качество выбранного управления можно характеризовать численным значением целевой функции ,зависящим от траектории системы в пространстве S.

Задача состоит в выборе-управления u, доставляющего экстремум выбранному критерию. Для простоты будем считать, что критерий аддитивен относительно множества состояний, пробегаемых в процессе эволюции системы, т. е.

(14.13)

Введем функцию , равную численному значению критерия (14.13) при оптимальном k-шаговом управлении, начиная из состояния . Предположим, что система находится в некотором состоянии и надлежит выбрать одношаговое управление таким образом, чтобы максимизировать (14.13). Тогда

(14.14)

Пусть теперь система находится в состоянии и надлежит выбрать оптимальное двухшаговое управление так, чтобы максимизировать (14.13). Тогда в соответствии с принципом оптимальности

Рассуждая аналогично, имеем

(14.15)

откуда, в частности,

(14.16)

Вычислительная процедура решения задачи теперь ясна. Отыскание оптимального управления начинаем с последнего шага. При этом для каждого из возможных состояний системы , используя (14.14), необходимо отыскать и запомнить оптимальное управление .Таким образом, будет известно оптимальное одношаговое управление для любого из возможных состояний системы. Теперь, используя (14.15) при k=2, для каждого из возможных состояний системы найдем оптимальное двухшаговое поведение . Обратим внимание на то, что при этом фактически приходится решать одношаговую оптимизационную задачу отыскания , так как после отыскания с использованием соотношения (14.12) вычисляется состояние , причем для каждого из оптимальное управление уже было найдено ранее. Аналогично отыскивается оптимальное поведение для k = 3, 4, ..., N-1. Поскольку начальное состояние системы фиксировано, при отыскании оптимального управления на первом шаге нет необходимости решать оптимизационную задачу для всех . Нужно сделать это только для исходного состояния .

Таким образом, метод динамического программирования позволяет отыскать оптимальное многошаговое управление путем решения совокупности более простых одношаговых оптимизационных задач.

Поясним вычислительную процедуру метода на следующих примерах.

Задача 1. На рис. 14.1 изображена сеть, соединяющая точки А и В. Сеть состоит из совокупности узлов S и соединяющих их дуг. Каждой дуге, соединяющей два каких-либо узла сети, приписано число, характеризующее продолжительность перехода по этой дуге. Необходимо отыскать кратчайший по времени путь из A в В, если разрешенным является только движение слева направо.

Решение. Составим таблицу, в которой будем хранить оптимальное управление и соответствующее ему значение целевой функции для всех возможных состояний системы после каждого шага. Число строк таблицы равно числу шагов N процесса управления

(в рассматриваемом примере N=4). Число столбцов таблицы равно числу возможных состояний (в рассматриваемом примере конечное состояние фиксировано, поэтому число столбцов на единицу меньше числа возможных состояний и равно 12).

k
k	1	2	3	4	5	6	7	8	9	10	11	12
1	---	---	---	---	---	---	---	---	13/12	13/8	13/6	13/7
2	---	---	---	---	12/11	11/12	12/10	11/16	---	---	---	---
3	---	5/22	5/18	6/15	---	---	---	---	---	---	---	---
4	3/24	---	---	---	---	---	---	---	---	---	---	---

Клетки таблицы разбиты пополам, причем слева вверху будем хранить оптимальное управление, а справа внизу — соответствующее значение целевой функции. Для каждого узла сети управление однозначно определяется номером следующего на выбранном маршруте узла. В первой строке таблицы хранится информация о последнем шаге пути.

Поскольку перед последним (четвертым) шагом множество возможных состояний есть

и из каждого из этих состояний ведет лишь один путь в В, оптимальное управление очевидно. При этом

Перед предпоследним (третьим) шагом множество возможных состояний системы .

Как видно из рисунка,

Пусть состояние системы перед двумя последними шагами есть :

Так как

то = min {6+12, 4+7} = 11, причем . Таким образом, установлено, что если система находится в состоянии , то оптимальное поведение на очередном шаге состоит в переходе в состояние , после чего ранее найденное оптимальное управление обеспечивает кратчайший переход в конечное состояние. Продолжительность пути из в равна 11 единицам. Продолжая аналогично, заполняем вторую и третью строки таблицы. Поскольку начальное состояние задано, четвертая строка содержит один элемент. При этом

Тогда

причем .

Теперь не представляет никакого труда определить оптимальное многошаговое управление. На первом шаге . При этом мы попадаем в состояние , для, которого оптимальное управление уже найдено и . После второго шага состояние системы есть и оптимальное управление на третьем шаге . Из состояния в ведет один путь.

Таким образом, кратчайший маршрут из A в В имеет вид и его продолжительность равна 24 единицам.

Характеристики

Тип файла

Документ

Размер

376 Kb

Материал

Акчурин

Тип материала

Книга

Предмет

Базы данных

Высшее учебное заведение

НИУ «МЭИ»

Тип файла документ

Документы такого типа открываются такими программами, как Microsoft Office Word на компьютерах Windows, Apple Pages на компьютерах Mac, Open Office - бесплатная альтернатива на различных платформах, в том числе Linux. Наиболее простым и современным решением будут Google документы, так как открываются онлайн без скачивания прямо в браузере на любой платформе. Существуют российские качественные аналоги, например от Яндекса.

Будьте внимательны на мобильных устройствах, так как там используются упрощённый функционал даже в официальном приложении от Microsoft, поэтому для просмотра скачивайте PDF-версию. А если нужно редактировать файл, то используйте оригинальный файл.

Файлы такого типа обычно разбиты на страницы, а текст может быть форматированным (жирный, курсив, выбор шрифта, таблицы и т.п.), а также в него можно добавлять изображения. Формат идеально подходит для рефератов, докладов и РПЗ курсовых проектов, которые необходимо распечатать. Кстати перед печатью также сохраняйте файл в PDF, так как принтер может начудить со шрифтами.

Список файлов книги

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.