Деменков Н.П. Вычислительные аспекты решения задач оптимального управления (2007) (1253737), страница 3
Текст из файла (страница 3)
е. векторыx (t ) ∈ X , u (t ) ∈U ,(1.3)где X, U – заданные множества.Необходимо найти такой вектор оптимального управления u ∗ ,чтобы он обеспечивал экстремум целевой функции (критерия оптимальности)tkJ = ∫ L ( x (t ), u (t ), t ) dt + Gk ( x(tk ), tk ) ,(1.4)t0т. е. переводил систему из начального x (t0 ) = x0 в новое состояние, расположенное внутри области Gk ( x (tk ), tk ) ≥ 0, и при этомудовлетворялись интегральные ограничения видаtk∫ N ( x (t ), u (t ), t ) dt = const.(1.5)t01.5. Методы решения задач оптимального управленияТеория оптимального управления является сравнительно молодой научной дисциплиной. Ее развитие началось с середины пятидесятых годов прошлого века. У ее истоков стоял известныйроссийский ученый А.А.
Фельдбаум. Он одним из первых обратилвнимание на специфику задач оптимального управления, на невозможность ее решения методами классического вариационногоисчисления. Ему удалось привлечь внимание к задаче оптимального управления крупнейших российских математиков.Для решения задач оптимального управления используются(рис. 1.6) аналитические или косвенные методы: классическое вариационное исчисление, принцип максимума Л.С. Понтрягина,метод динамического программирования Р. Беллмана, а такжепрямые методы оптимизации, к которым относятся различные задачи математического программирования.1516Рис.
1.6. Методы решения задач оптимального управления1.5.1. Классическое вариационное исчислениеВариационным исчислением называется раздел математики, вкотором рассматриваются задачи определения максимума и минимума функционалов, а также определения функций (кривых), накоторых эти максимумы и минимумы достигаются.Годом рождения классического вариационного исчисленияпринято считать 1696 г., когда И. Бернулли опубликовал в журнале Acta Eruditorum статью «Новая задача, к решению которой приглашаются математики». Эта задача заключалась в следующем(рис.
1.7): « ... в вертикальной плоскости даны две точки: A и B.Определить путь AMB, спускаясь по которому под влиянием собственной тяжести, тело M, начав двигаться из точки А, дойдет до другой точки В в кратчайшее время». Поставленнаязадача получила название задачи о брахистохроне, т. е.
кривой наискорейшегоспуска. Решение задачи было даноИ. Бернулли, Я. Бернулли, а такжеЛейбницем, Лопиталем и Ньютоном.Вскоре в работах Эйлера и Лагранжа этазадача была включена в более общий Рис. 1.7. Задача о брахистохронекласс аналогичных задач.Две заданные точки и вектор гравитационного ускорения g определяют вертикальную плоскость. Пустьось y направлена вниз, а начало координат совпадает с точкой А. Таккак сила реакции проволоки на бусинку направлена строго под прямым углом к ее скорости V, то система консервативна, т. е.
полнаяэнергия системы постоянна( mV / 2) = ( mV / 2) − mgy или V = (V20202)+ 2 gy = V ( y ).Компоненты скорости удовлетворяют следующим уравнениям:x = V(y) cos θ;y = V(y) sin θ.Задача состоит в том, чтобы найти угол θ(t), при котором времяперехода из точки А в точку В минимально.17Заметим, что задача о брахистохроне является частным случаем проблемы Ферми о траектории минимального времени прохождения через область, в которой скорость зависит от фазовых координат. Решением этой задачи являются циклоиды, т.
е. траектории,образованные точкой на окружности колеса, катящегося без проскальзывания по горизонтальной плоскости, и что θ = const.Если верить легенде, первым и изобретательным оптимизатором была Дидона. Выторговав столько земли, сколько можно охватить шкурой быка, она разрезала шкуру на длинные тонкие полосы и уложила их по полуокружности, диаметром которой былберег моря. Таким образом, она охватила наибольший участокземли и основала на нем город Карфаген.
Правдива эта историяили нет, максимизация площади, ограниченной кривой даннойдлины, является одной из классических математических задач.Проблема, которую решила Дидона, по существу была задачейвариационного исчисления.Решение задачи оптимального управления сводится к решениюдвухточечной краевой задачи.Для того чтобы найти вектор управления u (t), при которомкритерий качества J достигает экстремального значения, нужнорешить систему дифференциальных уравненийx = f ( x, u, t )(1.6)при x (t0) = x0;(p = − ∂f / ∂x)тp − ( ∂L / ∂x )т(1.7)при p (tk ) = ( ∂Gk / ∂x ) ,где u (t ) определяется из условият( ∂H / ∂u ) = 0 или ( ∂f / ∂u )тp + ( ∂L / ∂u ) = 0.т(1.8)Граничные условия для уравнений (1.6) и (1.7) разделены: условия x (t0) заданы при t = t0, а p (tk) – при t = tk.Классическое вариационное исчисление применяется, когдаограничения на переменные состояния и управления отсутствуют.18Это бывает, когда рассматриваются малые отклонения x и u отих установившихся значений.Классическое вариационное исчисление рассматривает толькогладкие траектории движения системы, в то время как во многихзадачах управления область допустимых траекторий и управленийоказывается ограниченной и замкнутой.
Однако изучение вариационного исчисления позволяет более глубоко понять содержаниематематических методов теории оптимального управления и ихвозможности.1.5.2. Принцип максимумаВ 1956 г. Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзеи Е.Ф. Мищенко предложили метод, обобщивший методы классического вариационного исчисления в случае задач, в которыхуправляющие воздействия описываются кусочно-непрерывнымифункциями, а множество значений этих функций принадлежитзамкнутому ограниченному множеству. В основу этого методабыл положен так называемый «принцип максимума» [2].Принцип максимума дает необходимые условия оптимальности, позволяющие выделить из множества допустимых процессовнекоторое подмножество процессов, которые можно проверить наоптимальность.
В этом смысле метод решения задач оптимальногоуправления на основе принципа максимума аналогичен методамисследования функций одной или нескольких переменных, прикоторых отбираются точки, удовлетворяющие необходимым условиям, а затем каждая из отобранных точек анализируется, например, с помощью достаточных условий.В рамках теории оптимального управления необходимые условия хороши тогда, когда с их помощью удается выделитьнебольшое количество процессов, которые могут быть оптимальными.
Принцип максимума для широкого круга задач дает возможность определить единственную траекторию, которая можетбыть оптимальной. Если в конкретной задаче из каких-либо соображений (например, из содержательного смысла этой задачи)известно, что оптимальное управление существует, то выделениеединственной траектории, которая может быть оптимальной, даетрешение задачи.Первое доказательство принципа максимума дал Р.В. Гамкрелидзе для линейных задач оптимального управления. Он построилполную теорию линейных систем управления и доказал достаточ19ность принципа максимума для таких систем. Таким образом, длялинейных задач оптимального управления принцип максимума –необходимое и достаточное условие оптимальности.В общем нелинейном случае принцип максимума доказалВ.Г.
Болтянский, который построил основы нелинейной теорииоптимального управления.Принцип максимума, как и классическое вариационное исчисление, приводит к двухточечной краевой задаче.Особенностью принципа максимума является то, что вариационная задача нахождения управления как функции времени u ∗ (t ),доставляющей экстремум заданному функционалу J, сведена к более простой задаче определения значения u ∗ (t ), обеспечивающегомаксимум функции Гамильтона H (u ) :H( x , u , p , t ) = L( x , u , t ) + p т (t ) f ( x , u , t ).(1.9)Отсюда и название метода – принцип максимума.Для задач, в которых на класс искомых экстремалей не наложены ограничения, принцип максимума дает те же результаты, чтои метод классического вариационного исчисления.
Однако в отличие от классического вариационного исчисления принцип максимума позволяет проще находить экстремали в виде кусочнонепрерывных (разрывных) функций и учитывать наличие ограничений координат.Наиболее широко принцип максимума применяют при синтезеоптимальных управлений в задачах максимального быстродействия и наличии ограничений координат управления ul (t ) ≤ U l max ;l = 1, 2,… , r.Таким образом, принцип максимума имеет ряд преимуществперед классическим методом вариационного исчисления.
Принципмаксимума прежде всего представляет ценность для инженера благодаря универсальности своей формулировки. Различные типызадач оптимизации изучаются с единой точки зрения. Это позволяет получить некоторые достаточные условия существования оптимального управления, например, для линейного объекта. Принципмаксимума является удобным средством определения оптимального закона управления как функции времени, т.
е. отыскания оптимальных программ управления (разомкнутые системы автоматиче20ского управления – САУ), а не отыскания управлений в видефункций от переменных состояния.1.5.3. Метод динамического программированияОдновременно с принципом максимума Понтрягина и независимо от него в теории оптимального управления коллективом американских ученых во главе с Р. Беллманом был разработан методдинамического программирования [3].Этот метод более универсален, чем метод, использующийпринцип максимума. Он применяется для нужд оптимальногоуправления процессами более общего характера, чем процессы,описываемые системами дифференциальных уравнений, и позволяет решать большой круг задач оптимального управления дискретными системами, т.