Деменков Н.П. - Вычислительные методы решения задач оптимального управления на основе принципа максимума Понтрягина - 2015 (842911), страница 2
Текст из файла (страница 2)
Однако условияоптимальности,получаемыеприегоприменениидлямногостадийных процессов, позволяют найти достаточно удобные алгоритмы оптимизации.1.1. Постановка задачи синтеза оптимальных систем уравненияДля решения задачи оптимального управления составляют математическую модель управляемого объекта или процесса, описывающуюегоповедениевовремениподвлиянием управляющих7воздействий и собственного текущего состояния.
Математическаямодель для задачи оптимального управления включает в себя :формулировку цели управления, выраженную через критерий качества управления; получение дифференциальных или разностныхуравнений, описывающих возможные способы движения объектауправления; определение ограничений на используемые ресурсы ввиде уравнений или неравенств.Задачу оптимального управления можно представить в видеструктуры, состоящей из цели управления, управляемого объекта,измерительной системы и вычислительного устройства, осуществляющего расчет оптимального управления (рис.тельного устройства-1.1 ).Задача вычислинайти условия, связывающие Xk , и и Хизм.При решении задач оптимизации необходимо сначала выбрать исформулировать целевую функцию (выбрать критерий оптимальности), затем согласовать ее с имеющимися возможностями (т. е.
учестьограничения) и, наконец, реализовать способ достижения оптимального значения целевой функции при учете ограничений.НеуправляемыеЦель управленияЗадание,хk'Jпереме нные! Возмущения (модель), wРасчетоптимальногоУправляющиепеременные, и Е ИУправляемыйобъектВекторсостояния, ХЕ х(модель)управленияИзмерительнаяХизмРис.система1.1.
Структура задачи оптимального управленияКритерий оптимальности может представлять собой технический или технико-экономический критерий, математическое выражение которого есть функция или функционал координат процесса и управляющих воздействий. В управлении техническимисистемами наиболее распространенными являются различные интегральные критерии.8В общем случае критерий оптимальности под интегралом содержит нелинейную функциюLот вектора состояния х и векторауправления и (задача Лагранжа):fkJf= L(x(t), и (t), t)dt.toПри технической реализации систем управления обычно используют простые критерии, включающие лишь основные требования ксистеме.
Например, в системах, оптимальных по быстродействию,функцияL = 1, и критерий оптимальности принимает видfkfJ = 1dt = tk - to = Т = min.toТакой критерий отражает требование минимизации времени переходного процесса и используется при разработке приводов металлорежущих станков, исполнительных механизмов регуляторов газовыхтурбин и прокатных станов, быстродействующих самопишущих приборов, систем управления движущимися объектами и др.Для задачи управления конечным состоянием ( задача Майера)при встрече двух тел в пространстве, например фрезы и заготовки,применяют критерий качества3J=lx(tk)-z(tk)I= I:[xi(tk)-zi(tk)]2 ,i=1где х (tk ) - координаты фрезы;z (tk ) - координаты заготовки.В обобщенной форме этот критерий можно представить в видеДля класса детерминированных систем в наиболее общем видекритерий оптимальности можно записать как задачу Больца:fkJf= Gk(x(tk), tk) + L(x(t), u(t), t)dt.toМодели управляемого объекта описывают, как правило, нелинейным векторным дифференциальным уравнением9х= f(x,и, t).При синтезе управления предполагают, что все помехи отфильтрованы.
Справедливость такой декомпозиции доказана только длялинейных систем, но естественность подхода делает его привлекательным для инженерной практики.Точность управления зависит также от строгости удовлетворения концевым условиям.Граничные условия следует задавать таким образом, чтобы существовал не единственный переход объекта из начального состояния в конечное при соблюдении ограничений.Несущественные изменения (вариации) условий задачи должныприводить кнесущественным изменениям минимального значенияпоказателя качества.
В практике синтеза могут встречаться дополнительные ограничения видаlkf N(x(t), u(t), t)dt = const.toНапример, это может быть ограничение количества топлива, материальных и людских ресурсов, которое может быть затрачено нарешение задачи .Ограничения могут быть наложены как на управляющие воздействиятак и на координаты системыlx1I ~ Xlmax, lx2I~ X2max, ...
,lxп l ~ X n max•Например, при управлении двигателем постоянного тока ограничены ток якоря (по условиям нагрева), напряжение (по условиямэлектрической прочности) и скорость вращения вала двигателя (поусловиям механической прочности), что не позволяет беспредельно уменьшать время переходного процесса.Во многих случаях ограничения придают смысл задаче об оптимальном управлении, решением которой должен быть ответ навопрос, как добиться наилучших результатов при ограниченныхресурсах.10Для того чтобы оценка свойств системы была объективной,любая форма записи должна содержать в себе информацию нетолько об изменении управления, но и о конечном и начальном состоянии системы.
Простейший способ записи заключается в фиксации граничных условий, т. е. получаем задачу с закрепленнымиконцами, когда задаются координаты начальной и конечной точек.Задача со свободным правым концом, когда допускается произвольное положение объекта в момент окончания управления fk,также является простейшей.Наиболее общий случай задания граничных условийсподвижнымиконцами(левым,если-допускаетсязадачивариацияначальных условий, и правым, если ограничения наложены на конечные условия движения).
Это означает, что граничное состояниесистемы определено с точностью до выполнения некоторых соотношений, называемых граничными условиями, например,Go ( x(to), to) = О;Gk(x(tk),tk)=O.В рамках этих ограничений допустимо любое начальное и конечное состояния системы.Математическая формулировка задачи оптимального управления состоит в следующем.Пусть управляемый динамический объект описывается на интервале времени[to , fk]системой нелинейных дифференциальныхуравненийx=f(x, и, t)(1.1)с системой граничных условий в начальный и конечный моментывремениx(to)=хо,(1.2)Имеется система ограничений, которым должны удовлетворять переменные состояния и управления:хгде Х, И-(t)Е Х, и(t)Е И,(1.3)заданные множества.11Необходимо найти такой вектор оптимального управленияи*,чтобы он обеспечивал экстремум целевой функции ( критерияоптимальности)fkJJ(x(tk),tk)=Gk(x(tk),tk) + L(x(t),u(t),t)dt(1.4)toи переводил систему из начального ( х (to) = хо) в новое состояние,расположенное внутри области Gk ( x(tk ), tk) > О, и при этом удовлетворялись интегральные ограничения видаfkJN( x(t), и (t), t) dt = const.(1.5)toДля решениязадачоптимальногоуправленияиспользуюткосвенные (аналитические) методы, а также прямые (численные)методы оптимизации.К прямым методам оптимизации относят различные задачиматематического программирования.Косвенные методы оптимизации включают в себя методыдифференциального и интегрального исчисления, классическоевариационное исчисление, принцип максимума Понтрягина и метод динамического программирования Беллмана.Общим для методов косвенной оптимизации является то, чтовид оптимальной функции управления и ее структуру определяютна основе необходимых условий оптимальности.1.2.
Принцип максимумаВо многих задачах управления область допустимых траекторий и управлений оказывается ограниченной и замкнутой.Необходимость применения принципа максимума Понтрягинавозникает в случае, когда нигде в допустимом диапазоне управляющейпеременнойневозможноудовлетворитьнеобходимомуусловию в классическом вариационном исчислении дН/ ди= О.Принцип максимума имеет ряд преимуществ перед классическим методом вариационного исчисления. Он прежде всего представляет ценность для инженера благодаря универсальности своей12формулировки. Различные типы задач оптимизации рассматривают сединой точки зрения. Принцип максимума является удобным средством определения оптимального закона управления как функциивремени, т. е.
для отыскания оптимальных программ управления.Особенно важен принцип максимума в системах управления смаксимальным быстродействием и минимальным расходом энергии, где применяются управления релейного типа, принимающиекрайние, а не промежуточные значения на допустимом интервалеуправления .В1956 г.Л. С . Понтрягин, В . Г. Болтянский, Р.В . Гамкрелидзе иЕ. Ф. Мищенко предложили метод, обобщающий методы классического вариационного исчисления для задач, в которых управляющие воздействия описываются кусочно-непрерывными функциями, а множество значений этих функций принадлежит замкнутомуограниченному множеству.С помощью принципа максимума, положенного в основу этого метода, получают условия оптимальности,литьизмножества допустимых процессовпозволяющие выденекотороеподмножество процессов, которые могут быть оптимальными.Для широкого круга задач принцип максимума дает возможность определить единственную траекторию, которая может бытьоптимальной.
Если в конкретной задаче из каких-либо соображений (например, из содержательного смысла этой задачи) известно,что оптимальное управление существует, то выделение этой единственной траектории и позволяет получить решение задачи.Для линейных задач оптимального управления принцип максимума-необходимое и достаточное условие оптимальности.Особенностью принципа максимума является то, что вариационная задача нахождения управления как функции времени идоставляющей экстремум заданному функционалулее простой задаче определения и* (t),J,* (t),сведена к бообеспечивающего максимум функции Гамильтона Н(и ).
Отсюда и название метода-принцип максимума.Определим оптимальное управлениетраекторию х* (t),и* (t)и оптимальнуюдоставляющие минимум функционалуlkfJ(x , и)= L(x, и, t)dt(1.6)to13при условиях(1.7)x=f(x,u,t);(1 .8)игдеGo, Gk -EU,(1.9)+ 1)-мерного пространствазаданные многообразия (пначальных и конечных условий; И -некоторое замкнутое множество допустимых управлений; функцииL, f= (Ji, ... , fп)и их частные производные по х непрерывны по совокупности переменных.Единственное отличие рассматриваемой задачи от задачи Лагранжавклассическомнового условия(1.9).вариационномисчислении-появлениеОднако именно это обстоятельство и делаетзадачу значительно более трудной.
Это связано с тем, что допустимые вариации управления должны удовлетворять условиюи =и* +8u ЕИ,т. е. вариации управления теперь не произвольны, а должны удовлетворять заданным ограничениям.Управлениеu(t) будемразыскивать в классе кусочно-непре-рывных функций.Принцип максимума также приводит к двухточечной краевойзадаче.Процедура определения оптимального управления на основепринципа максимума сводится к следующему.Вместо функционала(1.6))вводят эквивалентноеL(x, и, t) при x(to) = О,(1.1 О)J(x,и) (см.ему уравнениехо=расширенный вектор состоянияХ= (xo,Xl,...