1611690511-f3d3a168b7ec28ce5001ecec523eb6f6 (826917), страница 101
Текст из файла (страница 101)
д. зк1 ы если найдется вектор-функция гр(1) = (йт(1),...,ф (1)), удовлетворяющая совместно с вектор-функцией х(~) системе дифференциальных уравнений д'Н дН дич ' дх; ' и условиям трансверсальности Н(х(1о), п(1а), гР(1а)) д1о — ~ 4'(1о) Их;(1о) = О, Ек1 Н(х(Н), п(Н), ф(С~)) ей1 — " г)ч(йд) дх;(й1) = О, которые подходящим выбором гр и и в моменты ~о и 11 долзюны быть выполнены для любых допустимых условиями задачи дифференциалов ас и Их в начальной и конечной точках интегрирования.
Условия трансверсальности обусловливают краевые значения вектор-функций ф и и. Доказательство. Достаточно воспользоваться полученной формулой для дифференциала дй, которая справедлива независимо от выбора вектор-функции гр. Потребуем, чтобы ф было решением системы дифференциальных уравнений дН ф;= — —, г=1,...,т, дх; где х служит решением исходной системы уравнений: дН х;=Л;= —, (=1,..,,т.
'= ''=дф» Решение х(1) зависит только от управления и и заданных начальных или краевых условий для х. Для заданного управления решение х(1) определяется независимо от неизвестной вектор-функции гр(1). После того как решение к(1) найдено, можно воспользоваться системой дифференциальных уравнений для ер, задав краевые условия на начальные и конечные значения ф(1о) и гр(11) таким образом, чтобы 8.11. Экстремумы функционалов 609 уничтожить внеинтегральные члены в формуле, выражающей дифференциал функционала. После выполнения указанной процедуры в формуле для дифференциала функционала останутся только члены, содержащие управление. П Переменные ф;, 1 = 1,..., т называются сопряженными переменными, а определяющая их система дифференциальных уравнений— сопряженной системой. Функция Н называется функцией Гамильтона или гамильтопиапом задачи управления.
Сопряженная система совместно с системой дифференциальных уравнений для переменных х;, 1 = 1,..., гп, образуют гамильтонову систему дифференциальных уравнений. Свойствам таких систем посвящена следующая глава. Замечание 8.11.2. В приведенных выше рассуждениях не требовалось каких-либо жестких ограничений на функции Иг(х, ц,1) и ц(1). Достаточно лишь, чтобы выполнялись условия существования решений сопряженной системы, а функция — биу дН у=г ди. была интегрируемой в смысле исходного функционала. Например, функция Иг может быть кусочно-дифференцируемой по управлению, а н — кусочно-непрерывной вектор-функцией.
Следствие 8.11.2. В условиях теоремы В.114 градиент функционала Гт по управлению выражается вектор-функцией дО г'дН ВН ~ — = ~ —,...,— ), и=(цЕЯ:п=п(1), 1о<1<Н). ди ~ диг' 'дие) ' П р и м е р 8.11.3. Рассмотрим одномерное движение материальной точки, описываемое дифференциальным уравнением 1<и<1 где и — управление, выбираемое произвольно в указанном диапазоне, но так, чтобы уравнение движения имело решение.
В начальный момент времени 1о = 0 точка имеет координату д(0) = до и скорость д(0) = до. Управление требуется выбрать так, чтобы перевести точку из начального заданного положения в положение д(Т) = О, д(Т) = 0 за кратчайшее время Т. Такая задача встречается в теории активной стабилизации движения или равновесия. Глава 8. Динамика голономных систем 610 Р е ш е н и е. Примем обозначения: х1 = д, хг = о. Тогда имеем систему дифференциальных уравнений первого порядка хо=и, — 1<и<1.
х! = хг~ Функционал 9 и гамильтониан Н теоремы 8.11.4 принимают вид Π— 1 й, Н вЂ” 1 + о'1хг + 1гги о Запишем сопряженную систему дН дН гб1 = — =О Рг=- — = Фы дх1 ' дхг Проанализируем условия трансверсальности. Начальная и конечная точки движения фиксированы, фиксирован также и начальный момент времени. Следовательно, дх1(0) = г1хг(0) = Йхг(Т) = дхг(Т) = 0', г0о = О. Конечный момент времени не фиксирован; ИП = МТ ф О. Поэтому условия трансверсальности будут выполнены, если приравнять нулю коэффициент при Й~. 1+ 4~1(Т)хг(Т) + 4~г(Т)и(Т) = 1+ йг(Т)и(Т) = О. Дифференциал функционала О в пространстве управлений принимает вид т бО = Фгби д1. о Найдем решение сопряженной системы: гб1 = соней 4~г = (1 — Т) р1 + Фг(Т).
Функция 4г(1) служит градиентом функционала 9 и определяет структуру оптимального управления. Из условия трансверсальности следует, что ~бг(Т) ф О. Поэтому функция Фг(1) может обратиться в нуль всего лишь в один момент времени, и рассматриваемый функционал может иметь экстремумы только на границе области управления. Поскольку требуется найти минимум функционала, то следует выбирать и = — в)кп гбг, Только в этом случае любая вариация управления будет приводить лишь к увеличению функционала.
Из условия трансверсальности тогда следует, что Фг(Т) = Ы. В любом случае в зависимости от значения гбг управление как функция времени либо вообще не имеет переключений и все время остается равным какому-либо ограничению допустимой области, либо имеет только одно переключение с одного ограничения на другое. 8.11. Экстремумы функционалов 611 Нхг — хг дт ахг — =-и, 0<т<Т.
дт Пусть сначала и = +1. Интегрируя, получаем уравнение траектории тг хг= — т, х1 2 На плоскости (хыхг) зто полупарзбола, отвечающая отрицательным значениям хг и положительным значениям хь Предположим теперь, что при каком-то значении т = тг произошло переключение управле- ния, так что ( +1, О < т < ты и(1) = ~ )( -1, тг < т < Т. Тогда для момента т = Т будем иметь Тг хг — — — 2тг+Т, хг=2т;Т вЂ” тг — —, 0<тг<Т. г 2' При изменении тг в указанных пределах получим все множество точек фазовой плоскости, для которых время Т приведения в начало координат минимально, если и(+0) = 1.
Аналогичные результаты получаются и для случая и(+О) = — 1. Полупарабола, выходящая из начала координат и служащая линией переключения, имеет вид г хг 2 хг = т, Если имеется переключение, то / — 1, 0<т<ты '1+1, тг<т<Т, и множество точек, для которых время Т минимально, выражается фор- мулами г Т хг — — 2тг — Т, хг = — 2тгТ+ тг+ —, 0 < тг < Т.
Более полное представление об оптимальном управлении дает задача сингпеза. Так называется задача определения оптимального управления в зависимости от фазовых координат (в рассматриваемом случае от хы хг). Используем результаты исследования структуры оптимального управления. В начало координат траектория может входить либо при и = +1, либо при и = — 1. Возьмем независимую переменную т = Т вЂ” 1. Определим все точки фазовой плоскости, из которых можно попасть в начало координат по закону оптимального управления зз время Т.
Уравнения движения примут вид Глава 8. Динамика голономных систем 612 Таким образом линия переключения состоит из двух непересекающихся полупарабол. !!!!ы можем их объединить одним уравнением; !х2!х2 — — -оо < хг < + х!. 2 Рецепт оптимального управления прост. Пусть фвзовая точка, отражающая текущее состояние системы, имеет координаты 1хыхо). Из уравнения линии переключения можно найти соответствующее значение хь Управление в точке (хы хг) имеет вид +1, хг < хг(хг); и = — в)8п хг, хг = хг(хг); -1, х! > хг(хг). Приведенная формула определяет оптимальное управление для всей фв- зовой плоскости. О 8 8.12.
Интегральные вариационные принципы Теорема 8.12.1. (Принцип Гамильтона стационарного действия). Действительное деилсение голономной механической системы под действием потенциальных (обобщенно потенциальных) сил, выполняемое от заданного положения ц(1о) = цо до другого заданного положения ц(гг) = о! (гг > го), отличается от кинематически возможных движений системы мелсду этими пололсенилми о тол! все интервале времени тем, что действительное движение слузкит зкгтремалью функционала Ф(у) = Цц, ц, 1) дг, гдг Ь = Т+ о' — функция Лагранжа системы.
Доказательство. Вектор-функция ц1!) лагранжевых координат, описывающая действительное движение, удовлетворяет уравнениям Лагранжа второго рода (см. г 8.1), которые в свою очередь служат необходимыми и достаточными условиями экстремальности (теорема 8.11.2).П Определение 8.12.1. Пусть у — зкстремаль функционала Ф в смысле теоремы 8.12.1.
Значение этого функционала на экстремали зависит от начального и конечного положения системы, начального и конечного моментов времени: Яцо Чг, го, г ! ) = Ф17). 8.12. Интегральные вариапнонные принципы 613 Функция Я!1а,т1!,1е,1!) называется девствиел! по Гамильтону.
Замечание 8.12.1. Использование принципа Гамильтона приводит к необходимости решать краевую задачу, то есть задачу о поиске решения системы дифференциальных уравнений движения, удовлетворяющего заданным краевым условиям с1(1е), г1(1!). Эта задача имеет ряд существенных особенностей по сравнению с задачей Коши, когда решение системы дифференциальных уравнений определяется по начальным условиям !1(та), !1(тв). Задача Коши в силу принципа детерминированности Ньютона для реальных механических систем всегда имеет единственное решение. Решение же краевой задачи при произвольном выборе краевых условий может вообще отсутствовать или быть неоднозначным. Сказанное проиллюстрируем примером.
П р и м е р 8,12.1, Функция Лагранжа гармонического осциллятора выражается формулой (2 22) 2 где д — единственная лагранжева координата. Для определения закона движения воспользуемся принципом Гамильтона. Зададим начальный момент 1е — 0 и конечный 1! моменты времени, а также желаемые начальное д(Ма) = дв и конечное 9(1!) = 9! положения системы. Тогда ее закон движения должен доставлять экстремум функционалу Ф (™( г т з),11 !г 2 среди всех функций 9(1) таких, что 9(1в) = де, д(Х!) = аь Применив теорему 8.11.2, убеждаемся в том, что движение рассматриваемой системы должно удовлетворять уравнению гармонического осциллятора (см. З 3.9) д+ы 9=0. Пусть 1з = О.