Пупков К.В. Методы классической и современной теории автоматического управления. Том 2 (2000) (1095389), страница 92
Текст из файла (страница 92)
2.3.3. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ Рассмотрим двухточечную задачу об оптимальности по быстродействию управления обьектом (2.74) при наличии ограничений (2.76). При этом предполагается, что начальной точкой х может быть любая точка фазового пространства, а конечная точка х! совпадает с началом координат, т.е. х =О.
Как и всюду в данном параграфе, будем считать, что система уравнений (2.74) является нормальной. Теорема 2.4. Пусть и (!) и х (!), го < ! < г! — управление и траектория, переводяи!ие фазовую точку х системы (2.74) из заданного начального положении х в нао чало координат. Если управление и* (!) и траектория х'(!) удовлетворяют теореме 2.2, то они доставляют функционалу з = ) г!! = г! — го абсолютный минимум. Доказательство. Запишем равенство — ~!у,(х, -х,) = , '!у,( — '-.— ')+ , '(х, -х,) — ', (2.88) Глава 2. П инцип максим ма Пон ягина 495 здесь х(1) — любая траектория системы (2.74), соответствующая допустимому управлению п(1) и переводящая фазовую точку системы из заданного начального положения х в начало координат.
Будем, далее, полагать, что траектории х(1) н х (1) ИСХОДЯТ ИЗ НаЧаЛЬНОЙ ТОЧКИ Х В ОДИН Н тат жЕ МОМЕНТ ВРЕМЕНИ гь. Перепишем равенство (2.88) в векторной форме й т а [ц! (х -х)]= — (х -х)+ц!' — '((х -х). (2.89) Из (2.89), принимая во внимание (2.78) и (2.74), найдйм — [ц!'(х — х)) = — ц!'А(х -х)+ц!'[А(х -х)+В(н -в)) = с!1 (2.90) =ц!~В (в -н). Управление н'(1) н траектория х (1) удовлетворяют теореме 2.2 н поэтому управление и (1) в каждый момент времени 1 макснмнзнрует функцию цг~В п, т.е. в каждый момент времени 1 имеет место неравенство ц!тВ (ц (1) — и(!))>О.
Выше было показано, что для нормальной системы (2.74) управление и'(1) из условия максимума функции ц!~Вп определяется однозначным образом. Далее, если Х(1) Е Х (1), та П(!);ь и (1), ПРИЧЕМ В КажДОй ТОЧКЕ 1 (За ИСКЛЮЧЕНИЕМ КОНЕЧНОГО числа точек, а их можно не принимать во внимание), в которой п(1) е и (!) ц! В (и (!)-ц(!)) >О. (2.9 !) Обозначим т момент времени, в который приходит в начало координат траектории х(!).
Покажем, что т > 1!, если х(1) е х (1), здесь 1, — момент прохождения траектории х (1) через начало координат. Предположим противное и положим п(1) =О при с<1<1,. Тогда х(1) = 0 при т <1 < 1,. Проинтегрируем равенство (290): !! ) — (цю~(х -х))!!1=) ц!~В(п -п)а!1. !ь !о Из (2.92), принимая во внимание неравенство (2.91) и соотношение х (1,) = х(1,) = О, найдем, что О=С, (2.93) где С > О. Полученное противоречие доказывает недопустимость предположения о том, что т < 1, . Далее, поскольку на функцию х(1), которая сравнивается с функцией х (1), не накладывались никакие ограничения, то доказан абсолютный минимум функционала,У. Теорема 2.5 (теорема единственности). Пусть х (!) и х (1) — две оптималь- ные траектории, соединяющие начачьную точку х с конечной точкой х и досо ! тавляющие абсолютный минимум функ!!ионову 496 Методы тео ии оптимального п авления.
Часть П1 Тогда х (г) и х (г). (2 96) Из (2 9б) следует уравнение — +лг =О, 4'чг 3 1 решение которого имеет вид Нз(г)= с, сом+с« япг = Ля)п(г-а), здесь Л(Л>О) на-некоторые постоянные, причем 0 < а я2л В соответствии с (2 95) и(г) = яйп яп(г — а). Таким образом, оптимальное управление представляет собой кусочно-постоянную функцию, принимающую значения +! и -! на интервалах времени длиною х Исключение составляют первый и последний интервалы, длина которых зависит от а и г, (г„полагается равным нулю) и может быть яюбой величи- ной, не превышающей числа х Доказательство.
Будем предполагать, что в равенстве (2.90) вспомогательный вектор зр = (гр!(!),..., гр„(г)), существование которого гарантируется теоремой 2.2, соответствует оптимальной траектории х (г). Если х (г)их (г), то имеет место неравенство (2.91) и из (2.92) тогда следует противоречие (2.93), которое доказывает теорему. В теореме 2.5, в отличие от теоремы 2.4, конечной точкой х' может быть любая точка фазового пространства. Точку х' будем называть точкой равновесия, если найдется вектор н', удовлетворяюший ограничениям (2.76), такой, что Ах' + Вво = О.
При н(г)=в уравнение (2.74) имеет решение х(г) = х'. Анализ доказательства теоремы 2.4 показывает, что она сохраняет свою силу, если конечной точкой х является точка равновесия (точка х = 0 является частным случаем точки равновесия). ! При управлении техническими объектами, как правило, рассматривается перевод фазовой точки системы в точку равновесия (обычно в начало координат). Именно такая ситуация и рассмотрена в теореме 2.4. На самом деле теорема 2.4 сохраняет свою силу и в том случае, когда х может быть произвольной точкой фазового про! странства. Однако в этом случае доказательство теоремы заметно усложняется. Пример 2.4.
Рассмотрим систему уравнений (2 94) «з =и — «г Будем решать задачу о наибыстрейшем переводе фазовой точки системы (294) из началыюй точки х" = («,",х,") в начало коорлинат за минимально возможное время, полагая, что на управляющий параметр и ншюжено ограничение )и)я ! В процессе решения задачи в качестве начальной точки будет рассмотрена любая точка 4жзового пространства Легко видеть, что система уравнений (2.94) является нормальной Поэтому управление и(г) и траектория х(!), удовлетворяющие теореме 2 2, в соответствии с теоремой 2 4, являются оптимальными Запишем функцию Гамильтона 0(лг,х,и)=Ли «з ьжз(и — «!) Из условия максимума функции Гамильтона находим, что оптимальное управление и(!) = з)йп ж з(!) Вспомогательный вектор Чз(!) определяешя уравнениями Н% НЮ2 — ГШЗ. — Г-ж! г)г 497 Глава 2.
П иицип максим ма Пои ягииа Найлем фазовые траектории системы (2 94) при и =1 и л = -1 При и = 0 из сравнения уравнений (2.94) и (2 96) следует, что хз(г) = ЯЯ!п(г+ У), »(г) 0-исоа(г + 7) Фазовые траектории представляют собой окружности вида х~~ ь хзз = я~ (2 97) Радиус й зависит от начальных условий и может быть любой величиной При и=) уравнения(294) можно переписать ввиде с'(х, -1) Ых, =ха, — '= — (х, — 1) иг ' г(г В соответствии с (2 97) фазовые траектории системы (2 94) при и = 1 представляют собой окружности (*,-1)','=и' (2 98) радиуса )( с центром в точке О, с координатами (1,0) Семейство окружностей (2 98) изображено на рис 2 19 Рис. 2.19.
Графики окружностей, определяемых (2.98) Аналогичным образом легко показать, по при и =1 фазовые траектории являются окружностями вида (», + 1)'+,' = Я' (2 99) с центром в точке О.ь имеюаей координаты (-1,О) Окружности семейсгва (2 99) представлены на рис 2 20 Рнс. 2.20. Графики окружгюетей, определяемы* (2.99) По окружностям семейств (2.98) и (2.99) фазовая точка движется по часовой стрелке с равномерной скоростью, проходя за время к ровно половину окружности.
Рассмотрим оптимальную фазовую траекторию, которая соответствует управлению, представленному парис 221 На заключительном участке фиовая точка движется под воздействием управления и =1 по дуге окружности семейства (2.98), причем по той из окружностей семейства (2 98), которая проходит через начало координат, т.к конечной целью управления является перевод фиовой точки в начало координат Обозначим и длину заключительного участка Очевидно и < к За время и фазовая точка проходит дугу АО окружности 33 Зак. звв 498 Методы тео ии оптимального п авлеиил. Часть!П (х~ 1) +ха =1, меньше половины окружности (рис 2 22) Рис.
221. Графики управления н(1) В положение А фазовая точка попалц двигаясь в течение времени х под воздействием управления и = -1 по дуге ВА окружности семейства (2 99). За время я фазовая точка проходит ровно половину окружности. Таким образом, точка В симметрична точки А относительно центра О, Следующим участком оптимальной траектории (считая от конца) является полуокружность СВ с центром в точке Оь и, следовательно, точка С симметрична точке В относительно центра О, и та. Изображенному на рис 2 21 оптимальному управлению соответствует оптимальная траектория ОСВАО.
Рне. 2.22. График оптимальной фазовой траектории Если рассмотреть оптимальное управление (рис. 2 23), у которого на заключительном участке длиною П и(г)=-1, то получим оптимальную траекторию, симметричную траектории ОСВАО относительно начала коорлинат (на рис 2 22 траектория ОС'ВО) Рассмотрим теперь, что представляет собой совокупность всех возможных оптимальных траекторий Длительность заключительного участка П может быть любым числом, лежащим в диапазоне 0 эцлх Поэтому точка А может быть любой точкой полуокружности ОМь Точка В симметрична точке А относительно центра О,, и поэтому она может быть любой точкой полуокружностн Ф,Уз Аналогичным образом можно показать, что точка С может быть любой точкой полуокружности М,М, и т.д Если рассмотреть оптимальную траекторию типа ОС'В А 'О, то указанным выше способом легко установить, что возможные положения точки А' образуют полуокружносгь )Г>О, возможные положения точки В' — полуокружность М>Мь а возможные положения точки С' — полуокружность ггздгз и т.д Но точки А, В, С, А; С; В'являются точками фюового прострвиствц в которых происходит переключение оптимального управления.