XV Ванько В.И., Ермошина О.В., Кувыркин Г.Н. Вариационное исчисление и оптимальное управление (1081425), страница 29
Текст из файла (страница 29)
с)е1(им ..., иа) е О. Пример 7.2. Рассмотрим систему х1 = хт+ им хг = хз+из, хз = т1+ им для которой А = 0 0 1 , В = 0 1 многогранник б7 описывается неравенствами )и1! < 1, )из! < 1 и на плоскости п10па представляет собой квадрат. Проверим для этого многогранника (многоугольника) условие общности положения по отношению к заданной системе.
Поскольку четыре ребра квадрата Г разделяются на две пары паралельных ребер, для проверки общности нужно рас- т т смотреть только два вектора щ = (1, 0) и ит = (О., 1) . Для 226 7. ПРИНЦИП МАКСИМУМА первого из них имеем Вп1= О, АВц1= 1, А Ве1= 1 Так как о О 11= — 2~0, о то система векторов Вп1, АВпм АвВп1 линейно независима. Аналогично для второго вектора цз получаем Вез= 1, АВпз= О, А Виг= 0 Так как 0 1 0 1 О 0= — 1~':О, 0 0 1 то и система векторов Вцз, АВцз, А Вез линейно независима.
Таким образом, заданный многогранник удовлетворяет условию общности положения относительно заданной системы дифференциальных уравнений. ф Для линейной задачи оптимального быстродействия (7.30), (7.31) запишем функцию Попгпряеина Й(й.,х,и): и и я Й=Ф Ах+Ф Ви= ~~1 ~~1 ф1а,, х.+ ~~ ~~ фьдыи1. (7.33) ~=1 1=1 Ь=11=1 Сопряженная систпежа в данном случае имеет вид дф, ' — — 'Г = — Г~11ф1 7'=1 п, 7.4. Линейная задача ентиыальнете быстродействия 227 или в векторной форме (7.
34) Согласно (7.33), функция Й, как функция переменного и, т достигает максимума одновременно с функцией и'(и) = Ф Ви. Обозначим через Р(Ф) максимум функции Р(и) на множестве 57. Из теоремы 7.2 следует, что если и*(~) -- оптимальное управление, то найдется такое ненулевое решение Ф*(т) системы (7.34), что (7. 35) Так как система (7.34) с постоянными коэффициентами не содержит неизвестных функций х(т), и(т), то все ее решения можно найти, после чего легко опроделить соответствующие управления и*(у) как решения уравнения (7.35).
Решение последнего сводится к поиску наибольшего значения линейной функции Р(и) на замкнутом ограниченном множестве с7. Правда, возникает вопрос, имеет ли задача поиска и, при котором Г(и) максимально на 57, единственное решение. Ответ на это дает следующее утверждение. Теорема 7.3. Для любого нетривиального решения Ф(1) системы (7.34) соотношение (7.35) однозначно определяет управление и(с), причем это управление кусочно постоянно, а значениями управления в точках непрерывности являются вершины многогранника 77. ~ Пусть Ф(у) произвольное нетривиальное решение системы (7.34). Так как функция Ф(1.,и) = Ф(у) Ви линейка по и, то она имеет максимум на границе многогранника 77 (Х1Ч]. При этом максимум может достигаться либо в вершине многогранника, либо во всех точках некоторой грани.
Покажем, что в силу общности положения многогранника последняя ситуация реализуется лишь для конечного числа значений времени 1. 228 Т. ПРИНЦИП МАКСИМУМА Предположим, что для некоторого бесконечного множества М с [1>., 1з) при 1 Е М функция Ф(1, и) достигает максимума на целой грани Г> многогранника Г>. Тогда при и Е Г> она постоянна.
Поскольку множество М бесконечно, а количество граней Г> конечно, в М можно выделить бесконечное подмножество Мг значений, которым соответствует одна грань Г многогранника П. Пусть ие и и> -- концы ребра грани Гь Тогда вектор о = и> — ие определяет направление этого ребра. При этом для ~ Е Мг Ф(~) Во — Ф(~) В(и> — ио)— = Ф(~) Ви> — ФЯ Вие = Ф(>,и>) — Ф(1,ио) = О. Итак, функция Ф Во при 1 Е Мг обращается в нуль. Матрица В является числовой, и мы можем считать вектор о также постоянным, так как он один и тот же для всех 1 Е Мг. А теперь отметим следующее..
Поскольку функции Ф,(>) являются решениями линейной системы дифференциальных уравнений с постоянными коэффициентами, они представляют собой аналитические функции [Х): в этом контексте ~ можно рассматривать как комплексный аргумент и аналитичность будет иметь место во всей комплексной плоскости. Значит, и функт ция Ф Во является аналитической. Но так как она обращается в нуль на бесконечном подмножестве М отрезка [1>, ~э1, то, согласно теореме единственности [Х[, Ф Во = О при любом 1. Последовательно дифференцируя тождество Ф Во = О по 1 в силу системы (7.34), получаем (А Ф(г)) Во = О, цА )~Ф(>)) Во = О, ИА )" >Ф(1)) Во=О, 7.4. Линейная задача оптимального быстродействия 229 или, учитывая известное матричное тождество (АВ) = В А, т т т Ф(7) Вп = О, .Р(~) АВп = О, Ф(~) А Вп=О, (7.36) Ф(1) А" Вп =О.
Так как, по предположению, выполняется условие общности положения многогранника ХХ, система векторов Вп., АВп, ..., Ав 1Ви линейно независима, а потому образует базис в К". Из соотношений (7.36) вытекает, что при любом ~ вектор Ф(~) ортогонален каждому вектору базиса, а потому равен нулю. Это противоречит предположению о том, что решение Ф(~) системы (7.34) нетривиально. Итак, противоречие показывает, что для всех 1, кроме разве лишь конечного числа, функция Ф(1,и) достигает максимума только в одной точке вершине многогранника.
Значит, всюду, кроме конечного числа точек, определено однозначно управление и(Х). Выколов конечное число точек неоднозначной разрешимости уравнения (7.34)., мы тем самым разобьем отрезок [гм Хз) на конечное число частичных интервалов. Выберем один из таких интервалов сь = (т~.,тя). Пусть им ..., ия вершины многогранника 77. Тогда сь разделится на а непересекающихся множеств ЛХм ЛХо, ..., М„где ЛХ, множество значений ~ Е сь, в которых максимум Ф(Х, и) достигается в вершине иь Оказывается, что все множества М, являются открытыми (см.
ниже). Но интервал,Ь можно представить как об ьединение открытых непересекающихся множеств только в том случае, когда лишь одно из этих множеств непусто. Отсюда следует, что на интервале ст функция и(1) постоянна, а потому непрерывна. Покажем, что множество М, открытое, т.е, если тд Е М;, то и целая окрестность то также принадлежит М,. Другими 230 7. ПРИНЦИП МАКСИМУМА словами, если в точке те функция Ф(1,и) достигает максимума в вершине и,, то и при всех 1., достаточно близких к тсо функция Ф(г., и) достигает максимума в вершине и,.
Итак, при у ф 1 имеем Ф(ты и,) < Ф(ты и,) = Р(М(те)). Функция Ф(вази) = = Ф(1) Ви непрерывна по ~. Поэтому конечный набор неравенств Ф(тз и ) < Ф(1,и,), ~ ~1, выполняющихся в точке 1 = тд, останется в силе и в некоторой окрестности точки тш Но это как раз и значит,что точка максимума функции остается неизменной в некоторой окрестности те. Ь Согласно доказанной теореме, каждое оптимальное управление является кусочно гюстоянной функцией со значениями в вершинах многогранника Г.
Точки разрыва соответствуют смене значения управления, и мы будем называть их тпочиами переключения. Если т . точка переключения, то слева от нее управление имеет одно значение, скажем и,, а справа другое-- из. В этом случае говорят, что в т происходит перетлючение оптимального управления и*(1) из вершины и; в вершину и . Теорему 7.3 можно было бы охарактеризовать как теорему о конечности числа переключений.
В каждой конкретной ситуации число переключений зависит от закона движения (7.30), вида области управления (многогранника) Г и краевых условий х', х2. Оказывается., что есть класс линейных задач, в которых при любых краевых условиях можно указать оценку сверху для числа переключений. Характерным признаком этих задач является отсутствие комплексных корней у характеристического уравнения матрицы А.
Об этом говорит следующая теорема, в своем первоначальном виде доказанная А.А. Фельд- баумом. В своей формулировке мы ограничимся лишь частным случаем многогранника т-мерным пара лелепипедом, т.е. множеством в К" вида Г=1и=(ип ..., и„):ел<не<Я,й=1,т). (737) При такой структуре области управления каждое отдельное управление ия представляет собой самостоятельный параметр, 7.4. динейнал задача оптимального быстродействия 231 область изменения которого не зависит от значений других управлений.
По-прежнему предполагаем выполненным условие общности положения. Теорема 7.4. Если У вЂ” параллелепипед (7.37), а все корни характеристического уравнения матрицы А в законе движения (7.30) действительны, то у любого решения и(1) = т = (и1(Ь), ..., иг(1)) уравнения (7.35) каждая из координатных функций иь(Ь) кусочно постоянна и имеет не более и — 1 переключений (и --- порядок системы (7.30)).