Пупков К.В. Методы классической и современной теории автоматического управления. Том 2 (2000) (1095389), страница 122
Текст из файла (страница 122)
В теореме П!.3 рассматривается более узкий класс допустимых управлений. Однако это позволило получить дополнительное соотношение (П1.32). Опыт применения условий оптимальности показывает, что неравенство (П!.32) имеет важное значение. Можно привести достаточно простые примеры, в которых дополнительное условие (П1.32) заметно облегчает синтез оптимального управления. Впервые неравенство (П1.32) в числе необходимых условий оптимальности было получено в [3] (см.
теорему 2.5) для систем с фазовыми ограничениями первого порядка. Теорема П1.3 устанавливает справедливость данного неравенства для фазовых ограничений произвольного порядка. Если теорему П1.3 записать применительно к ограничениям первого порядка и сравнить с известной в теории оптимального управления теоремой 25 [3], то теорема П 1.3 отличается тем, что сочетает в себе сильное условие максимума (П 1.25) с неравенством (П1.32). В теореме 25 приводится лишь слабое условие максимума (П!.31). Доказательство теоремы П1.1 приводится в [5], причем схема доказательства данной теоремы заимствована из работы [!7], в которой получены условия оптимальности при ограничениях на фазовые координаты первого порядка. Возможность замены условий типа «общности положения» более слабым требованием регулярности оптимальной траектории непосредственно следует из сформулированной выше лелгмы.
Далее, теорема П1.2 легко выводится из теоремы П1.1. П1.2. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ ПО БЫСТРОДЕЙСТВИЮ В настоящем параграфе доказывается, что для линейного объекта полученные в параграфе П 1.! необходимые условия оптимальности являются одновременно достаточными или переводятся в разряд лостаточных путем незначительного усиления их. Будем предполагать, что движение объекта задается уравнением и'х — =АхьВп, и'г здесь А и 13 — постоянные матрицы, имеющие размерности соответственно ихп и пхг, х — и-мерный вектор, характеризуюшнй состояние системы, и — г-мерный вектор управления.
Управление и может принимать свои значения из замкнутого параллелепипеда (), определяемого неравенствами 648 П вложения (П1.34) где А„< О,А„> О . Пусть, далее, ограничение на фазовые координаты имеет вид 1 з к,», <М, ~ы здесь к,,к,,...,к„и М вЂ” некоторые константы. Ниже предполагается, что ограничение (П1.35) имеет порядок д. В силу линейности ограничения (П!.35) и управления (П1.33) каждая из функций Ф'(х),Ф'(х),...,ФЯ '(х),. /=1,2, также является линейной. Положим Ф~Я '(х) = ~с,»„Фзч '(х) =-~с,»,. !гн ~! В тех случаях, когда речь идет о произвольной ограничивающей поверхности Я, будем использовать обозначение ФЯ '(х). Рассмотрим двухточечную задачу об оптимальном по быстродействию управлении объектом (П! .33) при наличии ограничений (П1.34), (П!.35). При этом предполагается, что начальная точка х принадлежит открытому ядру области В, а конечная точка х совпадает с началом координат.
Отметим, что в данном случае функционал (П1.4) имеет вид (П!.36) В настоящем параграфе в качестве допустимых управлений рассматриваются кусочно-непрерывные, кусочно-гладкие вектор-функции в(г), удовлетворяющие неравенствам (П1.34). Далее, оптимальная траектория предполагается слабо регулярной. Такая траектория, очевидно, должна удовлетворять условиям теоремы П!.3 (см. также замечание 2). Выведем для сформулированной выше задачи из теоремы П!.3 ряд простых результатов, которые будут использованы затем для доказательства достаточности указанных условий.
Для объекта (П! .33) Н(у,х,н) = ус +~Р~А»+Чг Вц, (П1.37) а функция (П!:38) дх дх здесь цю =(цг,,цгз,...,ц~„) -н -мерный вектор. Из условия слабой регулярности тра- ектории х(г) следует, что при движении по границе области В управление в(г) не может принимать вершинного значения параллелепипеда и, а функции ; о=1,г, ,, а», '" аи„ не могут одновременно превращаться в нуль. Более того, в каждой точке Г гранично- го интервала г < г < г существует такое о = т, что дФч ! ',à — ~,.
~О, А„'<и. <А.'. а», П иложение1.Оптимальное п авлениеп ио аничениях пакор дииаты б49 В соответствии с (П1.38) уравнение Р(х,и) =0 (П1.40) при фиксированном х определяет в пространстве Е„некоторую плоскость. Так как вектор 8габ Р(х,и) не зависит от х и и, то область управления о) (х) является замыканием множества о), (х) . Аналогично область о) (х) представляет собой замыкание множества ф (х) . Отсюда, учитывая непрерывность по управлению функции (П!.37), находим, что на слабо регулярной траектории х (г) условия (П!.30), (П!.3!) можно заменить соот- ветственно равенствами (П1.25), (П!.26). Рассмотрим участок оптимальной траектории, принадлежашей границе области В. Принимая во внимание (П!.39), разрешим уравнение (П1.40) относительно и и„= —, Ах+~ Ч ~о(,„и„, (П!.41) дх, г~а) где символ ~ означает суммирование по о от! до г, пропуская о=т.
Подо=! ставляя далее (П1.41) в функцию ЬН(Ч),и) = Ч/тои, (П1.42) найдем и Пт) 1 ЬН(Ч), и)=ЬНЫ')(у,х,и)=~~1;„у,и„- „, — х ~дФ" '(х) дх, ~ е ю п дфо-)(т) л и гх) дфо-1(х) х ",~ '~~к"о( „,Ч), а,х + ) ~~'И Ч) а' и„. (П!.43) дх, о ' ...о о дх, Здесь обозначение Н! )(Ч),х,и) введено, чтобы подчеркнуть, что выражение (П!.43) получается из (П1.42) при подстановке в последнее (П1.41). Утверждение 1. Если шах ЬН(Ч),и) достигается на управлении и , причем НЕО> !М) А <и,„<А, у И, иО, то управления и„, н=),г, омт, доставляют дх, шах ЬН(у,х,и).
Здесь область ()1 ) задается неравенствами (П1,34), из которых неп следует исключить индекс о = т . Утверждение 1 непосредственно следует из равенства (П!.43). На границе области В вспомогательный вектор Ч)(г) находится из уравнений — =О, "Ч'о (П1.44) а)Ч) дН(Чг, х, и) дР(х, и) дг дх дх 650 П нложения (П1.46) здесь скалярный множитель Цг), в свою очередь, определяется из уравнения дН(у,х,и) дР(х,и) х дЯ,„(и) = Цг) ди ' ди ,, ди где Я„(и) = 0 — уравнение проходящей через точку и(г) грани параллелепипеда Н Учитывая (П1.39), из (П1.45) найдем л „)' чФ, Л(1)= „ ,~" д Фч ' (х) дх, Условимся считать, что в момент г определен скалярный множитель Л (!), если для данного г выполнено условие (П1.39) . Тогда скалярный множитель Л(з) опре- деляется формулой (П1.46).
Вообще говоря, в один и тот же момент времени г мо- жет быть определено несколько множителей: 'Л„(г),Л„(г),...,Л,(г), причем Л„(г) = Л„(г) = ... = Л,(г) . Пусть в момент и непрерывности управления и(г) определен множитель Л,(п) . дФч '(х(г)) Тогда в силу непрерывности и(г) и найдется такая окрестность точки дх, и, что для и-к<а<6+с будет определен множитель Л,(г ).
Пусть, далее, и— точка разрыва управления и(!) и пусть для и(п -О) определен множитель Л (и), а для и(п + О) — множитель Л„(п) . Тогда, очевидно, можно указать такие полуинтер- валы [п,п-е,),[п,6+аз), в каждой точке которых определены соответственно Л„,(г) и Л„(с). Точку д будем называть точкой переключения множителя Л(г) (множитель Л (г) переключается на множитель Л„(г) ), если существуют два таких интервала [г',г'-е,) и [г',г'+ез), что Л(г)=Л„,(г) при ги(г',г'-с,) и Цг) =Л„(г) пРи 1п(г',1'+вз) и не сУществУет такого интеРвала (Р-е,г'+а) н такого с, что Цг)=Л,(г) при гн(г'-е,г'+с). Из заданного определения следует, что точка не- прерывности управления и(г) не может быть точкой переключения.
Утверждение 2. В каждой точке Р переключения множителя Цг) последний ос- тается непрерывным. Из условия непрерывности функции Н(у,х,и) следует, что управления и (г'-О) и и*(У+О) доставляют в момент Р максимум функции (П1.37). Соединим точки и (г'-О) и и (г'-ь0) в пространстве Е„отрезком П (Пс ге(х(р))). В силу линей- ности относительно управления функция (П!.37) достигает максимума относительно множества сз (х(1')) в каждой точке отрезка П. Учитывая утверждение 1, получаем, что функции ЛН1 1(у,х,и) и ЬН60(~р,х,и) достигают на отрезке П максимума относительно параллелепипеда (7~ ~ и У( 1 соответственно. По определению точки д имеем: А1 < и (~'-О) < А~, и (г'+ О) с А1 0 А А„' < к„(г'+ О) < А~, п„(У -О) с А„О А„, П иложенне 1. Оптимальное п авление п и о аничениях на коо динаты 65! (х)л О дх,. (х) д.
0 д», Для любого управления н'еП (и'~ н (Р— 0), н'~и (В+0)) Из (П1.47), учитывая сказанное выше и (П1,43), получаем ~м 1 дх, Разделив (П1.48) на (П1.47) (П1.48) ~дФо '(х) дх, и принимая во внимание (П1.46), найдем Х„(!') — Х„(!') = О. Таким образом, утверждение 2 доказано. Сделаем некоторые преобразования. Подставив в уравнение (Ш.ЗЗ) а (!) из (П1.41), получим (П1.49) х = А„х+!)„й где о(, ~ дФо '(х) а, а дх, — матрица размерности и х и, дх,. ! — -1,и, « = 1,г, т ~т, ФЧ~(г) х(г) н(!))=уо+[цю(г)] А„х+[Чг(г)~ 1) й.
Раскрывая, наконец, множитель Х (!) в уравнениях (П! .44), находим — =О, — =-А ць а'т'о о(Ч т (П!.51) ой о(г Таким образом, из (П!.50), (П1.51) и утверждения ! следует, что на каждом интервале, на котором определен некоторый множитель Х (!), относительно уравнения (П1.49) должен выполняться принцип максимума в том виде, как он формулируется для открытого ядра области В.
— матрица размерности и к(г -1), Й вЂ” (г -1) -мерный вектор, получаемый из вектора н путем исключения т-й компоненты. Подставим в функцию (П!.37) управление и (!) из (П1.41). Тогда 652 П иложения Введем некоторое обобщенное условие общности положения (в смысле работы [3]). Будем считать, что относительно уравнения (П!.33) и о!раничений (П1.34) и (П1.35) выполнено обобщенное условие общности положения, если: 1) для любого ребра к параллелепипеда У векторы Рк, АРк,...,А" ~Рк линейно независимы в Х; 2) для любого 1,1=1,г, илюбого ребра к параллелепипеда (/! ! векторы ~(!! Р к, А„Р„к,...,А " Р„к линейно независимы. Ниже мы будем предполагать, что соотношения (П1.33), (П!.34), (П!.35) удовлетворяют обобщенному условию общности положения.