Пупков К.В. Методы классической и современной теории автоматического управления. Том 2 (2000) (1095389), страница 126
Текст из файла (страница 126)
Из условия максимума функции О(Чз,х,и) находим, что при движении в открытом ядре области В П вложения 668 йЧро «% Чр! йЧрз — =О,— =О,— =- рп — =-р, е(г озг е(г езг е()е Условие — < 0 выливается в неравенство езг (П1.114) (П1.117) Рне. П!.3. К задаче синтеза оптимального упранленнн при ограничениях на ускорение В соответствии с уравнениями(П!.113) вспомогательные функции Чзз(т) и Чз,(т) определяются в открытом ядре области В уравнениями Ч'з(т) = Чз1К(т)+ЧззК'(т)+ЧззК (т), Чз,(т) = -Чз, К (т) — азЧз,К(т) — азЧз,К'(т), (П!.! 20) где Ч', =Чз,(т=О), з =1,2,3, з 5 ой15 о йод+аз! "Ч'з — з~8пхз = -Чзз з~8пхз кО, Й Далее, соотношения (П1.54) и (П!.55) принимают вид Ч~з(!о — 0) = О, Ч з(!« ) = 0 (П1.
! 16) Перейдем к обратному времени т. В соответствии с теоремой П!.5 в точках схода т„* (каждой точке выхода г, в обратном времени соответствует точка схода) долж- ны выполняться условия скачка Чзо(то +0) = Чзо(то — 0), Чз!(то +0) =Чз,(то -0), Чзз(т„е +0) =Чзз(т, — 0), Чзз(т +0) =Чзз(т, — 0) — роз!8пхз. Далее, в точках выхода, очевидно, Чз(т, + 0) = Чз(т„- 0).
(П!.118) Соотношения (П1.110), (П!.111), (П1.115) — (П1.! 18) и условие Н(Чз(т = 0), х(т = 0), и(т = 0) ) = 0 (П!.119) образуют полную систему необходимых и достаточных условий оптимальности, ко- торым должна удовлетворять регулярная оптимальная траектория. Покажем, что исходящая в обратном времени из начала координат траектория ОМзУД (рнс. П1.3) оптимальна, а участки этой траектории ОМ и зУД, лежащие в от- крытом ядре области В, принадлежат поверхности переключения. П иложенне 1. Оптимальное п авление п и о аничениях на кос динаты 669 2 К'(т) В-! 1 2 3 2 З +а!З +а20+аЗ В ' — оператор обратного преобразования Лапласа.
На границе области В (т! < т < т!*) Ч!0(т) Ч!0(т1) Ч!1(т) Ч'1(т1) Ч!2 (т) = Ч!1(т1 )(т — т1 ) + Ч!2 (т! ). * * Далее, в интервале т! < т<т, (точкаМсоответствует т1,точка)!1- т,,точкаД вЂ” т,) Ч!3(т) = Ч!! (21 )К (т т! )+~Ч/! !т! )(т! т! ) ! Ч!2 (т! ))К (т т! ) ! (П1.121) -ьЧ22 [т, )К" (т — т, ), или Ч!з(т ) = Ч!! К(т )+Ч!2 К(т )+Ч21 К (т )+ (П1.122) + [-Ч!! К (т, ) — азЧ!2 К(т, ) — азЧ22 К (т, )~(т, — т, )К'( 10 — т, ), здесь т — время «свободного» движения, т.е.
время, отсчитываемое только при дви- 0 женин фазовой точки в открытом ядре области В. Для любого т, <т. <тз (т. >т, =т,) можно так выбрать вектор начальных 0 0* ° значений Чз =(Ч1~,Ч1,,Ч2,,Чгз), что в интервале 0 <т<т. участок траектории ОМ!УД удовлетворяет всем условиям оптимальности, а в самой точке т. Ч! (т.) = О, ° т.е. соответствующая точка х(т.) принадлежит поверхности переключения. Указанные числа Ч1,, Ч!2, Ч!з с точностью до постоянного множителя найдутся из системы линейных однородных уравнений 0 ° 0 ° 0 .
° Ч з(т!) =Ч!! К(т!)+Ч 2 К(т!)+Ч з К (т!) =О, Ч22(т. ) =-Чг! К(т. )+Ч!2 К(т. )+Чгз К"(т. )+[ — Ч2! К*(т,) — (П1,123) — азЧ1, К(т1) — азЧ!т К (т!))(т! — т!)К (т. — т,) = О. Покажем, что выбранный в соответствии с (П1.123) вектор Ч! = (Ч1,, Ч!2, Ч21) определяет функцию Ч!2(т), которая на отрезке О < т < т. не имеет других нулей, кроме точек т,, т,, т.. ПРи т,* < т <т. Ч22(т) не может обРаЩатьсЯ в нУль, т.к, в соответствии с леммой (см. 92.3) функция (П!.121) может иметь не более двух нулей.
Предположим, что Ч22(т) имеет нУль в интеРвале О < т <т1. Тогда, как следУет из Указанной леммы, функция Чгз (т) = Ч1, К(т)ь Ч12 К'(т) + Чгз К"(т) (П1.! 24) не может иметь нулей при т > т, . В равенстве (П1.124) индекс «звездочка» введен, чтобы подчеркнуть различие между Ч!з!'т) и функцией (П1.124). Это различие имев~ место при т > т, . Если функции (П1.! 24) соответствует управление и(т), О < т < т,, переводящее фазовую точку из начала координат на границу П иложення 670 то ц~;(т) < 0 (П!.125) при г>т,. Учитывая, что цг,,(т, ) = срз(т, ) = О, уравнение (П! .124) можно переписать в виде цг с (т) = гр, (т, )К(т — т, ) + цгз (т, )К (т - т, ) .
(П1. 126) Прп т > 0 К(т) > О. а для астатического объекта (а„=О) и К'(т) >О. Для астатического объекза функция К'(т) имеет вид, изображснный на рис. П1.4. Отметим, что К(0) = К'(0) = О, К'(т) йш К( ) Из (П1.!27) вытекает, что прн малых значениях разности т-т, знак функции (П!.127) определяется вторым слагаемым, а при больших — первым слагаемым.
Неравенство (П1.125) поэтому возможно только при цй(т,) <О, цгз(т,) <О, (П1.! 28) Для статического объекта будем дополнительно предполагать, что время лвижения по траекториял1 МД от одной ограничивающей плоскости до другой меньше т„, где та — отличное от нуля решение уравнения К'(т) = О. Из (П!.128) и (П!.121) находим, что функция (П1.122) не может обращаться в нуль в точке т.. Последнее противоречит уравнениям (П1,123). Таким образом, функция лому цИ(т,) <О. (П! .! 29) Далее, из соотношений цгз(т, +0) =О, цИ(т.) =0 вытекает, что цс,(т, ) > О, цсз(т, ) < О. (П1.130) Ркс.
П!.4. График фткккик К (т) сй;(т) имеет нули только в точках т,,т,*,т.. Из совокупное~и решений (П!,123) выберем решение, в котором ство (П1.119) удовлетворим соответствующим подбором числа цг„. неравенства срз > 0 следует. что функция уз(т) убывает на отрезке цгз >О. РавенИз (П1.!16) и 0<т<т.. По- П иложение1.Оптимальное п авлениеп ио аничениях пакор динаты 671 Из (П!.129), принимая во внимание (П1.130), (П1.114), получим условие (П1.115).
Таким образом, траектория НЯ принадлежит поверхности переключения, причем проводимые выше рассуждения распространяются на всю совокупность траекторий, сходящих в обратном времени с линии МЯ. Далее, поверхности переключения принадлежит также траектория ОМ и примыкающая к ОМ (с управлением и = — А ) совокупность траекторий (рис.
П1.3). На рис. П1.3 представлена лишь часть траекторий, образующих поверхность переключения. Остальные траектории являются симметричными (относительно начала координат) изображенным. ЕРМО и АЯДНМΠ— оптимальные траектории соответственно с одним и двумя заходами на границу. В заключение отметим, что выше был рассмотрен наиболее интересный для приложений случай «жесткого» ограничения по ускорению, когда траектории, образующие поверхность переключения, имеют участок (МЗ), лежащий на границе области В. При менее «жестких» ограничениях, когда в силу (П1.1!2) в точке М невозможно движение на границе области В, поверхностью переключения является изображенная на рис.
П1.3 совокупность траекторий, ограниченная линией ОМТ. 2. Ограничение на скорость движения. Рассмотрим теперь задачу синтеза оптимального по быстродействию управления объектом (П !.109), когда вместо ограничения на ускорение задано ограничение на скорость движения, т.е. область допустимых значений фазового вектора х задается неравенством: !хз1< О. (П!.13!) Неравенство (П1.131) представляет собой ограничение второго порядка. Для отыскания оптимальных траекторий и оптимального управления воспользуемся достаточными условиями оптимальности, задаваемыми теоремой П1.7. Отметим, что в соответствии с теоремой П1.7 движение по граница области В определяется уравнением х~ =С, а функция Ф(х) = хз.
Как следует нз (П1. ! 09), при движении по границе области В управление и(г) = азх, +азхз. (П1.132) В силу ограничения ! и( < А движение по границе области возможно только по отрезкам прямых хз — — О, х, =О, )а,О+азх, ~ < А, (П! . ! 33) хз = -О, хз — — О, (азх! -азР~ < А. (П1.! 34) Ниже в соответствии с условиями теоремы П1.7 вместо допустимых отрезков рассмотрим интервалы, которые получаются из (П1.133) и (П1.135) при замене нестрогих неравенств на строгие. В соответствии с теоремой П1.7 определим функции Гамильтона при движении по границе области В равенством Н(ф,х,с) = у»+у,с, (П !.135) где вспомогательный вектор ф = (уш у, ) определяется из уравнений ~7о Ф~, — = О, — = О. й й Из условия максимума функции (П1.135) находим с з!йпу, >О.
(П1.! 37) б72 П уложения Как и выше, синтез оптимального управления будем проводить с использованием обратного времени т. Выпишем условия скачка: Что(т + 0) = Что(т* — 0), тг',(т + 0) = Чт,(т - 0), (П!.138) Чт,(т — 0)=НО Ч'з(т -0)=рз! Чтв(т + 0) = Чте(т — 0), тг'!(т + 0) = тг',(т — 0), Чтз(т + О) = цО, Чтз(т + 0) = К,; Чтс(т + 0) = Чтс(т - 0), Чт,(т + 0) = у,(т — 0), (П1.139) Чтз(т +0) = Чтз(т — 0)+де, таз(т +0) = таз(т — 0)+пб рез!йп с <О, р!з!8п с> О.
Соотношения (П1.138) соответствуют точке выхода на ограничение (в обратном времени т ), соотношения (П1.139) — точке схода, а соотношения (П!. 140) — точке отражения. Пусть т — точка выхода на ограничение. Из уравнения Н(су(т - 0),х(т )тн(т - 0)) = Н(тв(т + 0), х(т ),с), принимаа во внимание (П1.138), найдем Чтз(т -0) = рз = О. Аналогичным образом можно показать, что в точке схода т Чтз(т +0) =р, =О.
(П1.141) Если т — точка отражения второго порядка, то из уравнения Н(у(т* — 0),х(т ),и(т -0)) = Н(Ч!(т +0),х(т )„и(т +0)) и соотношения (П! .140) следует равенство ат д(х(т)) р, + туз(т -0)(и(т + 0) -и(т -0)) = О. тй т=т тО По определению точки отражения От 8(х(т)) т!т з т=т +О Из равенства (П!.140) находим тогда т! л(х(т)) Р1 3 Нт тттО Далее, из условия максимума функции Н(у,хти) следует, что (П1.143) Чтз(т — 0)(и(т +0) — и(т — 0)) < О. Таким образом, каждое слагаемое, стояшее в левой части равенства (П!.143), неположительно и, следовательно, т! 8(х(т)) Р1 3 Отт т ттс Чтз(т -0)(и(т 40)-и(г -0)) =О. Из (П1.144) и (П1.89) вытекает, что р, =О. Соотношения (П1.110), (П1.! 19), (П! .132), (П!.! 37) — (П1.142), (П1.145) образуют полную систему достаточных условий оптимальности. П вложение 1.
Оптимальное п авление п ног аничениях на кое динаты 673 Отметим, что в соответствии с (П1.132) и условиями регулярности ! и(т +0) (=) азх,(т )+азхз(т )(< А, м(т — 0)) =(азх1(т )ч-азх,(т )( < А. Поскольку с=с -0 рз(т.) = О. (П 1.147) Рпс Л!.5. Грвфпкп з рвскторпа Для статического объекта будем по-прежнему предполагать, что время движения фазовой точки по траектории Р(. от одной ограничивающей плоскости до другой меньше тв.