Радиоэлектронные системы Основы построения и теория. Справочник . Под ред. Я.Д. Ширмана (2007) (1151789), страница 172
Текст из файла (страница 172)
23.6). Рис. 23.6 Стоимости управления. Для шагов /с = О, 1, ..., Ч вЂ” 1 задают функциями г»(ап и»), учитываюШими: ° отклонения к-х состояний от желаемых; ° расходы ресурса управления. Стоимость гч(цч) финального шага К = Ч связывают только с отклонением вектора состояния от желаемого. Савалупнал стаииасть управленст г(а, и), где а = )~ад! и и = ~)и»(! - векторы состояния и управления, определяется суммой стоимостей отдельных шагов Ч-1 г(и„и) = у»»(ими»)+гч(ач).
(23.28) ые Мииимизация совокупяой стоимости управления г(а,и) с учетом ограничений. Ограничениями явля- ются уравнения связи Сц+1 = Ь»(ам иг), последующих состояний с предыдущими и с управлеииями. Совокупности ограничений придают векторную форму (см. разд. 14.4.2) 8(а, и) = 11 Ь»(аь и») — ад 1 !! = 0 . (23.29) Необходимым условием минимума стоимости (23.28) с учетом ограничений (23.29) является мииимизация функции Лагранжа (14.12), имеющей вид ч-1» Е = 2.'(г»(а»,и») + Л» (Ь»(а», и») -а»„]~+ гч(ач), (23.30) где Л» — векторные множители Лагранжа. Необходимым условием минимума (23.30) является обращение в нуль частных градиентов А по а» и по и»с: дЕ!да»=0, дЕ7ди»=0.
(23.31) 23.6.2. Принцип максимума Понтрягина для многошагового управления с ограничениями в виде равенств Функции Гамильтоиа-Поитрягииа для дискретного (миогошаговего) управлеиия. Это скаляриые функции вида: Н» г»(я» ис,) Лс,Ь»(и»,и»), /с=0,1...(Ч-1) (23.32) Предназначены для выделения слагаемых (23.30), зависяших ат управления и» иа к- м шаге. Выбор знаков ми- иус в (23.32) позволяет использовать принятый термин "принцип максимума (а ие минимума!) Понтрягина'*. Выражение функции Лагранжа (23.30) через фуякции Гамильтоиа-Поитрягииа (23.32) иепрерывиого управления.
Имеет вид ~ ='л(ач) г.'Р»(и»,и»)+Л»а»ы » О ты = г„(е„)- ~'Н»(и»,а»»г- лг,Л»,п» вЂ” 1 л,а„. й.3 »ы Условия максимума функций (23.32) Гамильтоиа-Поитрягияа для дискретного управлеиия. Определяют согласно (23.31) условия минимизации функции Лагранжа (23.33): дН»!ди»»=0, /с=0,1,...,(Ч-1), (23.34а) дН„дя» — — -Л„, к =1,...,(Ч-1), (23,346) (23.34в) дгч дач =Лч-и аь» ! = ь» (ац и») = а»+ а(сц, иь 1») ьг (23.35) переходит в модель непрерывного управления (22.24), в частности, при иестохастическом управлении и=О: »1а(сМ = а(а, и, »)=дЬ(а,ии,т)lдг . (23.36) От (22.24) модель (23.36) отличается зависимостью векторной функции а() от управления и.
Стоимость управлеиия за едииицу времени )((а, и, г). Вводится в стоииость днскретнога (иногошаговага) управления г(ц», и») иа к-м шаге, см, (23.30): г»(оп ия) = Х (аь иь ц) Лг (23.37) Фуякця Гамильтоиа-Поитрягииа для иепрерывиого управления. Это скалярные функции управления и, относящиеся к единице времени, вида: Н(а, и, г) = 1;ш лз!» . й» м (23.38) Согласно (23.32), (23.35)-(23.38) Н(о, и, 1) = -т (а, и, г) — Л (г) а(а, и, г). (23.39) Выражение фуикции Лагранжа (23.30) через фуикции Гамильтоиа-Поитрягииа (23.39) иепрерывяого управлеиия. Имеет вид: Условия (23.34а,б,в) определяют принцип пошаговой апти»снзацми функций Н». Уравнение (23.34а) сводится к граничному (краевому) условию — условию трансверсальнасти управления, дополияя здесь, наряду с условием ао = сопл!, цепочку уравнений (23.34).
23.6.3. Принцип максимума Понтрягина для непрерывноао управления с ограничениями в виде равенств Непрерывное управлеиие. Рассматривается здесь как предельный случай дискретного (тнагашагавого) управления ц» = а(Г») при стремлении иитервалов дискретизации Ы = гь»! — 1у, к нулю. Подобно разд. 22.4.2 при Ы -+ 0 модель дискретного управления 383 дН/да = -А Л = в%/й . (23.48) = г„(а„) — Л„1а„+ Лоно + (23.40) АЛ/ь//-»А Л=О. (23.49) и Я (23.49а) (23.41) дН/ди = О, дИда = АЛ/й (23.42) дгч/дач = Л(/ч) . (23.43) и = Ка, т ачбчач 2 (23.45) Рвс. 23.7 384 Е = г„(а„)- 'ЦН(а„,и„,/„)/з/+ Л,',(аьн -аь)] т + 2 ~- — --: ~ а„/з/ — 8 Н(аюиь А„Уз/.
Ль -Ль 1 ыо Условия максимума функций (23.39) Гамильтона-Поятрягина для непрерывного управления. Определяют согласно условиям (23.31) минимизации функции Лагранжа, в данном случае в форме (23.40), с добавлением условия трансверсальности (23.34в) 23.6.4. Оптимизация терминального линейного непрерыеного управления с кеедратичными стоимостями потерь Термннальность управления. Это приближение вектора состояния а системы в конечный момент управления гч к заданному (здесь к нулевому). Линейная модель непрерывного управления. Задается аналогично (22.24), здесь при р=О, йх/й = а(а, и, з) = Аа+ Еи, (23.44) где учтено воздействие вектора управления и па векгор а с матричным коэффициентом управления Е Линей- ная модель может быть нествционарной: А-» А(/), Р-» Р(/).
(23.44а) Квадратичные функции стоимости потерь управления. Аналогичны квадратичной функции стоимости ошибок измерения (см. разд. 20). Стоимость гч ненулевого финального значения ач вектора состояния, подлежащую снижению, описывают квадратичной формой от ач с положительно определенной симметрической матрицей Бч/2 (множитель 1/2 лишь упрощает последующие выкладки). Подлежат снижению также затраты на управление в единипу времени Х (а/„иь //,).
Их обычно описывают квадратичной формой т Х (23.46) только от вектора управления и с положительно определенной симметрической матрицей Вя/2. Применение принципа максимума. Функции Гамильтона-Понтрягина для непрерывного управления (23.39) после подстановок (23.44), (23.46) принимает вид: Н =--и Я н-1 (Аа+Ри). 1 т т 2 Условия (23.41), (23.42) ее максимума Н детализируют на основе правил дифференцирования (разд.
26.7): дИди= — ба и — Р Л=О, (23.47) Из (23.48) следует дифференциальное уравнение для Л а из (23.47) следует пропорциональная связь и и Л Дифференциальное уравнение состояния а (23.44) с учетом этой связи принимает вид да/д/= А а — Рб„~ Р Л. (23.50) Решение дифференциальных уравнений терминального управления. Линейные уравнения (23.49)- (23.50) имеют нулевые правые части, т.е, однородны. Линейно н однородно краевое условие Л(/ч) = дгч/дач = =Вч ач. Это определяет однородную линейную связь Л(/) = Р(/) а(/), (23.51) с матричным коэффициентом Р(/), откуда вйlй = (в/Р/й) а + Р йх/й.
Подстановка выражений Л(/) и вЛ/й в (23.49)-(23.50) приводит к промежуточному соотношению вида (АР/й -»РА+А' Р-РБ„' Р'Р ) а = О. Произвольность аргумента а приводит к дифферввциавьночу уравнению Риккати для коэффициента Р(/) в/Р/й=-РА — А Р+РРБи РтР (23.52) при краевом условии Р(/ч) = Рч = оч. Структурная схема непрерывного терминального управлеяня. Представлена на рис. 23.7. Предусматривает отрицательную обратную связь ввкторныз вевичив и па вида К = К(/) = -Я„ртР. (23.53) Пример анализа динамики оптимального управления. Пусть модель (23.44) является одномерной.
Заданы скаляры А = 0; г = 1, Яю Яч и ао. Уравнение Рнккати (23.52) и краевое условие принимают вид З, /Р/Р'= й, Р(/ч) =5ч, откуда согласно (23.53) К(/) =-Б„''Р(/) =(/-/ч о /оч) При А = 0 в силу (23.49) Л = сопзь В силу (23.49а) тогда и управление и = сопзз', при этом определяющий »»Л!Нй = дН/да! = О, »»Лзl«Ц = дН!да 2 = — Ли откуда Л!(г) = Л!о = сопя!, Л2(г) = Л!о!+ сопл!. Анализ форсированного оптимального управления. При неизменном форсированном управлении ! и (= 1 движение (23.62) может быть только равноускоренным при и=! 'нли равнозаиедленным при и= — 1. Перемена знака управлгния (23.65) может произойти за время движения один раэ или ни одного раза, поскольку зависимость Лз(г) = Л!ог + сопл! от г является линейной.
В момент изменения знака управления и значения а ! и аз не изменяются. Две ветви фазовой траектории стыкуются при этом в соответствующей точке фазовой плоскости а !, аз (рис. 23.10). Начальная ветвь определяется согласно уравнению (о с»2 (23.62) равноуско- ренного (равноза- 1Р! х го медленного) движения и начальными условиями. О (х! Финальная ветвь определяется также уравнением (23.62) и Го нулевыми финальРис. 23.10 ными условиями. Состыкованная из участков фазовая »х!о траектория выделена для начальных услои вий а!О, а2О (первый Г ч случай, рис.
23.10) о ( утолщением линий и С»2 боковой штриховкой. Начальная точка отмечена указанием а2О времени го. НачальРис. 2331 ные точки других фазовых траекторий (второй, третий, четвертый и пятый случаи) отмечены указанием го го го го. Для первого из случаев зависимости а!(г), аз(г), и(г) детализированы на рис. 23.11. Движение начинается из точки а!о > 0 в сторону финальной точки а!ч = 0 с избыточной начальной скоростью нужного знака азо < О, ) азо ( > з/2а!о . Форсированное управления и = 1 снижает абсолютное значение скорости и перемену ее знака после «проскакивания» состояния а! = О. Чтобы погасить скорость после возвращения к финальному состоянию а! = 0 в момент времени т включается управление и = — 1 противоположного знака. Проскакивание финального состояния происходит и во втором случае (рис.
23.9), но не происходит в отсутствие избытка начальной скорости (третий, четвертый и пятый случаи). 23.7. Измерение-управление Так называют управление объектами, взаимосвязанное с измерением их случайно меняющихся параметров. 23.7.7. Модели объектов нелинейного и кегзилинейного измерения-управления Модель дискретного измерения (22.4) может служить основой моделей измерения-управления вида а»„ = Ь»(а»,и»,й»).
(23.66) После квазилинеаризации (22.5) и предельных переходов (разд.22) дискретные и непрерывные модели описываются уравнениями а„ы = Ь»(а»,и») м р», а», = Ь»(а»)+(»(и»)+!»», аа!а»=а(а,п,г)+р(г), »!а!»!»=а(аи)+»(п,г)+р(г). (23.66а) Новыми по сравнению с моделями (22.24), (22.5) являются зависимости векторных функций а() и Ь»() от векторов управлений в, которые, в свою очередь зависят от а. От моделей (23.36) и (23.54) они отличаются включением случайных векторов !»(г), йь «Проклятие размерности» (разд. 22.8) не позволяет до последнего времени эффективно решать нелинейные задачи измерения-управления на основе (23.66).