Пупков К.В. Методы классической и современной теории автоматического управления. Том 2 (2000) (1095389), страница 94
Текст из файла (страница 94)
Это и понятно, если в данный момент времени ! состояние системы характеризуется вектором х, то этот вектор полностью определяет дальнейшее оптимальное управление, т.к. из оптимальности траектории х(1) следует оптимальность и ее конечного участка. Для оптимизации систе- мы, начиная с состояния х, не важна предысторизс т.е. как система попала в состояние х . Значение имеет лишь само состояние х . Таким образом, оптимальное управление может быть задано в виде функции ц=у(х). (2.106) Равенство (2.106) является векторным. В скалярной форме оно имеет вид; и =У (Хпхз,...,х ), и„= у„(х„х„..., х„). Функция у(х) задает оптимальное управление в виде функции вектора состояния и называется синтезируюи)ей функцией, или функцией стратегии, а задача построения функции у(х) — синтезом оптимального управления.
Для специалистов'по автоматическому управлению наибольший интерес представляет определение оптимального управления в виде синтезирующей функции. Синтезирукнцая функция у(х) полностью определяет оптимальную систему: она показывает, какие следует взять обратные связи и как их следует преобразовать чтобы получить наилучшую (оптимальную) систему.
Очень важно, что функция у(х) позволяет построить управление системой по принципу обратной связи. * Строго говоря, принцип максимумц как уже отмечалосц ориентирован на определение оптимального управления в виде оптимальной программы. Однако он позволяет сравнительно просто выделить всю совокупность оптимальных траекторий, и тем самым найти оптимальное угазавление в виде синтезирующей функции. Пример 2.6. Рассмотрим в качестве примера управление параметрами газа в проточной полости Оптимальное управление будем искать в виде синтезирующей функции На рис. 2 26 представлена принципиакьная схема объекта регулирования Он состоит из ресивера 1, проточной полости 3, впускного 2 и выпускного 4 регулируемых отверстий, нерегулируемого отверспм 5, работающего на потребителя При построении математической модели, описывмошей изменения параметров гюа в проточной полости, были приняты следующие допущения: ° термодинамическое тело — идеальный гю; ° теплообмен между гюом и корпусом проточной полости отсутствует, ° регулирующие органы, осуществляющие изменение плошадей впускного и выпускного отверстий, являются безынерционными.
Изменение параметров газа в проточной полосш задается следующей системой дифференциальных уравнений: ~ = — "'(Т,О, - ТС, - ТС,') и'Т ЛТ (2 107) — — (()ггр — Т) О! — (Уг — 1] Тбз — (Ь вЂ” 1) ТО 3 ) где Оц Оы Оз — массовые секУндные Расходы газа чеРез отвеРстиЯ, имеющие плошади оь Рз,вз соответственно, Я вЂ” газовая постоянная, Л'- объем проточной полости,!г — показатель адиабаты; Р, Т вЂ” давле- 'Синтезу оптимального управления, или оператора оптимальной обратной связи, посвящен 13 1 2 504 Методы тео ии оптимального п авленил. Часть Ш ние и теипература гюа в ресивере, Р, Т вЂ” давление и температура газа в проточной полости Секундный расход газа через отверстия опрелелястся соотношениями' Р Р % =И151ас — ~ У(Р,Р ), Сз=рз5з)с~~у(Р,Р),Сз=из5<гс~у(Р„,Р), У(РнР)= 1, если — 50ь, Р, Рз здесь Ро Ид, И, — коэффициенты расхода газа через отверстия 5о 5,, 5, соответственно, Є— атмосфер- ное давление Коэффициент лс вычисляезся по формуле Рнс.
2.26. Принципиальная схема объекта управления 5, =/с)ноя( =5, 5з = агнз (гз =5г полагая, что на управляющие параметры и, и я, наложены ограничения 0<и, <1, 0<из <1 Рассмотрим оптимальный по расходу вывод параметров газа на заданный режим Для уменьшения объема вычислений функцию У(Р„Р,) аппраксимируем выражением 1, если — кбь Р, Рз Конечное состояние газа (режим, на который необходимо вывести систему) определяется точкой (Р', Т') Качество процесса управления будем оценивать функционалом Р Д=~И1(г~и~)г -з ь У(Р,Рг)а, НТ (2 108) где г, — время управления Функционал (2 108) задает массовый расход газа из ресивера. Таким образом, процессы, происходящие в полости, описываются системой нелинейных уравнений (2 107) Параметрами газа в проточной полости можно управлять, изменяя во времени площааи 5, и 5, впускного и выпускного отверстий Плошади 5, и 5, представим в виде Глава 2.
П инцип максим ма Понт агина 505 Оптимальное управление будем искать в форме оптимальной стратегии, т е требуется найти функции «с(Р.Т), «,(Р,Т), такие, что управления и, =«с(Р Т), и» -— ч (Р Т) переводят фазовую точку (Р, 7) системы (2 ! 07) нз произвольного начального состояния в заданное конечное состояние ( Рс, Т' ) н притом так, чтобы функционал (2 108) принимал свое наименьшее значение Воспользуемся теоремой 2.! Запишем функиню Здесь Р 0 прн — 5 О», РРỠ— —, 1' (Р,Р~)(1-(3») Р 1 при — '5(3», Р Р Рб» 1 б» (1-(3~)' РУ»(Р„Р) Р Р 1 при — 5 В», Р з з 1(1 О») з ! Р» Р»1 Уз(1, Р ) Р„ 0 при —" 5 б», Р (' ) б» ~7(! (3») Р„ прн — ">б» уз(р,р) Р Р при — >(3,, Из условия максимума функции Гамильтона находим Рр 1;Я Рр Ят ыбпг(Р,Рр) ц»р,»сасс — р~ ч цс — Трцгсгсд —,— "-+ц» — (»Тр — Т)ц(сс»сс ~ «1, Я ! р И ~ Я Т р И Р ~ Я ! р Е / »я Р ят зщпт(Р„, Р)~ — ц,— ТМ»аяс« — ц» — (» — 1)Тряся»с» «1~ И' )ЯТ И»Р (ят ~ (2 111) ! из= 2 32 зак.
366 Р Н(ц Р,Т иии»1=цй»,ЯРсав ~ У(Р,Р )+ ,!ят„ »Цс — (Т Цс»сисае У(Р Р )-ТИМУ»3е-~ — У(Р.,Р)-Т6») + (2 109) р 1ят Рр Р +ц 3 — (()ст — Т)цс»сис(ссгт Р У(Р,Р ) — (lс — !)Тнгссрст»с-~ У(Р,Р) — (» — 1)Т6») Вспомогательный вектор чс(с) = (чсе(с), чс,(с), ц,(с)) задается снстеьюй дифференциальных уравнений с(цв — =О, са — =-! ц«6Мч цс! — (СМ вЂ” С»Н-6»У))ч ц»~ — (»Тр — Т)6сЕ«(А — 1)ТС(С»+6») )1, (2!10) Я(стр — 2ЯТ 3 ПЯТ = — ц, — — (6»+6з)+ц» 6, — — ((с-1)(6»«6») И'Р 1 2 И' Методы тео ии оптимального п айления.
Часть 111 Поскольку оптимальные управления и!(1) и лз(г) являются кусочно-постоянными функциями, приннмжошими значения 0 и 1, то синшз оптимального управления сводится к посзроению в фазовом пространстве системы (2 107) геометрического места точек, в которых происходит переключение управления, т е к построению линий переключения. Воспользуемся принципом попятного движения Фельлбаума Введем обратное время т = г, — г, где г, — момент окончания процесса управления.
Если (РОК Т(г)), 05 ! <!,, — некоторая траектория системы (2 107), исходящая в момент шО из точки (Р,Т ), проходите момент г, через точку (Р',Т'), то в обратном времени т эта траектория проходит в обратном направлении, те Р(т=О]=Р', Т(т=О)=Т'. Р(т = г,) = Р, Т(т = г,) =Т таким обрюом, в обратном времени т любая оптимальная траектория должна исходить из точки (Р", Т" ] Для решения уравнений (2 107) и (2 110) в обратном времени в них необходимо перейти к производным по обратному времени т Между производными по прямому и обратному времени сушествуег простая связь г)у г(у г(г г(т Обозначим Чг" = Чг(т = 0) ве«тор начальных значений Если вектор ЧР удовлетворяет соотношению Н(лгь, Р", Т, и (т = О), ит(т = 0)) О, (2.112) то совместное решение системы уравнений (2 107), (2 110), (2!!!) (для уравнения (2 107) начальное значение определяется точкой (Р", Т ) ) задает некоторую оптимальную траекторию Полученная траектория выделена с помощью необходимых условий оптимальности, которые, строго говоря, не гара ~тируют ее оптимальности Однако на практике такие траектории, как правило, являются оптимальными.
Эпределенные соображения на зту тему приводятся ниже Если перебрать все возможные значения векгора чг", то получим совокупность оптимальных траекторий Очевидно, эта совокупность должна ох атывать всю фазовую плоскость системы (2.107) (или, по крайней мере, ее область управляемости) Таким образои, построив оптимальные траектории, можно найти синтезирующую функцию т(Р,Т) При реализации указанного способа целесообрюно поступить следующим образом так как согласно принципу максимума (теоремы 2 1) векгор-функция гр(г) определяется с точностью до постоянного положительного множителя, будем полагать, что начальные значения чг~ и ше удовлетворяю~ соотношениям (2 113) а величина Чгз определяется из УРавнения (2 112) Задавая значения из диапюона -!я Чг", <! и вычислЯя чга и чгт из соотношений (2 112), (2 113), строим однопараметрическое семейство оптимальных траекторий Этим семейством исчерпываются все возможные оптимальные траекпзрии системы (2 107) Ог однопарамстрического семейства легко перейти к конечному множеству оптимальных траекторий, например, равномерно распределив в интервале (-1,!) Ряд значений величины Чг', Это множество позволяет по точкам построить линии переключения Поскольку в уравнение (2 112) входит управление, то соотношения (2112) и (2 !! 3) должны решаться совместно с равенствами (2.111).
Далее, т к. в соответствии с равенствами (2! 11) возможны четыре комбинации значений вектора н(т) =О, то, задавшись одной из зтих комбинаций и величиной чп, из соотноя шений (2 113) и (2 112) находим чго и чгз. справедливость ланной комбинации проверяется с помощью равенств (2 1! 1). Если равенства (2 111) не выполняются, то следует перейти ко второй комбинации и т д. Олив из четырех комбинаций должна обязательно удовлетворять соотношениям (2.111) По указанному выше алгоритму можно составить для ЭВМ программу синтеза оптимального управления параметрами газа в проточной полости Рассмотрим два варианта численного решения задачи: ° выхолнаустановившийся режим Р, =8 МПК Та=300" К, ° выход на неустановившийся режим Р„=14 МПа, Т, = 320'К .
Исходныеданные: Р =40МПа, Т =300 К; )(=2871 Д К) ш5из Риз=! г !г = 1,4, И' = 50.!О 'м', уз = 10 10 м', К! = Кт = !2 10 м' 507 Глава 2. П иицип максим ма Пои ягииа Оптимальные траектории, полученные численно на ЦВМ, изображены на рис 2 27 н рис 2 28 Рис. 2.27. Графики оптимальных траекторий Рис. 2.28. Графики оптимальных траекторий Как следует из этих рисунков, фазоввя плоскость системы (2Л07) разбивается на три области, в каждой из которых управления и, и нз постоянны.
Переход через линию МА сопровождается переключением управления и,, а переход через линию МОŠ— переключением двух управлений и, и и, Линии переключения 20 и УО представляют собой оптимальные траектории системы, линия переключения бМ— траекторией системы не'является. Июбрвженные на рис. 2.27 и на рис.