Федоренко Р.П. Введение в вычислительную физику (1185915), страница 97
Текст из файла (страница 97)
Все Ьг" Е Кг могут быть получены по формуле $ ИтЯ Ьи(1) ЙО Ьи( ) Е К„. о Следовательно, т (а, йт) = а, $ И'(г) Ьи(г) й о т = $ (г, 1т' Ъи) Й = $ (И' (г)д, Ьи(г)) й,~ О. о о Это неравенство должно выполняться для всех Ьи( ) Е К„. Отсюда вытекает, что при всех г (точнее, при почти всех 1) должно быть (ТГ(г)а, Ьи) ЗО, Ч Ьи Е К(Г), У К Полученный результат можно преобразовать, вспомнив формулу (13). Строками матрицы Ит(1) являются векторы и,.(Г) — У'„(Г, х(Г), и(т)] р'Я + Фо~(Г, х(!), и(Г)]. В результате Ит'(1)й= ~'а, н,.(1) = ~ о = У'„(1, Х(1), и(Г)) Х а, Р'(Г) + О Х г, ФЧГ, х(1), и(Г) "1 = о ~-о = —,'„(у(Г, х(1), «(т) ),;»: а, р'(1)) + ч: а, Ф'(О х(Г), и(г)) .
~-о ~-о Заметим, что каждое р'(г) — решение линейного дифференциального уравнения (12) со своей правой частью У'(г). Таким образом, зр(т) = ~ д, ~р'(т) есть решение уравнения, содержащего лз неопре- ~-о деленных параметров: — р = т„(г, х(г), и(г)) Ф+ ~ч; я,. у'(г), Ф(т) = О. (16) Э зз1 эАцАчи оптимАиьиого гпгдвлзиия Определим «функцию Гамильтонаы Н(1, х, и, я) ьв (7(1, х, и), ~р) + ~х' я,. Фс(с, х, и). С-О Здесь ~р(1) — решение уравнения (16). Теперь условие (15) примет внд — „н(1, х(1), и(1), ф(с), к) ЬиэО, Чс, Чба е к„.
(17) Оно означает, что функция Н(1, х(1), и, ~р(1), К), рассматриваемая как функция и в области 11, в точке и(1) достигает локального минимума (макснмума, если бы мы использовали для разделения конусов К„и К вектор я'= — «). Это и есть простейший вариант принципа максимума. Он утверждает, что если траектория (х( ), и( )) оптимальна (х(1) — решение задачи Коши х = У, соответствующее управлению и( )), то существует вектор К, такой, что выполняется условие (17) экстремума Н по и в области У. Конечно, в приведенном выше выводе мы опустили некоторые элементы математической аккуратности, но основные содержательные соображения сохранены. Теория, основанная на использовании конечных вариаций управления на множествах малой меры (см.
5 27), позволяет утверждать, что функция Гамильтона достигает не локального, а точного минимума (макснмума) по и Е У именно в точке и(1). Неопределенные коэффициенты яи входящие в Н, играют роль множителей Лагранжа. Некоторые обобщения задачи. Выше был рассмотрен относительно простой вариант задачи оптимальною управления.
В дальнейшем мы рассмотрим н задачи, существенно от нее отличающиеся. Здесь же мы ограничимся простым, но полезным обобщением. Расширим управление, включив в нею набор параметров р= (рп сь, ..., рь), которые должны быть определены из тех же соображений, что и и( ). Будем рассматривать систему уравнений вида х= у(1, х(1), и(1), р), Ож с ат, х(О) =х (р). В функции Ф, входящие в описание стандартных конструкций функционалов, наряду с указанными ранее аргументами, может входить и вектор р. Будем считать, что, задав обобщенное управление (и( ), р), можно определить траекторию х(1) и вычислить значения всех функционалов, которые теперь следует обозначать как Р(и( ), р].
Формула для вариации функционала при малом возмущении управ- пгизлижвнныв мзтоды вычислитзльной ьизикв [ч. и ленив [и( ), р) [и(-) + Ьи( ), р+ Ьр) очевидным образом обобщается: т Г[и( ° ) + Ьи( ), р+ Ьр] Р[и( ), р] + $ (и, Ьи) с[Г+ (а, Ьр). о Вычисление производной а = дг" [и(. ), р]/др не требует новых сложных вычислений и осуществляется одновременно с вычислением м(г) (производной по и( )); см, 5 27.
Обратим внимание на то, что теперь задачу можно рассматривать на стандартном интервале времени О и гм1. В тех случаях, когда время процесса управления Т не фиксировано и является вместе с и( ) «ресурсом оптимизации», можно перейти к системе х = Т[, включив Т в качестве одной нз компонент в вектор параметров, Если Го[и( ), р] ш Т, задача называется задачей оптимального быстродействия, так как целью является выполнение системой поставленной задачи за минимальное время. Задачи с фазовыми ограничениями.
Особенно сложным является приближенное решение задач оптимального управления, если среди требований к управлению поставлено условие невыхода траектории х(г) нз некоторой заданной области. Рассмотрим простейший пример. Пусть поставлено условие б[х(О] <О, ч г, где б — скалярная гладкая функция. Как уже было сказано, это условие можно оформить в терминах функционала: Г[и( )] ш шах б[х(1)].
Если, как это часто случается, р = агк шах Ях(Г) ] есть не точка, а несколько точек или даже целый интервал, функционал оказывается недифференцируемым по Фреше. Однако он оказывается днфференцируемым по направлениям в функциональном пространстве, и можно написать почти очевидную (пока предварительную) формулу: ЬГ = шах б„[х(т)] Ьх(х). «яв Здесь 6,[х(х)] Ьх(х) есть линейный функционал от вариации управления Ьи( ),и мы знаем, как он вычисляется: т б„[х(т)] Ьх(т) = $ (н(1, т), Ьи(г)) ~й. о 465 8 381 зядячи оптимяльного гпгявлвпия Причины, приведшие к появлению в ю еще одного аргумента т, понятны.
Теперь мы имеем ЬГ'[Ьи( )] = шах ~ (и(1, т), Ьи(Г)) пк ~во о Формально можно обобщить задачу поиска улучшающей вариации управления Ьи( ° ), включив в нее еще и условия С[х(с)] + ~ (п(0 т), Ьи(1)) п1«0, Ы с Е р.. о Но это не так просто, ведь этих условий очень много (континуум, если 14 — отрезок, например). Вычисление «(г, т) для каждого т е 14 требует своего отдельного интегрирования сопряженной системы.
Однако здесь есть некоторые возможности облегчения ситуации; х(1) есть гладкая функция (х = /, у ограничена при всех и; следовательно, х(1) — непрерывная функция, с ограниченной кусочно-непрерывной производной), Такая функция не может очень сильно изгибаться. Поэтому если потребовать выполнения условия 6[х(1) ] «О не во всех 1 Е [О, Т [, а только в узлах некоторой сетки тг (у = 1, 2, ..., У), то в остальных точках 1 оно будет, видимо, нарушено не очень сильно.
Это соображение можно развивать и дальше, с тем чтобы число У было не слишком большим. Пусть при каком-то и( ) найдена траектория х(1) и вычислена функция 6[х(1) ]. Выделим на [О, Т] множество 14 условием 6[х(т)] > — с, г» О, т Е р. На этом множестве разместим небольшое число точек ту по следующему, например, правилу. Предположим, для простоты, что 14 есть просто отрезок. Разобьем его на заданное число У равных частей, и на каждой части нацдем точку тх с наибольшим на этой части значением 6[х(т)]. Конечно, мы не можем сказать заранее, сколько таких «контрольных» точек надо брать.
Это зависит от структуры траектории, от меры множества 14, от оценок [х[ = ]г'[ на данной траектории и прочих трудно контролируемых факторов. Поэтому эти соображения дополняются алгоритмами, регулирующими изменение числа У в зависимости от хода процесса поиска экстремума. Отметим, что мы не случайно не рассматриваем в таком же стиле близкую по форме конструкцию ограничения 6[х(1), и(г) ] «О. Дело, конечно, в свойствах гладкости функции 6[х(1), и(г) [. Так как и(1) — произвольная («измеримая») функция, то и С[х(г), и(г)], как функция г, — тоже произвольная функция.
И даже контролируя условие 6 «О на всюду плотном множестве меры нуль, мы на самом де- 16 — 1833 ПРИБЛИЖЕННЫЕ МЕТОДЫ ВЫЧИСЛИТЕЛЬНОЙ ФИЗИКИ 466 [ч. н ле не обеспечиваем выполнения условия БР а О при всех к Однако реально задача решаетсм в классе кусочно-постоянных и(г), к которым термин «измеримость», кажется, никакото отношения не имеет.
Это так: предложенная выше конструкция применима и в данном случае с конечным числом Х. Все дело в том, каким будет зто число г. Если и явно входит в ЬР, то, скорее всего, число контрольных точек тв будет сравнимо с числом интервалов постоянства и, т.е. с числом узлов сетки М. Это делает задачу определения Ьи (и подготовки необходимой информации) слишком громоздкой и дорогой. Как показал опыт, часто условие б(х) к О с хорошей точностью можно обеспечить при небольшом числе Г (3 .+ 5, например).
Что касается условий С(х, и) а О, то они могут быть учтены с помощью несложного искусственного приема. Явно входящие в 6 компоненты оформляютсм как дополнительные фазовые переменные, а управлением становмтся нх производные, т.е. делается замена переменных и = н, и(0) = р. Теперь н — компонента нового управления, р — неизвестный параметр, тоже входящий в обобщенное управление. Этот прием имеет отрицательные последствия: сравнительно простые ограничения и (типа О а и «1) становятся ограничениями в фазовом пространстве. Кроме того, если и(г) — разрывная функция, процессом малых вариаций н( ) — и( ) + ьи( ) приходится получать в н(1) аналог Ь-функции. Тем не менее этот прием с успехом применяется на практике.
В дальнейшем мы познакомим читателя и с более прогрессивной идеей учета таких условий в методах приближенного решения. Пример решения задачи. Выше были изложены основные идеи методов приближенного решеним задзч оптимального управления. Их реализация связана с необходимостью конкретизировать большое число деталей, кажущихся мелкими на первый взгляд, но оказываюших довольно большое влияние на эффективность алгоритма.
Мы не можем здесь уделить внимание этим. деталям, с ними читатель, если ему понадобитсм, может познакомиться по специальной литературе. Для иллюстрации приведем пример решения одной прикладной задачи — об оптимальном развороте самолета. Система уравнений движения для такой задачи имеет вид (0<1< 1) х' = х« соз хз соз хь, х~ = х« з1п хз, х = — х соз хз з1п х6, х' = й Ихзр соз а — С„дб)/хт — зго х'1, х = з(х сов х" — соз ~Ух«, х6= — к (х соз хп)Р(х«соз хз), х'= — С„хз= и, х~=и, х'В= и, х" = и . — з Здесь х = р,' ЫЛЯБ, ГДЕ р, — парамЕтр, вхОдяЩий в Обобщенное управление (и( ), р). Он имеет смысл времени выполнения маневра, которое не задано заранее, а является ресурсом оптимизации наряду 467 % 28! ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ с и(.).