Буков В.Н. Адаптивные прогнозирующие системы управления полетом (1987) (1246771), страница 40
Текст из файла (страница 40)
В связи с тем что в (7,4) векторы х и а остаются неизвеспгьгми, сделанный в 3 32 вывод о равенстве п(г) и и„„,(г) не является конструктивным. Как и в а 3.2, интеграл в (7.6) будем понимать в смъизге Иго,,тогда в сину перестановочности операций интегрирования и определения математического ожидания вместо (7.6) можно записать иЯ=агйпппггК 'М([и — и„аг(х,а)) 1и — и „,(х,а)Цг(ГюГ)), (77) гг откуда следует необходимость приближения и к и „, в смысле наименъших условнъ1х квадратов, т.е. выбор и(г) должен обеспечивать наименьшие значения вторых моментов разницы и — ие„т. Заметим, что в слу аю решения линейной квадратичной задачи дая объекта с известными параметрами (коэффициентами) х=ах+Ьи+$„ (7.8) 1, 1 и функционала (323), у которого К = — х рх и Д = — х Рх, оптимизи- 2 2 рующую функцию г(х, г), удовлетворяющую уравнению (3.24), следует искать в виде 1 $'(х, г) = — х'А(г)х+В(г), (7.9) 2 (7.11) где А — симметрическая положительно определенная матрюав;  — скаляр-- ная функция времени.
Тогда оптималыюе управление в соответствии с (7.4) определится формулой ' ) и „= — КЬ'Ах, (7Л О) а уравнение (3.24) уступит место уравнению 1, ° ° 1,, 1, 1 1 — х'Ах + В+ — х'а'Ах+ — х'Аах+ — 1гАЮ„. = — — х'бг 2 2 2 2 2 1 1 сграничнымусловием — х'А(г„)х+В(г„)= — х'рх, которое при произволъных х зквивалентно совокупности двух уравнений 1 А + а'А + Аа = — Р, В = — — 1г АЯ„ (7.12) с граничнъгми условиями А(г„) = р, В(г„) = О. При этомВ(г) в (7.9) не исполъзуется, а обеспечивает лишь удовлетворение уравнения (7.11). Позтому можно ограничиться решением толъко первого уравнения (7.12), переходя тем самым к детерминированной постановке задачи. Подставляя в (7.7) выражение (7.10) для и„„г н произвольную линейную форму для искомого управления и =Хх, (7.13) ') пр ФВс ию г ют п~ женин 1.
К 13' 195 где х — некоторая оценка состояния х, полу вем и(г)=ага шш тгК 'М[(Тх+КЬАх)(тх+КЬАх)'1г(ге, г)]. У Если принять, что по аналогии с (7.10) Т, = — КЬ'А, то и(г) агй пол тг К 'КЬ АМ[(х — х) (х — х)' ! з(ге, г)]АЬК = У = атй ш1п тг А ЬХЬ'АМ [(х - х) (х — х)' 1 г(ге, г)], У (7Л 4) откуда следует, что оптимальное управление соответствует детерминированной постановке задачи, а оценка х в искомом управлении должна быть наилучшей в среднем квадратическом смысле условной оценкой состояния х.
Зто утверждение н обеспечивает разделение задач управления и оценив ения. В общем случае получение подобного результата является очень сложной задачей. А. А. Красовский предложил рассмотреть случай достаточно вьгсокой точности оценивания состояния и параметров объекта, когда ьюжно полагать, что условное распределение вероятностей этих векторов близко л л к дельта-распределению 6 (х — х, а — а), где х = М[х Ч Яо г)], а = М[я 3 г(ге, г)]. (7.15) Тогда в силу свойства дельта-функции соотношение (7.7) приводится к виду и(г) =агй плп [гК '[и — и „(х, а)] [и — и „(х, а)]', (7.16) Г откуда непосредственно следует ЭГ(х,а, г) и(г) = и,„,(х, а) = К р'(х, ~ь г) (7Л7) от(г) Следовательно, при достаточно высокой точности оценивания состояния и параметров решение стохастической задачи оптимизации управления с наблюдениями может представлять собой сочетание совмещенного синтеза оптималыюго управления (7.3), (7.4) стохастическим объектом (7.1) (7.2) в предположении точного измерения векторов х(г) и а(г) с оцениванием состояния и параметров как условных средних (7.15) [4.4].
Точные алгоритмы оценивания нелинейных процессов по условному среднему, вообще говоря, представляются бесконечномерными цепочками уравнений, получаемых на основе условного уравнения Фоккера — Планка — Колмогорова. Конечномерные вычислительные алгоритмы оценивания являются следствием принятия различных аппроксимаций исходной задачи. Так получены, например, алгорнмы оценивания параметров, называемые фильтрами Калмана первого и второго порядка [4.4, 7.2]. Заметим, что границы применимости предположения о дельта-распределении для практических задач не установлены и, следователыю, границы области с предпочтительным н эффективным для рассматриваемой задачи оцениванием по условному среднему не известны. В то же время, подкрепляя приведенные рассуждения интуитивными соображениями, будем принимать калмановскую фильтрацию как одно из основных направлений построения алгоритмов текущего оценивания параметров.
196 При решении прикладных задач с использованием прогнозирующих моделей интенсивность случайных возмущений в (7.1) и (7.2) предполагается настолько малой, что на интервале оптимизации [б г„) вместо (7.3) можно решать(3.18),т.е нсполъзовать предложеннъю в предыдущих главах алгоритмы. 3 72. Идентификация при точном измерении компонент состояния объекта Выведем уравнения параметрической идентификации на физическом уровне строгости.
Полагая, что оцейивание состояния объекта (1.1) осуществляется автономно (или точность измерения вектора сосгояниядостаточна для организации адаптивного упразетения), будем считать, что в кахь дый момент времени мы располагаем оценками вектора состояния х н скос рости его изменения х в соответствии с соотношениями л е Х=Х, Х=Х+$1. (7.18) где К вЂ” матрица козффициентов усиления, а выражение в квадратных скобках характеризует невязку детерминированной части уравнения объекта Эвристический выбор линейной по невязке процедуры оценивания (7.19) определяет "физическин уровень" последующих результатов.
Выбор осуществляется нз соображений минимизации ковариационной матрицы (точиее, ее приближения) ошибок оценивания параметров. Задаваясь определенным уровнем приближения, разложим функцию Р в л л ряд Тейлора в окрестности оценок х н а и удержим необходимое число членов ряда. Ограничиваясь линейными членами разложения, в соответствии с (7.18) получим л л г дР г(х, а, и, г) = Р(х, а, и. г) = Р(х, а, и, г) + — „Ьа, (7.20) да л где дГ/да — матрица частных производных векторной функции г по укал л л ззнному векторному аргументу, вычисленная при х =х и а = а; Ьа = а — а— ошибка оценивания вектора параметров.
С учетом (7.20), (1.!) и (7.18) из (7.19) следует дР а=К~3„+$; — — „Ьа (7.21) 197 Здесь условно принимается, что все погрешности измерения или оценивания величин, характеризующих движение объекта, связаны с погрешиостял ми оценок х. Помехи $ можно полагать центрировзнными, так как постоянные ошибки датчиков могут быль оценены и соответствующим образом учтены [7.3! . Если известна аналитическая форма векторфункции Р в (1.1), то очевидным линейным по невязке непрерывным алгоритмом оценивания параметров объекта (1.1) является алгоритм а=К[хс+Р(х,а, и, г)), (7.24) 198 Вычитая из (7.21) уравнение (7.1), получаем 8Р Ьа = — К вЂ” „ььа + К(с„+ Ь) — ча .
(7.22) Введем обозначение векторного шума $х = $„+ 4, под которым будем понимать суммарный шум, искажающий наблюдения эа объектом (1.1) и отнесенный условно к измерителям скорости вектора состояния х. Известно 14,41, что дпя линейного процесса (7.22) в случае, если шумы $х н $„являются некоррелированньтми центрированными белыми шумь ми с известными интенсивностями Ят.
и Я„ковариационная матрица удовлетворяет уравнению 8Р 8Р' Р= — К вЂ” „Р-Р— К'+К5 К'+5. да Эа Это УРавнеиие цРн де1 Юг ФО пРивоДитсЯ к виДУ Р= К вЂ” Р а Я'/Юх~К-Р а 5в'! —.1' — а Я' л Р+5а, (7 25) откуда следует, что минимальную ковариациониую матрицу ') обеспечивает выбор аР' К=Р— „5 '. да При этом уравнение (7.23) принимает внд дЕ', ЭГ Р+Р а 5е л Р 5а. (7.25) 82 ' ал Формулы (7.19), (724) и (725) определяют алгоритм идентификации типа фильтра Калмана первого порядка в непрерывной форме. Начальиь1- ми условиями для (7.19) и (7.25) являются соответственно математическое ожидание начального значения вектора параметров и ковариационная матрица начальных ошибок оценивания параметров. Вместе с интенсивностями действующих шумов величины л(га) и Р(га) составляют априорную статистическую информацию, необходимую для реализации калмановской фильтрации.
Более строгий подход требует использования в (7.!9) полной оценки а векторной функции Р(х, а, и, г), которая в общем случае (нелинейность по векторам х, а нли негауссовость шумов в (7.18)) не совпадает с Е(х, д, и, г). Более сложная и более точная аппроксимация Е в (7.19) н использование более сложных разложений вместо (7.20) позволяют по. лучить алгоритмы идентификации более высокого порядка, обладающие в целом '14.41 улучшенными характеристиками сходимостн.
При одновременном оценивании состояния и параметров используется алгоритм типа фильтра Калмана, в котором в отличие от (7.19), (7.24) и (7.25) оценивается обобщенный вектор, формально объединянлций суб. '1 Имеется в виду матрица с минимальными диатенвльнымн элементами. векторы х и а [7.4, 75].
Такой подход сопровождается резким возрастанием трудоемкости вычислений. Поэтому в дальнейшем будем полагать, что интенсивности изменения состояния обьекта (1.1) и его параметров настолько различны, что вполне приемлемо их раздельное оцениванне. Кроме того, при решении практических задач идентификации модель управляемого объекта удобно выбирать таким образом, чтобы параметры а в (1.1), по крайней мере в течение одного цикла оценивания Ь|„ можно бъшо полагать постоянными, т.е. я= О.