Л.А. Растригин - Теория и применение случайного поиска (1121205), страница 14
Текст из файла (страница 14)
В рассматриваемой задаче находятся не только параметры, характеризующие детерминированную часть системы, но и параметры, которые описывают случайные помехи, действующие на систему, что необходимо для получения «лучших» оценок параметров предпо- лагаемого (пскомого) оптимального фильтра. В качестве вычислительного метода использован метод градиента. Для построения оптимальных систем необходимо не только определение параметров состояния проектируемой системы, но и измерение без ошибок или мгновенное вычисление фазовых координат.
Особую важность имеет вопрос получения достоверных оценок этих величии для нелинейных динамических систем, в которых все измеряемые сигналы искажены некоторьыш случайными возмущениями различного рода. В таких системах возникают трудности, связанные с попытками физического воспроизведения предельной математической операции дифференцирования. В (160) производится оценка фазовых координат нелинейной импульсной системы, возмущающим воздействием для которой является последовательность независимых гауссовых случайных векторов. 11еизвестные постоянные нли случайно меняющиеся параметры системы представлены как дополнительные параметры состояния (фазовые координаты) системы. Рассматриваемый объект управления описывается векторным уравне нпем в конечных разностях следующего типа: Х (й+ 1) = !'(Х (й), й) + б (й) е (й), (4.2.9) у которого наблюдаемый сигнал Х(й) связан с вектором состоя.
нпя системы Х(й) выражением Х(й) =~~(Х(й), й) +е(й), (4.2, ! О) где Х вЂ” л-мерный вектор состояния системы; е — пг-мерное (гп п) векторное возмущение, действукщее на объект; а — наблюдаемый р-мерный вектор; б -- матрица размером иХгл; е -- р-мерный вектор ошибки измерения; ~,( ° ) н )( ) — некоторые векторные функции, а последовательности е(!),..., е(й), е(й+1),... и е(1),..., е(й), е(й+1),... представляют собой последовательности гауссовых случайных векторов с нулевыми математическими ожиданиями и известными корреляционными матрицами вида М [а(1) а'(й))= А(й) йгя,' М(е(1)е (й))=В(И)Ь;,; М (е (1) е'(й) ] = 0 для всех целочисленных значений 1 и й, где символ М обозначает операцию усреднения по множеству реализаций (математическое ожидание); символ (') — операцию транспоннрованпя вектора, а бм — символ Кронекера.
Предполагается также,что матрицы А и  — определенно положительны, а векторы е и е не коррелированы между собой. Задача состоит в оценке последовательности состояний [Х(0),..., Х(п)] по наблюдениям последовательности векторов [У(0)...
Х(п)]. Оценка Х выбирается таким образом, чтобы минимизировать математическое ожидание некоторой функции потерь. Подходящей оказалась функция потерь, приписывающая равные веса всем ошибкам, превосходящим некоторое пороговое значение. После того как задача оценкя параметров была сведена к задаче минимизации, для решения применялся метод динамического программирования [161]. Прн этом оптимальной оценкой оказалась мода апостериорного распределения р(Х(0),..., Х(п)/Х(0),..., Х(п) ). Как отмечалось ранее, оценки параметров производятся и прп синтезе оптимальной стратегии в системах дуальпого управления [70, 91, 93, 97]. В [93] автор рассматривает систему дуальцого управления пр~ несколько отличных, чем в [71], исходных предпосылках.
Здесь полагаетси известной не плотность вероятности параметров, характеризующих объект управления, а лишь область возможных значений параметров. Оптимизация системы производится нз условия минимакса средних потерь, При этом уравнение средних потерь распадается на два. Одно пз них позволяет определить асимптотически оптимальное управление, а второе уравнение представляет собой оценку параметров объекта по методу максимального правдоподобия. В [97] решение основного уравнения теории дуального управления осуществляется поэтапно. На первом этапе находится оптимальная оценка неизвестных параметров управляемого объекта, названная оценкой минимальных потерь.
Затсм, па втором этапе, отыскивается асимптотическн оптимальное управление. Уравнение, из которого определяется оценка минимальных потерь, схоже с уравнением для оценки максимального правдоподобия и отличается от него лишь тем, что на впд оценки оказывает влияние характер функции потерь. Методами теории решающих функций в [!47] найдены ста- тнстические оценки параметров нелинейного динамического объекта с известным видом оператора.
В работах [!62, 1631 авторами показано, что в процессе оптимального управления линейными дискретными системами с квадратичным показателем качества при услови~, что случайные параметры, распределения которых известны, независимы для любого момента выборки, задачи оптимального управления и оценки параметров можно разделить.
Эта трактовка соответствует тому классу задач теории управления, в которых выполняется так называемый принцип достоверности эквивалентности [1641. Суть этого принципа состоит в том, что уравнение, описывающее систему управления, заменяется уравнением, в котором неизвестный параметр заменен его средним значением. Однако принцип достоверности эквивалентности применим не всегда.
В [81, 991 обсуждаются проблемы, вознпипощне прн оптимальном управлении процессами, значения постоянных параметров которых неизвестны, причем характер процессов таков, что измерить эти значения во время управления невозможно. В отличие от [162, 1631 здссь задачи оценки и оптимального управления не могут быть разделены для данного класса систем [991. В статье дается в общем виде постановка задачи оптимального управления для подобных систем. Показывается, что для систем рассматриваемого класса замена системы, параметры которой неизвестны, системой, параметры которой представлены средними зпаче:шями, и нахождение оптимальнон стратегии управления для новой системы не приводят к определению обшей оптимальной стратегии управления. Применение принципа достоверности эквивалентности в задачах оптимального управления системами с неполной информацией об объекте не позволяет найти оптимальную стратегию управления, но на основании этого принципа можно найти удовлетворительную субоптимальную стратегию.
Последовательная оценка состояний и параметров нелннеймых систем при наличии помех произведена в [1661. Изучаются системы, динамические характеристики которых можно описать обыкновенными дифференциальными уравнениями. Прп этом не требуется каких-либо статистических допущений относительно природы неизвестных входов системы нли погрешностей измерения выходных величин.
В целях оценки используется критерий, основанный на методе наименьших квадратов. Особенность подхода к решению рассмотренных в [165) задач заключается в последовательно уточняемом характере оценки, полученной по методу наименьших квадратов; оценка может использоваться в реальном масштабе времени. $4.З. СТАТИСТИЧЕСКИЕ ОЦЕНКИ ДИНАМИЧЕСКИХ ХАРАКТЕРИСТИК ОБЪЕКТА 1!аряду с оценкой параметров в некоторых работах изучаются также вопросы оценки динамических характеристик объектов управления [158, 166 †!70). В «167) даются элементы обобщенной теории определения внутренних физических параметров и передаточных характеристик систем методом проб. Под пробой понимается сигнал илн совокупность сигналов на входе системы, реакция на которые в некотором смысле полностью характеризует систему, В качестве такого пробного сигнала используется сигнал в виде белого шума.
Показывается, что при входном воздействии с заданпыми статистическими характеристиками при определенных достаточно широких условиях можно с помощью простых измерений средних значений переходных характеристик определить внутреннюю структуру системы и что эти измеряемые средние величины детермннированно связаны с физическими параметрамн, если известна математическая модель системы.
Эти статистические характеристики определяются усреднением произведений переходных функций на переходные функции ортогонального фильтра, причем на их входы подается один и тот >ке пробный сигнал в виде белого шума. Рассмотренный метод проб применим к системам, динамика которых описывается дифференциальными уравнениями в частных производных. Оценки параметров динамического объекта можно получить на основе теории, развитой американским ученым Р. Калменом «158). Рассмотрим основные идеи этого метода. Объект описывается разностным уравнением о[п)+Ь~п[п — 1)+...+Ь~п[п — !)= = аэх «п) + а ~ х [и — 1) +...
+ а 1х «п — !), (4.3.1) в котором ам аь..., аь Ьь..., Ьг — коэффициенты импульсной передаточной функции объекта. В соответствии с методом Калиена, действительные входные и выходные сигналых[п] и о[п) заменяются значениями наблюдаемых сигналов у[п] и з[««]. Затем производится вычисление коэффициентов а«и Ь, методом наименьших квадратов.