Л.А. Растригин - Теория и применение случайного поиска (1121205), страница 15
Текст из файла (страница 15)
Минимизируемой функцией является функция ошибки, зависящая от текущего момента времени а=У и равная т Л Е(Ж) = ~, [з[««] — з[п]) с(М-««), (4.3.2) л — О д где а[а] — сигнал при параметрах а«и Ь«, вычисленных на основании уравнения (4.3.1); з[п] — истинное значение сигнала; с(1) — весовая функция времени, непрерывная н монотонно убывающая, которая учитывает результаты наблюдения в зависимости от удаленности момента вычисления, а также возможную нестационарность обьекта. Приравнивая к нулю частные производные от Е(Ф) по различным а«и Ьь получают систему уравнений — =-.О; «=О, 1,..., Е =О; ]=1,2,..., 1.
(4.3.3) да« ' ' ''''* ' дЬ« Решая систему (4.3.3), состоящую из 21+1 уравнений, наход л л л д дят оценки ао, аь..., а«, Ь«,..., Ь«для соответствующих коэффициентов ам а«,..., а«, Ь«,..., Ь«разностного уравнения (4,3.1). Однако, как показано в [168], точность полученных оценок сильно зависит от уровня помех. Кроме этого, оценки по методу Калмена обладают асимптотическим смещением [171]. Дальнейшее развитие метод Калмена получил в [166]. В модифицированном методе путем введения а уравнение поправочных членов, компенсирующих смещение, удается получить асимптотически иесмещенные оценки.
Эффективность оценок по методу Калмена характеризуется соотношением [166] )7 е= — (1, (4.3.4) )7 где )с* — риск, соответствующий оптимальной оценке по методу [154]; )т — риск для оценки, полученной по модифицированному методу Калмена. 91 где й — коэффициент усиления, являющийся нормально ра:- пределенной случайной величиной с параметрами Ао, ооо. На объект воздействует лишь дискретная помеха е; в канале Е (см. рис.
4.4.), которая имеет нормальное распределение с нулевым математическим ожиданием н дисперсией оо. Оценка коэффициента усиления звена найдена тремя методами, Определенная по критерию минимума риска (154) оценка к оЧго+ооо Х д!г о- ! йо= — — — —" —— и по+о 2 ~ !).2 !" ! (4.3.5) Метод Калмена дает следующую несмещенную оценку: и ~. (г! — г! !)х! 1-! (4.3.6) У ~хл !»! Рис. 4.4. Рис. 4.о. Для сравнения некоторых методов оценки параметров рассмотрим пример, приведенный в (166). В качестве объекта управления взято интегрирующее звено, которое описывается следующими уравнениями: о„=о(а)=йд[п); по=О; л Ч!!=Ч(п)=,~, х;; х! = я!1! + е! = о! + е „ Третья оценка этого же коэффициента вычислена по методу максимума правдоподобия: (4.3.7) Х4л ~' — ! * Эффективность оценок И, й, Й~ характеризуется соответстл вующими величинами рисков Й*, Я и )т~, приведенными ниже.
о э У ~" (г „з о~ а~ ~' (э Как видно пз формул для риска, при 1>! эффективность оценок коэффициента, полученных тремя различными методами, характеризуется соотношением л )7~ )эа -)7 (4.8.8) пз которого следует очевидный вывод, что наиболее эффективной является оценка по методу минимума риска. В 1!681 методика Калмена проверена на цифровой машине, установлены границы ее применимости для объектов с различными передаточными функциями. Оценки коэффициентов рациональной передаточной функции объекта методом максимального правдоподобия получены в!169, 1701.
Структурно решаемая в 1!69) задача представлена иа рпс. 4.6, где 7 — - обозначает неизвестную передаточную функцию объекта; 2 — модель передаточной функции; 3 — формирующий фильтр неизвестного шума. Предполагается, что имеются конечные непрерывные записи нормальных рабочих входных и выходных сигналов; модель пе- зз редаточпой функции является рациональной функцией предопределенного порядка; на вход формирующего фильтра 3 поступает белый гауссов шум с дисперсией о'.
Выходной сигнал содержит аддитнвный гауссов шум с неизвестной спектральной плотностью предопределенного порядка. Функция правдоподобия для всех неизвестных коэффициентов имеет следующий вид: Е(0) = (2по') -т'ехр — - —, ~' (Р(0), (4.3.9) ! где 0 — вектор неизвестных коэффициентов; Т вЂ” число расчетных точек. Определение вектора коэффициентов объекта методом максимального праадоподооия сводится к решению следующего уравнения: ~„!д(0) =щ(п (4.3.10) где (,(О) — сигнал ошибки (разность выходных сигналов объекта и модели), являющийся функцией неизвестных параметров.
Следовательно, исходная задача в конечном счете сведена кзадаче минимизации среднеквадратической ошибки. Задача, определяемая выражением (4.3.10), представляет собой задачу минимизации сложной функции многих переменных. Для получения численного решения этой задачи применены итерационные методы (метод градиента, модифицированный метод Гаусса — -Ньютона). В (169] имеется ряд замечаний относительно полученных оценок коэффициентов передаточной функции. Дело в том, что упомянутые итерационные методы приводят к локальным максимумам функции правдоподобия и не позволяют определить, когда локальный максимум является глобальным. В [169) подчеркивается, что в настоящее время не существует метода для установления с достоверностью того факта, что найден глобальный максимум функции правдоподобия. Однако авторы указывают на ряд дополнительных мер, которые повышают вероятность нахождения глобального максимума, Среди нпх отмечены следующие: 1) применение случайного поиска в пространстве коэффициентов и использование для итерации в качестве начальной точки величины, соответствующей наибольшему значению функции правдоподобия; 2) осуществление итераций из случайно выбираемых точек; 3) применение субоптимальной, но состоятельной оценки в качестве начальной точки для итерации; 4) исследование пространства коэффициентов с целью отыскания точки, дающей большее значение функции, чем найденный локальный максимум функции правдоподобия.
По мнению авторов работ 1169, 1701, указанная проблема остается основным теоретическим препятствием при использовании критерия максимального правдоподобия, когда он приводит к нелинейным уравнениям относительно искомых коэффициентов. Авторы проверили полученные теоретические результаты при моделировании на цифровой вычислительной машине задачи с пятью искомыми коэффициентами и длиной записи в !00 то.
чек. Эксперимент показал, что при начале итераций из различных точек часто получались два различных локальных максимума правдоподобия. При этом заранее было известно, какое решение не является глобальным. Определена среднеквадратическая ошибка полученных оценок параметров от их номинальных значений. $4.4. ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК ОБЪЕКТА МЕТОДОМ СТАТИСТИЧЕСКОИ САМОНАСТРАИВАЮЩЕЙСЯ МОДЕЛИ Изложенный выше подход к оценке параметров и характеристик объекта сводится к аналитическому определению характеристик с помощью вычислительного устройства — аналогового или цифрового. Ниже рассматривается иной подход к определению характеристик объекта, сущность которого состоит в том, что строится упрощенная реальная модель объекта, которая управляется таким образом, чтобы минимизировать некоторую функцию нли функционал, зависящие от рассогласования выходных сигналов модели и объекта. Искомыми параметрами являются значения уставок модели после окончания процесса ее настройки.
Определение характеристик объекта управления методом самонастраивающейся модели с применением теории статисти- 95 ческих решений и дуального управления рассмотрено в [172 — 174). Блок-схема системы, использующеи самонастраивающуюся модель, представлена на рис. 4.6, на котором кроме уже извест- ных по рнс. 4.1 основных звеньев представлено дополнительное М вЂ” модель ооъекта с управля|ощим воздействием ц н выходной величиной з'".
Здесь, как и ранее (см. рцс. 4.!), рассматривается бейесовз задача. Объект н каналы связи обладают теми же свойствами, что и в схеме рпс. 4.1. Объект характеризуется вектором случайных параметров)., а модель — вектором настраиваемых параметров н, соответствующим |-му моменту времени. Оператор модели считается выбранным и в общем случае может нс совпадать с оператором объекта. Размерность векторов ц и Г может быть различной. Вычислительное устройство ВУ, обрабатывая поступнвшу|о последовательность случайных сигналов а, |, а,, н используя хранимую в памяти сформированную в процессе работы матрицу управлений ц, |, должно определить оптимальное управление (4.4.1) н,=-ц,(г, на', |,ц, |). За критерий оптимальности в !172) принят критерий минимума полного риска где )р',(з, а*„ гц) — удельная функция потерь; — уд |й р и — число тактов настройки.
Здесь, как и в ранее рассмотренных работах П53 --155, 175), правила решения относятся к классу регулярных, т. е. (4.4.3) Г(ц,/и; ьз*е ь ге ~) =Ь(и,— ц";), где н,' — оптимальное управление. Задача решается путем построения некоторой последова. тельности функций 5, и определения ряда управлений и„ т. е. оценок параметров модели, которые минимизируют функцию 5,.
Во второй части работы (172) получены оценки по критерию минимума полного риска для схемы рис. 4.6, когда помеха в канале Н отсутствует, а также для разомкнутой схемы рнс. 4.1 при таких же условиях зашумленностн, но по критерию оптимальности (4.2.! ). Объектом исследований является дискретный интегратор, характеризуемый параметром Л, являющимся случайной ветпчиной, распределенной по нормальному закону с известными дисперсией оЛз н математическим ожиданием Л».