1626435586-15eceb6ba43f688400eaeb312dc6d98a (844237), страница 18
Текст из файла (страница 18)
0 ао Подберем такое значение вектора параметров рт [ат, Ьт], чтобы минимизировать функцию штрафа 1 Х вЂ” ~ (а (д) — у (ь)] й. а Отсюда видно, что эта аадача является частным случаем задачи идентификации непрерывного объекта, которая была решена путем применения градиентного метода первого порядка. Полезно проследить алгоритм решения.
Определим функцию Н= — ]х (й) — Ь х(д)] + -]- РР(г)]г (Ь)х(й)+я(а)и(д)]+Гт]0]+Гь(0]. Здесь и (д) — известный входной сигнал, не обеспечиваю- щий оптимальных характеристик. Блок-схема вычисле- ний такова: ао ггадивнтныв мвтоды идвнтиэнклцин [гл. а $) задаться начальным значением а*, Ь1 вектора параметров рт = [ат, Ьт), 2) решить дифференциальное уравнение х» = Р(Ь')х~(1)+д(а)и(~), х'(0) = О, 3) решить систему сопряженных уравнений Л = Л ( Р) — Ытх'«)) — Р'(Ь') Л'Р), Л*'(~,) = О, Га —— Л1 (е) и (е), г„'р,) =о, Гь = Л1 (й) хг (Е), г,*р,) =о, 4) определить изменения оценок параметров Лаз = — Ка Г,(0), 'ль'=' — к' г' (0), 5) вычислить новое приближение агы =а1+ па', Ь'ы = Ь'+ АЬэ и продолжать вычисления, начиная с пункта 2),до достижения сходимости.
Важно отметить, что для идентификации р необходимо располагать реализацией входного сигнала и (Г) и «скорость» идентификации будет зависеть от этого входного сигнала. В этой постановке предполагалось, что может быть достигнуто абсолютное совпадение выходных сигналов модели и объекта. Но, конечно, выход объекта в действительности может быть искажен помехой, а уравнения модели и объекта могут быть уравнениями равного порядка. В подобных случаях логично предположить, что х (0) не задано, и определить Ах'(0), которое войдет в выражение для дифференциала функции штрафа ЛХ .= Лт (0) Ах (0), используя формулы йх~(0) = — Кд„Л'(0), хгы(0) = х~(0) + Ах~(0) о,е) мвтодыидвнтяэикеции динамичкских систкм (з( для итеративного вычисления вектора начальных условий, который требуется для решения дифференциального уравнения из пункта 2).
Неудобство этой процедуры состоит в том, что обычно получаются начальные условия, отличные от нулевых. Используя дискретную модификацию градиентного метода, можно решить задачу идентификации дискретной передаточной функции 2 (,) . +;+... + „,."-' гг(г) у = ~ го (х ((), р ((), (> г)г при ограничениях х = г (х ((), р (г), Ц, р=О х(го) = хог будем задаваться начальным значением р' и, решив систему дифференциальных уравнений, оценим величину функции штрафа Р.
Слегка изменяя р*, для нового значения р' + е) найдем штраф Х' + г);; у'-ю компоненту вектора-градиента функции штрафа можно приближенно оценить как кт ()'+ ч;) — у' грг (рг ( е) ро е Конечно, и здесь вычисления можно упростить, ааменив их приближенными вычислениями. Так, читатель отметит тесную связь между рассматриваемым примером и алгоритмом идентификации эталонной модели из главы 2.
Один из наиболее удобных путей упрощения сводится к использованию предположения о том, что постоянные параметры а и Ь могут быть идентифицированы применением статического варианта градиентного метода. Строго говоря, это неверно, хотя и может быть оправдано простотой процедуры приближенных вычислений. Для общей задачи минимизации функционала 122 гглдивнтныв мвтоды идвнтиэикхции ~гл. о Повторяя зту процедуру для возмущений различных компонент вектора параметров, определим приближенное значение вектора-градиента Ы/Ир'.
Первое приращение вектора параметров в направлении наискорейшего спуска к минимуму функции штрафа составит $ ЫХ йр = — й„—., Ыр' а новое приближение для вектора параметров определится как ро" = ро+ йр'. Простота приближенного метода позволила положить вго в основу нескольких итерационных схем главы 2, однако трудно оценить ошибку, связанную с приближенным вычислением И/Нр' (процедура точного вычисления свелась бы к ужв известным алгоритмам решения динамических задал).
Приближенная процедура приводит к существенным ошибкам, особенно тогда, когда функция штрафа не очень чувствительна к изменению вектора параметров. Последнее, к сожалению, довольно часто имеет место, если измерения или наблюдения искажены помехой и имеются неизвестные входные сигналы. Так же как и в статическом случае, можно рассмотреть разложение в ряд функции штрафа динамической задачи до членов второго порядка малости. Для функции штрафа (4.3.17) такое разложение имеет вид о г = ~ — + )о 1 око+ — Ьхо — око+ Г дЕ. 1т т дово =(дхо .! 2 дхо о (' двт ~т 1 тдоЕГ, т т + 1 — — 2т~ пхг+ — лЖ вЂ” пхг+ ко про — к ~ прг + 1 дх 2 дхо ! к — к + ~~~ ~д — — 2,~ дол+~(дН1 ии+~~~~ — 'о1 Лр+ доН д дН д дН дхо дв дх др дх Н1 (4.3.42) о,о1 методы идиитиФикАции динАмических систем яз для упрощения обозначений индекс й (номер шага) опущен, Чтобы упростить выражение (4.3.42), потребуем выполнения условий (4.3.18) и (4.3.19), в результате для АХ получим Гало, 1 1 т додо АУ = ~ — о+ Х~ 1 Ахо+ — Ах — Ахо+ †(а з ахо о М вЂ” о( 1 т аозт + — Ьх1 — оАхо+ГвАро+ ~ ~ — до 1 Аи+ ',ы-и.
а ан а ан дхо да дх др дх Н (4.3.43) Отметим теперь, что можно осуществить дополнительную минимизацию (4.3.43) по Ьх, Ар и Ьц. Эту минимизацию следует проводить при учете соотношений (4.3.14) и (4.3.15), используя которые, получим Ах(1с+ 1) = — Ах(7с) + — Ап(х) + — Ар(Й) = =! ° д дН 1 х Г д дН 1 = а (~) ~ъ(~)~АИ( )+~в (А) а (а) ~~ (~)+ +~ (а)~Ар(й); (4.3.44) Ар(я+1) ='Ар(х). (4.3.45) Обычное применение дискретного принципа максимума приводит к двухточечной задаче для уравнений (4.3.44), (4.3.45), а 124 ГРАдиентные методы идентиФикАции (гл. о (4.3.48) Здесь ЬХ и Ьà — множители Лагранжа, которые удовлет- воряют условиям на концах: (4.3.49) (4.3.50) (4.3.51) (4.3.52) е)о (йо) = — — — — )о (ео) — . Ех (ко), дз (Ао) додо (ко) дк ()оо) дк (ао)о ЛГ(йо) = — Г(йо), А)о (Ус)) — д, Ьк (ЪГ) доет(а ) ЛГ(й() = 0.
Так же, как и в статическом случае, использование вторых приращений определяет иаменение управления от итера- ции к итерации. Сложность вычислительных алгоритмов существенно возрастает по сравнению с градиентным ме- тодом первого порядка. В то же время сходимость ока- зывается квадратичной и гораздо более быстрой.
Однако область начальных условий и начальных приближений к управлению, гарантирующая сходимость, существенно сужается. Схема вычислений такова: 1) аадаться начальным значениемп'(Й), х'(й ) и р'(е ); 2) решив уравнения (4.3.14) и (4.3Л5), определить траекторию х' (Й) и параметры р' (й); ясно, что для реше- ния уравнения (4.3Л5) вычислительная машина не по- требуется, так как ро()о) = р'()оо); 3) решить сопряженные системы уравнений (4.3.18) и (4.3Л9) в «обратном» времени от й~ и )о;, 4) решить линейную двухточечную задачу (4.3.44)— (4.3.52). Благодаря линейности задачи для ее решения можно воспользоваться множеством различных методов (см.
«л) МЕТОДЫ ИДЕНТИФИКАПИИ ДИНАМИЧЕСКИХ СИСТЕМ (Зь Се))дж, (116)). Удобнее всего воспользоваться преобразованием Риккати. С линейными двухточечными задачами еще не раз придется встретиться в главе 6. Решение линейных ДКЗ дает искомые значения Ах«(й ) и Ар' (й ); 5) определить из уравнения (4.3.46) Аи'(й); 6) используя (4.3.27) — (4.3.29), построить новое приближение хмл (й,), р'+г(й») и и"'(й); 7) вернуться к пункту 2) и повторять вычисления до тех пор, пока х' (й,), р' (й,) и и' (й) при переходе от итерации и итерации практически не перестанут меняться. Как уже отмечалось, процедуру вычислений Ах (й), 'Ап(й) и Ар(й) можно упростить, используя преобразование Риккати.
Но вместо того чтобы сразу же применить это преобразование для упрощения формул градиентного метода второго порядка, поступим несколько иначе. Допустим снова, что уже выбраны начальные приближения для управления и' (й), начального состояния х'(й,) и вектора параметров р'(й,). Уравнения для состояний и параметров (4.3.14), (4.3Л5) решаются в прямом времени, сопряженные уравнения (4.3Л8) и (4.3.19)— в «обратном» времени.
Затем предполагается, что вариации первого порядка, связаны условиями, вытекающими из уравнений (4.3Л4), (4.3.15), (4.3.18) и (4.3Л9), а именно: д дН Ах(й+1) = ~ —,„„„,1 Ах(й)+ (дз(а) дА(а+()1 ( ) + Сдр(А) дь (Ь+ ()~ = — Ах(й)+ д ь Аи(й)+ — ААР(й), (4.3.53) (4.3.54) Ар(й*1) = Ар(й), (4.3.56) (2с ГРАдиентные мктоды идентиФННАции (Гл.. о где Н определяется выражением (4.3.16).
Изменение уп- равления дп определяется применением к дгс/дп известно- го линейного преобразования, а именно: (4.3.57) Условия на концах для линейной двухточечной задачи имеют вид д)о(/с ) ,'' о[ ( аП 1 (ко) а[х( о)[ д (к ) (4 3 58) Д[о ()сс) = — зс с Дх ()су), даос [х (ьс)1 (4.3.59) ДГ(й,)= — Г(й,), ЛГ(й,) =0. (4.3.60) Полученные соотношения можно записать в более простом виде: с„(ь) о с (ь) о о с (а)о Фа (а) с условиями на концах (4.3.58) — (4.3.60). Отправляясь от особенностей двухточечной аадачи, представляется разумным искать ее решение в виде Д)~(/с) = Е~ ([с) Дх()с) + ЕхрДр()с) + юх([с), (4.3.62) ДГ()с) = Егх()с) Дх(й) + Ег Др ([с) + юг ([с) (4 3 63) Подставляя зти выражения в (4.3.61) после'-несложных преобразований при отличных от нуля Ьх и Ьр получим дх(ь+ [) си(ь) 'Соа(ь) дь (ь) сос (ь) Сао(ь) Др(а+1) = О О дг (а) С' (Ь) Ст (А) дх (й) Д)а (Ь+ 1) др (ь) ДГ(А+1) два (ь) (4.3.61) 0.01 мнтоды идентиФикапии диномичкских систкм $27 набор матричных уравнений Риккатн.