1626435586-15eceb6ba43f688400eaeb312dc6d98a (844237), страница 17
Текст из файла (страница 17)
К сожалению, для нелинейных задач или произвольных функций впрафа зто свойство утрачивается. Относительно несложно показать, что задача минимизации при учете ограничения (4.2.34) Х = 0(х, п), 1(х, и) = 0 может быть решена точно так же, как и при отсутствии ограничений. Необходимо только заменить 0 (п~) функ- М2 ТРАдиентные методы идентиФикАции [гл. к цией Н (х, п*', У) и, конечно, добавить к системе уравнений дополнительные, соотношения О, (4.2.35) аХ* ак' решаемые на каждой итерации.
Мы начали с рассмотрения статического одношагового градиентного метода прея«де всего из-за его простоты, а не только для того, чтобы подчеркнуть применение градиентных процедур к идентификации статических объектов. В дальнейшем мы увидим, что зти методы с минимальными изменениями можно применять для решения многошаговых или непрерывных задач идентификации динамических объектов. 4.3. ГРАДИЕНТНЫЕ МЕТОДЫ ИДЕНТИФИКАЦИИ ДИНАМИЧЕСКИХ СИСТЕМ Результаты предыдущего раздела кюгут быть легко распространены на дискретные по времени или многошаговые задачи. Сначала рассмотрим следующую функцию штрафа: к — « У = О [х(й«)] + ~ «р[х(й), и(й), й].
(4.3.1) к=к Необходимо минимизировать функцию штрафа, удовлетворив одновременно следующим ограничениям: х (й + 1) = «р[х (й),п (й), й]. (4.3.2) Формально можно поставить двухточечную краевую задачу и, определив гамильтониап Н =«р[х(й), п(й), й]+А~(й+ 1) «р[х(й), п(й), й], (4.3.3) найти оптимальное управление и [й) и траекторию х (й) с помощью следующих соотношений: — — х(й, 1), х(йк)=х„ (4.3.4) дх(К) «'(й)' к'(й«) ддх х(к ~ (4.3.5) де[ [к)! — = О. (4.3.6) 1,1] МЕТОДЫ ИДЕНТИФИКАЦИИ ДИНАМИЧЕСКИХ СИСТЕМ Я3 Для того чтобы обойти трудности, связанные с необходимостью аналитического решения двухточечной задачи, применим градиентный метод первого порядка. Добавим к функции штрафа (4.3Л) ограничения (4.3.2) с множителями Лагранжа.
Учитывая (4.3.3), получим ку — ' ,К=О[х(йс)1+Г'х(й,)+ ',Я [УУ вЂ” ],'(й+4) (й+ 4)] = = О [х (Усс)] — Х~ (Усс) х (Усс) + [Г + ЗР (Ус,)] х (Уск) + кс-1 + ~ч~~ ~[УУ' — Х (Ус) х(Ус)]. (4.3.7) кв Взяв первую вариацию или первый дифференциал, получим ЛУ = [Г + Х~(Ус,)] У[х (й ) -[- ~ У вЂ” ]к (Усс)1 Лх (Усс) + кс — 1 + Х ][ ~~ — Х(Ус)1 Ьх(Ус)+~ ~~„Гйп(Ус)]. Положим скх (Уск) = О, так как х (к,) задано. Ради про- стоты выберем ]к и х так, чтобы д к — — Х (Ус), Л (Усу) дх [к ' (4.3.8) до до [х [Ку)[ В результате первый дифференциал функции У преобразуется к виду КУ вЂ” 1 УАУ = ~~' ,~ — 1 Ухи(Ус). (4.3.9) Для того чтобы обеспечить наискорейшее движение в направлении минимума, выберем д [к) ' (4.3ЛО) здесь К' — число, которое выбирается из соображений, связанных со сходимостью. Таким образом, использо- (в4 ГРАднвнтные мвтоды идвнтиФиклцнн [Гл.
в ванне градиентного метода первого порядка в многошаговых задачах сводится к следующей вычислительной схеме: 1) определить или задаться аначением пв(й), 2) используя (4.3.2), вычислить х' (й) для й, ~( й ( йс, 3) решить сопряженное уравнение (4.3.3) в «обратновс» времени для йс в й а й и определить У(й), 4) определить дН дт[.~(а)"~(д) а]+ др~['(д). кс(д) а],(й+ дас (д) до' (Й) ди' (Ь) (4.3.11) 5) получить приращение свп' (й) = — Кс —,. дос (а) 6) вычислить новуво итерацию управления вмв(7с) = пс (й) + свп'(й), (4.3.12) 7) вернуться к пункту 2) и повторять вычисления до тех пор, пока при переходе от итерации к итерации происходят заметные изменения траектории и управления.
При идентификации реальных объектов встречается множество ситуаций, в которых применение описанного выше градиентного метода первого порядка становится затруднительпым. Наиболее важным из них является случай, когда не задано начальное состояние и идентифицируются некие постоянные параметры р (й). В етом случае функция штрафа приобретает вид «с-в У = Ос [х (йС)] + 8в [х (йв)] + ~ ср [х (й), р (й), и (й), й], в=се (4.3 13) а уравнения объекта имеют вид х(7с+1) = ~р[х(й), р(й), п(й), й].
(4.3 14) Условие постоянства неизвестных параметров запишется как р (й + 1) = р (й). (4.3 15) аз~ мвтоды идвнтиоиклции динамичвских систем ~да Можно, конечно, расширить описание состояния, включив в него вектор параметров и избавившись тем самым от необходимости явного учета неизвестных параметров. Однако по причинам, которые станут ясны позднее, кажущейся простоте обозначений будет предпочтеи другой способ обобщения градиентного метода первого порядка, связанный с явной записью вектора параметров р(й). Определим гамильтониан' УУ = <р]х(й), р(Й), п(Й), й] + + Л (Ус + 1) юр ]х (Рс), р (Ус), и (й), Ус] + Гт (Ь + 1) р (Ус).
(4.3.16) Добавив к функции штрафа уравнения движения, полу- чим первый дифференциал функции У в виде + У~(йо)] ох(йо) + ~~ ]» (~~)] 1т т + ~ „— Х(йу)~ Лх (йу) + Г (йа) ЛР(/са)— Ву-г — 1' (Йу) Ьр(йу)+ ~~~ ]] — „— Х(Ь)~ Ьх(й) + и и, +~~ а — Г(й)~ Ар(Ь)+ ~~ „~ Лп(й)~. (4.3.17) Как и раньше, Л У упрощается путем введения сопряженных переменных.
И, в частности, используются следую-' щие условия: 1,(Ус) = —, Х (й~) =, (4.3.18) дН ав,]х (а,)] д Ю Ф дх (ау) Г(Рс) = —, Г()сУ) = О. (4.3.19) Таким образом, первый дифференциал функции штрафа преобразуется к виду ЛУ = 1СЕ'( ("")] + У~(Ь,)~ ох(й ) 1- ] 1,т(й ) др Жо) -]- .Е ~ — ~ Ап (Ус).
(4.3.20) з=м и6 грддиентные методы идентификАции (гл, а Выберем Ах (йа), Ар (й,) и Ап (й) так, чтобы получить наискорейший спуск к минимуму. Таким образом, по- ложим А» (Йа) ~да ~ д (д ) + (Йо) ~ АР (Йо) = Кдр1 (Йа), Ап(й) = — Кд„—. дН " дп(а) ' (4.3.21) (4.3.22) (4.3.23) о(й) Ка ~дза[х (да)[1+1,с(й) (4324) дха (Ьа) АР (й,) = — К'„Г'(й,), (4.3.25) Апс (Й) = — Кд„— (4.3.26) два (/а) 5) вычислить следующую итерацию начальных условий и управления: ха+'(Йо) = х'(7с,) + Ах'(Йо)а Р ~ (Йо) = Р (Йо) 1- Аро (Йо) па+а (Й) = пс (Й) + Аиа (Й), (4.3.27) (4.3.28) (4.3.29) Теперь на каждой итерации изменяется не только управление и (Й), но изменяются и начальные условия х(й,), р (Й ), в то время как раньше х (й,) было фиксировано и Ах (Й,) равнялось нулю.
Во многих задачах х (й,) является заданным. Если это так, то х (й,) используется как начальная точка для решения уравнений, описывающих движение объекта. Может также оказаться, что отсутствует управление п(й). Вэтом случае из алгоритма исключается процедура пересчета и (й) (и, разумеется, дВ7 ди). Общая блок-схема вычислений такова: 1) определить или задаться значениями х'(йо) Рс(йо) и (Й), 2) найти решение хс (й), йо ( й ( й» разностных уравнений (4.3.14), (4.3.15) с заданными х' (йа) и Ра (Йа) 3) определить У (й) и Гс (й), й > й а Йо, Решив сопряженную систему уравнений (4.3.18), (4.3 19) 4) определить приращения П3 ГРАДИЕНТНЫЕ МЕТОДЫ ИДЕНТИФИКАЦИИ [ГЛ. Е 6) вычислить новые значения искомых величин кмч (~) = е~ (1) + Ап~ (г); (4.3.39) х'+' (йе) = х'(йе) + Ахе(й ) (4.3.40) Рнт(~е) = Р'(~е) + АР'(~е) (4 3 41) 7) вернуться к пункту 3) и повторять вычисления до тех пор, пока иаменения параметров, управления и траектории при переходе от итерации и итерации не станут мало заметными.
В постановке аадачи идентификации можно учесть любое число ограничений, задаваемых равенствами или Рвс. 4.3Л, Настраиваемая модель мэ крамера 4.3Л. неравенствами. Однако в атой книге подобные постановки задач не рассматриваются (см. Сейдж, [116)), так как ограничения в форме неравенств на состояние объекта и управления и ограничения-равенства на концах траектории встречаются в задачах идентификации не слишком часто.
После краткого обсуждения двух примеров особое внимание будет обращено на иаучение градиентного метода второго порядка и метода сопряженного градиента для решения задач идентификации динамических объектов. Пример 4.3.1. Рассмотрим идентификацию одномерного объекта по схеме с настраиваемой моделью, схема которой изображена на рис.
4.3.1. Предполагается, что неиавестный объект описывается передаточной функцией с неиавестными постоянными параметрами ат = (ае, а„... мз1 митоды идвнтиеикацин динамнчвских систвм ПО ., „д]т, Ьт = ]Ь„Ь„..., Ь„,]т: й(д) Н, А(.) "+ дд+...+а гд"-' е() () ВИ ь,+ь, + +ь Вход объекта и (г) с преобразованием Лапласа У (г) и выход объекта г (ь) с преобразованием Лапласа Е (з) считаются известными. В начальный момент времени объект находился в состоянии покоя. Во временной области уравнения объекта можно записать в виде х = г (Ь) х (~) + л (а) и (ь), у (~) = Ь х (г), где — 10 О ь„,о~ о ... оо ь а дд-1 а Р (Ь) = д(а) = ад Ьд 00...