Ким Д.П. Сборник задач по теории автоматического управления (2008) (1151994), страница 35
Текст из файла (страница 35)
Так как, по определению, функция Беллмана имеет вид 'г Я(х(1)) = гшп (х21+ и )Йт, и(С) гктсгг г то Я > О при всех Ф < 11. Поэтому квадратичная форма, удовлетворяю- щая уравнению Беллмана, будет функцией Беллмана, если она являет- ся положительно определенной. Критерию Сильвестра положительной определенности квадратичной формы удовлетворяет решение а12 = 1, а22 = ~Г2, а~ ~ = ~Г2. Поэтому функция Беллмана и оптимальное управ- ление имеют вид 1 дЯ я = Лх21+ 2х~хт+ ~Г2х~з, и* = — — — = — (х~ + ьГ2хт).
2 дхз Методы классического варнационного исчисления и принцип макси- мума, как правило, позволяют находить оптимальное управление как функцию времени. В то же время, как следует из рассмотренного 214 Тл. 8. Методы теории оптилизльного управления примера, метод динамического программирования позволяет находить оптимальное управление с обратной связью. Недостатком метода динамического программирования при решении задач оптимального управления является то, что он исходную задачу сводит к решению нелинейного уравнения в частных производных. Уравнение Беллмана как необходимое условие оптимальности получено прн предположении, что функция Беллмана является гладкой (непрерывно дифференцнруемой). Однако это допущение не вытекает из условия задачи оптимального управления н часто не выполняется.
Поэтому применительно к задачам оптимального управления метод динамического программирования требует обоснования. В тех случаях, когда нет обоснования, он может быть использован как эвристический прием. При определенных условиях метод динамического программирования дает достаточное условие оптимальности. Достаточное условие оптимальности. Пусть Ях,1)— гладкое решение уравнения Беллмана (8.14в) при граничном условии (8.15), и управление п*(х,1), найденное из условия дд . дд , ИЯ Ях,п',1) + — г(х,п',1) + — = пцп(Ь+ — ), дх ' ' дт пагг аг Задачи 8.20. Определить оптимальный закон управления (управление с обратной связью) в следующих задачах оптимального управления: = хо, .7 = (нз + 4х~)Й; о = хо, д = (и~+ 4хз+ 5хз~)й; о о Т („з+ Я+Щдт. о а) х~ = хз, хз = и, х(0) б) х1=хм ха=и, х(0) в) хВ =ха, хз =и, х(0) г) хю = хт, хз = и — хт, х(0) = хо, .7 = (из + 1бх1,)й; о порождает единственную траекторию х*($), удовлетворяющую уравнениям (8Л 3в) и краевым условиям (8.136), вдоль которой функ-, ция и'(1) = и'(х'(1), Ф) кусочно-непрерывна.
Тогда функция п*(х, Ф) является оптимальным управлением задачи (8.13). 8А. Оавеан д) х~ = хз, хз = и — хз, х(0) = хо, ,У = (из + хз + хай; о е) х~ =хо, хо =и — хз, х(0) =хо,,У= (и +4х~+4хз)й; о Ответы 8.1. х(Фо) = О, хз(зу) = Ь,,7 = су. 8 2 х~ Ио) = хо,, хз(зо) = Ьо, хз(зо) = и хз(зо) = О хз(Зу) = Ь, .У = зу.
в з. *зо = о. *, р) = К. ~р) =,', г = ( ~4-;-4)а, и 8.4. х~(зо) = х~~, хз(Зо) = Ьо, хз(зо) = и/2, хю(уо) = о/2, х~(Зу) = х~~, зз ~р,)=*,', ~=) ~ $~- фа. и 8.5. х(Зо) = О, хз(зу) = О,,У = — хз(зу). 8.6. х~ (Со) = х~, хз(Зо) = хоз, хз(Уо) = ю/2, хз(зо) = о/2, х4(зу) = О, ,У = -хз(зу). 8.7. х~(зо) = х~~, хз(Зо) = хз, хз(зо) = ю/2, х4(уо) = ю/2, хз(уу) = О, .У = -х~(зу). 8.8. х~ (Зо) = х,, хз(Зо) = хз, хз(Со) = ю, хю (зо) = О, хз(Зу) = 0 ,У = -х~(зу). ж) ху хз, хз =и хф хз, х(0) х з) х~ =хз, хз=и — х~ — хз, х(0) =хо, и) х~ =хз, хз =и — х~ — хз, х(0) =хо, к) х~ = хз, хз = и-х~ -хз, х(0) =хо, ,У = (и'+ Зжз, + х',)й; о ,У = (из + 8х(+ 4х$)й; о У= (из+154+2 зз)й; о ( з+З*хз)й.
о Гл. В. Мее!одг! е!горне онеимольного ерееленыя х!(Зо) = х!, хз(йо) = Ь, хз(йо) = ю, хл(ЗО) = О, х!(Йу) = И, хз(ФУ) = О У = йу. 8.9. 8.11. х(0) = О, хю(Т) = а, .У = изй. о т 8.12. х(0) = О, х!(Т) = а, хз(Т) = О,,У = и~!Уз. о 8.13. ~и) < а, х(0) = О, х!(ЗУ) = а, хз(СУ) =О, .У =ФУ. 8.14. ~и~ < <и„„х(0) = О, х!(зу) =а,,У = йу. 8.16. ~и! < а, х(0) = О, .У = -х! (Т). 8.16. )и~ < и, х(0) = О, хз(Т) = О,,У = -х! (Т).
8.17. а) Ф!=О, !/!з=О, 4~з= — ф!, фл=-фз, фь=О; фз+2фьи!=О, 4!л+2фьие =0' !/!!(Зу) =О, !/!з(ЗУ) =1, фз(йу) =О, Н=(ф!хз+/зхл+Фзию+Флиз+Фь(и!+из)) 1с~! =О. б) !/!! =О, фз=О фз=-ф!, Ч$ц=-!/!з фь=О; !/!з+2!/!ьи!=О, Ф4 + 2!/!ь из = 0; !/!з(0) = -2ихз(0), !/!л(0) = — 2ихл(0), Ф!(Зу) =О, !)!з(ьу) = 1, Фз(ьу) =О, Н = (!/!юхз + Фохт + Фзи! + Фриз + !/!ь(и! + из)) /! , = О. в) Ф! =О, !/!з=О !/!з = -!/!! Фа = †!/!з Фь =0; 'фз + 2!еьи! =О, !/!4 + 2!рьиз = 0; З!! (Зу) = 1, !рз(ЗУ) = О, !рл(ЗУ) = О, Н = (Ф!хз + Фаз + Фзи! + !/!азиз + Фь(и! + из)) !!-! = О. г) ф!=О фз=О, фз= — ф!, фв=-фз, !/!ь=О; фз+2фьи!=О.
фл+ азиз = 0; !/!з(0) = — 2ихз(0), фв(0) = — ах!(0), з,(зу) = 1, Вз(зу) = о, Ул(зу) =- о, Н = (!р!хз + !/!зхл + !рзи! + !рлиз + !/ь(й!+ из)) 1! = О. д) !/!! =О, Фз=О, Фз = — 4я!, 4~я = — !/!з; 4'з+2Ли! =О, !рл+2Лия = 0; 2Лиз = О, Н=(Р!хз+!езха+!/!зич+юРюиг+Л(й!+й+и~~ — из„)) ~! ! = 1, е) Ф! =0 4з =О, Фз = — !/!!, 4!4 = -4!з, !/!з+2Ли! =О, тДв + 2Лиз =0; 2Лиз =О, !/!з(0) = — 2рхз(0), фа(0) =-2ихл(0), Н=(!/!!хз+фьхю+чьи!+фриз+Л(й!+йз+из — из„)) ~ = 1.
8.10. хю(ьо) = х,, хз(йо) = хз, хз(йо) = и/2, ха(Юо) = э/2, х!(Зу) = 4 хз(зУ) = О, У = йу ° ВЛ.О е 217 ж) з) 8.18. а) б) в) г) е) ж) и) ф~ = О, ййг = О, Фз = -г)>~ г)ч = -Фг; Фз — 2ий = О, Фз — 2иг = О; Фз(йй) = О, Ф~(йй) = О, Н = (ф1 ха + фгхз + ЗЗзи~ + азиз — (иг + игг)) ~,, = О. Ф1 = О, г) г = О, Фз = -т/ги 4ц = -Фг, фз — 2и1 = О, 1йз — 2иг = 0; фз(0) = -2Лхз(0), Ф4(0) = -2Лхз(0), фз(йй) = О, ф4(йй) = О, Н = (Фюхз+Фгхз+фзи1+44иг — (й~+игг)) ~,, =О.
фю = О, фг = О, фз = -фю, фа = -фг; фз + 2Ли1 = О, ф4+2Лиг = О; 2Лиз = О, фзЩ = 2хз(йу), ч~ц(йу) = 2х4(йу), Н=(Зг~хз+Зггхз+фзи1+Ф4иг+Л(йу+иг+йз — иэа)) !с г = и: ф1 = О, фг = О, фз = -фи фь = -4~; г)з + 2Ли1 = О, ф4+ 2Лиг = 0; 2Лиз = О, фз(0) = — 2ихз(0), ф~(0) = — 2иха(0), фз(йу) = 2хз(йу), ф~(йу) = 2х4(йу), Н=(з'1хз+Ргхз+Ръи1+Ззиг+Л(ц+йг+из и )) ! — О. и'(й) =О,б — 0,12й, х',(й) =О,зйг — О 02йз, хг(й) =О,бй — 0,0бйг; и*(й) = 0,3 — 0,03й, х7(й) = 0,15йг — О 005йз хг(й) = О,зй — 0,015йг; и" (й) = 0,1, х((й) = 0,5й, хг(й) = й; В З, З 1, З З и'(й) = — — — й, хг(й) = — й — — й, хг(й) = — й — — й; 5 25 ' ' 10 50 ' г 5 50 9 3, 2г 3 з ° 4 9 и'(й) = — — — й, х*,(й) =-й — — й, *;(й) =-й — — й; 5 50 ' ' 5 100 ' 5 100 и'(й) = 2, х|(й) = 0,5йг, хг(й) = й; з з, з и'(й) = — — — й, х;(й) = — й — — й + 5, 5 50 ' 20 100 з з хг(й) = — й — — й; 10 100 9 7, 7 г 3 й(й) = — й — —, х1(й) = 5й — — й + — й, 50 5' 10 100 7 9 х'(й) = 5 — -й+ — с; 5 100 и'(й) = — — — й, х~~(й) =5+ — й — — й, 1З З, З 10 50 ' ' 20 100 з з х'(й) = — й — — й; 10 100 218 Гл.
В. Методы теории олтимееьного аееения — 1, ЛО/2<й<ЛО, й, 0<й<АО/2, АΠ— С, ъ/ГО/2 < С ~( АО хс(й) = С с/2+5, О <С < Л0/2, х11С) = ЛОС вЂ” Сс/2+ 5, АО/2 < й ~( А.О е) и'(С) = 2, 0 ~( С (,/5/3, -2, ~/5/3 < С < ~/80/3, Зй, 0<й< /5/3, 26,67 — й,,/5/3 ( й < ~/80/3, ~ 9 2, 7 3 к) и'(С) = — й — —, хЦС) = 5й — — Сс + — Са, 50 5' ' 10 100 7 9 х'(С) = 5 — -С+ — С'. 5 !00 о<с < фо/3, 8.19.
а) и*(й) = — 1,,/1 О/3 < С <,/40/3, О < С <,/10/3, ~/40/3 — С, фО/3 < й ~ (~/40/3, Сс/2, 0 < С < ~/И/3, х11С) = ~/Й/зс — с~/2+ 10/3, фо/3 < с ~ (/40/3; С2 б) и'1С) = 1, хс(й) = С х11С) = 2' 1'1, 0<С<225, '1 — 1, 225<С<449, (С, 0<й(2,25, 1,9,49 — С, 2,25 < С ((4,49, С~/2, О ~ (С < 2,25, 2 949С Сс/2 2255 225 < С < 449 … ! 1, 0<!<658, ! — 1, 6,58 <С ~(8,!6, 5 — С, 0<й(658, С вЂ” 8,16„6,58 ( С < 8,16, < 5С вЂ” Сй/2, 0 < С < 6,58, хс(й) = С~/2 — 8,16С+ 43,29, 6,58 < С < 8,16; 1, 0<С<ВО/2, а) и'И)= … Глава 9 СИНТЕЗ ОПТИМАЛЬНЫХ ДЕТЕРМИНИРОВАННЫХ СИСТЕМ УПРАВЛЕНИЯ 9.1. Наблюдатели Для реализации управления с обратной связью необходимо иметь оценку текущих значений фазового вектора.
Устройства, обеспечивающие получение указанной оценки по измерениям (наблюдениям) управления ц(т) и выходного вектора у(т) на интервале 1о < т ( (8, называют наблюдателяии. В частности, устройство, описываемое уравнением х = Рх + Ку+ Нц, называется наблюдателем полного порядка для управляемой системы х = Ах+ Вц, у = Сх, (9.1) если при х(то) = х(1о) выполняется равенство х(1) = х(1) при всех ц(1), 1 > 1е. Наблюдатель полного порядка. Наблюдатель указанного выше типа называется наблюдателем полного порядка, так как оценка х имеет такую же размерность, что и вектор состояния х. Теорема 9.1.