Бесекерский (950612), страница 139
Текст из файла (страница 139)
9 24.3. Динамическое программирование Метод линамичсского программирования был разработан Р, Беллманом [4 ~. Он применим нс только лля решения задач оцтимпзапии систем управления, по и для самых различцыхтехпичсских и зкопомичсскихаалач. Пусть система описывается уравнениями (24 1), в качестве критерия оптимальности принят функционал (24.11), а переменные состояния и управления принадлежат некоторым замкнутым (ограниченным) пространствам, т. с. х(г)п Х, х(г„) = ао и бо, х(гя) = Ь и 6»;~ (2430) и(г)п(), го (г (гк Лалее, пусть прн заланном начальном состоянии х(то ) = ао существует оптимальное УпРавленис и(сао), обсспсчива|ощее минимУм фУнкцпонала(24.11), а х(т,ао)— оптимальнаятраекторня в пространствс состояний. Выберем произвольный момент времени ги прнцаллсжа|пий интервалу г„, г„и обозначим через а, точку а, = х(г„йо) на оптимальной траектории х(г,ао) .
При1щип оптимальности состоит в следуюпгсм. Если принять значения г, и а, за начальные, то на интервале гп г„оптимальное Управление й(т,а,) совпадет с оптимальным УпРавлснпсм й(г,ао) и, следовательно, участок оптимальной траектории х(Г,ао) для задачи с начальной точкой (Го,ао) на интервале г„г„совпадет с оптимальной траекторией для залачи с начальной ~очкой (Гиа, ) .
Локазательство достаточно очевидно. Оно исхолит из того, что значение функционала качества на участке гп г„должно быть одинаковым при управлениях й(г,а~ ) и и(г,ао) . Если бы зто было пе так и значение фушсцно~ала на атом интервале времени было бы, например, мспыпсдтя управления и(г,а,),тоуправленисй(г йо) можнобыло бы улучшить, замен ивето управлением й(г а, ), что противоречит принятому предположениюю об оптпмальиости управления и(г,а„) . Глана 24. Оптимальные системы 711 Итак, в соответспзии с изложенным введем функциональное уравнснис ,—,с [с„,й(св)] = ш1п ] )с(х,й) «Сс и«ц (24.3! ) и и от[с„,й(со)=ш(цт ~4(х,й)й+т!т[с„х(с,)] . !7мl м (24.32) сйуш«ция нт и оптимальное управление обы шо пе могут быть найдены аналитическимм путем.
Для этой цслн нримспяются цриблнженныс методы с использованном вычислительных машин. Рассмотрим идею приближенного расчета. Пусть с — фиксированное значение времени, а Ьс — малый отрезок времени. црпчслт 0 < с + Ьс < с„. Тогда ! Й1 «« т]с(с,й)=поп [ А(хй)«ст+ [ Я,(хй)сст . л 1~м (24.33) Вид управления й(т) па интервале с - С!с, с„ис оказывает влияния ца первое ела|немое в правой части (24.33). Поэтому па рассматриваемом интервале времени следует так выбрать уц!тавлсцне, чтобы минимизировать второе слагаемое в правой части (24.33) при выполи«нин условий й(т)Н (7, Х(т)ц Х, Х(Сх)Н Сх С+С!С <с<С,.
(24.34) На основании цринпипа оптимальности перепишем (24.33) слсдуюпсиьт образом: [««с« ж(с.. )= ]п1 ]' 7,(т,й)от+И«.. ( с)] . (24.35) и 1 На интервале с, с+ с!с управление й(т) должно быть выбрано так, стобы мин им изнровать правую часть (24.35). От этого выбора зависят оба «Е!агземых правой части. Заменим ца малом интервале Лс матрцчцую функцию Яхй) и функцию Я хй) пх фпксированпььчи значениями в точке с, а производную х отношением конечных разностей с)х = х(с+ бс) — х(с) и Лс.
Тогда вместо (24 35) можно записать приближенно; т]т(сх) = лип[ Гс(хй) См +т!с(с+Сзс,хх ь Я. и '(24.36) Кроме того, имеем (24.37) х+схх=х(с+дс)=х(с)+дс Г[х(с),й(с)]=хьбс /(х,й). па основании которого можетбыть найдено оптимальпоеуправление й(х). Если на промежутке се, С, в!лора гь промежуточную точку Сц то на основании принципапа оптнмальпост и 712 Оптимальные и адаптивные системы автоматического управления На основании (24,36) и (2437) можно найти приближенное значение Чс(с,х) . Для конечного момента времени с, и любых хе С» следует, что чг(с,,х) = О. Поэтому вычисление Чг(с.х) улобно начинать с конца, т.
е, с момента времени с - с„и области С», На первом шаге расчета рассматривается момент времени с = с„— с)с, !!ри с+ С»с = с.„ величина х е Ах вслелствие красного условия при наллсжит множеству С, . Подставляя в (24,36) и(24.37) значение с = с, — лги учитывая, что чс(с„х) =О, имеем »р(с„-бс.т)=шт7э1» й(с.-бс)! бс1 в х+ С»х = х+С»с. Дхи(с„. — Ьс) !.~ (2438) чг(с+лс,х+м)=»Т»(с,й)+ — е~ — ' лс+8(с»с)д~. (24.39) ~д9 " дЧг с7х,11 1дс лидУ, г)с~ Злесь 8(ос) — величина более высокого порядка малости, чем с)>с.
Вхолящис в правую часть(24 39) произволиыс х,, уловлетворяк>т (24.1), Поз гому чг(с + с»сх+ с>х) = вг(с,х) +) — + ~> — /, 1сгс +8(лс)с>с. Гад - дВ ~~ дг,, дх, (24 4»0) Далее фиксируется произвольное зцачсиис х ц Х, Мин имум правой части первогоого равенства (24.38) вычисляется по тем значениям й(с„-ЬС) из множества (7, лля которых точка х+ С>х, определяемая вторым равенством (2438), соотнстствует значениюю б е С . Если лля какой-либо точки таких значений й(гэ -см) ис сугцсствует, то функция вс(с„- с»с,х) ие опрслслеиа в этой то ис, Таким образом, но значению функции чг(с„,х) можно приближенно онре>тел»гть значения функции Чг(с„— с>с,х) на некотором нодмцожсстве Х, из Х.Так какяаиитервале с„— цС, С„управление й(т) принято постоянным и равным и(сэ -Ьс), то олповрсмепио с пахожлепием функции чг(с,.
-бс,х) приближенно пайлсио управление й(с, — Лс,х), которое реализует зту функцию. Послелу»сисис шаги рассчитывасотся аналогично. Если весь интервал управления с, разбит иа ис шагов, то восле т-го ~нага определяется функция ф(О,х), па подмножестве Х из Х и уцравлеиис й(О,х), как кусочно-постоянная функция с интервалами постоянства Лс. Если начальная точка х(0) = а приналлсжит подмножеству Х„, лля когорого опрелелена функция вг(О,х), то, положив х = и, получаем вг(О,а) — минимум функционала (24 11) исходной залачи уиравлсиия и и(0 а) = й '(т) — он>- иос управление. Подставляя затем оптимальное управление в (24.1) и решая систему исхолпьгх лиффсреициальиых уравнений, можно определить оптимальную траскториюдвижеиия х*(т).
Серьезным исяостаткоги метоца является то, что с ростом размерности залачи (порялка и дифференциального уравнения) существенно нозрастаюг требования к быстродействию и объему памяти вычислительных машин. Введем прслположепис, что функция»р имеет исцрерывиыс части ь~е произволиые по всем своим аргументам: с, хи ..., х„.Тогда в равенстве(2436) фупкцшо Щс е с»с х + ох) можно представить слсдуюгии и образом: Глава 24. Оптимальные системы 713 ппп — е ~ — /,[х(е),й(е) [еА[х(е),й(е)[(=0 (дцт " дче .— '[д»,,дх, ' Е (24А 1) при условиях х= е'(х й), х(0)=а, х(е„.)=6 и 6», х(е)п Х, 04е ке„.
(24А2) Уравнение (24А1) представляет собой уравнение Бсллмана с красным условием уе(Е„,х) =О. Сумма первых двух членов (24А1) есть полная производная функции чх(е,х) по времени. Поэтому уравнение Бсллмапа можно записать в другом виде: пй1п» вЂ” ч-Яй(е),и(е)[ =О. (е(ве э аЕе (24.43) Требоваегпе нспрерь|вной дифференцируелюсти функции ее(е,х) является весьма жестким н во многих задачах гю выполняется. В.
Г. Болтянский показал [16], что можно ослабить требования к функции ц~(е,х) . В пей допускаются разрывы частных производныхх на некотором множестве точек. заметим, что сели фУгекцииее и 7 не зависЯт Явно от вРемени, то Рсиеенис УРавпснпя (24.43) — функция дг и оптимальное управление й, которое реализует минимум, тоже нс зависит явно от времени, т, е, Г1» = »Тг(х) и й = й(х), однако в обшем случае Чг(Е,х) и й(Е,х). Аналитическое нахождение функции ГЕЕ в явной форме удается только в некоторых частных случаях. 9 24.4.
Аналитическое конструирование регуляторов Так называемая задача аналитического конструирования регуляторов была сформулирована и рсшспа А, М. Летовым [55[. Эта задача развивалась также в работа: А. А. Красовского [43[ и Н. 11. Красовского [45[. Пусть имеется стационарный объект, уравнения которого имеют вид (24.3): (24А4) Требуется определить оптимальное управление и = и(т), минимизируюшес функционал качества ( п 7=~ ~~сх~ чаиз~еее= [Йе (с,.>0, »=1, ...,п, а>0).