Основы ТАУ - Ч-3 Оптимальные, многосвязные и адаптивные системы - Воронов [1970] (1189551), страница 14
Текст из файла (страница 14)
440+ И9,1 ~782+ 62,4 1 2 з 4 6 7 8 9 1О 11 12 1З 14 15 10 7,5 7,5 5 5 5 2,5 2,5 2,5 2,5 о' о о о о 1ОО 56,255 56,25 25 25 25 6,25 6,25 6,25 6,25 о о о о о о 0 25 о 2,5 5,0 о' 2,5 5,0 7,5 о' 2,5 е 7,5 1О' о о 12,5 о 12,5 25 о 12,5 25 37,5 о 12,5 25 37,5 50 6 4,5 45 з 3 з 1,5 1,5 1,5 1,5 о' о о о о 4,5 17 з 15,5 28 1,5 14 26,5 39 о 12,5 37,5 50 36 20,25 289 9 240,25 784 2,25 196 702,3 1521 о 156,25 285 1410 2500 56,25 31,6 451 14,06 З76' 1225 3,52 306 1097 2378 о 244 975 2200 3910 156,25 87,85 507,25 39,06 4О1 1250 9,78 312,25 1103',3 2384,5 о' 244 975 2200 3910 З1,2 17,6 101,5 7,8 80,2 250 2 62,4 220,7 476,9 о' 48,8 195 440 782 Второй этап: ЛУ(з,')=31,2 4=124,8; (17,6+ 136,7) 7,8+ 189,5 ЛУ(х,') =поп 80,2+136,7 =197,3; 250+ 93,6 2,0+ 244,1 62,4+ 189,5 М (х,') = ппв = 246,1; 476,9+ 93,6 ( О+ 361,3 ~48,8+ 244,1 ЛУ (х,') = ш(п (195+ 189,5 = 292,9 293 440+ 136,7 ~782+ 93,6 Остается начальный этап.
Так как на этом этапе оптимальная траектория должна исходить из начальной точки хс, мы и здесь сужаем область вычислений, ограничиваясь расчетами только для этой точки: О+ 292,9 (48,8) + (246,2) ЛУ (х',) = ш1п 195+ 197,3 = 292,9 293 440+ 154,3 782+ 124,8 Заметим, что суммы цифр, стоящие в первой (292,2) и второй (295) строках, отличаются лишь на 0,7 з/о, что соизмеримо с погрешностью расчета, поэтому оба варианта практически равновероятны и оба нанесены на график (второй — двойной линией). Теперь, идя от начальной точки по отрезкам условно-оптимальных траекторий, т.
е. по линиям, отмеченным стрелками, находим приближенную оптимальную траекторию в виде ломаной линии, показанной ка рис. 3-3 жирной линией. Оптимальное управление находится с помощью уравнения (3-13): и,+, — — 0,6 я;+ — '. 76 Плавной прерывистой линней на рнс. 3-3 нанесена точная оптимальная траектория В рассмотренном примере мы шли «обратным ходомы от последнего этапа к первому, как это чаще всего и делается. Заметим, что этот путь не обязателен, и вся процедура динамического программирования может идти и «прямым ходомм от начального этапа к конечному, так как в силу нринцнпа оптимальности начальной отрезок оптимальной траектории также является условно-оптимальной траекторией. 75 О Я2 Р,4 ЯБ ОВ «,Осек Рис. 3-4. Проиллюстрнруем решение того же примера прямым ходом.
Проведем границу первого этапа Лг =- 2,5 и выберем на этой границе те же дискретные точки х„', х'„х!„х!„х,'. Переберем на этом этапе нуги, ведущие в этн точки, и определим на ннх приращения Лэ (х,'). По той же причине, что и раньше, вертикальные отрезки из рассмотрения исключаются, поэтому условно-оптимальными приближенными траекториями на этом этапе будут прямолинейные лучи, проведенные из точки х (О) в намеченные дискретные точки. Из табл. 3-1 находим ЛУ (х)) Л1 (х,') = 48,8; Лэ'(х«) =- 195; ЛУ(х',) = 440; ЛУ(х,') = 782.
Эти цифры проставлены в кружках 1 этапа на рнс. 3-4. 17 (2,0+ 48,81 ЬХ"(х',) = ш!в~ ) = 48,8; '( 488+0) 7,8+ 195 б Х (х() = ш!и ~ 62,4 + 48,8 ~ = 1 И,2; 195+ 0 17,6+ 440 80,2+ 195 ЛХ(*1) = ш!и 220'7, 48 8 — — 269,5; т > 440+ 0 31,2+ 782 101,5+ 440 ЛХ(х,".) = ш!и 250+ 195 = 445. 476,9+ 48,8 782+ 0 Н а третьем этапе: с2,0-(-48,8) ЛХ(л";) = ш!и! ' ) = 48,8; 48,8+ 0 ) ( 7,8+Ш,2) ЛХ(х,',) = шш 62,4+48,8 = 1И,2; 195+ 0 17,6 + 269,5 80,2 + И1,2 ЛХ(х!) ш1п 220 8 ! 488 — — 191,4; 440+ 0 31,2 + 445 101,5 + 269,5 250 + И1,2 476,9 + 48,8 782 + 0 ЛХ (т!) = ш1в = 361,2.
Так как для всех оХ (л1) = 48,8 данные повторяются, на четвертом атапе 1 во втором, третьем и четвертом снизу кружках сразу проставляем цифры 48,8, И1,3 и 191,5. Остается вычислить лишь 31,2 + 361,2 101,5 + 191,4 ЛХ(т() = пно 7 250+ Ш,2 = 292,9. 476,9+ 48,8 782+ 0 Дальнейшие построения очевидны. Решение пришло к тому же результату, как и при обратном ходе. Заметим, что при построении епрямыма ходом, даже если оптимальное решение на самом деле единственно, мы получали по нескольку оптимальных условно траекторий, выходящих из одной точки (точно также,как при решении «обратным ходом» несколько траекторий входило в одну точку).
Это литве кажущееся противоречие с теоремой об едип- 78 Перебирая пути, ведущие из дискретных точек !! этапа в дискретные точки 1 этапа, так же как зто делалось и при обратном ходе, получим: гтвенности решений, которое объясняется тем, что при квантовании х мы „бъединяем как бы множество точек в одну. На самом деле «прямой ход» определяе~ пучок оптимальных траекторий, исходящих иэ начала л» (рис. 3-5, 6), а «обратный» вЂ” исходящих иэ конца (рпс. 3-5, а).
Отсюда видно, что аадача о нахождении траекторий с закрепленным концом и свободным началом удобнее решать обратным ходом, а с эакреплеииым началом и свободным концом — прямым. Заметим также, что в данном примере мы вычисляли приращения ЬХ при переходе от точки к точке по приближенному раэностному уравнению. Но значения Ы могут быть заданы экспериментально и надписаны над соотэетствутощими отрезками. ГГосле этого методика определения оптимальной траектории ничем не будет отличаться от рассмотренной. а) хн б) ггл Хо Рис. 3-5. Теперь получим точное решение.
Рассмотрим уравнение о'э — =и — ах й (3-32) и функционал т Хе = п»(п ~ (х' 4- Гсэи«) «ГГ. с (3-33) Так кан явной зависимости У * от времени нет, уравнение Беллмана записываем в виде д1«1 е д«"« шгн)х» й-Ггэиэ+(и.— ах) ~~ ~ =х»'+й и*э+(иэ — ах*) — =О. оэ а*= . Это функциональное уравнение равносильно следующим двум: (3-34) Второе из уравнений получено путем дифференцирования первого по и и приравнивания производной нулю. Переменные х и и должны отмечаться здесь и далее звездочками, но для упрощения записи звездочку опускаем, 79 ау* Исключая -- из уравнений (3-34), получаем ах хз — х'из+ 2ай'их=О. (3-35) Продифференцируем (3-35) по времени и выразим и' через х', учитывая (3-32): йи аИи+хйх — =ай'и+х. аТ и — ах сй (3-36) Уравнение (3-36) и исходное уравнение (3-32) образуют систему, из которой находятся оптимальные решения и х (1) и х * (г).
Нетрудно убедиться, что зта система совпадает с системой уравнений Эйлера — Лагранжа, полученных обычным методом вариационного исчисления. Решая зту систему при граничт ном условии ~хЖ=хк, получим з яй т~ хх (Г) =хк —, зЬ тТ' т сй т~ + а зЬ тс и*(г) =хн — — -- — — —, а тТ где т = — )~ 1+ахах. 1 о В нашем случае а=0,6; й=1,25; т=1; Т=1; хк-— -10 и мы имеем х" (г) = 8,509 яй г; и* (г) = 8,509 (сп г + 0,6 яв г). (3-37) 3-4.
О чноненном решении уравненнй дннамнчеенего программирования Если задано уравнение — „=1(х, к) йх и функционал Х=1 Р(х, к) й, о По формулам (3-37) и построена точная кривая на рис. 3-3 прерывистой линией. где х, и — векторы; то функциональное уравнение для поэтап- ного решения принимает вид: ду 1 Ют —— ш1п [Р (х, и) + ( (х, и) — 1. дх 1' Для уверенного использования приближенного метода, основанного на замене дифференциальных уравнений разностными, нужно установить, что поставленная вариационная задача эквивалентна решению нелинейного уравнения, построенного на основе уравнения Беллмана, и затем показать, что метод конечных разностей даст приближенное решение рассматриваемого дифференциального уравнения.
Оба эти доказательства оказываются несколько затруднительными, особенно при наличии ограничений. Беллман предлагает следующий численный метод, позволяющий обойти эти доказательства. Заменим первоначальную задачу задачей об определении минимума (максимума) функции: г ((ио)) = Л 5 г (хю ио), о=о где У вЂ” число интервалов, на которые разбивается промежуток (О, Т); Л = Т~М. Минимум отыскивается по всем значениям и„, удовлетворяющим условиям х„,, = х„+ Л/ (хд, ио), хо = х (0), где х„=х(ЙЛ), иь — — и (ЙЛ).
ук (хо) ш1п у ((ио )) Полагая заменяем задачу минимизации рекурентными соотношениями: ТО (хо) = ОО ХЯ+1(хо) = ш1п (ЛР(х, и) + Х$ [хо+ Л~(х, и)]). (3-31) По существу, в рассмотренном примере численная процедура реализовала вычисление по этим соотношениям для простейшего случая. При высоком порядке уравнений приходится запоминать столь большое число значений координат на каждом этапе, что самые крупные современные вычислительные машины перестают справляться с задачей.
Был предпринят ряд попыток упрощения процедуры. Одна из них, предложенная Мерриэмом, была рассмотрена в з 3-2. В тех случаях, когда критерий оптимальности выражается квадратичными функционалами, а сами уравнения линейны, задача сводилась к обь1чным нелинейным уравнениям типа Риккатти, которые рекомендовалось решать с помощью аналоговых моделей. ГЛАЯЯ ЧЕТВЕРТАЯ ПРИМЕНЕНИЕ МЕТОДОВ ФУНКЦИОНАЛЬНОГО АНАЛИЗА В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 4-1. Общие оеедення о жножеотннх н фуннцноннлвных проетренотеех Начиная с 1957 †19 гг.,для решения задач оптимальяого управления начинают примениться методы функционального анализа [94, 80, 242[. Это было свяаапо с попытками создания общих методов исследования систем управления, применяемых для решения разнообразных задач.