Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения, страница 20
Описание файла
PDF-файл из архива "Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения", который расположен в категории "". Всё это находится в предмете "вариационное исчисление" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 20 страницы из PDF
. . , pn )∗ = p ∈ E n на множестве&%(9)D = p ∈ E n : p∗ x0 < 0 .Оказывается, что оптимальное время T0 равно максимальному значению функции Z(p):T0 = max Z(p) = Z(p0 ) .p∈DРассматриваемый здесь метод Нейштадта-Итона является одним извозможных методов решения экстремальной задачиZ(p) → max .(10)p∈DФункция Z(p) определяется как положительный корень функции∗TΦ(p, T ) = p x0 +∗c(e−τ A p) dτ0по аргументу T . Мы покажем, что при p ∈ D этот корень существуети определяется единственным образом.182Лемма 19.1. Φ(p, T ) = p∗ [x0 − ξ(p, T )].Лемма 19.2. Φ(p0 , T0 ) = 0.∗∂Φ(p, T )= c(e−T A p) > 0 ∀p = 0, T > 0.∂TТаким образом, функция f (T ) = Φ(p, T ) является монотонно возрастающей функцией аргумента T и поэтому (при фиксированномp = 0) имеет не более одного корня.Лемма 19.3.Лемма 19.4.
Если функция f (T ) = Φ(p, T ), p = 0, имеет положительный корень T = Z(p), то p ∈ D; кроме того, оптимальноезначение p0 ∈ D.Лемма 19.5. При каждом p ∈ D функция f (T ) = Φ(p, T ) имеетединственный положительный корень T = Z(p), причёмZ(p) Z(p0 ) = T0∀p ∈ D.Лемма 19.6. Функция Z(p) положительно однородна измерения 0,т.е.Z(λp) = Z(p)∀p ∈ D,∀λ > 0.Из лемм 19.5, 19.6 следует, чтоmax Z(p) = max Z(p) = Z(p0 ),p∈Dp∈D0"где D0 = D S, т.е. максимумфункции Z(p) на& множестве D дости%гается на луче L(p0 ) = p ∈ E n : p = λp0 , λ > 0 .Лемма 19.7.
При всех p ∈ D \ L(p0 )Z(p) < Z(p0 ) = T0 .Оказывается, что функция Z(p) при p ∈ D имеет градиент Z (p),определяемый формулой#$1ξ(p,T)−x.Z (p) =0∗c(e−T A p)T =Z(p)183Для решения экстремальной задачи (10) рассмотрим дифференциальное уравнение “подъёма” по градиенту:dpdspX(p) ≡ ξ(p, Z(p)) − x0 ,= X(p),s=0q ∈ D0 .= q,(11)(12)Правая часть уравнения (11) отличается от градиента Z (p) лишь положительным множителем.
Каждая точка луча L(p0 ) является положением равновесия уравнения (11), и других положений равновесияв D это уравнение не имеет.Теорема 19.1. Для любого q ∈ D01) решение p(s, q) задачи Коши (11), (12) определено при всех s 0;2) p(s, q) ∈ D0 при всех s 0;3) существует (и не зависит от q)lim p(s, q) = p0 .s→+∞Имеется ряд дискретных аналогов описанного метода, один из которых называется методом Итона.
В этих методах строится по определённым алгоритмам последовательность(pk , Tk ),k = 0, 1, . . . ,такая, чтоp0 = −x0,x0 pk = 1, pk ∈ D0 ,lim pk = pопт ,k→∞Tk = Z(pk ), Tk < Tk+1 ,lim Tk = Tопт .k→∞Недостатком этих методов является медленная сходимость к оптимальному решению. Более подробно затронутые здесь проблемы описаны в [7].Замечание 19.1. В заключение приведём два рисунка, дающих наглядное представление о свойствах функции Z(p): в случае двумернойзадачи быстродействияẋ1 = x2 + u1 , x1 (0) = 2, x1 (T ) = 0,T −→ min,u(·)ẋ2 =u2 , x2 (0) = 2, x2 (T ) = 0,184z6z = Z(p1 , p2 )5p2p155p1 + p2 = 00−5−5Рисунок 19.1с областью управления U =мая уравнениемz = Z(p),u21ε2+ u22 1 поверхность, определяе-p = (p1 , p2 ),p1 + p2 0,показана на рис.
19.1. Эта поверхность является линейчатой.* Расчётыε2 ψ12 + ψ22 .выполнены при выборе параметра ε2 = 10−5 , c(ψ) =На рисунке 19.2 построен график функции013π 7πcos αz = Z(q(α)), α ∈,; q(α) =.sin α4 4Максимизатор этой функцииα∗ ≡ argmax Z(α) ≈ 4.4677πα∈[ 3π4 , 4 ]позволяет найти оптимальное времяT0 = Z(q(α∗ )) ≈ 5.999и начальное значение q(α∗ ) сопряжённой переменной, определяющейоптимальные управление и траекторию. Точное значение оптимального времени при ε = 0, когда область управления U = {u1 = 0, |u2 | 1}185является отрезком, равно 6. Функции Z(p) и Z(q(α)) не обладаютсвойством вогнутости.64zz = Z q(α)23π4π207π4α∗π3π2α2πРисунок 19.24.19.3 Метод продолжения по параметруПусть p0 , T0 – оптимальная пара (p0 = 1, T0 > 0) – неизвестноерешение нелинейной системы уравненийξ(p, T ) = x0 ,11p2 = ,22(13)объекта.где x0 – заданное начальное состояние управляемого Предположим, что нам известно решение p 0 , T 0 p 0 = 1, T 0 > 0 системыξ(p, T ) = x0 ,11p2 = ,22(14)отвечающее начальному состоянию x0 = 0 (точку x0 можно получить, выбрав p 0 , T 0 , непосредственным подсчётом: x0 = ξ(p 0 , T 0 )).Соединим точки x0 и x0 гладкой кривой L, определяемой уравнениемx = g(ε), 0 ε 1;g(0) = x0 ;186g(1) = x0 ;g (ε) = 0.(15)Линия L может быть отрезком и в этом случаеg(ε) = x0 + ε(x0 − x0 ),x0 = x0 .Предполагаем, что L не проходит через начало координат.Рассмотрим систему уравненийξ(p, T ) = g(ε),11p2 = ,22содержащую параметр ε ∈ [0, 1].
Решениеp(ε), T (ε), 0 ε 1p(ε) = 1, T (ε) > 0 ,(16)(17)системы (16) cуществует, единственно, гладко зависит от параметра εи удовлетворяет системе обыкновенных дифференциальных уравнений⎧dp⎪⎪p∗= 0,⎨dε(18)∂ξ(p, T ) dp ∂ξ(p, T ) dT⎪⎪⎩+= g (ε),∂pdε∂Tdεнеразрешённой относительно производных. Система (18) при сделанных предположениях об области управления U приводится к виду⎧−1 ⎪dp∂ξ(p, T )p∗ g (ε) ∂ξ(p, T )⎪⎪= p p∗ −−g (ε) −,⎨dε∂pc(e−T A∗ p)∂T(19)⎪p∗ g (ε)dT⎪⎪= − −T A∗ ,⎩dεc(ep)разрешённому относительно производных.
Обращаемая матрица в системе (19) является симметричной и положительно определённой. Длясистемы (19) известны начальные условияp(ε) = p 0 , T (ε) = T 0 .(20)ε=0ε=0Решая задачу Коши (19), (20) на отрезке 0 ε 1, найдём функции (17), причём найденные функции при ε = 1 дают искомое решение p0 , T0 исходной системы (13):p(ε) = p0 , T (ε) = T0 .ε=1ε=1187Интегрирование задачи Коши (19), (20) на практике осуществляетсячисленными методами, в результате чего искомое решение p0 , T0 будет найдено приближённо с погрешностями, обусловленными неточностью решения задачи Коши (19), (20).
Найденное приближённоерешение можно уточнить другими методами, например, методом (8).4.19.4 Метод проектирования начального состояния на изохронуВ основу этого метода положена описанная ниже наглядная геометрическая конструкция, связанная с рассматриваемой линейной задачей быстродействия. Пусть x0 = 0 – заданное начальное состояниеуправляемого объекта, а p0 , T0 – оптимальное начальное значениесопряжённой переменной и оптимальное время (p0 = 1, T0 > 0),подлежащие определению. Возьмём шар Sr (x0 ) с центром в точке x0радиуса r, 0 < r < x0 . Изохрона ΣT при достаточно малых T > 0не пересекается с шаром Sr (x0 ); при T = T0 у них есть общая точка x0 ; пусть T = T"(r) – первый момент" встречи изохроны ΣT с шаром Sr (x0 ): ΣT (r) Sr (x0 ) ="∅, ΣT Sr (x0 ) = ∅ при 0 T < T (r).Последнее множество ΣT (r) Sr (x0 ) состоит из единственной точки y(r), которая является проекцией начального состояния x0 на изохрону ΣT (r) .
Ясно, что (см. рисунок 19.3)y(r) − x0 = r, y(r) = ξ(p(r), T (r)),x2p(r) = 1, p(r) =Sr (x0 )rp(r)x0y(r)0ΣT (r)Рисунок 19.3188x1y(r) − x0.rФункции p(r), T (r) являются решением следующей системы обыкновенных дифференциальных уравнений⎧−1 ⎪dp∂ξ(p, T )∂ξ(p, T )1⎪∗⎪= rE −+ pp−p −,⎨dr∂pc(e−T A∗ p)∂T(21)⎪1dT⎪⎪= − −T A∗ ,⎩drc(ep)и удовлетворяют начальным условиямx0, T=−= 0.px0 r=x0 r=x0 (22)Действительно, дифференцируя по r тождествоr p(r) = ξ(p(r), T (r)) − x0 ,получаемp(r) + rdp(r)∂ξ dp(r)∂ξ dT (r)=+,dr∂p dr∂T dr(23)а условие p(r) = 1 даётp(r)∗dp(r)= 0.dr(24)Умножив (23) слева на строку p∗ (r), получаем второе уравнение системы (21); умножение уравнения (24) слева на столбец p(r) и сложение полученного уравнения с уравнением (23) приводит к первомууравнению системы (21). Начальные условия (22) имеют простой геометрический смысл. Если проинтегрировать задачу Коши (21), (22)←−−−−−−−−−на отрезке 0 r x0 (справа налево), то её решение p(r), T (r)позволяет найти оптимальную пару p0 , T0 по формулам(25)p0 = p(r) , T0 = T (r) .r=0r=0При выполнении численного интегрирования задачи Коши (21),(22) возникают погрешности.
Поэтому найденное описанным методомрешение (25) будет содержать погрешности, и его можно уточнитьдругими методами, например, методом (8).1894.19.5 Потенциальная форма метода проектированияЕсли в задаче (21), (22) выбрать в качестве независимой переменной аргумент T и исключить параметр r, то приходим к задаче Коши⎧−1dp∂ξ(p, T )∂ξ(p, T )⎪⎪⎨= ξ(p, T ) − x0 E −+ p p∗ (E − p p∗ ),dT∂p∂T(26)⎪x0⎪⎩ p,=−x0 T =0где неизвестная векторная функция p(T ) = (p1 (T ), .
. . , pn (T ))∗ имеет размерность n. Дифференциальное уравнение проектирования (26)следует решать от значения T = 0 до такого положительного значенияT = T0 > 0, при котором величина r = ξ − x0 обращается в нуль.Уравнение (26), как мы видели, основывается на геометрической конструкции проектирования начального состояния x0 на изохрону ΣT ;эта геометрическая конструкция описывалась неявным уравнениемp−ξ(p, T ) − x0=0ξ(p, T ) − x0 (27)относительно неизвестной функции p = p(T ), которая удовлетворяетусловию нормировки p(T ) ∈ S и неравенствуΦ(p, T ) < 0,0 T < T0 ,где функция∗TΦ(p, T ) = p x0 +∗c(e−τ A p) dτ = p∗ x0 − ξ(p, T )0уже встречалась выше (см. раздел 4.19.2). Уравнение (27) не имеетградиентной формы (его левая часть не может быть представлена какградиент по аргументу p некоторой функции).Опишем сейчас градиентную форму конструкции проектирования.Введём функцию#$1p2 − ln −Φ(p, T ) , 0 T < T0 ,(28)2которую будем называть потенциалом.