Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения, страница 19
Описание файла
PDF-файл из архива "Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения", который расположен в категории "". Всё это находится в предмете "вариационное исчисление" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 19 страницы из PDF
Кроме того, имеет местопредельное соотношениеπk − rk =c(ψ 0 + λk χk ) − c(ψ 0 + λk χ̄)− (h0 , χk − χ̄) → 0,λkk → ∞.Действительно, опорная функция удовлетворяет условию Липшица попеременной ψ|c(ψ ) − c(ψ )| L ψ − ψ ∀ψ , ψ ∈ E nс константой Липшица L, поэтому можно записать цепочку соотношений|πk − rk | Lλk χk − χ̄+ h0 · χk − χ̄ =λk= (L + h0 ) · χk − χ̄ → 0,k → ∞.Таким образом, установлено, что rk → 0 и πk − rk → 0 при k → ∞,откуда с учётом соотношенийπk = (πk − rk ) + rk ,|πk | |πk − rk | + |rk |,имеем: πk → 0 при k → ∞, что противоречит условию (17), котороеможет быть записано в виде: |πk | ε > 0 для ∀k K.Теорема 17.1 полностью доказана.Следствие 17.1. Условие строгой выпуклости выпуклого компакта U в направлении вектора ψ 0 = 0 равносильно существованию вточке ψ 0 градиента c (ψ 0 ) опорной функции c(ψ) компакта U .Следствие 17.2.
Выпуклый компакт U является строго выпуклым тогда и только тогда, когда существует градиент в любой точкеψ ∈ E n , ψ = 0.173Замечание 17.1. Подчеркнём ещё раз важный для приложенийконструктивный аспект теоремы 17.1. Рассмотрим уравнение(ψ 0 , u) = c(ψ 0 ),содержащее ненулевой векторный параметр ψ 0 ∈ E n , относительнонеизвестной точки u из строго выпуклого компакта U . Это уравнениеимеет единственное решение, определяемое формулойu = c (ψ 0 ).Упражнение 17.2. Проверить справедливость равенства(ψ, c (ψ)) = c(ψ)∀ψ = 0,(теорема Эйлера для однородных функций измерения 1), используясвойство положительной однородности измерения 1 опорной функции c(ψ).Упражнение 17.3.
Граница ∂U выпуклого компакта U допускаетпредставление!∂U =Hψ 0 .ψ 0 ∈SДля строго выпуклого компакта U имеет место следующее параметрическое описание границы:∂U = {u ∈ E n : u = c (ψ), ψ ∈ S}.Здесь S = {ψ ∈ E n : ψ = 1} – единичная сфера.Вернёмся к основной задаче нашего курса – линейной задаче быстродействия:⎧ẋ = Ax + u,⎪⎪⎪⎨ x(t0 ) ∈ M0 ,x(t1 ) ∈ M1 ,⎪⎪⎪⎩ t1 − t0 → min .u(·)∈УUФормулируемая ниже теорема 17.2 является следствием теоремы 17.1.Теорема 17.2. Пусть в задаче быстродействия множества M0 и Uстрого выпуклы. Тогда для любого начального значения сопряжённойпеременной ψ(t0 ) ∈ S соответствующая пара (x(t), u(t)), удовлетворяющая условиям а), б) принципа максимума на [t0 , t1 ] (см.
раздел 3.11),является единственной.Действительно, при заданном начальном значении p0 ≡ ψ(t0 ) ∈ Sсопряжённой переменной1741) однозначно определяется сопряжённая переменная∗ψ(t, p0 ) = e−(t−t0 )A p0 ,t0 t t 1 ,2) из условия максимума а) однозначно определяется экстремальное управлениеu(t, p0 ) = c (ψ(t, p0 )),t0 t t 1 ,3) из условия трансверсальности б) однозначно определяется начальная точка x(t0 ) траектории x(t):x0 ≡ x(t0 ) = c (M0 , ψ(t0 )),4) из задачи Кошиẋ = Ax + u(t, p0 ),x(t0 ) = x0 ,однозначно определяется траектория x(t), t0 t t1 .4.18Линейная задача быстродействия с гладкой областью управленияОбсудим вопрос о построении вычислительных методов нахождения оптимальных решений в линейных задачах быстродействия специального вида, имеющих гладкую область управления U . В данномразделе рассмотрены основные свойства этих задач.Рассмотрим линейную задачу быстродействияẋ = Ax + u;x|t=0 = x0 ,x0 = 0;x|t=T = 0;T → min(1)с “гладкой” областью управления U ∈ Γ3 [7].
Предполагается, чтоиз точки x0 возможен перевод объекта в начало координат при помощи допустимого управления. Характерной чертой “гладкой” задачи(1) является непрерывность оптимального управления.Пусть область управления U является выпуклым компактом, лежащим в пространстве E n . Этот компакт однозначно определяетсясвоей опорной функциейc(ψ) = max (u, ψ), ψ ∈ E n .u∈U175(2)Определим специальный класс Γ выпуклых компактов, которые будемназывать гладкими.Определение 18.1.
Выпуклый компакт U ∈ Γ, если для опорнойфункции c(ψ) компакта U выполнены следующие три предположения:П1 Функция c(ψ) имеет строго положительный минимум на единичной сфере S = {ψ ∈ E n : ψ = 1}:min c(ψ) > 0;ψ∈SП2 Функция c(ψ) имеет непрерывные частные производные до второго порядка включительно при всех ψ ∈ E n , ψ = 0;П3 Ранг матрицы c (ψ) вторых частных производных (гессиана)функции c(ψ) равен n − 1 при всех ψ ∈ S;nc (ψ) = cij (ψ)i,j=1,cij (ψ) ≡∂ 2 c(ψ),∂ψi ∂ψji, j = 1, . . .
, n.Будем писать U ∈ Γ3 , если U ∈ Γ и функция c(ψ) имеет непрерывные частные производные до третьего порядка включительно привсех ψ = 0.Упражнение 18.1. Пусть n = 2. Проверить, что выпуклый компактu2u2U = u ∈ E 2 : 21 + 22 1 ,a1a2ограниченный эллипсом, принадлежит Γ, Γ3 .Упражнение 18.2. Показать, что эллипсоидU = {u ∈ E n : (u, Qu) 1} ∈ Γ3 .Здесь Q – симметричная положительно определённая (n×n)-матрица.Упражнение 18.3. П1 ⇐⇒ 0 ∈ int U .Отсюда следует, что компакт U ∈ Γ содержит точку 0 ∈ E n вкачестве внутренней точки.Упражнение 18.4.
Проверить, что ∀ψ ∈ E n , ψ = 0, выполняютсяравенстваψ ∗ c (ψ) = c(ψ), c (ψ) ψ = 0 ,т.е. ранг матрицы c (ψ) n − 1.176Упражнение 18.5. Проверить, что уравнениеψ ∗ u = c(ψ),ψ ∈ E n , ψ = 0 ,относительно u ∈ U , U ∈ Γ, имеет единственное решение, определяемое формулойu = c (ψ).Рассмотрим сопряжённое уравнениеψ̇ = −A∗ ψи сопряжённую переменную∗ψ(t, p) = e−tA p,где p = ψ(0, p) – начальное значение сопряжённой переменной приt = 0.
Рассмотрим так называемое экстремальное управление u(t, p),отвечающее сопряжённой переменной ψ(t, p) и определяемое условиеммаксимума а), раздел 3.11:∗ψ(t, p) u(t, p) = c(ψ(t, p)).Отсюда следует (см. упражнение 17.5), чтоu(t, p) = c (ψ(t, p)).Cледовательно, оптимальное управление u0 (t), 0 t T0 , в задаче (1)допускает представлениеu0 (t) = c (ψ(t, p0 )), 0 t T0 ,с некоторым вектором p0 ∈ S.
Вектор p0 (начальное значение оптимальной сопряжённой переменной) и число T0 > 0 (оптимальноевремя перехода из точки x0 в начало координат) нам неизвестны.Можно показать, что в гладкой задаче быстродействия (1) вектор p0определяется единственным образом.Таким образом, решение задачи (1) на основе принципа максимума сводится к нахождению параметров p0 ∈ S и T0 > 0. Подставимэкстремальное управление u(t, p) в уравнение движения объекта ирассмотрим задачу Кошиẋ = Ax + u(t, p),177x|t=0 = x0 .Её решение x(t, p) выпишем с помощью формулы Коши:⎛⎞tx(t, p) = etA ⎝x0 + e−sA u(s, p) ds⎠ .0Нет оснований полагать, что при произвольно выбранном векторе pрешение x(t, p) когда-либо попадает в начало координат.
Потребуем,чтобыx(T, p) = 0, p ∈ S, T > 0.Эти условия приводят к системе нелинейных уравненийp2 = 1ξ(p, T ) = x0 ,(3)относительно единичного вектора p и положительного числа T . ЗдесьTξ(p, T ) = −∗e−sA c (e−sA p) ds0– n-мерная векторная нелинейная функция аргументовp ∈ E n \ {0}Пустьp = p0 , T = T0иT > 0.(p0 ∈ S, T0 > 0)(4)– решение системы (3). Тогда в задаче (1)• T0 – оптимальное время,∗• u0 (t) = c (e−tA p0 ), 0 t T0 , – оптимальное управление,• x0 (t) = x(t, p0 ), 0 t T0 , – оптимальная траектория.Следует обратить внимание на то, что в задаче (1) принцип максимума является необходимым и достаточным условием оптимальности,так как объект локально управляем в начало координат (проверить!).Итак, решение задачи быстродействия (1) на основе принципа максимума сводится к нахождению решения системы уравнений (3) относительно начального значения сопряжённой переменной p и оптимального времени T .
Ниже рассмотрены некоторые методы решения178системы (3). Эти методы существенно используют специфику системы (3).Укажем геометрическую интерпретацию решения p0 , T0 . Рассмотрим множествоΣT = {x ∈ E n : x = ξ(p, T ), p ∈ S},T 0,которое называется изохроной (множество уровня оптимального времени перехода). Точка x0 ∈ ΣT0 , а вектор p0 – единичный векторвнутренней нормали к ΣT0 в точке x0 (рисунок 18.1).x0p00ΣT 0Рисунок 18.1Множество VT = conv ΣT , ограниченное изохроной ΣT , обладаетследующими свойствами:• VT = {0} при T = 0,• VT ⊂ VT , VT = VT при 0 T < T (монотонное разбуханиемножества VT с ростом параметра T ),• VT ∈ Γ при T > 0.С геометрической точки зрения решение системы (3) состоит внахожденииа) первого момента T = T0 > 0 попадания точки x0 на границу ΣTмножества VT ,б) единичного вектора p0 внутренней нормали к ΣT0 в точке x0 .179Нахождение оптимальной пары (p0 , T0 ) в линейной задаче быстродействия (1) можно трактовать как решение следующей краевойзадачи принципа максимума⎧⎪= 0,⎨ ẋ = Ax + c (ψ), x = x0 , xt=0t=T(5)⎪ψ = p ∈ S,⎩ ψ̇ = −A∗ ψ,t=0где p ∈ S и T > 0 не заданы.
Обратим внимание на то, что краеваязадача (5) нелинейна за счёт члена c (ψ).4.19 Некоторые численные методы решения линейной задачи быстродействияПусть Tопт = T0 – оптимальное время, pопт = p0 – оптимальноеначальное значение сопряжённой переменной:ξ(p0 , T0 ) = x0 ,p0 = 1,T0 > 0.(1)Обсудим некоторые алгоритмы нахождения парыpопт , Tопт .(2)4.19.1 Метод НьютонаМетод Ньютона решения системы уравнений11p2 = .22ξ(p, T ) = x0 ,(3)Пусть pk , Tk – некоторое приближение к точному решению системы (3): pk = 1, Tk > 0.
Полагаяpопт = pk + ∆p,Tопт = Tk + ∆T,и производя линеаризацию системы уравнений (3), получаем линейную алгебраическую систему уравнений⎫ ∂ξ∂ξ⎪· ∆p +· ∆T = x0 − ξk ⎬∂p k∂T k(4)⎪⎭(pk )∗ · ∆p = 0180с неизвестными ∆p, ∆T . Здесь∂ξ(p, T )=−∂pT−sA e−sA∗c (e−sA∗p) e0∗∂ξ(p, T )= −e−T A c (e−T A p),∂T∂ξ(p, T ) ≡,∂p p=pkkT =Tk∂ξ∂ξ(p, T ) ≡.∂T k∂T p=pkds,∂ξ∂pT =TkС помощью утверждений упражнения 17.4 могут быть установленыследующие соотношения∂ξ(p, T )p = 0,∂pранг матрицыq∗∂ξq 0,∂p∗∂ξ(p, T )= −c(e−T A p) < 0;∂T∂ξ(p, T )равен n − 1 ∀p = 0, T > 0;∂pp∗(5)q ∈ En.Линейная система уравнений (4) имеет порядок n + 1.
Понизим еёпорядок на единицу. Умножение первого уравнения системы (4) слевана строку (pk )∗ приводит к определению ∆T :∆T =(pk )∗ (ξk − x0 ),ck∗ck ≡ c(e−Tk A pk ) > 0.(6)Умножив второе уравнение системы (4) слева на столбец pk и вычитаяиз полученного уравнения первое уравнение системы (4), приходим клинейной системе уравнений относительно ∆p 10∂ξ∂ξ· ∆T(7)· ∆p = (ξk − x0 ) +pk (pk )∗ −∂p k∂T kс симметричной положительно определённой матрицей. Теперь полагаемTk+1 = Tk + ∆T,pk+1 =pk + ∆p,pk + ∆pk = 0, 1, 2, .
. .(8)Здесь ∆T определяется формулой (6), а ∆p – решение линейной системы уравнений (7), имеющей порядок n. Итерационный процесс (8)181представляет собой метод Ньютона для решения системы (3), отличающийся от классического метода Ньютона нормировкой переменной p,которая вводится в связи со специальным видом второго уравнениясистемы (3).Как показывают численные эксперименты, метод (8) сходится непри всяком нулевом приближении, а в случае сходимости приводит кбыстрому уточнению решения (квадратичная скорость сходимости).Поэтому весьма актуальной является задача получения “достаточно хорошего” нулевого приближения, которое можно уточнить методом (8). Для выработки нулевого приближения (8) используется ряддругих методов.4.19.2 Метод Нейштадта-ИтонаНахождение парыpопт = p0 ,Tопт = T0в этом методе сводится к задаче максимизации вводимой ниже функции Z(p) конечного числа переменных (p1 , .