Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения, страница 22
Описание файла
PDF-файл из архива "Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения", который расположен в категории "". Всё это находится в предмете "вариационное исчисление" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 22 страницы из PDF
Терминальная функция ϕ(x) = x2 является выпуклой непрерывно дифференцируемой в E 2 функцией, поэтому принцип максимума Понтрягина является в этой задаче необходимым и достаточным условиемоптимальности.Для решения этой задачи применяемпринцип максимума Понтрягина условие максимума а) . Условие трансверсальности б) дляодноточечного множества выполняется автоматически, и в решениизадачи участия не принимает. Пусть u(t) = (u1 (t), u2 (t))∗ – оптимальное управление.
Оно удовлетворяет условию максимума а)(u(t), ψ(t)) = c(U, ψ(t))с сопряжённой переменной ψ(t), которая является решением задачиКошиψ̇ = 0, ψ(1) = −ϕ (x(1)) = −2x(1).Так как c(U, ψ) = |ψ1 | + |ψ2 |, то условие максимума можно записатьв виде(7)u1 (t)ψ1 (t) + u2 (t)ψ2 (t) = |ψ1 (t)| + |ψ2 (t)|.Из (7) получаем, что⎧⎪⎨+1,u1 (t) = −1,⎪⎩[−1, 1],⎧⎪⎨+1,u2 (t) = −1,⎪⎩[−1, 1],если ψ1 (t) > 0,если ψ1 (t) < 0,если ψ1 (t) = 0,если ψ2 (t) > 0,если ψ2 (t) < 0,если ψ2 (t) = 0.При ψi (t) = 0 условием максимума (7) управление ui (t), i = 1, 2, неопределяется однозначно.
В данном примере матрица A = O, сопряжённое уравнение имеет вид ψ̇ = 0, решение сопряжённого уравненияявляется константойψ(t) ≡ ψ = (ψ 1 , ψ 2 )∗ ,198t ∈ [0, 1],которая определяется конечным условием ψ(1) = −2x(1). В случае,когда константы ψ 1 и ψ 2 отличны от нуля оптимальное управлениеопределяется однозначно:u1 (t) = sign ψ 1иu2 (t) = sign ψ 2 .Из первого уравнения движения ẋ1 = u1 следует, чтоttu1 (s)ds = −5 +x1 (t) = x1 (0) +0u1 (s) ds,0откуда, используя неравенства |u1 (t)| 1 и 0 t 1, получаемx1 (1) −4 < 0, следовательно, ψ 1 = ψ1 (1) = −2x(1) > 0 для любого допустимого процесса (x(t), u(t)), t ∈ [0, 1]. Таким образом, первая координата оптимального управления однозначно определяется:u1 (t) = sign ψ 1 = +1, а первая координата оптимальной траекторииимеет вид x1 (t) = −5 + t, t ∈ [0, 1], x1 (1) = −4.Аналогично из второго уравнения движения ẋ2 = u2 следует, чтоtx2 (t) = x2 (0) +tu2 (s)ds = 1 +0u2 (s) ds,0откуда, используя неравенства |u2 (t)| 1 и 0 t 1, получаемx2 (1) 0.
Если допустить, что для оптимальной траектории x2 (1) > 0,то при этом условии ψ 2 = ψ2 (1) = −2x2 (1) < 0. Поэтому втораякоордината оптимального управления u2 (t) = sign ψ 2 = −1, а втораякоордината оптимальной траектории имеет вид x2 (t) = 1 − t, t ∈ [0, 1].Следовательно, x2 (1) = 0, что противоречит неравенству x2 (1) > 0.Остается принять равенство x2 (1) = 0, или11u2 (s) ds = 0 ⇐⇒1+0[1 + u2 (s)] ds = 0.0Из последнего условия, в силу неотрицательности подынтегральнойфункции, получаемu2 (s) + 1 = 0для почти всехs ∈ [0, 1],т.е. вторая координата u2 (·) оптимального управления u2 (t) = −1,а вторая координата оптимальной траектории имеет вид x2 (t) = 1 − t,t ∈ [0, 1], x2 (1) = 0. Таким образом, следует считать ψ 2 = 0.199Итак, построен экстремальный процессx1 (t) = −5 + t, x2 (t) = 1 − t,u1 (t) = 1, u2 (t) = −1,t ∈ [0, 1],который удовлетворяет условиям а), б) c участием сопряжённой переменной ψ1ψ(t) =, ψ 1 > 0.0Можно считать, что, в соответствии с условием трансверсальности вмомент времени t1 (см.
примечание 5), имеют место соотношенияψ 1 = ψ1 (t1 ) = −ϕx1 (x(1)) = −2 x1 (1) = 8.Впрочем, можно выбрать ψ 1 = 1, что соответствует нормировке (ненулевой) сопряжённой переменной в момент времени t1 .В соответствии с формулами, определяющими экстремальный процесс, конец оптимальной траектории совпадает с точкой (−4, 0)∗ . Терминальная функция ϕ(x) = x21 + x22 является выпуклой и гладкой.Оптимальность построенного решения вытекает из теоремы 20.3.Оптимальная траектория x(t), 0 t 1, представляет собой отрезок (см.
рисунок 20.1).x2x(t)x(0)1x(1)−5−4−10x1Рисунок 20.1В заключение предлагается следующая наглядная геометрическаяинтерпретация полученного оптимального решения (см. рисунок 20.2).Множество достижимости рассматриваемого управляемого объектаимеет форму квадрата:%&X(1) = x ∈ E 2 : − 6 x1 −4, 0 x2 2 .200Среди всех точек этого квадрата ближайшей к началу координат точкой служит его юго-восточная вершина (−4, 0)∗ , с которой совпадает правый конец оптимальной траектории, т.е. для оптимальнойтраектории выполняются условия x1 (1) = −4, x2 (1) = 0. Векторψ = (ψ 1 , ψ 2 )∗ , где ψ 1 > 0, ψ 2 = 0, является опорным вектором к множеству достижимости X(1) в его граничной точке x(1) = (−4, 0)∗ .x2X(1)x(0)4x(1)−6 −5 −404 x1Рисунок 20.2Замечание 20.1.
Теорема 20.1 о существовании оптимального решения взадаче (1) остаётся справедливой в предположении, что функция ϕ(x) является полунепрерывной снизу. Напомним [12], что функция ϕ(·) : X → E n ,определённая на множестве X ⊂ E n , называется полунепрерывной снизу вточке x ∈ X, если для любой последовательности {xi } точек из X, сходящейся к точке x, выполняется неравенствоlim ϕ(xi ) ϕ(x).i→∞Функция ϕ(x) называется полунепрерывной снизу на множестве X, еслиона полунепрерывна снизу в каждой точке этого множества. На основе соответствующей теоремы Вейерштрасса [12], в силу компактности и непустотымножества достижимости, получаем утверждение теоремы 20.1 о существовании оптимального управления в задаче (1).2016 Гладкие выпуклые компакты на плоскости. Основные сведения.
Параметрическиеуравнения границы. Критерий выпуклости положительно однородной функции измерения единица6.21Плоские гладкие выпуклые компакты6.21.1 Определение. Основной результатПусть U ⊂ E 2 – плоский выпуклый компакт, аc(ψ) = max (u, ψ),u∈Uψ ∈ E2,– его опорная функция.Определение 21.1. Выпуклый компакт U будем называть гладкими писать U ∈ SM (E 2 ), если опорная функция c(ψ) этого компактаудовлетворяет следующим двум условиям:1◦ функция c(ψ) в области E 2 \ {0} принадлежит классу C k , k 3,в частности, при всех ψ = 0 определены и непрерывны её градиент c (ψ) и гессиан c (ψ);2◦ для любого единичного вектора ψ ранг матрицы c (ψ) равен 1.Замечание 21.1.
Матрица вторых частных производных (гессиан)опорной функции c 1 ψ1 (ψ) cψ1 ψ2 (ψ)c (ψ) = ψcψ2 ψ1 (ψ) cψ2 ψ2 (ψ)симметрична и обладает свойствомc (ψ)ψ = 0∀ψ = 0,т.е. вектор ψ = 0 является собственным вектором матрицы c (ψ), отвечающим нулевому собственному значению. Поэтому det c (ψ) = 0и, следовательно, всегда ранг матрицы c (ψ) меньше двух. Эта матрица всегда имеет нулевое собственное значение. Характеристическоеуравнение cψ ψ (ψ) − λ cψ ψ (ψ)1 2 1 1=0c(ψ)c (ψ) − λψ2 ψ1ψ2 ψ2202принимает вид#$λ2 − cψ1 ψ1 (ψ) + cψ2 ψ2 (ψ) λ + det c (ψ) = 0или#$λ λ − cψ1 ψ1 (ψ) + cψ2 ψ2 (ψ) = 0,откуда находится второе собственное значениеR = cψ1 ψ1 (ψ) + cψ2 ψ2 (ψ),равное следу гессиана c (ψ).
При ранге гессиана, равном единице,имеем: R = 0; в силу выпуклости опорной функции R 0, поэтому R > 0. Ненулевой вектор χ, ортогональный вектору ψ, является собственным вектором матрицы c (ψ), отвечающим собственномузначению R:c (ψ) χ = R χ.Теорема 21.1. Граница ∂U гладкого плоского выпуклого компактаU ∈ SM (E 2 ) определяется векторным параметрическим уравнениемx = c (ψ)|ψ=q(α) ,α ∈ [0, 2π),которое в координатной форме имеет видx1 = cψ1 (q(α)),α ∈ [0, 2π),x2 = cψ2 (q(α)),(1)(2)где c (ψ) – градиент опорной функции c(ψ) множества U , аcos αq(α) =sin α– единичный вектор. Векторное уравнение (1) может быть записано ввидеx = c0 (α)q(α) + c0 (α)q (α),α ∈ [0, 2π),(3)или, в координатной форме,x1 = c0 (α) cos α − c0 (α) sin α,x2 = c0 (α) sin α + c0 (α) cos α,гдеc0 (α) = c(q(α)),c0 (α) = (c (q(α)), q (α))203(4)(5)– гладкие 2π−периодические функции.
Функция c0 (α) является решением линейного неоднородного дифференциального уравненияc0 (α) + c0 (α) = R(α),(6)R(α) = q ∗ (α) c (q(α)) q (α)(7)правая часть которого2π−периодична и является положительным собственным значениемматрицы c (ψ)|ψ=q(α) :c (q(α))q (α) = R(α)q (α).(8)Функция R(α) удовлетворяет условию ортогональностиπR(α)q(α) dα = 0.(9)−πКривизна k(α) кривой ∂U в точке c (q(α)) определяется равенствомk(α) =1,R(α)(10)величина R(α) есть радиус кривизны границы ∂U в точке c (q(α)).2 Доказательство.
Векторное уравнение (1) границы ∂U гладкого выпуклого компакта U записывается на основании теоремы оградиенте опорной функции; уравнения (2) дают координатную запись векторного уравнения (1). Для вывода векторного уравнения (3)следует разложить вектор c (q(α)) по ортонормированному базису− sin αcos α., q (α) =q(α) =cos αsin αЗаписав это разложение в видеc (q(α)) = κ1 (α) q(α) + κ2 (α) q (α)(11)с неопределёнными коэффициентами κ1 (α), κ2 (α), получаем, умножив скалярно уравнение (11) на единичный вектор q(α):κ1 (α) = c (q(α)), q(α) = c(q(α)) = c0 (α).(12)204Умножение (11) на единичный вектор q (α) даёт:κ2 (α) = (c (q(α)), q (α)) =dc(q(α)) = c0 (α) .dα(13)В силу (1), (11)-(13) векторное уравнение (3) получение. Его координатной формой являются параметрические уравнения (4).Покажем, что функция c0 (α) является решением дифференциального уравнения (6) с правой частью (7).
Имеем:d (13)c0 (α) =dαd c (q(α)), q (α) ==dα = c (q(α))q (α), q (α) + c (q(α)), q (α) = (7)= q ∗ (α) c (q(α)) q (α) − c (q(α)), q(α) =c0 (α) ={q (α) = −q(α)}= R(α) − c(q(α)) = R(α) − c0 (α),откуда следует уравнение (6) и формула (7) для его правой части.Так как c (q(α)) q(α) = 0, то вектор q(α) является собственнымвектором матрицы c (q(α)), отвечающим нулевому собственному значению, а вектор q (α), ортогональный вектору q(α), является собственным вектором матрицы c (q(α)), отвечающим положительномусобственному значению R(α), см.