Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения, страница 13
Описание файла
PDF-файл из архива "Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения", который расположен в категории "". Всё это находится в предмете "вариационное исчисление" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 13 страницы из PDF
Пусть выполнено условие I. Тогдаc(X(t), ψ(t)) ={формула (5), раздел 3.9}t= c(M0 , ψ(t0 )) +{условие I, a), б)}c(U, ψ(s)) ds =t0t= (x(t0 ), ψ(t0 )) +(u(s), ψ(s)) ds ={формула (7), раздел 3.9}t0= (x(t), ψ(t)),т.е. доказано равенство (12). Равенство (13) доказывается совершенноаналогично с помощью леммы о сопряжённой переменной:c(Z(t), −ψ(t)) ={формула (6), раздел 3.9}t1= c(M1 , −ψ(t1 )) +{условие I, a), в)}c(U, ψ(s)) ds =t= (x(t1 ), −ψ(t1 )) +t1(u(s), ψ(s)) ds ={формула (8), раздел 3.9}t= (x(t), −ψ(t)).Проверим теперь, что условие II влечёт условие I. Пусть выполненоусловие II; полагая в (12) t = t0 и в (13) t = t1 , получаем условиятрансверсальности принципа максимума Понтрягина; используя (12)и выполняя почленное вычитание формул (5) и (7) из раздела 3.9,получаемt .0=0+c(U, ψ(s)) − (u(s), ψ(s)) ds,t0109t ∈ [t0 , t1 ];выполнив здесь дифференцирование по аргументу t, приходим к соотношениюc(U, ψ(t)) − (u(t), ψ(t)) = 0 для почти всехt ∈ [t0 , t1 ],т.е.
к условию максимума а) принципа максимума Понтрягина.Равенства (12), (13) позволяют дать геометрическую интерпретацию сопряжённой переменной с привлечением множеств X(t) и Z(t).Пусть пара (x(t), u(t)) удовлетворяет принципу максимума Понтрягина на отрезке [t0 , t1 ] с сопряжённой переменной ψ(t). Рассмотримгиперплоскость%&Γψ(t) = y ∈ E n : (y − x(t), ψ(t)) = 0 ,вектором нормали которой служит сопряжённая переменная ψ(t).
Точка x(t) принадлежит каждому из множеств X(t), Z(t), Γψ(t) . Гиперплоскость Γψ(t) в каждый момент времени t ∈ [t0 , t1 ] разделяет множества достижимости X(t) и управляемости Z(t) (см. рисунок 11.3).Γψ(t)x(t)Z(t)X(t)ψ(t)Рисунок 11.3Задача 11.1. Пусть пара (x(t), u(t)) удовлетворяет принципу максимума Понтрягина на отрезке [t0 , t1 ] с сопряжённой переменной ψ(t).Доказать, что гиперплоскость Γψ(t) разделяет множества X(t) и Z(t),т.е.∀ξ ∈ X(t): ξ − x(t), ψ(t) 0,∀ζ ∈ Z(t):ζ − x(t), −ψ(t) 0(см. рисунок 11.4).110ζ−ψ(t)ξψ(t)X(t)Z(t)x(t)Γψ(t)Рисунок 11.43.12Теорема существования оптимального управленияПри доказательстве теоремы существования оптимального управления в линейной задаче быстродействия предполагается компактность множеств M0 , M1 (выпуклости этих множеств не требуется) и существенно используется компактность множества достижимости X(t) и его непрерывная зависимость от времени t (см.
раздел 3.8); кроме того, предполагается управляемость объекта из M0в M1 на некотором конечном отрезке времени [t0 , T ].В случае выпуклости компактов M0 , M1 доказательство теоремысильно упрощается (см. ниже замечание 12.1).Теорема 12.1. Пусть1) M0 , M1 ∈ Ω(E n );2) класс допустимых управлений У состоит из функций, интегрируемых по Лебегу;3) на некотором конечном отрезке времени [t0 , T ] объект управляемиз M0 в M1 .Тогда в классе допустимых управлений У существует оптимальноеуправление u(t), t0 t t1 , t1 T , для рассматриваемой линейнойзадачи быстродействия.2 Пусть X(t) = X(t0 , t, M0 ) – множество достижимости.
По третьему условию теоремы"X(T ) M1 = ∅,(1)т.е. множество X(T ) имеет хотя бы одну общую точку с множеством M1 (см. рисунок 12.1).111X(T )M1t#0t1T$tРисунок 12.1Рассмотрим множествоI = {t ∈ [t0 , T ]: X(t)"M1 = ∅}.Это множество непусто, так как T ∈ I, см. (1), и ограничено снизучислом t0 .
Положимt1 = inf I.Из определения числа t1 следует, что"X(t) M1 = ∅ приt 0 t < t1 .(2)Мы покажем ниже, чтоX(t1 )"M1 = ∅.(3)Выполнение соотношений (2) и (3) означает оптимальность времени t1 . Из (3) и определения множества достижимости X(t1 ) следуетсуществование допустимого управления u(t), t0 t t1 , переводящего объект из множества M0 на множество M1 . Это управление иявляется оптимальным управлением для рассматриваемой линейнойзадачи быстродействия.Итак, остаётся доказать утверждение (3). Это доказательство опирается на следующую лемму.Лемма 12.1. Существует такая точка x∗ ∈ M1 , что∀ε > 0 x∗ ∈ X(t1 ) + Sε (0).2 Возьмём последовательность {T k } такую, что"T k t1 , T k → t1 при k → ∞, X(T k ) M1 = ∅ ∀k.112Возможность выбора такой последовательности {T k } вытекает из определения числа t1 .
Существует такая точка xk ∈ E n , что"xk ∈ X(T k ) M1 ∀k.(4)Так как xk ∈ M1 ∀k, и M1 – компакт, то из последовательности {xk }можно выбрать сходящуюся к некоторой точке x∗ ∈ M1 подпоследовательность. Не изменяя обозначений, будем считать, чтоxk → x∗ ∈ M1 ,k → ∞.(5)Из непрерывной зависимости множества достижимости X(t) от времени t (свойство 4◦ , раздел 3.8) и предельного соотношения T k → t1(k → ∞) следует, чтоh(X(T k ), X(t1 )) → 0,k → ∞.(6)Из (5), (6) следует, что для любого числа ε > 01)∃k0 = k0 (ε) > 0: ∀k k0x∗ − xk ε2,т.е.∀k k02)x∗ ∈ {xk } + S ε (0);(7)2∃k1 = k1 (ε) > 0: ∀k k1h(X(T k ), X(t1 )) ε2,и поэтому в силу определения расстояния Хаусдорфа∀k k1X(T k ) ⊂ X(t1 ) + S ε (0).(8)2Полагая k2 = max{k0 , k1 } и привлекая соотношения (7), (4), (8), получим (считая номер k k2 )(7)(4)(8)x∗ ∈ {xk } + S ε (0) ⊂ X(T k ) + S ε (0) ⊂ X(t1 ) + S ε (0) + S ε (0) =2222= X(t1 ) + Sε (0).(9)Лемма 12.1 доказана.Покажем, в заключение, что утверждение (3) следует из доказан1ной леммы 12.1.
Действительно, положив ε = m, m = 1, 2, . . ., имеемx∗ ∈ M1иx∗ ∈ X(t1 ) +1131S1 (0),mm = 1, 2, . . .По определению алгебраической суммы двух множеств точку x∗ можно представить в видеx∗ = ξ m +1 mψ ,mгдеξ m ∈ X(t1 ),ψ m 1.(10)В силу компактности множества достижимости X(t1 ) из последовательности {ξ m } можно выбрать подпоследовательность, сходящуюсяк некоторой точке ξ∗ ∈ X(t1 ). Не изменяя обозначений, будем считать, что ξ m → ξ∗ , m → ∞.
Тогда предельный переход при m → ∞в (9) даёт x∗ = ξ∗ ∈ X(t1 ), т.е. доказано соотношение (3), так какx∗ ∈ X(t1 ) и одновременно x∗ ∈ M1 .Замечание 12.1. В случае выпуклости компактов M0 , M1 теорема существования оптимального управления доказывается намногопроще. Действительно, в силу выпуклости компактов X(T k ) (свойство 3◦ , раздел 3.8) и M1 , условие"X(T k ) M1 = ∅на основании следствия из свойства 14◦ раздела 2.5 равносильно условиюc(X(T k ), ψ) + c(M1 , −ψ) 0 ∀ψ ∈ S .Перейдём в последнем неравенстве к пределу, устремив k к бесконечности (при каждом фиксированном ψ ∈ S). Тогда, используя свойствонепрерывности опорной функции по первому аргументу и условие (6),получим неравенствоc(X(t1 ), ψ) + c(M1 , −ψ) 0 ∀ψ ∈ S ,которое, в силу следствия из свойства 14◦ раздела 2.5, равносильноусловию (3), что завершает доказательство теоремы существования вслучае M0 , M1 ∈ conv Ω(E n ).3.13Примеры применения необходимых условий оптимальности для решения линейных задач быстродействияТеорема о необходимых условиях оптимальности в форме принципа максимума Понтрягина (раздел 3.11) и теорема существованияоптимального управления (раздел 3.12) позволяют в рассмотренных114ниже примерах построить оптимальные решения.
Здесь мы пользуемся следующей схемой рассуждений: если существует единственнаяпара (x(t), u(t)), t0 t t1 , удовлетворяющая принципу максимумаПонтрягина, то эта пара является оптимальной. Действительно, наличие такой пары обеспечивает управляемость объекта на отрезке [t0 , t1 ]и (на основании теоремы из раздела 3.12) существование оптимального управления. Оптимальная пара должна удовлетворять принципумаксимума Понтрягина (теорема из раздела 3.11, подраздел 3.11.4), ив силу единственности пары (x(t), u(t)), удовлетворяющей принципумаксимума, эта пара (x(t), u(t)) оптимальна.
В примерах 13.1, 13.2 множества M0 , M1 состоят из одной точкипри этом условия трансверсальности б), в) выполняютсяавтоматически и в анализе задачи участия не принимают . В примере 13.1 пара (x(t), u(t)), удовлетворяющая принципу максимума, единственна.В примере 13.2 рассмотрена ситуация, когда пара (x(t), u(t)), удовлетворяющая принципу максимума, неединственна; это обстоятельствопозволяет поставить вопрос об изучении достаточных условий оптимальности (см. разделы 3.14, 3.15).
Рассмотрены также примеры,требующие привлечения условий трансверсальности.Пример 13.1. Задача быстродействия для тележки. Рассмотримлинейную задачу быстродействия при n = 2, t0 = 0,%&0 1A=, U = u ∈ E 2 : u1 = 0, |u2 | 1 ,0 0 a0, M1 =,M0 =b0т.е. следующую задачу⎧ẋ1 = x2 ,x1 (0) = a,⎪⎪⎪⎨ ẋ2 = u2 ,x1 (t1 ) = 0,x2 (0) = b,x2 (t1 ) = 0,|u2 | 1,u ∈ U = {u ∈ E 2 : u1 = 0, |u2 | 1},⎪⎪⎪⎩t1 → min .(задача быстродействия для тележки, движущейся без трения поддействием ограниченной внешней силы). МножествоM0 начальныхaсостояний состоит из одной точки x0 =, а множество M1 коbнечных состояний состоит из одной точки, совпадающей с началомкоординат фазовой плоскости.
Требуется перевести рассматриваемый115управляемый объект из точки x0 в начало координат при помощи допустимого управления за минимальное время. Область управления Uимеет форму отрезка (см. рисунок 13.1).x2x0 =1 abU0x1% &M0 = x0% &M1 = 0−1Рисунок 13.1Для решения этой задачи применяем принцип максимума Понтрягина условие максимума а); условия трансверсальности б), в), которые для одноточечных множеств выполняютсяавтоматически, в решении задачи участиянепринимают.u1 (t)Пусть u(t) =– оптимальное управление. Оно удовлетвоu2 (t)ряет условию максимумаа) (u(t), ψ(t)) = c(U, ψ(t))ψ1 (t)с некоторой сопряжённой переменной ψ(t) =. Так какψ2 (t) ψ1,c(U, ψ) = |ψ2 |, ψ =ψ2(1)то условие (1) принимает видu1 (t) ψ1 (t) + u2 (t) ψ2 (t) = |ψ2 (t)|.116(2)Так как u(t) ∈ U , то u1 (t) = 0, и условие (2) можно записать в формеu2 (t) ψ2 (t) = |ψ2 (t)|.(3)Из (3) получаем, чтоu2 (t) = 1,u2 (t) = −1,−1 u2 (t) 1,если ψ2 (t) > 0,если ψ2 (t) < 0,если ψ2 (t) = 0.(4)В последнем случае (ψ2 (t) = 0) управление u2 (t) условием максимума (3) не определяется однозначно.