Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения, страница 10
Описание файла
PDF-файл из архива "Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения", который расположен в категории "". Всё это находится в предмете "вариационное исчисление" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 10 страницы из PDF
Пусть1) U ∈ Ω(E n ),2) D(s) – непрерывная (n × n)-матрица,3) класс допустимых управлений 1) ∀s : u(s) ∈ UУ = u(s) 2) u(s) – интегрируемая по Лебегу функциясостоит из интегрируемых по Лебегу функций, принимающихзначения из компакта U .Тогда множествоtD(s) У dsX=t083(интеграл)обладает следующими свойствами⎫⎫a) X непусто,⎪⎬⎪⎬б) X ограничено, X ∈ Ω(E n )X ∈ conv Ω(E n ).⎭в) X замкнуто,⎪⎪⎭г) X выпукло.Утверждения а), б) теоремы 6.2 легко проверяются (см. доказательство теоремы 6.1), утверждения в), г) приводятся без доказательства.Замечание 6.1. В теореме 6.2 не предполагается выпуклости компакта U ; при этом интеграл X оказывается всегда выпуклым.
Проиллюстрируем это обстоятельство примером.Пример 6.1. Пусть n = 1, D(s) ≡ 1, U = {−1, +1} – множество,состоящее из двух точек −1 и +1 (U – невыпуклое множество). Найти1множество X = 1 · У ds.0Класс допустимых управлений У содержит управления+1, 0 s < τ,0 τ 1,u0 (s) ≡ −1, u1 (s) ≡ +1, uτ (s) =−1, τ < s 1,(кроме этих управлений в У содержится много других управлений,которые, однако, для построения интеграла X не потребуются), а множество X (интеграл) содержит точки111 · u0 (s) ds = −1,x0 =1 · u1 (s) ds = +1,x1 =0011 · uτ (s) ds = 2τ − 1,xτ =0 τ 1.0Из рисунка 6.1 ясно, что отрезок [−1, +1] ⊂ X, и так как для любой1точки x ∈ X, представимой в форме x = u(s) ds, |u(s)| = 1, имеем 1|x| = u(s) ds 1, то X = [−1, +1].0840x1X01τx = 2τ − 1−1Рисунок 6.2Построенное в этом примере множество X = [−1, +1] выпукло, хотякомпакт U = {−1, +1} выпуклым не является.В примере 6.1 интеграл X был найден на основании определенияинтеграла.
Нахождение интегралов на основании определения, требующее перебора всех допустимых управлений из У, весьма неудобно для приложений. Здесь ситуацию можно сравнить с задачей вычисления интеграла Римана от функции действительного переменного: вычисление интеграла Римана на основании определения с помощью интегральных сумм в известном смысле неудобно для практики,и в ряде случаев интеграл удобно вычислять с помощью формулыНьютона–Лейбница. Теоремы 6.1 и 6.2 позволяют находить интегралы от класса допустимых управлений по следующей схеме: сначалавычисляется опорная функция интеграла, а затем по опорной функциивосстанавливается интеграл. Покажем, как эта схема применяется вконкретных задачах.Пример 6.2.
Пусть n = 2,0 1A=, D(s) = e−sA , U = S1 (0).−1 0TD(s) У ds.Найти интеграл X(T ) =085В силу теоремы 6.2 множество X(T ) является выпуклым компактом. Найдём сначала его опорную функцию, привлекая теорему 6.1 овнесении знака опорной функции под знак интеграла:{теорема 6.1}c(X(T ), ψ) =T= c(e−sA U, ψ) ds =0{свойство 5◦ , раздел 2.5}T−sA∗c(U, e=0Tψ) ds =∗e−sA ψ ds =0Tψ ds = T ψ = c(ST (0), ψ).=0Итак, два выпуклых компакта X(T ) и ST (0) имеют одинаковые опорные функции, отсюда, на основании свойства опорных функций (см.формулу (14) раздела 2.5), следует совпадение этих множеств:X(T ) = ST (0).Таким образом, интеграл X(T ) является кругом радиуса T с центромв начале координат.∗Выше мы воспользовались равенством e−sA ψ = ψ; геометрический смысл этого равенства состоит в том, что длина векторапри повороте его на угол s сохраняется.Для прямого доказательстваcos αэтого равенства положим ψ = ψи вычислимsin α cos s sin scos αcos(s − α)−sA∗eψ = ψ·= ψ;− sin s cos ssin α− sin(s − α)поэтому)∗e−sA ψ = ψ cos2 (s − α) + sin2 (s − α) = ψ .Пример 6.3.
Пусть n = 2, A =πНайти интеграл X =e−sA У ds.0860 1, U = {−v, v}, v ∈ E 2 .−1 0Действуя по той же схеме, получаем:π−sA∗c(U, ec(X, ψ) =πψ) ds =0(v, e−sA∗ ψ) ds,0так как c({−v, v}, ψ) = |(v, ψ)|, (см. раздел 2.5). Полагаяcos αcos βψ = ψ, v = v,sin αsin βнаходим−sA∗e∗cos(s − α)ψ = ψ, (v, e−sA ψ) = v · ψ · cos(s − α + β).− sin(s − α)Следовательно,πc(X, ψ) = ψ · v ·cos(s − α + β) ds =0π= ψ · v ·cos(s) ds = 2v · ψ = c(S2v (0), ψ)0иX = S2v (0).Заметим, что правая часть формулы (6), в отличие от примеров 6.2,6.3, не всегда может быть найдена аналитически (на основе формулыНьютона–Лейбница).
В таких случаях интеграл в правой части формулы (6) может быть приближённо вычислен при фиксированном ψметодами численного интегрирования.2.6.4 Теорема о непрерывной зависимости интеграла от верхнего пределаТеорема 6.3. При выполнении условий теоремы 6.2 множествоtD(s)У dsX(t) =t087непрерывно зависит от аргумента t, т.е.
Хаусдорфово расстояниеh(X(t ), X(t)) → 0 приt → t.2 Действительно, в силу теоремы 6.2 множества X(t ), X(t) являются выпуклыми компактами и расстояние Хаусдорфа между ними можно выразить в терминах их опорных функций (свойство 16◦опорных функций). Опорные функции этих множеств можно найти спомощью теоремы 6.1. Поэтому имеем:{свойство 16◦ , раздел 2.5}h(X(t ), X(t)) ={теорема 6.1}= maxc(X(t ), ψ) − c(X(t), ψ) =ψ∈S t t = max c(D(s)U, ψ) ds max c(U, D∗ (s)ψ) ds ψ∈S ψ∈S t⎧t +⎫,n⎨⎬, max |t − t| · |U | · ψ · max [dij (s)]2 =⎭ψ∈S ⎩|s−t|δ= const · |t − t| → 0 приi,j=1t → t,#$здесь δ – некоторое положительное число, t ∈ t − δ, t + δ .Итак, закончено изложение вспомогательного материала, которыйбудет использоваться для изучения линейной задачи быстродействия.883 Линейная теория быстродействия3.7Постановка линейной задачи быстродействияРассмотрим линейную задачу быстродействия в E n :⎧ẋ = Ax + u,⎪⎪⎪⎨ x(t0 ) ∈ M0 ,x(t1 ) ∈ M1 ,⎪⎪⎪⎩ t1 − t0 → min .u(·)∈УЗдесь x – вектор фазовых координат объекта, A – матрица системы,u – управление, M0 , M1 – множества начальных и конечных состояний объекта; класс допустимых управлений 1) ∀s : u(s) ∈ UУ = УU = u(s) 2) u(s) – интегрируемая функциясостоит из функций u(s) скалярного аргумента s, принимающих значения из множества U ∈ Ω(E n ) и интегрируемых по Лебегу.
Множество U называется областью управления. Начальный момент времени t0 фиксирован.Требуется найти допустимое управление, которое обеспечивает перевод объекта из множества M0 в множество M1 за минимальное время. Управление, решающее эту задачу, будем называть оптимальнымпо быстродействию.Основные вопросы линейной теории быстродействия (управляемость, необходимые условия оптимальности, достаточные условия оптимальности, существование оптимального управления) рассмотреныниже в разделах 3.10-3.15.Напомним, что матрицу A мы считаем постоянной. Постановкалинейной задачи быстродействия предполагает задание следующегонабора исходных данных:{A, M0 , M1 , У = УU , t0 }.3.8Основные свойства множеств достижимости X(t)и управляемости Z(t)Эти множества введены в разделе 1.3, где мы установили следующее свойство.89Свойство 1◦ (представление множеств X(t) и Z(t) на основеформулы Коши):имеют место формулы(t−t0 )AX(t) ≡ X(t0 , t, M0 ) = etM0 +e(t−s)A У ds,t0 < t,(1)e(t−s)A (−У) ds, t < t1 ,(2)t0t1Z(t) ≡ Z(t, t1 , M1 ) = e(t−t1 )A M1 +tX(t0 ) ≡ X(t0 , t0 , M0 ) = M0 ,Z(t1 ) ≡ Z(t1 , t1 , M1 ) = M1 .На формулах (1) и (2) основано изучение ряда простейших свойствмножеств X(t), Z(t), которые приводятся ниже.Свойство 2◦ (опорная функция множеств X(t), Z(t)):имеют место формулы(t−t0 )Ac(X(t), ψ) = c(etM0 , ψ)+c(e(t−s)A U, ψ) ds,(3)c(e(t−s)A U, ψ) ds.(4)t0(t−t1 )Ac(Z(t), −ψ) = c(et1M1 , −ψ) +t2 Для получения формул (3), (4) следует использовать представление рассмотренных множеств в виде алгебраической суммы двухмножеств (см.
(1), (2), свойство 7◦ аддитивности опорной функции попервому аргументу, раздел 2.5) и теорему 6.1 из раздела 2.6 о внесениизнака опорной функции под знак интеграла. Используя свойство 5◦ ,раздел 2.5, опорных функций, формулы (3), (4) можно записать в виде(t−t0 )A∗c(X(t), ψ) = c(M0 , etψ) +∗c(U, e(t−s)A ψ) ds,(5)t0(t−t1 )A∗c(Z(t), −ψ) = c(M1 , −et1ψ) +∗c(U, e(t−s)A ψ) ds.(6)tВ правые части формул (5), (6) входят опорные функции множеств U ,M0 , M1 и матрица A, другими словами, опорные функции множеств90достижимости и управляемости выражены в терминах исходных данных рассматриваемой линейной задачи быстродействия.Свойство 3◦ (о компактности и выпуклости множеств X(t),Z(t)):• если M0 , M1 ∈ Ω(E n ), то X(t), Z(t) ∈ Ω(E n );• если же M0 , M1 ∈ conv Ω(E n ), то X(t), Z(t) ∈ conv Ω(E n ).2 Действительно, множества X(t) и Z(t), в соответствии с формулами (1), (2), являются алгебраической суммой двух множеств.
Вторые слагаемые (интегралы) по теореме 6.2 являются выпуклыми компактами. Первые слагаемые, представляющие собой линейное преобразование компактов M0 , M1 , являются компактами (проверить, чтоумножение матрицы на компакт даёт компакт; умножение матрицына выпуклый компакт приводит к выпуклому компакту).
Алгебраическая сумма двух компактов является компактом; алгебраическаясумма двух выпуклых компактов является выпуклым компактом. Этисоображения приводят к обоснованию свойства 3◦ .Замечание 8.1. Для одноточечных множеств M0 , M1 множества X(t), Z(t) являются выпуклыми компактами.Свойство 4◦ (непрерывная зависимость множеств X(t), Z(t) отвремени t):h (X(t ), X(t)) → 0,h (Z(t ), Z(t)) → 0приt → t.Упражнение 8.1.
Доказать свойство 4◦ , привлекая формулы (1),(2) и теорему 6.3 раздела 2.6.3.9Сопряжённое уравнение. Сопряжённая переменная. Лемма о сопряжённой переменнойРассмотрим линейное дифференциальное уравнениеẋ = Ax + u(t),Уравнениеx ∈ En.ψ̇ = −A∗ ψназывается сопряжённым уравнением для уравнения (1). Здесь⎛ ⎞ψ1⎜ .. ⎟ψ=⎝ . ⎠ψn91(1)(2)– неизвестная n-мерная векторная функция аргумента t, A∗ – матрица, полученная транспонированием из матрицы A, входящей в уравнение (1).
Уравнение (2) является линейным однородным. Оно, очевидно,имеет тривиальное решение ψ(t) ≡ 0. Это нулевое решение сопряжённого уравнения нас не интересует в контексте изучения необходимыхусловий оптимальности. Решение сопряжённого уравнения можно записать с помощью формулы Коши:∗ψ(t) = e−(t−t0 )A ψ(t0 )(3)(вектор начальных условий задан в момент времени t0 ). В силу невырожденности экспоненциала (раздел 1.2)ψ(t) = 0 ∀t ⇐⇒ ψ(t0 ) = 0т.е. тривиальное решение ψ(t) ≡ 0 уравнения (2) получаем только принулевом начальном условии ψ(t0 ) = 0.Определение 9.1. Любое нетривиальное решение ψ(t) сопряжённого уравнения (2) будем называть сопряжённой переменной.Для получения сопряжённой переменной ψ(t) следует решить сопряжённое уравнение (2) с некоторым ненулевым начальным условием.Если начальное условие задано в момент времени t1 , то вместоформулы (3) получаем формулу∗ψ(t) = e−(t−t1 )A ψ(t1 ).(4)В дальнейшем изложении существенно используется следующаялемма.Лемма о сопряжённой переменной.
Пусть t0 < t1 , t ∈ [t0 , t1 ],X(t) ≡ X(t0 , t, M0 ) – множество достижимости, Z(t) ≡ Z(t, t1 , M1 ) –множество управляемости. Для любой сопряжённой переменной ψ(t)имеют место следующие равенстваtc(X(t), ψ(t)) = c(M0 , ψ(t0 ))+c(U, ψ(s)) ds ,(5)c(U, ψ(s)) ds ;(6)t0t1c(Z(t), −ψ(t)) = c(M1 , −ψ(t1 )) +t92кроме того, справедливы соотношенияt(u(s), ψ(s)) ds ,(7)t1(x(t), −ψ(t)) = (x(t1 ), −ψ(t1 )) + (u(s), ψ(s)) ds ,(8)(x(t), ψ(t)) = (x(t0 ), ψ(t0 ))+t0tгде ẋ(t) = Ax(t) + u(t) для почти всех t ∈ [t0 , t1 ], т.е. в формулах (7), (8) x(t) – любая траектория, отвечающая управлению u(t).2 Равенства (5)-(8) устанавливаются непосредственной проверкой.Проверим сначала равенство (7).