Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения (1155776), страница 9
Текст из файла (страница 9)
формула (19) для рассматриваемых невыпуклых компактов F1 и F2 неверна.В заключение рассмотрим пример применения формулы (19) длянахождения расстояния между двумя шарами Sr1 (a1 ) и Sr2 (a2 ), гдеa1 , a2 ∈ E n , r1 , r2 0. Имеем:h(Sr1 (a1 ), Sr2 (a2 )) = max c(Sr1 (a1 ), ψ) − c(Sr2 (a2 ), ψ) =ψ∈S= max (a1 − a2 , ψ) + (r1 − r2 )ψ = a1 − a2 + |r1 − r2 | .ψ=1Мы закончили рассмотрение основных свойств опорных функций,которые являются удобным аналитическим аппаратом для описаниявыпуклых компактов.2.6Интегралы. Три теоремы об интегралахВ этом разделе будут представлены три теоремы:Теорема 6.1 – о внесении знака опорной функции под знак интеграла,Теорема 6.2 – об основных свойствах интеграла,Теорема 6.3– о непрерывной зависимости интеграла от верхнего предела интегрирования.2.6.1 Краткое введениеМы уже знакомы с постановкой линейной задачи быстродействия,компактная запись которой имеет вид⎧ẋ = Ax + u,⎪⎪⎨x(t0 ) ∈ M0 ,(1)x(t1 ) ∈ M1 ,⎪⎪⎩t1 − t0 → min .Постановка линейной задачи быстродействия требует задания следующего набора исходных данных {A, M0 , M1 , У = УU }, где A – матрица73системы, M0 – множество начальных состояний объекта, M1 – множество конечных состояний объекта, У = УU – класс допустимыхуправлений, U – область управления.
Напомним, что начальный момент времени t0 считается фиксированным. Класс допустимых управлений 1) ∀s: u(s) ∈ UУ = u(s) 2) u(s) – интегрируемая функциясостоит из векторных функций u(s) скалярного аргумента s, принимающих значения из заданного множества U ∈ Ω(E n ), причёмкаждая из этих функций u(s) интегрируема. При изучении задачибыстродействия (1) важную роль играет множество достижимостиX(t0 , t, M0 ) ≡ X(t), которое может быть представлено в форме(t−t0 )AX(t0 , t, M0 ) = etM0 +e(t−s)A У ds,t0 < t;(2)t0X(t0 , t0 , M0 ) = M0 .Множество X(t), как показывает правая часть равенства (2), является алгебраической суммой двух множеств.
На основании свойства 7◦ опорных функций (аддитивность по первому аргументу) опорную функцию множества достижимости X(t) можно представить ввиде суммы двух слагаемых:⎛ t⎞(3)c(X(t), ψ) = c e(t−t0 )A M0 , ψ + c ⎝ e(t−t0 )A У ds, ψ ⎠.t0Последнее слагаемое в формуле (3) представляет собой опорную функцию от множества, определяемого интегралом. Возникает вопрос отом, как опорная функция интеграла выражается через опорную функцию компакта U , входящего в описание класса У = УU допустимыхуправлений. Ответ на поставленный вопрос даёт рассмотренная ниже теорема 6.1.
Теоремы 6.2 и 6.3 дают описание некоторых свойствинтеграла.Напомним определение интегралаtD(s) У dst074(4)от класса допустимых управлений.Определение 6.1. Пусть D(s) – непрерывная (n × n)-матрица;t0 < t; интеграл (4) определяется равенством⎧⎫tt⎨⎬D(s) У ds = x ∈ E n : x = D(s)u(s) ds, u(·) ∈ У =⎩⎭t0t0⎫⎧ t⎬! ⎨=D(s)u(s) ds .⎭⎩u(·)∈Уt0Интеграл (4) является множеством, лежащим в пространстве E n .Упражнение 6.1. Пусть n = 1, D(s) ≡ 1, t0 = 0, 0 < t, U = [−1, 1].Показать, чтоt21 · У ds = [−t, t] ,1 · У ds = [−2, 2] .002.6.2 Теорема о внесении знака опорной функции под знак интегралаТеорема 6.1. Пусть1) U ∈ Ω(E n ),2) D(s) – непрерывная (n × n)-матрица, 1) ∀s: u(s) ∈ U3) У = u(s) 2) u(s) – интегрируемая функция– класс допустимых управлений.Рассмотрим множествоtD(s) У ds,X=(5)t0 < t.t0Тогда имеет место равенство:⎞⎛ ttD(s) У ds, ψ ⎠ = c D(s) U, ψ ds,c⎝t0t075ψ ∈ En.(6)2 Введём обозначения:a ≡ c(X, ψ) – левая часть равенства (6),tb ≡ c(D(s)U, ψ) ds – правая часть равенства (6).t0Тогда утверждение теоремы 6.1 кратко запишется в форме(7)a = b.Доказательство теоремы 6.1 проводится по следующей схеме:1.2.3.4.∃a∃bab=⇒ a = babПриведём сначала некоторые вспомогательные утверждения (леммы 6.1, 6.2).Лемма 6.1.
Пусть⎛ ⎞⎞⎛ 1x1a1 . . . a1n⎟⎜A = ⎝. . . . . . . . .⎠ – (n × n)-матрица, x = ⎝ ... ⎠ – вектор из E n .nna1 . . . anxnСправедливо неравенство+,, n i 2Ax x aj .(8)i,j=12 Действительно, пусть ai = (ai1 , . . . , ain ) – i-ая строка матрицы A.Тогда))222222Ax = (a1 , x) + . . . + (an , x) a1 x + . .
. + an x =+,), n222(aij ) ,= x a1 + . . . + an = x i,j=1⎛⎞⎞⎛ 1a1(a , x)⎜ ⎟⎟⎜т.к. A = ⎝ ... ⎠, Ax = ⎝ ... ⎠, что доказывает лемму 6.1.an(an , x)76Рассмотрим теперь квадратную⎛ 1d1 (s)D(s) = ⎝ . . .dn1 (s)матрицу порядка n⎞. . . d1n (s)...... ⎠,n. . . dn (s)непрерывно зависящую от s ∈ [t0 , t]; каждый её элемент dij (s) является непрерывной функцией аргумента s ∈ [t0 , t]. Положим,ωji (δ) =sup dij (s1 ) − dij (s2 ), i, j = 1, . . . , n; δ > 0.|s1 −s2 |δs1 ,s2 ∈[t0 ,t]Функция ωji (δ) аргумента δ > 0, называемая модулем непрерывностифункции dij (s), удовлетворяет условию ωji (δ) ↓ 0 при δ → +0 (это следует из равномерной непрерывности на отрезке [t0 , t] функции dij (s),которая предполагается непрерывной на этом отрезке).
Положим+,, n # i $2ωj (δ) .ω(δ) = i,j=1Ясно, что ω(δ) ↓ 0 при δ → +0.Лемма 6.2. Пусть s1 , s2 ∈ [t0 , t]; δ > 0; |s1 − s2 | δ; ψ ∈ E n ,u ∈ U . Имеют место неравенстваc(D(s1 )U, ψ)−c(D(s2 )U, ψ) |U |·ψ·ω(|s1 −s2 |) |U |·ψ·ω(δ), (9)(D(s1 )u, ψ)−(D(s2 )u, ψ) |U |·ψ·ω(|s1 −s2 |) |U |·ψ·ω(δ), (10)правая часть которых стремится к нулю при δ → +0.2 Действительно, привлекая свойства опорных функций, последовательно получаемc(D(s1 )U, ψ) − c(D(s2 )U, ψ)={свойство 5◦ , раздел 2.5}свойство 4◦ , раздел 2.5;∗∗= c(U, D (s1 )ψ) − c(U, D (s2 )ψ) |U | – модуль компакта U |U | · [D(s1 ) − D(s2 )]∗ ψ+,, n |U | · ψ[dij (s1 ) − dij (s2 )]2 {лемма 6.1}{определение функции ω(δ)}i,j=1 |U | · ψ · ω(|s1 − s2 |) |U | · ψ · ω(δ).77{|s1 − s2 | δ}Неравенство (9) доказано.
Неравенство (10) доказывается аналогично: (D(s1 )u, ψ) − (D(s2 )u, ψ) = (u, [D(s1 ) − D(s2 )]∗ ψ) u · [D(s1 ) − D(s2 )]∗ ψ |U | · ψ · ω(|s1 − s2 |) |U | · ψ · ω(δ).Обратимся теперь к доказательству теоремы 6.1 по указанной выше схеме 1., 2., 3., 4.1. ∃ a. Чтобы проверить утверждение 1.
для величины a = c(X, ψ)(при любом фиксированном векторе ψ ∈ E n ), мы покажем, что множество X непусто и ограничено.Проверим сначала, что X = ∅. Множество⎧⎫tt⎨⎬X = D(s)У ds = x ∈ E n : x = D(s)u(s) ds, u(·) ∈ У⎩⎭t0t0непусто, так как множество U непусто и существуетточка u∗ ∈ U ;управление u∗ (s) ≡ u∗ ∀s является допустимым u∗ (s) ∈ У и точкаx∗ ≡tD(s)u∗ (s) ds ∈ X.t0Для доказательства ограниченности множества X возьмем любуюточку x ∈ X. Точку x можно представить в форме x =tD(s)u(s) ds,t0где u(·) ∈ У, u(s) ∈ U при любом s ∈ [t0 , t].
Следовательно,tD(s)u(s) ds x t0tt0где{лемма 6.1}+,, n # i $2dj (s) ds R,u(s) i,j=1+,, n # i $2R = (t − t0 ) |U | max dj (s) .s∈[t0 ,t]i,j=1Таким образом, ∃ R > 0: X ⊂ SR (0). Ограниченность множества Xдоказана. Следовательно, при каждом ψ ∈ E n величина a = c(X, ψ)определена и принимает конечное значение. Утверждение 1. доказано.782. ∃ b. Чтобы проверить утверждение 2. для величиныtc(D(s) U, ψ) dsb=t0(при любом фиксированном векторе ψ ∈ E n ), перепишем последнююформулу в видеtb = c(U, D∗ (s)ψ) ds.(11)t0Существование интеграла (11) следует из непрерывности подынтегральной функции по переменной интегрирования s ∈ [t0 , t].
Непрерывность подынтегральной функции по s вытекает из непрерывностиопорной функции по второму аргументу, непрерывности D∗ (s)ψ по s итеоремы о непрерывности суперпозиции двух непрерывных функций.Заметим, что непрерывность функции c(D(s)U, ψ) по s следует такжеиз неравенства (9). Проверка утверждения 2. закончена.3. a b. Любая точка x ∈ X =tD(s) У ds допускает представлеt0ниеtx=D(s)u(s) ds,u(·) ∈ У.t0Поэтомуt(x, ψ) =D(s)u(s) ds, ψt0t=D(s)u(s), ψ ds =t0t= (u(s), D∗ (s)ψ) ds t0tt0t={по определению опорной функции}c(U, D∗ (s)ψ) ds ={свойство 5◦ , раздел 2.5}c(D(s) U, ψ) ds ≡ b.t0Итак, (x, ψ) b∀x ∈ X.
Следовательно, ∀ψ ∈ E na ≡ c(X, ψ) = sup (x, ψ) b.x∈X79Утверждение 3. доказано.Проведём теперь наиболее трудную часть доказательства теоремы 6.1 – проверку утверждения 4.:a b.(12)Неравенство (12) вытекает из следующей леммы 6.3.Лемма 6.3. Для любого натурального N имеет место неравенствоa b − εN ,(13)где εN > 0, εN → 0 при N → ∞.Лемма 6.4. Для любого натурального N∃ xN ∈ X: (xN , ψ) b − εN ,(14)где εN > 0, εN → 0 при N → ∞.Очевидно, чтолемма 6.4 =⇒ лемма 6.3 =⇒ неравенство (12)Действительно,a = c(X, ψ) = sup (x, ψ) (xN , ψ) b − εN ,x∈Xт.е.
a b − εN ∀N , и переход к пределу при N → ∞ в последнемнеравенстве (a и b от N не зависят, а εN → 0, N → ∞) приводит кинтересующему нас неравенству (12). Таким образом, для доказательства неравенства (12) остаётся установить утверждение леммы 6.4.Лемма 6.5. Имеет место утверждение леммы 6.4, причём в (14)точка xN допускает представлениеtxN =D(s)uN (s) ds,(15)t0где uN (·) – кусочно-постоянное допустимое управление (uN (·) ∈ У),а число εN определяется равенствомt − t0εN = 2(t − t0 ) · |U | · ψ · ω,(16)N80причёмεN → 0 при N → ∞.(17)Доказательство леммы 6.5, которое мы сейчас проведём, состоитиз двух частей:(α) построение управления uN (s), t0 s t;(β) проверка требуемых утверждений (14)-(17).(α) Опишем сначала построение управления uN (·).
Пусть N – натуральное число; разобьём отрезок [t0 , t] на N равных частей точкамиt0 ≡ t0 < t1 < . . . < tN ≡ t,где tj+1 − tj = (t − t0 )/N ≡ δ > 0, δ = δN → 0 при N → ∞ (см. рисунок 6.1).t1t0 = t0I0t2I2I1tN −1tj+1tjtN = t1I N −1IjsРисунок 6.1Определим множества I 0 = [t0 , t1 ), I 1 = [t1 , t2 ), . . . , I j = [tj , tj+1 ),. . . , I N −1 = [tN −1 , tN ]. Напомним, что число b определяется интегралом, стоящим в правой части формулы (6). Подынтегральная функцияэтого интеграла при s = tj , j = 0, 1, . . . , N − 1, представима в формеc(D(tj )U, ψ) = (D(tj )uj , ψ),где uj ∈ U.Действительно, так как U ∈ Ω(E n ), тоc(D(tj )U, ψ) = c(U, D∗ (tj )ψ) = max(u, D∗ (tj )ψ) =u∈Uj∗jjj= (u , D (t )ψ) = (D(t )u , ψ),81uj ∈ U.(18)Привлекая выделенные выше точки uj , определим кусочно-постоянное управление uN (s), s ∈ [t0 , t], полагая⎧ 0u ,s ∈ I 0,⎪⎪⎪1⎪s ∈ I 1,u ,⎪⎪⎨.............(19)uN (s) =j,s ∈ Ij,u⎪⎪⎪⎪.............⎪⎪⎩ N −1, s ∈ I N −1 .uЯсно, что построенное управление uN (·) ∈ У, так как функция uN (s)– интегрируема и принимает значения из компакта U при любомs ∈ [t0 , t].)(β) Проверим утверждения (14)-(17).
Так как управление (19) допустимо, то точка xN , определяемая равенствами (15), (19) принадлежит множеству X. Представим левую часть неравенства (14) в форме⎛ t⎞(15)(xN , ψ) = ⎝ D(s)uN (s) ds, ψ ⎠ =t0t=(19)(D(s)uN (s), ψ) ds =N−1 j=0t0(D(s)uj , ψ) ds,(20)Ijа число b, входящее в правую часть неравенства (14), в формеtc(D(s)U, ψ) ds =b=N−1 j=0t0c(D(s)U, ψ) ds.(21)IjИз (20), (21) получаем вычитанием:(xN , ψ) − b =N−1j=0[(D(s)uj , ψ) − c(D(s)U, ψ)] ds. (22)Rj , где Rj =IjОценим .сверху величину |Rj |.
Привлекая (22), (18), получаем(D(s)uj , ψ) − (D(tj )uj , ψ) +Rj =Ij+ (D(tj )uj , ψ) − c(D(tj )U, ψ) +82{равно нулю в силу(18)}+ c(D(tj )U, ψ) − c(D(s)U, ψ) ds,откуда с помощью леммы 6.2 приходим к оценке|Rj | 2(tj+1 − tj ) · |U | · ψ · ω(tj+1 − tj ).Следовательно,N−1|Rj | 2N δ · |U | · ψ · ω(δ) =j=0= 2(t − t0 ) · |U | · ψ · ωt − t0N≡ εN ,(23)причём εN → 0 при N → ∞, так как ω(δ) → 0 при δ → 0. Такимобразом, из (23), (22) получаем, что |(xN , ψ) − b| εN , или−εN (xN , ψ) − b εN .Левая часть последнего неравенства приводит к неравенству (14).Лемма 6.5 доказана полностью, неравенство (12) обосновано. Доказательство теоремы 6.1 закончено.2.6.3 Теорема об основных свойствах интегралаТеорема 6.2.