Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения, страница 17
Описание файла
PDF-файл из архива "Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения", который расположен в категории "". Всё это находится в предмете "вариационное исчисление" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 17 страницы из PDF
Задача приведения объекта в начало координат частовстречается в приложениях. Условие локальной управляемости в начало координат на отрезке [t, t1 ] принимает следующий вид (см. (1)):∃ ε > 0: Sε (0) ⊂ Z(t, t1 , {0}).(6)Условие (6) можно представить в форме0 ∈ int Z(t, t1 , {0}),т.е. точка 0 ∈ E n является внутренней точкой множества управляемости Z(t, t1 , {0}) (см. рисунок 15.2).В рассматриваемом случае M1 = {0} множество управляемости(см. раздел 1.3) допускает следующее представлениеt1Z(t, t1 , {0}) =e(t−s)A (−У) ds.tПоэтому вопрос о локальной управляемости в начало координат сводится к вопросу о том, является ли точка 0 ∈ E n внутренней точкой множества, определяемого интегралом. В следующем подразделе 3.15.4 излагаются необходимые и достаточные условия для того,1500Z(t, t1 , {0})Sε (0)Рисунок 15.2чтобы точка 0 была внутренней точкой интеграла при специальномвиде множества U .
Этот результат позволяет получить удобные дляпрактического применения достаточные условия локальной управляемости в начало координат (см. ниже подраздел 3.15.5) и достаточныеусловия оптимальности в начало координат (см. подраздел 3.15.6).3.15.4 Лемма о внутренней точке интегралаЛемма. Пусть1) U = {−v, v} (т.е. множество U состоит из двух точек: −v и v);2) A – квадратная матрица порядка n;3) множество X ⊂ E n определяется интегралом:tX=e−sA У ds;0 < t;У = УU .0Тогда равносильны следующие два условия (I) и (II):(I)0 ∈ int Xвекторы v, Av, .
. . , An−1 vлинейно независимы⇐⇒ (II)(7)2 При доказательстве леммы о внутренней точке интеграла используются два вспомогательных утверждения (леммы 1 и 2).Лемма 1. Равносильны следующие два условия (I) и (I ):(I)0 ∈ int X⇐⇒ (I )151m ≡ min c(X, ψ) > 0ψ∈S2 Действительно, по теореме 6.2 (раздел 2.6) X ∈ conv Ω(E n ), тогда, учитывая, что Sr (0) ∈ conv Ω(E n ) для любого r 0, и привлекаяследствие из свойства 11◦ , раздел 2.5, имеем(I) ⇐⇒∃ r > 0 : Sr (0) ⊂ X⇐⇒⇐⇒ ∃ r > 0 : r||ψ|| c(X, ψ)⇐⇒ 0 < r c(X, ψ)∀ψ ∈ E n ⇐⇒∀ψ ∈ S ⇐⇒ (I’)m>0Лемма 2 (неотрицательность опорной функции множества X):tc(X, ψ) = −sA(ev, ψ) ds 0.02 Действительно,⎛ t⎞c(X, ψ) = c ⎝ e−sA У ds, ψ)⎠ =t=0∗c(U, e−sA ψ) ds =0t=(v, e−sA∗ ψ) ds =0теорема 6.1, раздел 2.6,свойство 5◦ , раздел 2.5{пример 5, подраздел 2.5.4}t −sA(ev, ψ) ds 0.0В силу леммы 1 утверждение (7) леммы о внутренней точке интеграла равносильно утверждению(I ) m > 0 ⇐⇒ (II)(8)Из леммы 2 следует, что m 0; поэтому утверждение (8) будет доказано, если установить равносильность следующих утверждений (I )и (II ):(I )m=0⇐⇒ (II )векторы v, Av, .
. . , An−1 vлинейно зависимы152(9)Докажем (9). Сначала покажем, что (I ) ⇒ (II ). Если выполненоусловие (I ) m = 0, то в силу непрерывности опорной функции∃ ψ̄ ∈ S: c(X, ψ̄) = 0,тогда, используя лемму 2, получаемt −sA(ev, ψ̄) ds = 0.0В последнем интеграле подынтегральная функция неотрицательна инепрерывна, t > 0, поэтому(e−sA v, ψ̄) = 0 ∀s ∈ [0, t],откуда дифференцированием по аргументу s получаем(e−sA Av, ψ̄) = 0, . . . , (e−sA An−1 v, ψ̄) = 0;положив, наконец, здесь s = 0, приходим к равенствам(v, ψ̄) = 0, (Av, ψ̄) = 0, .
. . , (An−1 v, ψ̄) = 0,которые можно записать в виде одного матричного равенства(v, Av, . . . , An−1 v)∗ ψ̄ = 0,ψ̄ ∈ S.Следовательно, det(v, Av, . . . , An−1 v) = 0, т.е. векторыv, Av, . . . , An−1 vлинейно зависимы (выполнено условие (II )).Докажем теперь, что (II ) ⇒ (I ). Если выполнено условие (II )(линейная зависимость векторов v, Av, . . . , An−1 v), то∃ ψ̄ ∈ S: (v, ψ̄) = (Av, ψ̄) = . . .
= (An−1 v, ψ̄) = 0.Используя представление экспоненциала в виде конечной суммы−sAe=n−1j=0153pj (s)Aj(10)с непрерывными коэффициентами pj (·) (см. раздел 1.2), определениечисла m, лемму 2 и равенства (10), получаем:t0 m = min c(X, ψ) c(X, ψ̄) =ψ∈S −sA(ev, ψ̄) ds =0⎛⎞t n−1t n−1 jj⎝⎠= pj (s)A v, ψ̄ ds = pj (s) A v, ψ̄ ds = 0.j=0j=000Отсюда следует равенство m = 0 (выполнение условия (I )).Итак, доказано утверждение (9); это влечёт утверждение (8), которое равносильно утверждению (7) леммы о внутренней точке интеграла.Замечание15.1.
Утверждение леммы о внутренней точке интеграласохраняется для множествt1−sAeX=t1У ds,tX=e(t−s)A У ds;t < t1 .tСледствие из леммы о внутренней точке интеграла. В случае области управления U = {−v, v}, t < t1 , объект локально управляем вначало координат на отрезке [t, t1 ] тогда и только тогда, когда векторыv, Av, . . .
, An−1 v линейно независимы.3.15.5 Достаточные условия локальной управляемости в началокоординатТеорема 15.2. Пусть1) M1 = {0};2) существует вектор v ∈ E n такой, что v ∈ U , −v ∈ U , и векторыv, Av, . . . , An−1 v линейно независимы.Тогда объект локально управляем в начало координат на любом отрезке [t, t1 ], t < t1 .2 Нужно доказать, что∃ ε > 0: Sε (0) ⊂ Z(t, t1 , {0}).154Имеем:t1Z(t, t1 , {0}) =e(t−s)A (−УU ) ds ⊃tt1⊃e(t−s)A (−У{−v,v} ) ds ⊃ Sε (0),ε > 0.tПоследнее включение при некотором ε > 0 записано на основаниилеммы о внутренней точке интеграла и замечания к ней.3.15.6 Теорема о достаточных условиях оптимальности в началокоординатТеорема 15.3.
Пусть1) M0 ∈ Ω(E n ), M1 = {0};2) существует вектор v ∈ E n такой, что v ∈ U , −v ∈ U и векторыv, Av, . . . , An−1 v линейно независимы;3) пара (x(t), u(t)) удовлетворяет принципу максимума Понтрягинана отрезке [t0 , t1 ].Тогда пара (x(t), u(t)), t0 t t1 , оптимальна.2 На основании теоремы 15.2 объект локально управляем в начало координат на любом отрезке [t, t1 ], t < t1 .
Оптимальность пары (x(t), u(t)), t0 t t1 , вытекает из теоремы 15.1 о достаточныхусловиях оптимальности в форме принципа максимума с условиемлокальной управляемости на множестве M1 , см. подраздел 3.15.2. Теоремы 15.2, 15.3 очень удобны при решении конкретных примеров.Пример 15.1. Рассмотрим линейную задачу быстродействия приt0 = 0, n = 2, M0 ∈ Ω(E n ), M1 = {0},0 12 u1 = 0A=, U = u∈E .0 0 |u2 | 1В случае M0 = {x0 } этот пример подробно рассмотрен в разделе 3.13, см. пример 13.1. Исследуем вопрос о локальной управляемости объекта в начало координат, используя теорему 15.2 о достаточ155ных условиях локальной управляемости в начало координат (подраздел 3.15.5).
Имеем 00v=∈ U, −v =∈ U;1−1векторы 0v=1и 1Av =0линейно независимы. Следовательно, объект локально управляем вначало координат на любом отрезке [t, t1 ], t < t1 (теорема 15.2). Наосновании теоремы 15.3 в рассматриваемом примере пара (x(t), u(t)),t0 t t1 , удовлетворяющая принципу максимума Понтрягина, оптимальна.Аналогичные выводы имеют место для примера 15.1 (проверитьсамостоятельно) с матрицами0 10 101A=, A=, A=.−1 01 00 −1Обратим внимание на то, что с помощью последних теорем, содержащих достаточные условия, не всегда удаётся обнаружить локальную управляемость и оптимальность для систем, фактически обладающих этими свойствами.
Это замечание иллюстрирует следующийпример.Пример 15.2. Рассмотрим задачу быстродействияẋ = u;x, u ∈ E 2 ;U = S1 (0),M0 ∈ Ω(E 2 ),M1 = {0}.Выясним вопрос о локальной управляемости в начало координат. Таккак здесь матрица A = 0, то векторы v, Av линейно зависимы при любом векторе v, теорема 15.2 неприменима (теорема 15.3 также неприменима). Рассматриваемый объект локально управляем в начало координат на любом отрезке [t, t1 ], t < t1 , см.
(6), так какZ(t, t1 , {0}) = St1 −t (0).В силу теоремы 15.3 в примере 15.2 любая пара (x(t), u(t)), t0 t t1 ,удовлетворяющая принципу максимума, оптимальна.1563.16Задача синтеза в простейших примерахС задачей синтеза мы встретились в разделе 3.13 при разборепримера 13.1. В разделе 3.16 рассмотрим ряд других примеров.Пример 16.1. Задача о наискорейшем успокоении математическогомаятника. Рассмотрим линейную задачу быстродействия при a0 1, A=,n = 2, t0 = 0, x0 =b−1 0U = {u ∈ E 2 : u1 = 0, |u2 | 1},M0 = {x0 },M1 = {0},т.е.
следующую задачу⎧ẋ1 = x2 ,x1 (0) = a, x1 (t1 ) = 0,⎪⎪⎨ẋ2 = −x1 + u2 , x2 (0) = b, x2 (t1 ) = 0,⎪ |u2 | 1, u ∈ U = {u ∈ E 2 : u1 = 0, |u2 | 1},⎪⎩t1 → min .(1)Мы знаем, что в этой задаче принцип максимума является не только необходимым, но и достаточным условием оптимальности (см. раздел 3.15, теорема 15.3).Выпишем сопряжённую переменную cos t sin tψ10ψ10 cos t + ψ20 sin t−tA∗ψ(0) =ψ(t) = e,=− sin t cos t ψ20−ψ10 sin t + ψ20 cos tψ10= 0 – вектор начальных значений сопряжённой пеψ20ременной.
Вторую координату ψ2 (t) сопряжённой переменной можнопредставить в формегде ψ(0) =ψ2 (t) = −ψ(0) sin(t − ϕ0 ).Точно так же, как и в примере 13.1, используя принцип максимума,приходим к выводу, чтоu2 (t) = sign ψ2 (t) = sign(− sin(t − ϕ0 )).Следовательно, оптимальное управление u2 (t) является кусочно-постоянной функцией, принимающей значения 1 и −1, причём расстояниемежду соседними точками переключения равно π (см. рисунок 16.1).157u = u2 (t)1 uϕ0 + π0ϕ0u = − sin(t − ϕ0 )−1tРисунок 16.1Рассмотрим системуẋ1 = x2 ,ẋ2 = −x1 ;(2)фазовые траектории этой системы, представленные на рисунке 16.2,являются окружностями с центром в начале координат, движение покоторым происходит в направлении часовой стрелки, причём один оборот фазовая точка выполняет за время, равное 2π.x2x10Рисунок 16.2Фазовые траектории системы (1) при u2 = 1, т.е. системыẋ1 = x2 ,ẋ2 = −x1 + 1,158(3)изображены на рисунке 16.3 а); они получены переносом траекторий системы (2) на 1 вправо.
Фазовые траектории системы (1) приu2 = −1, т.е. системыẋ1 = x2 ,(4)ẋ2 = −x1 − 1,изображены на рисунке 16.3 б); они получены переносом траекторийсистемы (2) на 1 влево.0u2 = −1u2 = +1x2O11M1x1N1Рисунок 16.3. a)O−1−1x20x1Рисунок 16.3. б)Из рисунка 16.3 ясно, что в начало координат при помощи управления u2 ≡ 1, удовлетворяющего принципу максимума, можно попастьиз точек фазовой плоскости, заполняющих полуокружность M1 O сцентром в точке O1 (1, 0). В случае управления u2 ≡ −1 эти точки заполняют полуокружность N1 O c центром в точке O−1 (−1, 0)(см. рисунок 16.4).Напомним, что длина интервала, на котором оптимальное управление сохраняет постоянное значение, не превосходит π.
За время πпо траекториям, изображённым на рисунке 16.3, фазовая точка описывает полуокружность.Выясним теперь вопрос о том, из каких точек фазовой плоскости возможен переход в начало координат при помощи оптимальногоуправления с одной точкой переключения. Рассмотрим сначала управ-159x2O−1O10N1M1x1Рисунок 16.4ление−1, 0 t < τ,u2 (t) =+1, τ < t t1 ,0 < τ < π,0 < t1 − τ < π.Такие начальные состояния x0 заполняют область I−+ , ограниченную полуокружностями M1 O, N1 O, N1 N2 , N2 P1 M1 . (см. рисунок 16.5).Для управлений+1, 0 t < τ,u2 (t) =−1, τ < t t1 ,0 < τ < π,0 < t1 − τ < π,мы получаем область I+− , (см.