Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения, страница 3
Описание файла
PDF-файл из архива "Ю.Н. Киселёв, С.Н. Аввакумов, М.В. Орлов - Оптимальное управление. Линейная теория и приложения", который расположен в категории "". Всё это находится в предмете "вариационное исчисление" из 7 семестр, которые можно найти в файловом архиве МГУ им. Ломоносова. Не смотря на прямую связь этого архива с МГУ им. Ломоносова, его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
В 1.2приводится обоснование формулы Коши для линейных систем с постоянными коэффициентами, изучается экспоненциал матрицы, рассмотрены примеры.141.2.1Формула Коши для решения начальной задачи в случае линейной системы обыкновенных дифференциальных уравненийСкалярный случай (n = 1). Рассмотрим задачу Кошиẋ = ax + u(t),x(t0 ) = x0 ,(1)где x = x(t) – неизвестная скалярная функция аргумента t, u(t) –известная непрерывная функция, a – заданное число, x0 – заданноеначальное условие, t – независимая переменная (время), t0 – начальный момент времени.Решение задачи Коши (1) определяется следующей формулой:⎛⎞t(t−t0 )a ⎝−(s−t0 )ax(t) = ex0 +eu(s) ds⎠ .(2)t0В этом можно убедиться непосредственной проверкой. Действительно, функция (2) удовлетворяет начальному условию x(t0 ) = x0 иявляется решением дифференциального уравнения, так как⎛⎞tẋ(t) = a e(t−t0 )a ⎝x0 +e−(s−t0 )a u(s) ds⎠ + e−(t−t0 )a e(t−t0 )a u(t) =t0= ax(t) + u(t).Формула (2) называется формулой Коши.Замечание 2.1.
Если u(t) – кусочно-непрерывная функция со скачками в точках τ1 , . . . , τs , то формулой (2) определяется непрерывная кусочно-дифференцируемая функция x(t), которая удовлетворяет дифференциальному уравнению ẋ(t) = ax(t) + u(t) ∀t = τ1 , . . . , τs ;производная ẋ(t) в точках τ1 , . . . , τs имеет конечные скачки (см. рисунок 2.1).Общий случай (n > 1). Рассмотрим задачу Кошиẋ = Ax + u(t),Здесь⎛⎞⎛x1a11⎜ .. ⎟x = ⎝ . ⎠, A = ⎝ . . .an1xn.........x(t0 ) = x0 .(3)⎞⎞⎛⎛⎞u1 (t)x01a1n⎟⎟⎜⎜. . . ⎠, u(t) = ⎝ ... ⎠, x0 = ⎝ ... ⎠;annun (t)x0n15u = u(t)u0τ2t0 τ1τsx0tx = x(t)t0 τ1τ2τstРисунок 2.1x = x(t)– неизвестная векторная функция, u(t) – заданная непрерывная векторная функция, A – постоянная квадратная матрица, x0 –вектор начальных условий. Решение⎛⎞x1 (t)⎜⎟x(t) = ⎝ ... ⎠xn (t)задачи Коши (3) определяется формулой⎛⎞te−(s−t0 )A u(s) ds⎠ ,x(t) = e(t−t0 )A ⎝x0 +(4)t0или(t−t0 )Ax(t) = etx0 +e(t−s)A u(s) ds.(5)t0Формулы (4), (5) называются формулами Коши.
В однородномслучае (u(t) = 0) решение задачи Коши ẋ = Ax, x(t0 ) = x0 , определяется формулой(6)x(t) = e(t−t0 )A x0 .16В формулах (4)-(6) участвует матричная функция e(t−t0 )A , называемая экспоненциалом матрицы A. В разделе 1.2.2 вводится понятие экспоненциала, изучаются его основные свойства. После этогонетрудно обосновать формулу Коши.1.2.2 Экспоненциал постоянной квадратной матрицы.
Его основные свойства. Обоснование формулы КошиРассмотрим квадратную матрицу n-ого порядка⎞⎛d11 . . . d1nD = ⎝. . . . . . . . . ⎠dn1 . . . dnnnD = (D)ij, (D)ij = dij , i, j = 1, . . . , n.i,j=1Напомним известную из математического анализа формулу∞et = 1 + tkt2tkt+ + ... ++ ... =.1! 2!k!k!k=0Этот степенной ряд сходится при всех t.Определим теперь экспоненциал eD матрицы D, положив∞eD = E + 1111D + D2 + . . .
+ Dk + . . . =Dk .1!2!k!k!(7)k=0Здесь 0! = 1; DO = E – единичная матрица n-го порядка.Таким образом, экспоненциал определён как сумма матричного ряда (7), члены которого являются квадратными матрицами порядка n.Экспоненциал eD – квадратная матрица порядка n. Сходимостьматричного ряда (7) понимается в смысле поэлементной сходимости,т.е.(eD )ij = (E)ij +111(D)ij + (D2 )ij + . . . + (Dk )ij + . . .
.1!2!k!(8)В случае D = tA, где t – скалярный множитель (в приложенияхt – время), A – (n × n)-матрица, получаемetA = E +t2ttkA + A2 + . . . + Ak + . . .1!2!k!17(9)Теорема 2.1 (об основных свойствах экспоненциала).1) Для любой (n×n)-матрицы D существует экспоненциал eD (сходится матричный ряд (7), т.е.
сходятся n2 числовых рядов (8));2) если A, B – две перестановочные (AB = BA) (n × n)-матрицы,тоeA · eB = eA+B ;3) матрица eD невырождена, причём её обратная матрица определяется равенством D −1e= e(−D) ;4) пусть D = tA; матричная функция etA непрерывно дифференцируема, причёмd tAe = AetA = etA A .dt2 Доказательство.1) Докажем сходимость числовых рядов (8) для любой матрицы D.Для этого оценим общий член рядов (8). Пусть|(D)ij | d,i, j = 1, . .
. , n.Тогдаn 2 (D)iα (D)αj n d 2 , D ij = α=1 3 D ij n2 d 3 ,................................... k D ij nk−1 dk ,индукция...................................Отсюда получаем оценку общего члена ряда (8):k1 (Dk )ij 1 (nd) . n k! k!18(10)Теорема сравнения для числовых рядов, сходимость ряда∞end − 11 (nd)k=n k!nk=1и неравенство (10) позволяют сделать заключение о сходимостивсех n2 рядов (8), причём эти ряды сходятся абсолютно. Итак, экпоненциал eD определен для любой матрицы D.2) Пусть AB = BA. Тогда(A + B)2 = (A + B)(A + B) = A2 + AB + BA + B 2 = A2 +2AB +B 2 ,(A + B)3 = A3 + 3A2 B + 3AB 2 + B 3 ,.......................................................................(A + B)m= Am + mAm−1 B + .
. . + mAB m−1 + B m =m m!m!Ak B m−k =Ak B l ,=k!(m − k)!k! l!k+l=mk=0(11)k, l0т.е. для перестановочных матриц A, B имеет место формула биномаm!Ньютона,– биномиальные коэффициенты. Привлекая (7),k!(m − k)!(11), получаем:∞ ∞∞ ∞ 11m! k lAB (7)kle ·e =AB =A B =·k!l!k! l!k=0l=0k=0 l=0⎞⎛∞∞1 ⎜m! k l ⎟ 1(7)=A B⎠=(A + B)m = eA+B .⎝m!k!l!m!k+l=mm=0m=0k, l0Задача 2.1. Привести примеры матриц A, B, для которыхeA · eB = eA·B .3) Невырожденность экпоненциала и формула для его обращениявытекают из части 2) рассматриваемой теоремы. Действительно, всилу перестановочности матриц D и (−D) получаем:eD · e−D = eD−D = eO = E,19eD · e−D = E.4) Докажем, что матричная функция etA непрерывно дифференцируема по аргументу t, т.е.
каждый её элемент (etA )ij – непрерывнодифференцируемая функция аргумента t. Так какetAij=∞ ktk=0k!(Ak )ij(12)– сумма степенного ряда относительно аргумента t (радиус сходимости этого ряда равен ∞), и степенные ряды можно дифференцироватьсколько угодно раз, причём при дифференцируемости радиус сходимости не изменяется, то функции (12) аналитические. Следовательно,d(etA ), причёмсуществует производная dtd tA de=dtdttkt2E + tA + A2 + . . . + Ak + . .
.2!k!=tk−1Ak + . . . =(k − 1)!tk−1Ak−1 + . . . = AetA = etA A .= A E + tA + . . . +(k − 1)!= A + tA2 + . . . +Таким образом,d tA e= A etA ,dtetA t=0= E.(13)Это свойство экcпоненциала позволяет проверить справедливостьформулы Коши при n > 1 (подобно тому, как это было сделано вышепри n = 1).
Действительно, для векторной функции x(t), определяемой формулой (4), выполняется начальное условие x(t0 ) = x0 и, крометого,⎛ẋ(t) = Ae(t−t0 )A ⎝x0 +t⎞e−(s−t0 )A u(s) ds⎠ +t0+ e(t−t0 )A e−(t−t0 )A u(t) = Ax(t) + u(t),т.е. функция (4) является решением задачи Коши (3).Итак, доказана20Теорема 2.2.
Решение задачи Коши (3) существует и определяетсяформулой Коши (4) или (5). Кроме того, решение задачи Коши (3)единственно.Задача 2.2. Доказать единственность решения задачи Коши (3).Задача 2.3. Проверить, что tA ∗∗e= et(A ) , esA · etA = e(t+s)A ,где t, s ∈ E 1 , ∗ – знак транспонирования.Замечание 2.2. Если непрерывная функция u(t) определена наинтервале (a, b), содержащем точку t0 , то решение задачи (3) определено на всем интервале (a, b) и описывается на этом интервалеформулой Коши (4).
Таким образом, формула Коши (4) применимакак при t > t0 , так и при t < t0 .Пример. Найти решение задачи Кошиẋ = x + 1,x(0) = 1.Здесь n = 1, a = 1, t0 = 0, x0 = 1, u(·) ≡ 1. Применение формулы (2) даёт:⎛x(t) = et ⎝1 +t⎞e−s · 1 ds⎠ =0= ets=t e−s 1+= et (1 − e−t + 1) = 2et − 1.−1 s=0Формулу Коши (4), (5) целесообразно запомнить, так как исследование линейной задачи быстродействия основано в значительнойстепени на применении формулы Коши.1.2.3Примеры вычисления экспоненциала для конкретных матриц0 1tAПример 2.1. Найти экспоненциал e матрицы A =.0 02kПрямое вычисление даёт A = 0; следовательно, A = 0 при k 2,и ряд (7) содержит лишь 2 члена: 1 00 11 ttAe = E + tA =+t=.0 10 00 121Итак,tAe1=0t,1−tAe=−t,110Пример 2.2.
Найти экспоненциал etAНаходим:A2 = −E,A3 = −A,A4 = E,A5 = A,.........1 0e=.−t 10матрицы A =−1−tA∗1.0A6 = −E,A7 = −A,A8 = E,A9 = A,.........Применение формулы (7) даёт:t3t4t5t6t2etA = E + tA + (−E) + (−A) + E + A + (−E) + . . . =2!3!6! 4! 3 5! 5t2t4tt= 1 − + − ... E + t − + − ... A =2! 4!3! 5!= cos(t) E + sin(t) A.(14)Таким образом,tAeetA∗ 1 00 1cos t sin t= cos t+ sin t=,−1 0− sin t cos t0 1∗cos t − sin t=,e−tA = etA .sin tcos tВ примерах 2.1, 2.2 экспоненциал etA получен вычислением ряда (7). Рассмотрим теперь другой приём нахождения экспоненциалана основе его свойства (13).01Пример 2.3.
Найти экспоненциал etA матрицы A =.0 −11) Покажем, что1 1 − e−tetA =.(15)0e−tДля доказательства формулы (15) достаточно проверить, что матрица, стоящая в правой части (15), удовлетворяет условиям (13). Эта22матрица при t = 0 превращается в единичную матрицу, далее d 1 1 − e−t0e−t=,e−t0 −e−tdt 00e−t011 1 − e−t=,0e−t0 −e−t0 −1и формула (15) доказана.
Недостатком этого способа является то, чтоне указан способ получения самой формулы (15).2) Рассмотрим метод получения (15) на основе свойства (13). Запишем экспоненциал в форме y1 (t) z1 (t)etA == y(t) z(t) .y2 (t) z2 (t)y1 (t)Его первый столбец y(t) =находим, решая задачу Кошиy2 (t) 1ẏ = Ay, y(0) =,0причём вектором начальных условий служит первый столбец единичной матрицы. Последняя система в координатной форме имеет вид:ẏ1 = y2 ,y1 (0) = 1,ẏ2 = −y2 ,y2 (0) = 0.Решая её, получаем:y1 (t) ≡ 1,y2 (t) ≡ 0, 1y(t) ≡.0Для нахождения второго столбца z(t) экспоненциала решаем задачуКоши 0ż = Az, z(0) =.1Получаем:z1 (t) = 1 − e−t ,z2 (t) = e−t ,z(t) =1 − e−t.e−tТаким образом, мы пришли к формуле (15).23Обратим внимание на то, что экспоненциал (15) может быть записан в форме(16)etA = p0 (t) E + p1 (t) A,где p0 (t) = 1, p1 (t) = 1 − e−t .
Аналогичное представление было получено для экcпоненциала из примера 2.2, см. (14), где p0 (t) = cos(t),p1 (t) = sin(t). Это наблюдение позволяет применить для нахожденияэкспоненциала следующий метод.3) Ищем экспоненциал в форме (16), где функции p0 (t), p1 (t) подлежат определению. Полагая в (16) t = 0, получаем 1 0p0 (0) p1 (0),=0p0 (0) − p1 (0)0 1откуда следует, что функции p0 (t), p1 (t) должны удовлетворять начальным условиям(17)p0 (0) = 1, p1 (0) = 0.Дифференцируя (16) по t, получаемAetA = ṗ0 (t) E + ṗ1 (t) A;(18)подстановка (16) в (18) даётp0 (t) A + p1 (t) A2 = ṗ0 (t) E + ṗ1 (t) A,откуда, принимая во внимание равенство A2 = −A, находимṗ0 (t) E + ṗ1 (t) + p1 (t) − p0 (t) A = 0,т.е.