Лекции по ОУ (1050564), страница 3
Текст из файла (страница 3)
Соответственно значение x(t 0 ) называют левым концом траектории, x (t1 ) – правым концом траектории системы (1.3.1).1.4. Линейные системы. Формула КошиВажным частным случаем обыкновенной системы (1.3.1) являются линейные обыкновенные системы, которые моделируют линейные технологические и экономические процессы. Это системы следующего вида:dx1= a11 (t )x1 (t ) + ... + a1n (t )xn (t ) + b1 (u1 (t ),..., u m (t )) ,dt9…dxn= an1 (t )x1 (t ) + ... + ann (t )xn (t ) + bn (u1 (t ),..., u m (t )) .dt(1.4.1)В дальнейшем будем пользоваться матричной записью системы (1.4.1), для чеговведем обозначения:⎡ a11 (t ) ...
a1n (t )⎤...... ⎥ ,A(t ) = ⎢ ...⎥⎢⎢⎣an1 (t ) ... ann (t )⎥⎦⎡ b1 (u1 (t ),..., u m (t ), t )⎤⎥....b(u (t ), t ) = ⎢⎥⎢⎢⎣bn (u1 (t ),..., u m (t ), t )⎥⎦Тогда (1.4.1) можно записать в видеdx= A(t )x(t ) + b(u (t ), t ) .dt(1.4.2)Систему, записанную в матричном виде, часто называют просто уравнением. Система (1.4.2) называется линейной по управлению, еслиb(u (t ), t ) = B(t ) u (t ) , где B(t ) – матрица размерности n × m . Если матрицы A и Bне зависят от времени t , т.е. постоянны, то линейная по управлению системаназывается стационарной. Таким образом, линейная стационарная системаимеет видdx= Ax(t ) + Bu (t ) .dt(1.4.3)Пусть для уравнения (1.4.3) задано начальное условиеx(t 0 ) = x0 .(1.4.4)Решение полученной задачи Коши определяется следующей формулой:x(t ) = eA (t − t 0 )tx0 + e A(t −τ ) Bu (τ )dτ ,∫(1.4.5)t0которую называют формулой Коши.
Здесь e A(t −t0 ) – матричная функция, называемая экспоненциалом матрицы A . По аналогии с известной из математического анализа формулойt t2tne = 1+ + +K+ +K,n!1! 2!t10экспоненциал e D квадратной матрицы D размерности n × n определяется каксумма матричного ряда:111e D = E + D + D 2 + K + D n + K .,1!2!n!(1.4.6)где E – единичная матрица размерности n × n . Таким образом, экспоненциалe D – это квадратная матрица n -го порядка. Сходимость матричного ряда (1.4.6)понимается в смысле поэлементной сходимости, т.е.(e )Dij= (E )ij +( )1(D )ij + 1 D 21!2!ij+K+( )1 nDn!ij+ K.В случае D = tA , где A – n × n матрица, t – скалярный множитель, имеемeAttt2 2tn n= E + A + A +K+ A +K.1!2!n!Покажем, что функция x(t ) , определенная формулой (1.4.5), действительно является решением задачи Коши (1.4.3), (1.4.4).
Очевидно,x(t 0 ) = e A(t0 −t0 ) x0 = e 0 x0 = Ex0 = x0 ,т. е. начальное условие (1.4.4) выполняется. Чтобы проверить, что функция(1.4.5) удовлетворяет уравнению (1.4.3), подсчитаем сначала производнуюd A(t −t0 )e. Как уже говорилось, каждый элемент матрицы e A(t −t0 ) – это суммаdtстепенного ряда с радиусом сходимости, равным ∞ , а степенной ряд можнопочленно дифференцировать сколь угодно раз, причем радиус сходимости приdэтом не изменяется. Следовательно, производная e A(t −t0 ) существует и вычисdtляется следующим образом:2n⎞(t − t0 )d A(t −t0 ) d ⎛⎜2 (t − t 0 )n (t − t 0 )e= ⎜E + A+A+L+ A+ L⎟⎟ =dtdt ⎝n!1!2!⎠n −1n −1⎛⎞(()t − t0 )−ttAt1n−0= 0 + A + At + L + A+ L = A⎜⎜ E ++L+ A+ L⎟⎟ =(n − 1)!(n − 1)!1!⎝⎠= Ae A(t −t0 ) .Так как x0 – постоянный вектор, то, дифференцируя первое слагаемое в (1.4.5),получим:()d A(t −t0 )ex0 = Ae A(t −t0 ) x0 .dt11(1.4.7)Чтобы подсчитать производную от второго слагаемого в (1.4.5), воспользуемся формулой дифференцирования интеграла по параметру [2].
Согласноэтой формуле будем иметьtt00de A(t −τ ) Bu (τ )dτ = e A(t −t ) Bu (t ) + ∫ Ae A(t −τ ) Bu (τ )dτ =∫dt ttt= Bu (t ) + A ∫ e A(t −τ ) Bu (τ )dτ .(1.4.8)t0Используя (1.4.7) – (1.4.8), найдем производную функции, определенной формулой (1.4.5):tdx= Ae A (t − t 0 ) x 0 + Bu (t ) + A e A (t − τ ) Bu (τ )d τ =dtt∫0⎡= A ⎢ e A (t − t 0 ) x 0 +⎢⎣t∫et0A (t − τ )⎤Bu (τ )d τ ⎥ + Bu (t ) = Ax (t ) + Bu (t ).⎥⎦Полученное равенство показывает, что функция x(t ) , определенная формулой(1.4.5), удовлетворяет системе (1.4.3) и, следовательно, является решениемуравнения (1.4.3). Выполнимость начального условия уже доказана.122.
ОПТИМИЗАЦИЯ СИСТЕМ УПРАВЛЕНИЯПри исследовании систем управления, моделирующих различные явления в науке, технике, экономике, часто возникает проблема оптимизации, илизадача оптимального управления изучаемым процессом.Задачи оптимального управления относятся к наиболее сложным в теорииоптимизации. Самая же простая в этой теории – задача нахождения экстремума(минимума или максимума) функции одной переменной. Ее естественнымобобщением является задача нахождения экстремума функции многих переменных. Решение этой задачи представляет собой конечный вектор, элементвекторного пространства, поэтому задачи такого характера называются задачами конечномерной оптимизации.Дальнейшее обобщение и усложнение в теории оптимизации составляетисследование экстремума функционала.
Существенным отличием здесь отпредшествующих задач является то, что решение представляет собой не конечный вектор, а функцию, элемент бесконечномерного функционального пространства. Отсюда вытекает вся сложность таких задач, и к ним относятся задачи оптимального управления.2.1. Задача оптимизации функционалаРассмотрим множество M произвольной природы. Говорят, что на множестве M задан функционал F , если известно правило, по которому каждомуэлементу v ∈ M ставится в соответствие определенное действительное число c .При этом пишут: F (v ) = c .
Множество M называется областью задания, илиобластью определения функционала F . Элементы множества M называют аргументами функционала. Функционал осуществляет отображение множестваM на множество действительных чисел и является обобщением понятия функции. Приведем примеры функционалов.Пример 1. Пусть M – это множество плоских фигур, ограниченных замкнутыми кривыми. Каждой фигуре v ∈ M поставим в соответствие ее площадьS = F (v ) . Тем самым будет определен функционал F с областью задания M .Пример 2. Пусть M – это множество функций, заданных и непрерывныхна отрезке [a, b]. Каждой функции y = y ( x ) из M поставим в соответствие действительное число F ( y ) , равное ее интегралу на отрезке [a, b]:13b∫ y(x )dx = F ( y ).aЭто соотношение определяет функционал F с областью задания M .Приведем основные сведения из теории экстремума функционалов.
Будемрассматривать в качестве области задания функционалов пространство непрерывных функций, определенных на отрезке [a, b], которое обозначается C [a, b].Определение2.1.1.Расстояниеммеждудвумяфункциямиx1 (t ), x2 (t )∈ C [a, b] называется числоρ( x1 , x2 ) = max x1 (t ) − x2 (t ) .a ≤t ≤bОпределение 2.1.2.
ε -окрестностью функции x0 (t )∈ C [a, b] называетсясовокупность функций x(t ) , расстояние которых от x0 (t ) меньше ε :ρ( x, x0 ) < ε .Определение 2.1.3. Функционал F ( x ) называется непрерывным приx = x0 (t ) , если для любого ε > 0 существует δ > 0 такое, что для всех функцийx(t ) , удовлетворяющих условию ρ( x, x0 ) < δ , выполняется неравенствоF ( x ) − F ( x0 ) < ε .Определение 2.1.4.
Функционал F ( x ) называется линейным, если онудовлетворяет условиям:1) F (cx ) = cF ( x ) ,где c – произвольная постоянная;2) ∀x1 , x2 ∈ C [a, b] F ( x1 + x2 ) = F ( x1 ) + F ( x2 ) .Определение 2.1.5. Функционал F ( x ) , заданный на выпуклом множестве,называется выпуклым, если при всех x, y ∈ C [a, b] и всех λ , (0 ≤ λ ≤ 1) выполняется неравенствоF (λx + (1 − λ ) y ) ≤ λF ( x ) + (1 − λ )F ( y ) .Если в этом условии при x ≠ y равенство возможно только при λ = 0 или λ = 1 ,то функционал называется строго выпуклым.Определение 2.1.6.
Функционал F ( x ) называется ограниченным снизу(сверху), если существует число A , такое, что при всех x из области определения функционала выполняется неравенство F ( x ) ≥ A (F ( x ) ≤ A) .Обозначим через δ x разность между двумя функциями ~x , x ∈ C [a, b] :δ x(t ) = ~x (t ) − x(t ) .14Эта разность называется вариацией, или приращением аргумента x(t ) . Приращению аргумента δ x будет соответствовать величинаΔ F = F ( x + δx ) − F ( x ),которая называется приращением функционала.
Предположим, что приращениефункционала F ( x ) можно представить в видеΔ F = L ( x , δx ) + β( x , δx ) δx ,гдеL( x, δx ) – линейный по отношению кδxфункционал,δ x = max δ x (t ) (норма функции δx(t ) ), и при δx → 0 β( x, δx ) → 0 .a≤t≤bОпределение 2.1.7. Линейная часть приращения L( x, δx ) функционалаF ( x ) называется вариацией функционала и обозначается δF .
Сам функционалназывается дифференцируемым в точке x = x(t ) .Определение 2.1.8. Говорят, что функционал F ( x ) достигает в точкеx = x0 (t ) относительного (или локального) минимума, если для всех функцийx(t ) , принадлежащих некоторой ε – окрестности функции x0 (t ), имеет местонеравенствоF ( x ) ≥ F ( x0 ) .(2.1.1)Определение 2.1.9. Говорят, что функционал F ( x ) достигает в точкеx = x0 (t ) относительного (или локального) максимума, если для всех функцийx(t ) , принадлежащих некоторой ε -окрестности функции x 0 (t ) , имеет место неравенствоF ( x ) ≤ F ( x0 ) .(2.1.2)Если неравенства (2.1.1), (2.1.2) заменить на строгие, то получим определение строгого относительного минимума и строгого относительного максимума соответственно.Если неравенство (2.1.1) выполняется для всех функций из множестваC [a, b], то говорят, что функционал F ( x ) достигает на C [a, b] абсолютного (илиглобального) минимума в точке x0 (t ).Если неравенство (2.1.2) выполняется для всех функций из множества C [a, b],то говорят, что функционал F ( x ) достигает на C [a, b] абсолютного (или глобального) максимума в точке x0 (t ).Минимум и максимум имеют общее название – экстремум.
Задачу отыскания экстремума функционала кратко записывают в видеF ( x ) → extr.(2.1.3)Каждая точка, в которой достигается экстремум, называется решением задачи(2.1.3) (локальным или глобальным). Решение может быть не одно.15Пусть U – некоторое подмножество C [a, b]. Рассмотрим задачу отыскания экстремума F ( x ) на множестве U :F ( x ) → extr , x ∈U .(2.1.4)Задачу (2.1.4) называют задачей на условный экстремум, в то время как задача(2.1.3) – это задача на безусловный экстремум (или задача безусловной оптимизации).