Понтрягин Л.С. - Математическая теория оптимальных процессов (4-е издание) (955115), страница 24
Текст из файла (страница 24)
е л«*Ь ,32) линейно независимы. Определим, далее, функцию о(г,т,$) переменного (, где т и й — действительные параметры, считая ее равной и!дп$ на интервале между точками т и в+й и равной нулю вне этого интервала. Наконец, определим управление и = и(г,$г,...,$н), зависящее от и действительных параметров $1, ..., йн, положив (! в! «ял) ~. (( ! «вь), а-! это управление мы будем рассматривать на отрезке О ( ! ( Гь где !! — фиксированнне положительное число, и при достаточно малых в ) О и 5!, ..., $н.
Траектория, соответствующая управлени!о и(1, $!,..., $н) и исходящая в момент ! = О из некоторой точки хо, оканчивается (в момент ! = г!) в точке х, =х,(хо, $!, ..., $") = г, а — ' (*,->( — гК,о, «,, гча) (гг! о з-! (см. (3!)). «) Этот факт, относящийся н матричному исчислению, можно доказать, например, следующим образом. Пусть матрица М = а-'4 — Е; тогда она представляется в вице сходящегося матричного ряда г 3 М А! Аг !з П 21 31 Из этого следуст, что любая матрица С, представляющаяся в виде сходящегося степенного матричного ряда С = а«Е+ а!М+ а,М'+ а,И'+ ..., (««) перестановочна с матрнцей А. Каждое собственное значение матрицы М имеет вид е — '" — 1, где Х вЂ” собственное значение матрнны А, и потому существует такое е, ) О, что прн О ( е ( ел собственные значения матрицы М лежат в единичном круге.
Следовательно (см. Л. С. Понтрягин, Обыкновенные дяфференцпагьные уравненгщ, Физматгиз, 1961, стр. 302 — 3ОЗ), существует такая матрица С, пред- ТЕОРЕМЫ СУЩЕСТВОВАНИЯ Так как при $'= ... = $н=О сумма, стоящая в (33) под знаком интеграла, обращается в нуль, то х,(хо Г ° ° ., $")(л о.й 1" =О.
Р4) далее, так как (при достаточно малых $л и н) слагае- мое в (33), зависящее от йл, имеет вид ее+ 1 .ь '(ь-Ь ( .— ььь). зе ставимая в виде степенного ряда (**), что ес = М+ Е, т. е. ес е-ая. При этом собственные значения матрицы С можно предполагать как угодно близкими к нулю (при достаточно излом ео). Так как матрицы А н С псрестаиовочны, то из соотношения ес е-ьл вытекает, что есьея = Е, и потому все собственные значения льатрицы С+ еА имеют внд 2йпй Так как, кроме того, они близки к нулю (при малом ео), то все собственные значения матрицы С+ еА равны нулю. Пусть 8 — такая матрица, что матрица б = Я(С+ еА)Я-ь имеет жорданову форму. Тогда, умножая соотношение ее+эх Е слева иа 5, з справа на 5 — ', мы получим ео = Е, т.
е, Е=Е+ 6+ — бь+ — бь+ ... 1 1 2 6 (" ) Но так как все собственные значения матрицы б равны нулю, то все элементы втой матрицы, стоящие на главной диагонали и выше нее, равны нулю. Поэтому и матрицах бэ, б', 64, ... все элементы, стоящие непосредственно под главной диагональю, также равны нулю.
Тогда из ( ° ) следует, что и в матрице 6 все элементы, стоящие непосредственно под главной диагональю, равны нулю, т. е. б— нулевая матрица (напомиим, что 6 имеет жорданову форму). Следовательно, и С+ еА — нулевая матрица, т. е. С = — еА. Из ( ) следует теперь, что матрица А представляется в виде сходящегося степенного ряда А — — (аоЕ+ льМ+ аьМз+ а Мь+ ...). (, „) е Всякое инвариантное подпространство матрипы А является в силу( ) инвариаитиым подпрострапством и матрицы М.
Обратььо, всякое инвариантное подпространство матрицы М ивляетсн в силу ( ° ° ° ° ) инвариантным подпростраиством матрицы А. Таким образом, матрицы А и М (а значит также матрицы А и е сл = М+ Е) имеют общие ннвариаптные подпространства (если е настолько мало, что цроведенныс рассуждения применимы). 164 лингиные оптимальные БыстРОдейстВия [Гл. 3 то, дифференцируя соогношение (33), мы получим — =е'А(е-А'"Ь), й=), 2, ..., и.
~$ -о Отсюда вытекает, что якобиан переменных х'„х',, .... х", (т. е. координат точки х1) по переменным $', $а, ..., $" равен ~е'' ~ Ь, где Л вЂ” определитель матрицы, составленной из координат векторов (32). Так как определитель матрицы е"" отличен от нуля и, кроме того, при достаточно малом е, Л ~ О (ибо векторы (32) линейно независимы), то якобиан (35) отличен от нуля. Итак, мы можем выбрать в предыдущих построениях параметр В настолько малым, что якобиан (35) будет отличен от нуля. Кроме того, имеет место соотношение (34).
Из этого, в силу теоремы о неявных функциях, вытекает разрешимость уравнения х,(ха, $', Вх, ..., $") =О относительно $', В"', ..., ~" для всех значений хм принадлежащих некоторой окрестности Г начала координат О яХ. Иначе говоря, для любой точки хВя 'Р' существует такое кусочно-постоянное управление и (а именно, управление и(1, $',..., 5'"), О ( г ( г, при надлежащим образом выбранных 5', ..., ~"), которое переводит фазовую точку из положения ха в начало координат (за время 1~). Пусть теперь ха — произвольная точка пространства Х.
Заставим фазовую точку сначала двигаться из положения ха при управлении и(1) = О. Так как все собственные значения оператора А имеют отрицательные действительные часги, то по истечении некоторого времени движущаяся точка придет в окрестность Г, после чего ее, по доказанному, можно перевести в начало координат. Отсюда в силу теоремы !3 вытекает существование оптимального управления, переводящего фазовую точку из положения ха в начало координат. теОРемы сушествовхния Итак, теорема !4 доказана. Следствие.
Предположим, что начало координат пространства Е„ является внутренней точкой многогран.- ника Е/. Обозначим через Тт множество тех точек хоеи еиХ, которые могут быть (при помощи надлежаще выбранного управлении) переведены в начало координат О ~ Х за время, не превосходящее Т (где Т вЂ” некоторое положительное число). Тогда Хт есть замкнутое выпуклое множество пространства Х, имеющее внутренние точки (т.
е. выпуклое тело). Д о к а з а т с л ь с т в о. Обратимся к доказательству теоремы !4, взяв в нем о! = Т. Тогда мы получим такую окрестность У начала координат О ~ Х, что для любой точки хо ~ 'т' существует кусочно-постоянное управление, которое переводит фазовую точку нз положения хо в начало координат (за время Т) Иначе говоря, У с: г.т, т. е, начало координат является в н у т р е н н е й точкой множества гт. Замкнутость множества гт легко следует из теоремы существования. Остается доказать, что множество Хт выпукло.
Пусть х,=(х,', хп ..., х",) и хо=(х,', х'„..., х,") — две точки множества Тт, а и!(г) н и,(!) — управления, переводящие фазовую точку из положений х!„хо в начало координат за время, не превосходящее Т, Будем предполагать оба управления и!(1), ио(!) заданными на всем отрезке О ( ! ( Т, считая нх равными нулю от момента попадания фазовой точки в начало координат и до момента Т. Тогда ио(!) и ио(() — управления, заданные на отрезке О ~ ! = Т и переводящие за время Т фазовую точку из положений х! и хо в начало координат, т. е.
в силу (22) и т Т о,оо!(*! о о оо'я, оо оооо!) о. ч ! о л т Т о„от!(ч.о ( !о о!, оцо)!о!)=о. о ! о (36) (37) Пусть теперь а! и ао — произвольные положительные числа, удовлетворяющие условию а!+ ао — — 1; положим !5в лингппые оптимлльпыв выстгодвпствия [гл.э хо = а~х~+ азхм ив(1) = а~и,(!)+и,и,(!). Тогда точка хв расположена на отрезке, соединяющем точки х~ и хь а точка и,(!) — на отрезке, соединяющем точки и,(!) и из(!) (при любом 1, О < ! ( Т), так что и0(!)я (7 при любом ! (ибо (7 — выпуклый многогранник) .
Таким образом, и0(!) — допустимое управление, заданное на отрезке 0 =1( Т. Умножая соотношения (36), (37) соответственно на аь ол и складывая, получаем Таким образом, управление ив(1) переводит фазовую точку из положения хв в начало координат за время 7, т. е. хв е=Хт. Итак, любая точка отрезка, соединяющего точки х~ и хм принадлежит множеству Хт, и потому множество Хт выпукло. й 20. Синтез оптимального управления В главе 1 мы рассмотрели на конкретных примерах задачу синтезирования оптимальных управлений. Эта задача имеет смысл для произвольного управляемого процесса (см.
формулу (4) в 5 2). Однако здесь мы будем рассматривать лишь линейные системы вида (1), удовлетворяющие условиям, указанным в формулировке теоремы 14 (по поводу условия устойчивости оператора А см. замечание в конце этого параграфа). Для таких систем имеют место теоремы существования и единственности (теоремы 14 и 12), благодаря чему задача синтеза является в принципе решенной. Приводимые здесь соображения дают конструктивный метод решения этой задачи. Осуществление этого метода в каждом конкретном случае требует, однако, ряда построений.
Синтезирование оптимального управления линейной системы (1) было осуществлено ранее (совершенно другими методами, т. е. без использования принципа максимума) лишь для случая одного управляющего параметра (т. е. при г= 1) — А. А. Фельдбаумом при действительных собственных значениях оператора А и Д. Бушоу в случае, когда и = 2, а собственные значения Ф м1 синтез оптимхльного упРАВления 157 оператора Л комплексны. Использование принципа максимума дает возможность значительно проще получить указанные результаты (см. примеры, изложенные в $5).