Понтрягин Л.С. - Математическая теория оптимальных процессов (2-е издание) (955113), страница 22
Текст из файла (страница 22)
При т = 1 лемма, очевидно, справедлива, ибо функция 7', (1) е" ' имеет те же корни, что и функция >> (~) и потому имеет не более чем й> действительных корней. Предположим, что лемма уже доказана для случая, когда в формуле (17) имеется меньше чем т слагаемых, и докажем ее для случая >е слагаемых. Допустим, что лемма неверна и функция (17) имеет по крайней мере й, + ез + ... + е + т действительных корней. Умножив функцию (17) на е ~~' (что не изменит ее корней), мы получим функцию 7,(С)с<к — лт>'+... +7 д(1) е<" 1-ь, >'+7' (Г), (18) которая также имеет по крайней мере Й, + Й,+ ... + й„,+т действительных корней.
Так как между каждыми двумя действительными корнями функции лежит по крайней мере один корень ее производной, то (е + 1)-я производная функции (18) имеет по крайней мере (й,+...+й + т) — (й + 1)=й +...+й +(т — 1) действительных корней. Но (е + 1)-я производная функции (18), как нетрудно видеть, имеет вид у, (О е"' '""+ уФ) с"* '""+ ...+Р,(1)е~~ -1 ~ >', (19) причем числа Л, — Л, Л, — Л, ..., Л, — Л, очевидно, попарно различны, а степень многочлена я> (~) по-прежнему равна йо Согласно предположению индукции, функция(19) имеет не болеейг+ е, + ...
+ л,+ (и — 1) — 1 действительных корней, вопреки тому, что было сказано ранее. Полученное противоречие и завершает индукцию. Таким образом, лемма доказана. 5 18. Теоремы единственности Решим уравнение (2), как неоднородное, методом вариации постоянных. Для этого обозначим через 138 ЛИНЕЙНЫЕ ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ стл. 3 фундаментальную систему решений однородного уравнения ссх —,=Ах, сСс удовлетворяющую начальным условиям ф1 (1в) = 6'., а через сР'(1) ф'(1) ф" (1) — фундаментальную систему решений однородного уравнения (5), удовлетворяющую начальным условиям сЯ (1в) = бс.
Легко видеть, что для всех 1 имеет место соотяошение (срв(1), фс(1))=бс, с, 1'=1, 2, ..., и. (21) В самом деле, в силу выбора начальных условий это соотношение выполнено при 1 = 1в; далее, — ", (Р'(1), рс(1))=( — А*Р'(1), фс(1))+(Р'(1), Арс(1)).=О.
Будем искать общее решение уравнения (2) в виде и х(1) = ~Ч~ ~ср„(1) с" (1). Подставляя это решение в уравнение (2), получим ~ ср„ (1) = Ви (1); и= 1 умножая последнее соотношение скалярно на ср' (1) и учитывая соотношеное (21), получаем Таким образом, реисение уравнения (2) при произвольном управлении и(1) и начальном условии х (1в) = хв = = (х'„хз„..., х,") записываетсл в виде и с х(1)= ~Чсср„(1) (х',+$(сР" (с)э Ви(т))с1т). (22) х=с ТЕОРЕМЫ ЕДИНСТВЕННОСТИ 139 я 18! Т е о р е м а 11. Пусть и! (1) и и, (с) — два оптимальных управления, заданных соответственно на отрезках = ! < с! и оо ( о = во и переводящ х точку х, в одну и ту же точку х!. Тоэда эти управления совпадают (см.
сноску на стр. 130), т. е. в! —— !э и и, (в) = ио (1) на отрезке со = с ~ с!. Д о к а э а т е л ь с т в о. Прежде всего ясно, что 11=18, ибо если бы было, например, с! ( 18, то управление и = ио (!) не было бы оптимальным. Так как при 8 = в! обе траектории, исходящие иэ точки хо и соответствУющие УпРавлениЯм и, (1) и и, (г), приходят в одну и ту же точку х„то мы имеем (в силу (22)) *,= Ь,со)( со-'1)о со, в,со)в)= о=! и / -Хо,со(и,1)оо),в,о)) >, в=! с, откуда и Г' Со ~о,со)($)о сс), в,,в))а — 1)) сс), в,,о))в+о. в=с с, св Так как векторы ф, (в!), ..., фи (Г!) линейно независимы, то иэ последнего равенства следует, что $(фс(!), Ви,(Г))дГ=)(ф!(Г), Ви,(Г))дГ, 1=1, ..., и. (23) Оптимальному управлению и! (1) соответствует вектор- функция с)) (в), удовлетворяющая условию (б) и являющаяся решением уравнения (5). Начальное эначение этой функции (при в = во) обозначим через фв=(фсв ..
с фив)' тогда решение с() (с) можно записать в виде и ф(Г)ии ХФ оф'(с) 1 140 линвйныв оптимлльныз выстгодвнствия ~гл, г Умножая соотношение (23) на ф и суммируя по 1, получаем 1 ° н $ (ф (с), Ви1 (г)) дт = $(ф (с), Ви (с)) сВ. (24) Но так как, согласно соотношению (6) и определению величины Р (ф), мы имеем (на отрезке ~г ( с ( гд) (ф(й), Ви,(Е)) =Р(ф(1)))(ф(г), Ви (Е)), то из (24) вытекает, что (ф (с), Ви1 (Е)) = (ф (г), Ви, (с)). Следовательно, оба управления ит (С), и, (Е) удовлетворяют соотношению (6) с одной и той же функцией ф (с), и потому (в силу теоремы 9) ит (с) = и, (с).
Итак, теорема 11 доказана. Будем называть управление и (г), со ( ~ ( ~, экстремальным, если оно удовлетворяет условию (6), где ф (~)— некоторое нетривиальное решение уравнения (5). Для нахождения о п т и м а л ь н о г о управления, переводящего фазовую точку из положения хг в положение х„ можно найти сперва все з к с т р е м а л ь н ы е управления, переводящие фазовую точку из положения х, в положение х„а затем выбрать из их числа то (единственное в силу теоремы 11), которое осуществляет этот переход за кратчайшее время. Возникает вопрос: может ли существовать несколько экстремальных управлений, переводящих фазовую точку из положения хь в, положение х,? Вообще говоря, их может существовать несколько.
Нижеследующая теорема указывает важный случай единственности для экстремальных управлений. Т е о р ем а 12. Предположим, что начало координат пространства Е„является внутренней точкой многозранника П, и пусть и, (1) и и, (с) — два экстремальных управления, заданных соответственно на отрезках гь ( ~ .== 11 и 8е ~ 1 ( 8з и переводящих точку хг в начало координат х,=О пространства Х.
Тогда эти управления совпадают, т. е. г1 — — гг и и, (8) = и, (Е) на отрезке Еь ( з ~ К,. До к а за тельство. Обозначим через х, (й) и х,(с) траектории, соответствующие управлениям и1 (8) и иг (С) и исходящие в момент гг из точки хо. Согласно условиям ТЕОРЕМЫ ЕДИНСТВЕННОСТИ 141 1 181 теоремы мы имеем хд (С,) = х, (Сд) = О, или (в силу (22)) вв с Хв,сво(ч~1св Со, о .св)овв)=о, вв 1 и / с ° 2в,СвО(,у-,.1СО СвО, в,,овсов)=о. вв — 1 со Отсюда (в силу линейной независимости векторов (20) при любом С) вытекают равенства (д = 1, 2, ..., п) с, св — х', = $(фс(С), Ви, (С))сСС = ~(дрс(С), Ви, (С)) сй.
(25) Св Допустим для определенности, что Сд ) С„и пусть ср (С)— то решение уравнения (5), для которого на отрезке С ( С ~ -=. С, имеет место соотношение (др (С), Вид (С)) = Р (р (С)), определяющее функцию ид (С). Как и при доказательстве теоремы 11, функцию д)о (С) запишем в виде др (С) = = '~ д)отодр' (С). Умножая соотношение (25) на 1)ос и суммивв=! руя по 1, получаем с, $ (дСд(С), Вид(С)) сСС= $ (д)о(1), Вид(С)) сй. (26) Св св Заметим теперь, что для любого решения ф (С) урав- нения (5) справедливо неравенство Р (д(д (С)) ) О. (27) В самом деле, так как начало координат пространства Е„ является внутренней точкой выпуклого тела У, то функция (с(о (С), Ви), как функция переменного и, либо тождествен- но равна нулю, либо может принимать как отрицательные, так и положительные значения. В силу (27) и (26) мы имеем неравенство 1(ф(С), ВЕ1(С)) СС~)(ф(С), Ви.(С))сй 442 ЛИНЕЙНЫЕ ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ П'Л.
г Отсюда так же, как и при доказательстве теоремы 11, ,получаем и,(с)=и,(г) на отреаке цо(т( с,. Учитывая соотношение (26), мы получаем отсюда $ (ф(г), Ви,(г)) г(с=0. (28) ь Далее, так как равенство Р (ф (г)) = 0 может иметь место только в том случае, если функция (ф (Т), Ви) равна нулю на всем многограннике У, т. е. может иметь место только для конечного числа значений г, то из соотношений (27), (28) с необходимостью вытекает, что С, = 1,. Итак, теорема 12 доказана. 3 а м е ч а н и е. До сих пор мы испольэовали только условие 1', указанное в теореме 2 (т.
е. формулу (20) гл. 1). Условие же 2' (т. е. соотношение (21) гл. 1) мы нигде не испольэовали. Нетрудно видеть, однако, что при выполнении предположений теоремы 12 равенство (21) гл. 1 выполняется автоматически. В самом деле, в силу соотношений (4), (6), (27) и соотношения (20) гл. 1, имеем М ( С (1,), х (Г,)) = Н ( Э (Г,), х (Г,), и (Г,)) = = (~) (г1), Ах (г1)) + (ф (Е,), Ви (11)) = = (ф (1,), Ах,) + Р (ф (е,)) = Р (ф (гт)) ) 0 (ибо хд —— О). е 19.
Теоремы существования Т е о р е м а 13. Если для процесса, описываемого уравнением (2), существует хотя би одно управление, переводящее фавовую точку ив положения хв в положение х„ то существует и оптимальное управление, переводящее фиговую точку из положения хг в положение х,. (Как всегда, мы предполагаем выполненным условие общности положения.) Д о к а а а тел ь с т в о. Мы должны предполагать, что аадан некоторый класс В допустимых управлений и что в классе В существуют управления, переводящие фазо- ТЕОРЕМЫ СУЩЕСТВОВАНИЯ а (0( вую точку из положения х0 в положение х,.
Обозначим череа Р~,„наибольший класс управлений, т. е. множество всех иамеримых управлений (со значениями в 0)), а череа .Рм(„— наименьший класс управлений, т. е. множество всех кусочно-постоянных управлений (со аначениями в 7У). Таким обрааом, Р„„~ Р:з Р,ди. Докажем прежде всего, что в классе Р „существует оптимальное управление, переводящее фазовую точку из положения е0 в положение е,. Обоаначим через Л совокупность всех управлений класса Р„,, переводящих фазовую точку из положения е0 в положение хп Множество Л непусто, так как, по предположению, в классе Р (а значит — и в Р „) существуют управления, переводящие фазовую точку из положения хи в положение х,. Каждому управлению и (1)~Л соответствует время перехода (из положения х0 в положение л,). Нижнюю грань всех таких времен при и (~)~Л обозначим череа 0а и докажем, что существует управление и~ (0), переводящее точку х0 в точку е, за время Р.
Ввиду воаможности производить сдвиг времени (см. условие 3) в в 10), мы можем ограничиться рассмотрением лишь таких управлений, которые ааданы на отреаках вида О ~ г -=. ~,. Выберем иа множества Л такую бесконечную последовательность управлений (на (1)), ааданных соответственно на отрезках О ( ~ ( ~„()0 = 1, 2, ...), что имеет место равенство 11ш 80 — си. 0 си Обозначим череа хь (Т) траекторию, соответствующую управлению и (~) и исходящую в момент 0 = О иа точки е0; тогда еь (~ ) = х,. Мы имеем и т (ь с К (,0') — 0,))()-«((0" 0), 0,0)) )=0 0-си и 0 (ибо второй множитель под анаком суммы ограничен, а первый стремится к нулю); точно так же и )с(А 11ш ~ (р,(00) ~~ (0()'(1), Ви (~))Ю =О.
А сот 144 ЛИНЕЙНЫЕ ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ (Гл. 3 Из этих соотношений следует, что и / с 11ш ~~ ~~рт(1~)[хе+~(дуг(1), Вид(1))о1 = и Сд Пш ~ фт (1д) ~ хто+ $ (дРт (1), Вид (8)) 111 Д-"и=1 о = Ппъ хд(1д)=х, (29) (см. (22)). Рассмотрим теперь гильбертово пространство В, всех измеримых функций с интегрируемым квадратом, заданных на отрезке О =1 = ге.