Диссертация (Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии), страница 4
Описание файла
Файл "Диссертация" внутри архива находится в папке "Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии". PDF-файл из архива "Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 4 страницы из PDF
. . , )T ; (·)T – операция транспонирования.Процесс управления описывается системой уравнений Ито [26]:() = ((), (())) + ((), (()))(),(1.1)(0 ) = 0 .Здесь ∈ [0, +∞) – время функционирования системы; ∈ – состояние системы; () ∈ – стандартный винеровский процесс; ∈ – вектор управления.Компоненты функций (, ) → (, ) : × → , (, ) → (, ) : × →× , → () : → заданы и измеримы по Борелю, ⊂ – заданноемножество. Множество стратегий * = (·) управления обозначим через .1.2ОбобщенноеуравнениеФоккера-Планка-КолмогороваХрусталевым М.М. исследовалась бескоалиционная неантагонистическая дифференциальная игра многих лиц, осуществляющих совместное управление стохастическим диффузионным процессом, и получены достаточные условия равновесия поНэшу [44, 45].Для одного игрока задача вырождается в задачу стохастического оптимальногоуправления диффузионным процессом с информационными ограничениями (1.1).Обычно предполагается, что для процесса (1.1) существует плотность вероятности состояния и эта плотность (, ) → (, ) : × → 1 непрерывна и дважды непрерывно дифференцируема, тогда она удовлетворяет уравнению ФоккераПланка-Колмогорова.
Здесь – ограниченное время функционирования системы.В работе [44] рассматривается более общий случай, когда распределение состояния системы (1.1) в момент времени задается борелевской вероятностной мерой¯ кото * () из специально сконструированного пространства мер , пополнение рого представляет собой банахово пространство. Через * ⊂ обозначим подмножество вероятностных мер.
Введем обозначение → * () = (, ·) : [0, +∞) → * .18Эволюция вероятностной меры (, ·) описывается обыкновенным дифференциаль-¯ (обобщенное уравнение Фоккераным уравнением в банаховом пространстве Планка-Колмогорова (ФПК) * ()= ( * (), * )(1.2)с начальным условием * (0) = 0* ,0* (·) ∈ 0* ⊂ *(1.3)из заданного множества 0* начальных распределений. При фиксированных ∈ * ,¯ , представляющая собой значение функции (, ) → ∈ квазимера (·) ∈ ¯ , определяется равенством (, ) : * × → ]︃∫︁ [︃∑︁∫︁ ∑︁∑︁ 2 ()()() () = (, ()) + (, ()) (), =1=1 =1(1.4)которое должно выполняться для любых функций → () : → 1 из 02 .
Здесь есть элемент матрицы T /2, 02 – пространство дважды непрерывно дифференцируемых функций на , аннулирующихся вне некоторого шара в .Такое представление позволяет не использовать классическое уравнение ФПК, аследовательно охватывает случаи: когда распределение состояния системы в каждый момент времени задается вероятностной мерой произвольного вида; если жемера имеет плотность, нет необходимости предполагать ее непрерывность и дифференцируемость.При заданной функции () ∈ решением задачи Коши (1.2), (1.3) являетсяабсолютно непрерывная функция * (), удовлетворяющая начальному условию (1.3)и почти всюду на [0, +∞) уранению (1.2).Тождество (1.4) в каждой конкретной задаче может выполняться для более широкого класса функций (), чем класс 02 .
Обозначим через * ⊃ 02 расширенныйкласс функций (), для которых при любом (·) ∈ справедливо тождество (1.4).Условие А.Всюду при использовании функций () достаточно выполнения сле-дующего более слабого условия, чем () ∈ * . Равенство (1.4) должно выполнятьсявдоль любого решения (, ·) уравнения (1.2) с начальным условием (1.3), т. е. при (·) = (, ·),для почти всех на интервале [0, +∞).19(·) = (, ·),1.3Достаточные условия стабильности стохастической системыПусть функция () удовлетворяет информационным ограничениям: каждая компонента функции () зависит от своего заданного заранее набора компонент векторасостояния.
Функцию (), удовлетворяющую указанным требованиям, будем называть допустимой стратегией управления.Обозначим через ∞ множество допустимых процессов управления =( * (·), * ), удовлетворяющих следующим условиям:1. * = (·) ∈ – допустимая стратегия управления;2. начальная мера * (0 ) = 0* выбирается из заданного множества 0* ;3. при заданной стратегии управления * и заданной начальной мере 0* функция * () (траектория) есть решение уравнения (1.2) с начальным условием (1.3).Пусть задана измеримая по Борелю функция (, ) → (, ) : × → 1 .Вводится в рассмотрение функционал1 → () = lim1 →+∞ 1 − 0∫︁1 ∫︁ (, ()) (, ),(1.5)0 определенный на некоторых элементах множества ∞ (множество таких элементов0может быть и пусто).
Учитывая последний факт, через ∞⊂ ∞ обозначим множе-ство элементов из ∞ , для которых функционал (1.5) определен.В работе [46] получены достаточные условия в задаче оптимального управления0и задаче стабилизации(оптимальной стабилизации системы (1.1)) на множестве ∞(не обязательно оптимальной).В диссертационной работе для формулировки результата требуются результатыпо задаче стабилизации.
Понадобится следующее условие регулярности [46]. Фиксируем стратегию ¯* ∈ . Будем говорить, что для стратегии ¯* выполнено условиерегулярности относительно функции → 0 () : * → 1 , если для любого процесса = ( * (·), ¯* ) ∈ ∞ функция → 0 ( * ()) : [0 , +∞) → 1 ограничена.Допустимая стратегия ¯* = ¯(·) ∈ называется стабилизирующей стратегией, если для любого процесса ¯ = ( * (·), ¯* ) ∈ ∞ , использующего0стратегию ¯* , функционал (1.5) определен (¯ ∈ ∞) и значение критерия (1.5) одноОпределение 1.1.20и то же для всех таких процессов(¯ ) = ¯ .(1.6)Величину ¯ в этом случае назовем стабильным значением критерия.Нижеследующая теорема 1.1 дает достаточное условие стабилизации системы (1.1) по критерию (1.5).[46].
Пусть функция 0 (·) ∈ 2 ∩ * ( 2 – пространство дваждынепрерывно дифференцируемых функций на ), допустимая стратегия ¯* = ¯(·) ∈ и число ¯ удовлетворяют условиям:1. для стратегии ¯* выполнено условие регулярности относительно функции∫︁0 () = 0 ()() : * → 1 ;Теорема 1.1.2. ℎ(.¯()) = ¯ , ∈ .Тогда стратегия ¯(·) является стабилизирующей стратегией, а число ¯ – стабильным значением критерия. Здесьℎ(, ) =∑︁=11.4∑︁ ∑︁ 02 (, ) () + (, ) 0 () + (, ). =1 =1(1.7)Метод функций Ляпунова-Лагранжа, функционал ЛагранжаТакже понадобятся некоторые конструкции из [46] используемые в доказательствах. Важную роль для получения условий оптимальности процессов управлениястохастическими системами на неограниченном интервале времени играет функционал Лагранжа, предложенный в работах Хрусталева М.М.
[46]. Использование функционала Лагранжа дает возможность рассматривать вместо исходного критерия достаточное богатое многопараметрическое представление оптимизируемого функционала.Введем в рассмотрение множество процессов с элементами = (* (·), * ),получающимися из элементов множества ∞ сужением функции * () на интервал = [0, 1 ], в результате которого получается функция * () = (, ·).Будем предполагать, что для всех элементов ∈ определен функционал∫︁1 ∫︁ → () = (, ()) (, ) : → 1 .0 21(1.8)В работах [44], [45] получены достаточные условия оптимальности в задаче о минимуме функционала (1.8) на элементах множества с фиксированной начальноймерой 0* , аналогичные достаточным условиям В.Ф.
Кротова для классической детерминированной задачи оптимального управления.Для доказательства используется вектор функция Ляпунова-Лагранжа кротовского типа = (0 , 1 , . . . , ), ≤ , с помощью которой строится функционалЛагранжа-Кротова, используемый для доказательства условий оптимальности. Вдиссертации используется лишь первая компонента 0 вектор-функции , а остальные считаются равными нулю, = 0, = 1, .
Поэтому используемые в диссертацииконструкции из работ М.М. Хрусталева приведем для этого случая и вместо 0 будем использовать обозначение . Функция (, ) → (, ) : × 0* → 1 должнаобладать следующими свойствами:1. – локально липшицева на × 0* и дифференцируема по Фреше по совокупности аргументов (, ) всюду на ( ∖ 0 ) × * ;2. частная производная функции при всех ∈ ∖ 0 , ∈ * представима ввиде∫︁ =(, , (·))(),(1.9)где функция (, , ) → (, , ) : × × * → 1 такова, что при каждых фиксированных ∈ ∖ 0 , ∈ * функция (, ·, ) : → 1 есть функция из * .Здесь 0 ⊂ – множество нулевой меры на , 0* – окрестность множества *¯)в пространстве (не Используемый в доказательствах функционал Лагранжа-Кротова имеет вид ( ) = −(1 , * (1 )) + (0, 0* )+⎡⎤∫︁1∫︁+ ⎣ (, * ()) + (, , (), * ()) (, )⎦ , (1.10)0где(, , , ) =∑︁=1∑︁ ∑︁2 (, )(, , ) + (, )(, , ).
=1 =1(1.11)В [44] (лемма 2) доказано, что для любого элемента ∈ функционал (1.10)определен и справедливо равенство ( ) = ( ).22В работах [44–46] функционал (1.10) в более общей задаче используется для получения достаточных условий оптимальности. Несмотря на то, что функционалы и совпадают, функционал Лагранжа обладает тем преимуществом, что он содержитсвободную для выбора функцию (, ) (аналог вектора множителей Лагранжа в конечномерных задачах), позволяющую получить достаточно конструктивные условияоптимальности.В диссертации используется еще более конкретная форма функционала Лагранжа (1.10) с функцией (, ) вида∫︁(, ) = ¯ 1 + 0 ()(),где 0 () – квадратичная или линейно-квадратичная функция вида1 0 () = T + T .2(1.12)Здесь ¯ – постоянное число, – постоянная матрица и T – поcтоянный вектор.В этом случае функционал Лагранжа (1.10) принимает вид∫︁( ) = −0∫︁ () (1 , ) + 0 ()0* () + ¯ 1 +∫︁1⎤⎡∫︁⎣−¯++0ℎ(, ()) (, )⎦ , (1.13)где функция ℎ(, ) определяется равенством (1.7).Для корректности равенства (1.2) и теоремы 1.1 с функцией 0 () вида (1.12)требуется выполнение включения 0 (·) ∈ *(1.14)или более слабого условия А.