Диссертация (Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии), страница 4

PDF-файл Диссертация (Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии), страница 4 Физико-математические науки (22921): Диссертация - Аспирантура и докторантураДиссертация (Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполно2019-03-122019-03-12zzyxelСтудИзба

Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии301

Описание файла

Файл "Диссертация" внутри архива находится в папке "Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии". PDF-файл из архива "Оптимизация линейных и квазилинейных диффузионных стохастических систем, функционирующих на неограниченном интервале времени, при неполной информации о состоянии", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве МАИ. Не смотря на прямую связь этого архива с МАИ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.

Просмотр PDF-файла онлайн

Текст 4 страницы из PDF

. . , )T ; (·)T – операция транспонирования.Процесс управления описывается системой уравнений Ито [26]:() = ((), (())) + ((), (()))(),(1.1)(0 ) = 0 .Здесь ∈ [0, +∞) – время функционирования системы; ∈ – состояние системы; () ∈ – стандартный винеровский процесс; ∈ – вектор управления.Компоненты функций (, ) → (, ) : × → , (, ) → (, ) : × →× , → () : → заданы и измеримы по Борелю, ⊂ – заданноемножество. Множество стратегий * = (·) управления обозначим через .1.2ОбобщенноеуравнениеФоккера-Планка-КолмогороваХрусталевым М.М. исследовалась бескоалиционная неантагонистическая дифференциальная игра многих лиц, осуществляющих совместное управление стохастическим диффузионным процессом, и получены достаточные условия равновесия поНэшу [44, 45].Для одного игрока задача вырождается в задачу стохастического оптимальногоуправления диффузионным процессом с информационными ограничениями (1.1).Обычно предполагается, что для процесса (1.1) существует плотность вероятности состояния и эта плотность (, ) → (, ) : × → 1 непрерывна и дважды непрерывно дифференцируема, тогда она удовлетворяет уравнению ФоккераПланка-Колмогорова.

Здесь – ограниченное время функционирования системы.В работе [44] рассматривается более общий случай, когда распределение состояния системы (1.1) в момент времени задается борелевской вероятностной мерой¯ кото * () из специально сконструированного пространства мер , пополнение рого представляет собой банахово пространство. Через * ⊂ обозначим подмножество вероятностных мер.

Введем обозначение → * () = (, ·) : [0, +∞) → * .18Эволюция вероятностной меры (, ·) описывается обыкновенным дифференциаль-¯ (обобщенное уравнение Фоккераным уравнением в банаховом пространстве Планка-Колмогорова (ФПК) * ()= ( * (), * )(1.2)с начальным условием * (0) = 0* ,0* (·) ∈ 0* ⊂ *(1.3)из заданного множества 0* начальных распределений. При фиксированных ∈ * ,¯ , представляющая собой значение функции (, ) → ∈ квазимера (·) ∈ ¯ , определяется равенством (, ) : * × → ]︃∫︁ [︃∑︁∫︁ ∑︁∑︁ 2 ()()() () = (, ()) + (, ()) (), =1=1 =1(1.4)которое должно выполняться для любых функций → () : → 1 из 02 .

Здесь есть элемент матрицы T /2, 02 – пространство дважды непрерывно дифференцируемых функций на , аннулирующихся вне некоторого шара в .Такое представление позволяет не использовать классическое уравнение ФПК, аследовательно охватывает случаи: когда распределение состояния системы в каждый момент времени задается вероятностной мерой произвольного вида; если жемера имеет плотность, нет необходимости предполагать ее непрерывность и дифференцируемость.При заданной функции () ∈ решением задачи Коши (1.2), (1.3) являетсяабсолютно непрерывная функция * (), удовлетворяющая начальному условию (1.3)и почти всюду на [0, +∞) уранению (1.2).Тождество (1.4) в каждой конкретной задаче может выполняться для более широкого класса функций (), чем класс 02 .

Обозначим через * ⊃ 02 расширенныйкласс функций (), для которых при любом (·) ∈ справедливо тождество (1.4).Условие А.Всюду при использовании функций () достаточно выполнения сле-дующего более слабого условия, чем () ∈ * . Равенство (1.4) должно выполнятьсявдоль любого решения (, ·) уравнения (1.2) с начальным условием (1.3), т. е. при (·) = (, ·),для почти всех на интервале [0, +∞).19(·) = (, ·),1.3Достаточные условия стабильности стохастической системыПусть функция () удовлетворяет информационным ограничениям: каждая компонента функции () зависит от своего заданного заранее набора компонент векторасостояния.

Функцию (), удовлетворяющую указанным требованиям, будем называть допустимой стратегией управления.Обозначим через ∞ множество допустимых процессов управления =( * (·), * ), удовлетворяющих следующим условиям:1. * = (·) ∈ – допустимая стратегия управления;2. начальная мера * (0 ) = 0* выбирается из заданного множества 0* ;3. при заданной стратегии управления * и заданной начальной мере 0* функция * () (траектория) есть решение уравнения (1.2) с начальным условием (1.3).Пусть задана измеримая по Борелю функция (, ) → (, ) : × → 1 .Вводится в рассмотрение функционал1 → () = lim1 →+∞ 1 − 0∫︁1 ∫︁ (, ()) (, ),(1.5)0 определенный на некоторых элементах множества ∞ (множество таких элементов0может быть и пусто).

Учитывая последний факт, через ∞⊂ ∞ обозначим множе-ство элементов из ∞ , для которых функционал (1.5) определен.В работе [46] получены достаточные условия в задаче оптимального управления0и задаче стабилизации(оптимальной стабилизации системы (1.1)) на множестве ∞(не обязательно оптимальной).В диссертационной работе для формулировки результата требуются результатыпо задаче стабилизации.

Понадобится следующее условие регулярности [46]. Фиксируем стратегию ¯* ∈ . Будем говорить, что для стратегии ¯* выполнено условиерегулярности относительно функции → 0 () : * → 1 , если для любого процесса = ( * (·), ¯* ) ∈ ∞ функция → 0 ( * ()) : [0 , +∞) → 1 ограничена.Допустимая стратегия ¯* = ¯(·) ∈ называется стабилизирующей стратегией, если для любого процесса ¯ = ( * (·), ¯* ) ∈ ∞ , использующего0стратегию ¯* , функционал (1.5) определен (¯ ∈ ∞) и значение критерия (1.5) одноОпределение 1.1.20и то же для всех таких процессов(¯ ) = ¯ .(1.6)Величину ¯ в этом случае назовем стабильным значением критерия.Нижеследующая теорема 1.1 дает достаточное условие стабилизации системы (1.1) по критерию (1.5).[46].

Пусть функция 0 (·) ∈ 2 ∩ * ( 2 – пространство дваждынепрерывно дифференцируемых функций на ), допустимая стратегия ¯* = ¯(·) ∈ и число ¯ удовлетворяют условиям:1. для стратегии ¯* выполнено условие регулярности относительно функции∫︁0 () = 0 ()() : * → 1 ;Теорема 1.1.2. ℎ(.¯()) = ¯ , ∈ .Тогда стратегия ¯(·) является стабилизирующей стратегией, а число ¯ – стабильным значением критерия. Здесьℎ(, ) =∑︁=11.4∑︁ ∑︁ 02 (, ) () + (, ) 0 () + (, ). =1 =1(1.7)Метод функций Ляпунова-Лагранжа, функционал ЛагранжаТакже понадобятся некоторые конструкции из [46] используемые в доказательствах. Важную роль для получения условий оптимальности процессов управлениястохастическими системами на неограниченном интервале времени играет функционал Лагранжа, предложенный в работах Хрусталева М.М.

[46]. Использование функционала Лагранжа дает возможность рассматривать вместо исходного критерия достаточное богатое многопараметрическое представление оптимизируемого функционала.Введем в рассмотрение множество процессов с элементами = (* (·), * ),получающимися из элементов множества ∞ сужением функции * () на интервал = [0, 1 ], в результате которого получается функция * () = (, ·).Будем предполагать, что для всех элементов ∈ определен функционал∫︁1 ∫︁ → () = (, ()) (, ) : → 1 .0 21(1.8)В работах [44], [45] получены достаточные условия оптимальности в задаче о минимуме функционала (1.8) на элементах множества с фиксированной начальноймерой 0* , аналогичные достаточным условиям В.Ф.

Кротова для классической детерминированной задачи оптимального управления.Для доказательства используется вектор функция Ляпунова-Лагранжа кротовского типа = (0 , 1 , . . . , ), ≤ , с помощью которой строится функционалЛагранжа-Кротова, используемый для доказательства условий оптимальности. Вдиссертации используется лишь первая компонента 0 вектор-функции , а остальные считаются равными нулю, = 0, = 1, .

Поэтому используемые в диссертацииконструкции из работ М.М. Хрусталева приведем для этого случая и вместо 0 будем использовать обозначение . Функция (, ) → (, ) : × 0* → 1 должнаобладать следующими свойствами:1. – локально липшицева на × 0* и дифференцируема по Фреше по совокупности аргументов (, ) всюду на ( ∖ 0 ) × * ;2. частная производная функции при всех ∈ ∖ 0 , ∈ * представима ввиде∫︁ =(, , (·))(),(1.9)где функция (, , ) → (, , ) : × × * → 1 такова, что при каждых фиксированных ∈ ∖ 0 , ∈ * функция (, ·, ) : → 1 есть функция из * .Здесь 0 ⊂ – множество нулевой меры на , 0* – окрестность множества *¯)в пространстве (не Используемый в доказательствах функционал Лагранжа-Кротова имеет вид ( ) = −(1 , * (1 )) + (0, 0* )+⎡⎤∫︁1∫︁+ ⎣ (, * ()) + (, , (), * ()) (, )⎦ , (1.10)0где(, , , ) =∑︁=1∑︁ ∑︁2 (, )(, , ) + (, )(, , ).

=1 =1(1.11)В [44] (лемма 2) доказано, что для любого элемента ∈ функционал (1.10)определен и справедливо равенство ( ) = ( ).22В работах [44–46] функционал (1.10) в более общей задаче используется для получения достаточных условий оптимальности. Несмотря на то, что функционалы и совпадают, функционал Лагранжа обладает тем преимуществом, что он содержитсвободную для выбора функцию (, ) (аналог вектора множителей Лагранжа в конечномерных задачах), позволяющую получить достаточно конструктивные условияоптимальности.В диссертации используется еще более конкретная форма функционала Лагранжа (1.10) с функцией (, ) вида∫︁(, ) = ¯ 1 + 0 ()(),где 0 () – квадратичная или линейно-квадратичная функция вида1 0 () = T + T .2(1.12)Здесь ¯ – постоянное число, – постоянная матрица и T – поcтоянный вектор.В этом случае функционал Лагранжа (1.10) принимает вид∫︁( ) = −0∫︁ () (1 , ) + 0 ()0* () + ¯ 1 +∫︁1⎤⎡∫︁⎣−¯++0ℎ(, ()) (, )⎦ , (1.13)где функция ℎ(, ) определяется равенством (1.7).Для корректности равенства (1.2) и теоремы 1.1 с функцией 0 () вида (1.12)требуется выполнение включения 0 (·) ∈ *(1.14)или более слабого условия А.

Поделитесь ссылкой:

Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.

Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.

Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.

Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.

Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.

Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.

Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.

Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.

Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.

Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.

Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.

Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.