Главная » Просмотр файлов » Диссертация

Диссертация (1145356), страница 18

Файл №1145356 Диссертация (Теоретико-игровые задачи со случайной продолжительностью) 18 страницаДиссертация (1145356) страница 182019-06-29СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 18)

Задача минимизации рискагде ¯1 = 1 ( ); () = ()1− ()130– функция риска (1.4.22). Заметим, что ¯1 – этоматематическое ожидание , т.е. ¯1 = E( ). Последнее уравнение в (4.2.13)может быть проинтегрировано, что дает∫︁ 2 () =1 − ()( )1 ( ).1 − ( )0С использованием введенных переменных гамильтониан (4.2.9) может бытьпереписан следующим образом:(︀)︀ = 1 (, ) + ℎ(, ) 2 + ¯1 () .(4.2.14)Одна возможная проблема, которая может возникать при нахождении оптимальных управлений, связана с существованием сингулярных траекторий[17, 180].

Доказательство отсутствия сингулярных траекторий приведено в работе [222].Оптимальная пара (* , * ) получается как решение системы ДУ (4.2.13)совместно с условием максимизации (4.2.10). Эта задача имеет особенность,которая заключается в том, что правые части уравнений (4.2.13) зависят оттерминального значения 1 . Это требует решения задачи о неподвижной точке, которая требует дополнительного изучения. Таким образом, имеет смыслсформулировать иную постановку задачи, которая была бы проще в решениии в то же время была близка к описанной задаче минимизации дисперсии.В качестве кандидата может быть рассмотрена задача минимизации второгомомента функционала (0 , , ), как описано в следующем пункте.Глава 4.4.3Игры со случайной продолжительностью.

Задача минимизации риска131Второй момент как функция выигрышаРассмотрим второй момент функции выигрыша (0 , , ):2 ( (0 , , )) =⎛∫︁ = () ⎝⎛ ⎞2⃒ ∫︁∫︁⃒ℎ() ⎠ ⃒⃒ − () ⎝ ℎ() ⎠ =⎞200⎛0⎞2∫︁0∫︁⎟ℎ() ⎠ − 2⎜=⎝0∫︁ ()ℎ()0ℎ() . (4.3.15)0Используя описанный выше подход введем новую переменную, динамикакоторой описывается следующим ДУ:˙ = ℎ(, ),(0) = 0.(4.3.16)Задача минимизации второго момента функции выигрыша формулируетсяследующим образом:: :min (0 , ) = −∫︀0 ()ℎ(, )() + 21 2 ( )т.ч.

(4.1.1), (4.3.16) выполняются и ∈ Гамильтониан имеет вид(︀)︀ = 1 (, ) + ℎ(, ) 2 + ()() ,(4.3.17)где предполагается, что задача оптимального управления регулярна и следовательно 0 = −1. Оптимальное управление находится из условия максимизации гамильтониана:* = argmax (, , , ).∈(4.3.18)Глава 4.Игры со случайной продолжительностью. Задача минимизации риска132Сопряженные переменные подчиняются ДУ˙ 1 = −1 ′ (, * ) − ℎ′ (, * )(2 + ()()),˙ 2 =− ()ℎ(, * ),(4.3.19)где значения в правой точке находятся из выражения ( ) = −∇( ), которое влечет ( ) = [0, −( )] .Мы можем переписать гамильтонову систему (4.1.1), (4.3.16) и (4.3.19) следующим образом:˙ = (, * ),(0) = 0 ,˙ = ℎ(, * ),(0) = 0,˙ 1 =−1 ′ (, * )−ℎ′ (, * )(2˙ 2 = − ()ℎ(, * ),+ ()()),(4.3.20)1 ( ) = 02 ( ) = −( ).Следуя подходу, описанному в предыдущем пункте, введем новую переменную = 2 + ()().

Таким образом, система (4.3.20) приобретает следующийвид:˙ = (, * ),(0) = 0 ,˙ = ℎ(, * ),(0) = 0,˙ 1 = −1 ′ (, * ) − ℎ′ (, * ), 1 ( ) = 0,˙ = − (),(4.3.21)2 ( ) = 0.Полученные результаты могут быть использованы для вычисления другихмер риска и неопределенности (см. [37, 39, 312]) в дифференциальных играхсо случайной продолжительностью как в некооперативной, так и кооперативной постановке. Отдельного изучения потребуют вопросы существования иединственности решений для различных классов управлений.Часть IIКооперативные дифференциальныеигры со случайной продолжительностьюв форме характеристической функции133Глава 5Кооперативные дифференциальныеигры с предписаннойпродолжительностью в формехарактеристической функции5.1Устойчивая кооперация в кооперативных дифференциальных играх с предписанной продолжительностью5.1.1Основные понятияРассмотрим кооперативную форму игры Γ(0 , 0 , ), которая была определена в разделе 1.1.

Кооперативная постановка игры означает, что перед началом игры игроки договариваются об использовании ими таких допустимыхуправлений {* }, что соответствующая им кооперативная траектория * (), ∈ [0 , ], будет максимизировать суммарный выигрыш (1.1.4) всех игроковиз (предполагаем, что максимум достигается).В кооперативном варианте игры главной задачей, носящей конфликтныйхарактер, становится проблема справедливого раздела заработанного суммарного выигрыша (1.1.4) между игроками. Определение «справедливого» спосо134Глава 5.

Кооперативные дифференциальные игры с предписанной продолжительностью135ба распределения (1.1.4) основано на понятии характеристической функции[16].Характеристической функцией (0 , 0 , , ), ⊆ , | | = ,в игреΓ(0 , 0 , ) будем называть функцию (0 , 0 , , ·) : 2 → R, удовлетворяющую условиям:(5.1.1) (0 , 0 , , ∅) = 0, (0 , 0 , , 1 ∪2 ) ≥ (0 , 0 , , 1 ) + (0 , 0 , , 2 ),(5.1.2)∀ 1 , 2 ⊂ , 1 ∩ 2 = ∅.Для коалиции , состоящей из всех игроков, значение (0 , 0 , , ) вычисляется согласно (1.1.4) и имеет вид: (0 , 0 , , ) =∑︁ (0 , 0 , , *1 , . . . , * ).(5.1.3)=1Способы построения характеристической функции (0 , 0 , , ) в дифференциальных играх с предписанной продолжительностью обсуждаются далеев § 5.3. Игру Γ (0 , 0 , ) =< , (0 , 0 , , ·) >, рассматриваемую в формеэтой характеристической функции [16], будем называть кооперативной дифференциальной игрой с предписанной продолжительностью в форме характеристической функции.Обозначим как (0 , 0 , ) множество всех дележей [16] в игре Γ (0 , 0 , ),т.е.(0 , 0 , ) = { = { } :∑︁ = (0 , 0 , , ),=1 ≥ (0 , 0 , , {}), = 1, .

. . , }, (5.1.4)где (0 , 0 , , {}) — значение характеристической функции (0 , 0 , , )для коалиции , состоящей из одного -го игрока. Свойство ≥ (0 , 0 , , {})называется свойством индивидуальной рациональности для игрока [16].Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью136Для семейства подыгр Γ(* (), , ), ∈ [0 , ] вдоль оптимальной траектории * () аналогичным образом введем характеристическую функцию (* (), , , ) и определим Γ (* (), , ). Множество дележей в подыгреΓ (* (), , ) будем обозначать как (* (), , ).Будем говорить, что вектор (, , ) является допустимым набором, если существует решение задачи оптимального управления (1.1.4) для системы(1.1.1) с начальным условием () = и продолжительностью − .Определение 5.1.1. [101] Решением кооперативной игры или принципом оптимальности (ПО) для семейства подыгр Γ (, , ) будем называть точечномножественное отображение (, , )⊂(, , ), определенное для всех допустимых наборов (, , ).Наиболее известными принципами оптимальности являются C-ядро [16],вектор Шепли [226, 227] и NM-решение [141], которые переносятся на кооперативные дифференциальные игры из кооперативной теории Неймана-Моргенштерна [141] без изменений.

-ядро в подыгре Γ(* (), , ) определим как подмножество (* (), , )={ (* (), , )}=1 множества дележей (* (), , ) ⊂ (* (), , ) , ∈ [0 , ],так что∑︁ (* (), , ) ≥ (* (), , ; ),∀ ⊂ .(5.1.5)∈Альтернативным (и эквивалентным) является определение С–ядра как множества дележей, таких что∑︁ (* (), , ) ≤ (* (), , ; ) − (* (), , ; ∖ ),∀ ⊂ . (5.1.6)∈Необходимые и достаточные условия непустоты -ядра в статических кооперативных играх доказаны в теореме Бондаревой-Шепли [10, 326].Другим частным случаем принципа оптимальности (0 , 0 , ) в игреГлава 5. Кооперативные дифференциальные игры с предписанной продолжительностью137Γ (0 , 0 , ) является вектор Шепли [325], т.е.

вектор ℎ = {ℎ }∈ , т.ч.ℎ (0 , 0 , ) =)︁∑︁ ( − )!( − 1)! (︁ (, 0 , 0 , ) − (∖{}, 0 , 0 , .=!⊆(5.1.7)(5.1.8)∈Вектор Шепли обладает рядом важных преимуществ при использовании в качестве принципа оптимальности, поскольку всегда существует, является единственным дележом и пр.

(см. подробный обзор в [228]).Для игры = 2 лиц из (5.1.7) имеем следующие формулы для вычислениякомпонент вектора Шепли ℎ = {ℎ }=1,21ℎ1 (0 , 0 , ) = [ (·, ) − (·, {2}) + (·, {1})];21ℎ2 (0 , 0 , ) = [ (·, ) − (·, {1}) + (·, {2})].2(5.1.9)(5.1.10)Для игры = 3 лиц из (5.1.7) имеем следующие формулы для вычислениякомпонент вектора Шепли ℎ = {ℎ }=1,2,3ℎ1 (0 , 0 , ) =13 [(·, ) − (·, {2, 3})] + 61 [ (·, {1, 2})−− (·, {2}) + (·, {1, 3}) − (·, {3})] + 31 (·, {1}),ℎ2 (0 , 0 , ) =13 [(·, ) − (·, {1, 3})] + 61 [ (·, {1, 2})−− (·, {1}) + (·, {2, 3}) − (·, {3})] +ℎ3 (0 , 0 , ) =13 [13(·, {2}),(5.1.11)(·, ) − (·, {1, 2})] + 61 [ (·, {1, 3})−− (·, {1}) + (·, {2, 3}) − (·, {2})] + 31 (·, {3}).В отличие от C–ядра, вектор Шепли всегда может быть построен на основе характеристической функции (0 , 0 , , ).

Вопрос о непустоте С–ядраявляется важным вопросом в области кооперативных (статических) игр. Вслучае игры 2 лиц множество дележей и C–ядро совпадают, т.е. (0 , 0 , ) =(0 , 0 , ) (аналогично (* (), , ) = (* (), , ), ∈ [0 , ]). Таким образом, для игры 2 лиц супераддитивность характеристической функции (5.1.2)Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью138влечет непустоту C–ядра (множества дележей), а вектор Шепли всегда принадлежит C–ядру. В общем случае, вектор Шепли не всегда принадлежитC–ядру. Однако в случае его принадлежности C–ядру, в статической кооперативной теории игр принято говорить об «устойчивости» вектора Шепли.

Вчастности, было доказано [114], что для выпуклых (или иначе — супермодулярных) игр, т.е. для игр с характеристической функцией, т.ч. (0 , 0 , , ) + (0 , 0 , , ) ≤ (0 , 0 , , ∪ ) + (0 , 0 , , ∩ ),(5.1.12)∀, ⊂ .C–ядро не пусто и содержит вектор Шепли.5.1.2Принцип динамической устойчивости в игре Γ (0 , 0 , )При переносе результатов кооперативной (статической) теории в область дифференциальных игр проблема поиска устойчивых принципов оптимальностиусложняется некоторыми дополнительными аспектами, возникающими в динамике. В кооперативных дифференциальных играх для сохранения кооперации между игроками в течение всей игры одной супераддитивности характеристической функции (* (), , , ) вдоль кооперативной траектории * (), ∈ [0 , ] недостаточно.Проблема динамической неустойчивости вектора Шепли для задачи переговоров была отмечена в работе [232].

В работе [110] Петросяном Л.А. впервые было сформулировано строгое математическое определение динамическойустойчивости принципа оптимальности (кооперативного решения) в кооперативных дифференциальных играх, а в работе [111] предложен способ решенияпроблемы динамической неустойчивости кооперативного решения при помощи схемы выплат, получившей название процедуры распределения дележаГлава 5. Кооперативные дифференциальные игры с предписанной продолжительностью139(ПРД).Определение 5.1.2. (см.

[111]) Функция ( ), ∈ [0 , ], ∈ называетсяпроцедурой распределения дележа (0 , 0 , ), (0 , 0 , ) ∈ (0 , 0 , ) вигре Γ (0 , 0 , ), если∫︁ (0 , 0 , ) = ∈ . ( ),(5.1.13)0Отметим, что в работе Петросяна Л.А. [110] на ПРД () накладывалосьтребование неотрицательности компонент () ≥ 0, = 1, . . .

, которое вболее поздних публикациях не всегда использовалось. В данной работе неотрицательность ПРД не требуется, за исключением примеров Главы 6.Определение 5.1.3. Дележ (0 , 0 , ) ∈ (0 , 0 , ) в игре Γ (0 , 0 , ) является динамически устойчивым, если существует такая процедура распределения дележа (ПРД) ( ), ∈ [0 , ], ∈ ,∫︁ (0 , 0 , ) = ∈ , ( ),0что вдоль кооперативной траектории * (), ∈ [0 ; ] выполняется∫︁( (), , ) = {* ( ) } ∈ (* (), , ), ∈ [0 , ], ∈ .Определение 5.1.4. (см. [111]) Принцип оптимальности (0 , 0 , ) в игреΓ (0 , 0 , ) называется динамически устойчивым, если любой дележ(0 , 0 , ) ∈ (0 , 0 , ) является динамически устойчивым.Теорема 5.1.1.

[113, 111, 188] Пусть (* (), , ) является абсолютно непрерывной функцией времени , ∈ [0 , ]. Пусть ( ) = −(* ( ), , ), = 1, . . . , .(5.1.14)Тогда (0 , 0 , ) является динамически устойчивым дележом с ПРД (5.1.14).Глава 5. Кооперативные дифференциальные игры с предписанной продолжительностью140Очевидно, что при выборе ПРД по формуле (5.1.14) имеем [113, 111]∫︁ ( ) + (* (), , ), (0 , 0 , ) = ∈ [0 , ].(5.1.15)0Пусть (* (), , ) ̸= ∅ при ∈ [0 , ].

Содержательно определение 5.1.4означает следующее. Пусть игроки договорились распределить совместныймаксимальный выигрыш (0 , 0 , ; ) согласно некоторому дележу(0 , 0 , ) ∈ (0 , 0 , ) и выбрали ПРД по правилу (5.1.14). Тогда ∀, ∈ [0 ; ] на отрезке времени [0 , ] игроки по предварительной договоренно∫︀ сти получают 0 ( ) , = 1, . . .

Характеристики

Тип файла
PDF-файл
Размер
2,66 Mb
Высшее учебное заведение

Список файлов диссертации

Теоретико-игровые задачи со случайной продолжительностью
Свежие статьи
Популярно сейчас
А знаете ли Вы, что из года в год задания практически не меняются? Математика, преподаваемая в учебных заведениях, никак не менялась минимум 30 лет. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6495
Авторов
на СтудИзбе
303
Средний доход
с одного платного файла
Обучение Подробнее