Диссертация (1145356), страница 9
Текст из файла (страница 9)
Доход от производства взаимозаменяемых товаров:1 ∑︁ ) , > 0. () = ( −2 =1(1.5.35)В этом случае функция цены зависит от общего количества однотипныхтоваров, производимых всеми игроками. Это так называемый случай отрицательного внешнего эффекта (negative externality).
Функция дохода(1.5.35) удовлетворяет требованиям 1.-4. при условии ∈ [0, ].Отметим также, что при значениях ̸= 0 изоэластическая функция дохода(1.5.33) не удовлетворяет требованиям 1) и 2). Это может быть интерпретировано как введение штрафа за малые значения управляющей функции (вслучае разработки месторождения это соответствует недовыбору ресурса).Функция расходов () обычно выбирается неотрицательной и неубывающей.
В большинстве случаев расходы игрока можно адекватно описать линейной функцией () = , где > 0.Глава 1.1.5.356Основные модели и методыДругие моделиНаряду с динамическими моделями задач рационального природопользования, разработанные методы были применены к задачам управления силойбренда в ходе рекламной кампании [240]. В данной модели описывает силубренда -го игрока (фирмы). Эта величина может быть интерпретирована какнематериальный актив соответствующей фирмы, который она накапливаетпутем инвестиций в рекламу своего продукта.Динамика силы бренда описывается ДУ˙ = ( ) + ( ),(1.5.36)где ( ) – неположительная функция, описывающая эффект “забывания”бренда, – объем капитальных вложений в рекламную компанию за единичный интервал времени, ( ) – неотрицательная функция, описывающая влияние инвестиций в рекламу на увеличение силы бренда.
Отметим, что динамика силы бренда -го игрока не зависит от величины силы бренда остальныхигроков. В дальнейшем будем полагать функции ( ) и ( ) линейными.Уравнения (1.5.36), соответственно, будут иметь следующий вид:˙ = − + ,(1.5.37)где ≥ 0 и > 0 – некоторые постоянные параметры, = 1, . . . , .В свою очередь, выигрыш -го игрока зависит от состояний всех остальныхигроков и определяется следующим образом:[︃(︃ℎ (, ) =−∑︁=1)︃ ]︃1 − 2 ,2где > 0 и > 0 – некоторые постоянные параметры, = 1, .
. . , .(1.5.38)Глава 2Дифференциальные игры со случайныммоментом окончания2.1Постановка задачи. Игра Γ (0, 0, )В данном разделе изучается модификация дифференциальной игры лицс предписанной продолжительностью Γ(0 , 0 , ), а именно, предполагается,что игра заканчивается в момент времени , где — случайная величинас известной функцией распределения (), ∈ [0 , ] [102]. Таким образом,постановка дифференциальной игры со случайной продолжительностью является обобщением постановки дифференциальной игры с предписанной продолжительностью, описанной в § 1.1.Итак, рассмотрим дифференциальную игру лиц Γ (0 , 0 , ) со случайной продолжительностью ( −0 ) и начальным состоянием 0 [102].
Динамикаигры задается системой обыкновенных дифференциальных уравнений (1.1.1),для которой выполняются требования Предположения 1.1.1.Игра начинается в момент 0 из состояния 0 , однако момент ее окончанияне фиксирован заранее, а является реализацией некоторой случайной величины . Будем полагать, что для случайной величины задана функцияраспределения (), которая удовлетворяет предположению A2). Кроме того,57Глава 2.58Дифференциальные игры со случайным моментом окончаниядалее будем предполагать существование функции плотности () = ′ () дляслучайной величины , т.е.
выполнение предположения B2).Функция мгновенного выигрыша ℎ (( ), ( )) игрока в момент времени , ∈ [0 , ), зависит от фазовой переменной (0 , 0 , , (·)) и текущих значений управлений ( ), где (·) = {1 (·), . . . , (·)} — –набор допустимыхуправлений игроков. Предполагается, что ℎ являются непрерывными функциями своих аргументов.Математическое ожидание выигрыша игрока (︂∫︁)︂ (0 , 0 , , 1 , . . .
, ) = Eℎ (( ), ( ))0в игре Γ (0 , 0 , ) в силу сделанных предположений A2), B2) имеет вид:⎤⎡∫︁ ∫︁ (0 , 0 , , 1 , . . . , ) = ⎣ ℎ (( ), ( )) ⎦ (),0 = 1, . . . , .0(2.1.1)При развитии игры во времени, в каждый промежуточный момент , ∈(0 ; ), игроки попадают в подыгру Γ ((), , ) с начальным состоянием() = .
Очевидно, что игра может закончиться до момента с вероятностью (), а вероятность продолжить игру после момента равна (1 − ()).Тогда под выигрышем в подыгре Γ ((), , ) будем понимать условное математическое ожидание выигрыша, а именно:∫︁∫︁ (, , , 1 , . . .
, ) =ℎ (( ), ( )) (),(2.1.2) где (), ≥ есть функция распределения момента окончания игры вподыгре Γ ((), , ). Нетрудно заметить, что () является условной функцией распределения, а именно функцией распределения момента окончанияигры при условии, что игра не закончилась до момента , ∈ (0 , ). КромеГлава 2.Дифференциальные игры со случайным моментом окончания59того, необходимо, чтобы () удовлетворяла стандартному условию нормировки при ∈ (0 , ). Условная функция распределения () вычисляетсяпо следующей формуле: () − (),1 − () () = ∈ [, ).(2.1.3)Очевидно, что в подыгре Γ ((), , ) условная плотность распределения () определяется следующим образом: () = (), ∈ [, ).1 − ()(2.1.4)Таким образом, при предположении о существовании плотности () = ′ () и учитывая равенства (2.1.2) и (2.1.4), запишем интегральный выигрышигрока , = 1, .
. . , , в подыгре Γ ((), , ): (, , , 1 , . . . , ) =11 − ()∫︁∫︁ ℎ (( ), ( )) ().(2.1.5) 2.2Упрощение интегрального выигрыша в игреΓ (0, 0, )Рассмотрим интегральный выигрыш игрока , который имеет вид (2.1.1). Неумаляя общности, в этом разделе положим 0 = 0. Кроме того, введем болеекомпактное обозначение ℎ ( ) = ℎ (( ), ( )).Ниже будет рассмотрен случай = ∞ как более сложный. Все полученныерезультаты легко формулируются для случая, когда случайная величина определена на конечном интервале [0 , ]. Итак, рассмотрим интегральныйфункционал∫︁∞ ∫︁ ℎ ( ) ().00Справедлива следующая теорема.Глава 2.60Дифференциальные игры со случайным моментом окончанияТеорема 2.2.1.
Пусть функции мгновенного выигрыша ℎ (), = 1, . . . , являются неотрицательными функциями для всех ∈ [0 , ∞) и интегрируемыми функциями времени . Тогда выигрыш игрока (2.1.1) может бытьпредставлен в следующем виде:∫︁∞ ∫︁ (0 , 0 , 1 , . . . , ) =0∫︁∞ℎ ( ) () = (1 − ( ))ℎ ( ).0(2.2.6)0Доказательство. Введем кусочную функцию (, ) следующим образом:⎧⎪⎨ ()ℎ ( ), ≤ ;(, ) = ()ℎ ( ) · { ≤} =⎪⎩0, > .Поскольку функция (, ) ≥ 0 является неотрицательной, можно использовать теорему Тонелли [52, 63] о перестановке интегралов в повторном интеграле. Тогда справедливо следующее равенство:∫︁+∞ ∫︁ ∫︁+∞ ∫︁+∞ ()ℎ ( ) =(, ) =0000∫︁+∞ ∫︁+∞(, ) =(, ) =∫︁ ∫︁=0[0,+∞)×[0,+∞)0∫︁+∞ ∫︁+∞∫︁+∞= ()ℎ ( ) =(1 − ( ))ℎ ( ).00Если же нельзя гарантировать (, ) ≥ 0 (а, фактически, неотрицательность функции мгновенного выигрыша ℎ ( )), но при этом выполнено условиеабсолютной сходимости кратного интеграла∫︁ ∫︁|(, )| < +∞,[0,+∞)×[0,+∞)Глава 2.Дифференциальные игры со случайным моментом окончания61то можно использовать теорему Фубини [52, 63] и также изменить порядокинтегрирования.В общем случае имеет место следующий результат.Теорема 2.2.2 ([67]).
Ожидаемый выигрыш (2.1.1) может быть представлен в виде (2.2.6), если выполняются следующие условия:1.∫︁lim (1 − ( ))ℎ () = 0. →∞02. Следующие интегралы существуют в смысле несобственных интегралов Римана:⃒⃒⃒∫︁∞ ⃒∫︁ ⃒⃒⃒ ℎ ( ) ⃒ () < +∞,⃒⃒⃒⃒0 = 1, . . . , .0Замечание 2.2.1. Заметим, что при < ∞ и при сделанных предположениях о виде подынтегральной функции и управляющих воздействий, первое ивторое условия Теоремы 2.2.2 выполняются в силу ограниченности интегралана конечном интервале. Таким образом, условия Теоремы 2.2.2 выполняютсядля любого конечного интервала [0 , ).Подводя итог, можно заключить, что при некоторых стандартных ограничениях на функцию ℎ (·) мгновенного выигрыша игрока , интегральныйфункционал, соответствующий ожидаемому интегральному выигрышу игрока в игре Γ (0 , 0 , ) может быть приведен к стандартному виду:∫︁ ∫︁ (0 , 0 , , 1 , .
. . , ) =ℎ (( ), ( )) () =00∫︁= (1 − ( ))ℎ (( ), ( )). (2.2.7)0Глава 2.62Дифференциальные игры со случайным моментом окончанияАналогично, для выигрыша игрока в подыгре Γ ((), , ) справедливоследующее представление:∫︁∫︁ (, , , 1 , . . . , ) =ℎ (( ), ( )) () = 1=1 − ()∫︁(1 − ( ))ℎ (( ), ( )). (2.2.8)Таким образом, нестандартный для задач оптимального управления функционал, а именно функционал с повторным интегрированием (2.1.1), был приведен к стандартному виду (2.2.8) при помощи замены порядка интегрирования.Отметим, что в зарубежной литературе в приложениях из области оптимального управления, в которых управляемый процесс рассматривается наслучайном промежутке времени (см.
[182, 348]), интегральный функционализначально рассматривается в виде (2.2.8) без проверки условий Теорем 2.2.1и 2.2.2. Однако существуют примеры, доказывающие, что данное преобразование не всегда корректно (см. [67]).Следствие 2.2.1. Используя определение функции интенсивности отказов(1.4.22) и формулу (1.4.23), выражение (2.2.7) может быть переписано вследующем виде:∫︁ (0 , 0 , , 1 , . .
. , ) = (1 − ( ))ℎ (( ), ( )) =0∫︁=ℎ (( ), ( ))−∫︀ 0(). (2.2.9)0Для экспоненциального распределения (1.4.24) случайной величины изГлава 2.63Дифференциальные игры со случайным моментом окончания(2.2.9) имеем∫︁∞ (0 , 0 , 1 , . . . , ) =ℎ (( ), ( ))−( −0 ) .(2.2.10)0Для распределения Вейбулла (1.4.25) случайной величины из (2.2.9) имеем 1 − () = − , следовательно, интегральный выигрыш игрока вычисляется по следующей формуле:∫︁∞ (0 , 0 , 1 , .