Диссертация (1145356), страница 8
Текст из файла (страница 8)
Аналогичный подход может быть использован для нахождения функций Беллмана, соответствующих равновесию по Нэшу.1.3.2Игры с бесконечной продолжительностьюПрименительно к методу динамического программирования, задачи с бесконечной продолжительностью не приводят к каким-либо существенным изменениям в формулировке результатов. Поэтому мы пропускаем этот вопрос иотсылаем к [140, 169, 168, 183, 194] за более полной информацией.Глава 1.1.448Основные модели и методыНекоторые сведения из теории вероятностейПусть — случайная величина, для которой известна функция распределения (), ∈ [0 , ]. В дальнейшем изложении будем использовать некоторые предположения из указанных ниже, в зависимости от рассматриваемойзадачи.A1) Будем полагать, что для случайной величины задана функция распределения (), которая определена при ∈ [0 , ∞) и удовлетворяет условиюнормировки:∫︁∞ () = 1.0A2) Будем полагать, что для случайной величины задана функция распределения (), которая определена при ∈ [0 , ] и удовлетворяет условиюнормировки:∫︁ () = 1.0B1) Будем предполагать существование функции плотности () = ′ ()для случайной величины , ∈ [0 , ∞).B2) Будем предполагать существование функции плотности () = ′ ()для случайной величины , ∈ [0 , ].Функция риска/ интенсивности отказов (см., например, [206]) определяетсяследующим образом:() = ().(1 − ())(1.4.22)Кроме того, справедлива формула [206]:1 − () = −∫︀ 0( ).(1.4.23)Замечание 1.4.1.
Отметим, что функция () определена для ∈ [0 , ) иимеет особенность в = .Глава 1.49Основные модели и методыНеформально можно сказать, что в момент времени = случайное событие перестает быть случайным и становится детерминированным, соответственно, функция () обращается в точке = в дельта-функцию.Относительно функции риска () будем использовать одно из предположений об области определения функции:C1) (), ∈ [0 , ∞).C2) (), ∈ [0 , ).В математической теории надежности для случайной величины (момента отказа системы технических элементов) используются различные вероятностные распределения, а именно экспоненциальное, Вейбулла, нормальное,логарифмически нормальное, Гамма-распределение и другие [4, 14].Если случайная величина распределена по экспоненциальному закону, тоимеем () = −(−0 ) ; () = 1 − −(−0 ) ; ()= ,1 − () ∈ [0 , ∞).
(1.4.24)Известно [206], что функция интенсивности отказов (1.4.22) постоянна тогда и только тогда, когда случайная величина распределена по экспоненциальному закону (1.4.24).По закону Вейбулла () = −1 − ,1 − () = − .(1.4.25)Распределение Вейбулла имеет функцию интенсивности отказов следующего вида [346]:() = −1 ;(1.4.26) ≥ 0; > 0; > 0.Здесь и – параметры, определяющие данное распределение.
– это пара-Глава 1.50Основные модели и методыРисунок 1.1. Функция интенсивности отказов () для распределения Вейбулламетр масштаба , а параметр формы соответствует одной из трех фаз, в которой может находиться система. Значение < 1 соответствует "новорожденному"периоду, здесь функция интенсивности отказов () является убывающейфункцией. При = 1 система находится в режиме нормальной эксплуатации,() равна константе . Отметим, что при = 1 распределение Вейбулла соответствует экспоненциальному распределению.
При > 1 система находитсяв состоянии износа, () является возрастающей функцией. Частным случаем распределения Вейбулла для "стареющей"системы является распределениеРэлея, которому соответствует = 2.Пусть { }=1 – независимые случайные величины с соответствующимифункциями распределения { ()}=1 и функциями интенсивности отказов{ ()}=1 .
Рассмотрим случайную величину = min{1 , . . . , }. Тогдасправедливы следующие утверждения.Утверждение 1.4.1. Пусть { }=1 – независимые случайные величины, сфункциями распределения { ()}=1 . Тогда для случайной величины функция распределения () имеет вид () = 1 −∏︁=1(1 − ()) .(1.4.27)Глава 1.51Основные модели и методыДоказательство.
По определению функции распределения, () = { < }.По свойству распределения вероятностей, { < } = 1 − { ≥ } .По условию = min{1 , 2 , . . . , }, значит { ≥ } = {min{1 , 2 , . . . , } ≥ } = {1 ≥ } {2 ≥ } . . . { ≥ } ,поскольку { }=1 – независимые случайные величины.Далее, снова пользуясь определением функции распределения, получаем: {1 ≥ } {2 ≥ } . .
. { ≥ } = (1 − 1 ()) (1 − 2 ()) . . . (1 − ()) ,откуда следует (1.4.27).Утверждение 1.4.2. Пусть – независимые случайные величины с плотностями распределения (). Тогда плотность распределения случайной величины имеет следующий вид:∑︁∏︁ () (1 − ()). () ==1(1.4.28)̸=Доказательство. Используя результат Утверждения 1.4.1 и учитывая определение плотности распределения вероятности получаем (1.4.28). ()– функции риска, со1 − ()ответствующие независимым случайным величинам , = 1, . .
. , . ТогдаУтверждение 1.4.3. [273] Пусть () =функция риска (), соответствующая случайной величине , имеет следующий вид:() =∑︁ ().(1.4.29)=1Доказательство. Используя результаты Утверждений 1.4.1 и 1.4.2 получаем:∑︀∏︀ () (1 − ())∑︁∑︁ () ()=1̸=() ==== ().∏︀1 − ()1−()=1=1(1 − ())=1Глава 1.1.552Основные модели и методыДинамика и функции выигрыша в примерахВ дальнейшем будет рассмотрен ряд примеров, посвященных применениютеории дифференциальных игр в задачах из области рационального природопользования: управление потреблением невозобновляемых ресурсов, оптимальное управление объемом вредных выбросов и т.п.
Эти процессы обычноописываются двумя классами уравнений динамики, которые описаны в разделе 1.5.1. Далее, в разделе 1.5.2, приводятся различные функции полезности,которые используются при описании выигрыша, получаемого участниками игры.1.5.1Динамические модели задач природопользованияМодель эксплуатации невозобновляемого ресурсаДинамика изменения доступного объема ресурса () при некоторой идеализации описывается следующим дифференциальным уравнением:()˙= − (, ); ≥ 0,(0 ) = 0 > 0,(1.5.30)где управления соответствуют “усилиям”, затрачиваемым -тым игроком наизвлечение ресурса, а функция (, ) описывает скорость убывания ресурса.
Отметим, что состояние может быть вектором. В этом случае модельописывает совместную разработку нескольких невозобновляемых ресурсов.Для адекватного описания процесса функция (, ) должна удовлетворять ряду условий:1. Ресурс может только убывать: (, ) ≥ 0, ∀, > 0,2. Частные производные (, )> 0,Глава 1.53Основные модели и методы⃦⃦ 2⃦ (, ) ⃦⃦3. Функция (, ) вогнута по : ⃦⃦ ⃦ ≤ 0,4.
Процесс добычи оканчивается при исчерпании соответствующего ресурса: = 0 ⇒ ( ) (, ) = 0.Верно следующее утверждение:Утверждение 1.5.1. При выполнении условий 2) и 3) функция интенсивности отбора ресурса (, ) удовлетворяет законуневозрастающейэффек⃒⃒ (, ) ⃒⃒ (, ) ⃒⃒≤, , =тивности добычи: для ′ > ′′ верно ⃒ =′ ⃒ =′′1, . . . , .Модель динамики уровня загрязненияПусть () – это общий уровень загрязнения в момент . Динамика измененияуровня загрязнения () задается уравнением:()˙= −() + (, ),(0) = 0 ≥ 0, ≥ 0,(1.5.31)где () – это скорость абсорбции, а управления соответствуют интенсивности выброса вредных веществ соответствующими игроками. Ненулевой первыйчлен в правой части (1.5.31) описывает естественный процесс поглощения иоседания вредных веществ, происходящий в природе.Аналогично предыдущему случаю, функции () и (, ) должны удовлетворять следующим условиям:1. Интенсивность загрязнения и скорость абсорбции не могут быть отрицательными: (, ) ≥ 0, () ≥ 0 ∀, ≥ 0, кроме того, (, 0) = 0,(0) = 0,⃦ 2⃦⃦ (, ) ⃦⃦2.
Функция (, ) выпукла по : ⃦⃦ ⃦ ≥> 0.В дальнейшем будем опускать индекс при функции если из контекстапонятно, о какой модели идет речь.Глава 1.1.5.254Основные модели и методыФункции выигрышаФункция мгновенного выигрыша -го игрока обычно представляется в видесуммы:ℎ (, ) = (, ) − (, ),(1.5.32)где (, ) описывает мгновенный доход игрока, а (, ) соответствует эксплуатационным расходам, а также, в случае задачи загрязнения, штрафамили налоговым сборам, связанным с процессом загрязнения.В дальнейшем мы будем полагать, что доход игрока зависит от его управлений, а также возможно от управлений других игроков: = (), а функциярасходов зависит от переменных состояния: = ().Функция дохода удовлетворяет следующим требованиям:1.
Неотрицательность: () ≥ 0, ∀ > 0,2. “Кто не работает, тот не ест”: = 0 ⇒ () = 0, ()≥ 0.⃦⃦ 2⃦ () ⃦⃦4. Функция (, ) вогнута по : ⃦⃦ ⃦ ≤ 0.3. Частные производныеТак же как и в случае, описанном в разделе 1.5.1, для функции (, ) выполняется закон уменьшающегося дохода: при увеличении значение част- ()не возрастают.Рассмотрим несколько распространенных функций дохода:ных производных1. Логарифмическая функция дохода: () = ( + 1),2. Изоэластическая функция дохода:1− () = ,1− ̸= 1.(1.5.33)Глава 1.55Основные модели и методыОтметим, что при = 1 изоэластическая функция (1.5.33) трансформируется в логарифмическую с несмещенным аргументом: lim→1 () =( ).3.
Доход от производства незаменяемых товаров:1 () = ( − ) , > 0.2(1.5.34)В данном количество произведенных товаров полагается пропорциональным управлению , а цена товара описывается убывающей функцией( ) = − 12 . Общий доход определяется как произведение числа произведенных товаров на их цену что, после приведения к стандартномувиду дает (1.5.34). Функция дохода (1.5.34) удовлетворяет требованиям1.-4. при условии ∈ [0, ].4.