Диссертация (1145439), страница 24
Текст из файла (страница 24)
В задаче (2.17),(2.18) (εδ ≥ 1) условия, стимулирующие кооперативноеповедение игроков, выполняются при³´p(ε − 1)εδpx0 ≥1+c(ε − 1)(ε2 δ − 1) 2 − 4µ1 (1 − µ1 )илиx0 ≤³´p(ε − 1)εδp1−.c(ε − 1)(ε2 δ − 1) 2 − 4µ1 (1 − µ1 )134Доказательство. Динамически устойчивая ПРД примет видβi (t) =1 h δε2 − 1 c 2 ³ ε − 12p(1 − δε) ´ cA(x)+B+Ax +t2δε2εcδε2 (ε − 1) tp2 (1 − δε)2p(1 − δε) i+D(1 − δ) − A 2 2+B.c δε (ε − 1)2cε(ε − 1)Подставляя в (2.8) и упрощая, получим условие, стимулирующее рациональное поведение на каждом шаге, в видеa(xct )2 + bxct + c ≥ 0 ,гдеcK 2(1 − 2µ1 (1 − µ1 )) > 0 ,4ε2−pK 2b= 2,2ε (ε − 1)(1 − 2µ1 (1 − µ1 ))a=c=p2 (1 − 2µ1 )2p2 (1 − δε)(δε(2ε − 1) − 1)+ (2µ1 (1 − µ1 ) − 1).8c4cδ 2 ε2 (ε − 1)2Заметим, что условие имеет квадратичный по x вид, и вершина этой параболы лежитниже оси x:c−p2b2= − < 0,4a8cа корни имеют видx1 =ppεδp,+2c(ε − 1) c(ε δ − 1) 2 − 4µ1 (1 − µ1 )x2 =ppεδp.−2c(ε − 1) c(ε δ − 1) 2 − 4µ1 (1 − µ1 )Следовательно, условие, стимулирующее рациональное поведение на каждом шаге, выполнено приxct ≥ppεδp+2c(ε − 1) c(ε δ − 1) 2 − 4µ1 (1 − µ1 )илиppεδp−,c(ε − 1) c(ε2 δ − 1) 2 − 4µ1 (1 − µ1 )pкогда этот корень неотрицателен, т.е.
когда (ε2 δ − 1) 2 − 4µ1 (1 − µ1 ) − εδ(ε − 1) ≥ 0, чтоxct ≤достаточно проверить при µ1 = 1/2. Тогда условие принимает вид εδ − 1 ≥ 0, что вернопри нашем предположении.Тогда получим³´p(ε − 1)(εδ)t+1p1+c(ε − 1)(ε2 δ − 1) 2 − 4µ1 (1 − µ1 )(2.21)³´p(ε − 1)(εδ)t+1px0 ≤1−.c(ε − 1)(ε2 δ − 1) 2 − 4µ1 (1 − µ1 )(2.22)x0 ≥и135Правая часть неравенства (2.21) убывает по t, а правая часть (2.22) – возрастает поt, поэтому достаточно проверить выполнение этих неравенств при t = 0.
Окончательно,получим условия на параметры модели, при которых выполняется условие, стимулирующеерациональное поведение на каждом шаге´³p(ε − 1)εδpx0 ≥1+c(ε − 1)(ε2 δ − 1) 2 − 4µ1 (1 − µ1 )илиx0 ≤³´p(ε − 1)εδp1−.c(ε − 1)(ε2 δ − 1) 2 − 4µ1 (1 − µ1 )Условие Янга (2.6) для этой модели принимает видξ(0) − δ t ξ(t) ≥ Vi (0) − δ t Vi (t) .Это неравенство выполняется при t = 0, поэтому достаточно проверить, что производная левой части неравенства не меньше, чем производная правой части, т.е.−δ t [ln δ(ay (xct )2 + by xct + dy ) + (xct )0 (2ay xt + by )] ≥ 0 ,гдеc(ε2 δ − 1)A− A1 =(1 − 2µ1 (1 − µ1 )) ,24δBp(ε2 δ − 1)2pby = − B1 = −(1 − 2µ1 (1 − µ1 )) = −ay ,22δ(ε − 1)c(ε − 1)ay =dy =p2 (εδ − 1)2p2 (1 − 2µ1 )2D− D1 = −(1−2µ(1−µ))+1124cδ(1 − δ)(ε − 1)28c(1 − δ)и(xct )0³= ln(εδ)´pc− xt .c(ε − 1)После преобразований условие Янга принимает вид− ln(ε2 δ)ay (xct )2 +2p2p2ay ln(ε2 δ)xct − 2ln(εδ) + ln δdy ≥ 0 .c(ε − 1)c (ε − 1)2Заметим, что условие имеет квадратичный по x вид и вершина этой параболы лежитвыше оси x:c−b2p2= − ln δ> 0,4a8c(1 − δ)а корни имеют видx1 =pp√pp√+N , x2 =−N,c(ε − 1) cc(ε − 1) c136где N =ln(ε2 δ)(ε2 δ−δ ln δ.− 1)(1 − δ)(2 − 4µ1 (1 − µ1 ))Следовательно, условие Янга выполняется, еслиxct ≥√p(1 + (ε − 1) N )c(ε − 1)xct ≤√p(1 − (ε − 1) N ) ,c(ε − 1)иликогда этот корень неотрицателен, т.е.
когда ln(ε2 δ)(ε2 δ − 1)(1 − δ)(2 − 4µ1 (1 − µ1 )) + δ ln δ(ε −1)2 ≥ 0, что достаточно проверить при µ1 = 1/2 и верно при εδ ≥ 1.Откуда условия принимают видx0 ≥√p(1 + (ε − 1)(εδ)t N )c(ε − 1)(2.23)x0 ≤√p(1 − (ε − 1)(εδ)t N ) .c(ε − 1)(2.24)илиПравая часть неравенства (2.23) убывает по t, а правая часть (2.24) – возрастает поt, поэтому достаточно проверить выполнение условий при t = 0. Окончательно, получимусловия на параметры модели, при которых выполняется условие защиты от иррационального поведения:x0 ≥√p(1 + (ε − 1) N )c(ε − 1)x0 ≤√p(1 − (ε − 1) N ) ,c(ε − 1)илипри εδ ≥ 1.В завершении сравним условия на x0 , необходимые для выполнения условия Янга иусловия, стимулирующего рациональное поведение на каждом шаге, и получимsεδ−δ ln δ>,22(ε δ − 1)ln(ε δ)(ε2 δ − 1)(1 − δ)что доказывает, что условие, стимулирующее рациональное поведение на каждом шаге,сильнее.1373.3.
Модель разделения ресурсовВ данном разделе приведены результаты исследования теоретико-игровой модели управления возобновляемыми ресурсами с дискретным временем. Агентами эколого-экономической системы являются центр (арбитр), который разделяет эксплуатируемую территориюмежду участниками, и игроки (страны или фирмы), эксплуатирующий возобновляемыйресурс.Построены равновесия по Нэшу и кооперативные равновесия для случая конечного ибесконечного горизонта планирования.
При этом решения бесконечной задачи получены изрешения n-шаговой игры путем устремления горизонта планирования к бесконечности.Основная задача, решаемая здесь, – это применение разработанного в диссертационнойработе метода поддержания кооперативного поведения с участием центра в модели разделения экологических ресурсов типа «рыбных войн». При этом, в отличие от традиционнойпостановки, центр наказывает агентов эколого-экономической системы за отклонение откооперативного равновесия путем изменения территории эксплуатации.Доказаны свойства полученных оптимальных решений, показаны отличительные особенности разработанной схемы кооперативного регулируемого равновесия.
Для модели сбесконечным горизонтом планирования построена динамически устойчивая процедура распределения дележа и доказано выполнение условий, стимулирующих кооперативное поведение агентов эколого-экономической системы.3.3.1. Модель и равновесияРазделим эксплуатируемую территорию на две части: s и 1 − s, где ведут эксплуатациюдва игрока. Агентами эколого-экономической системы являются центр (арбитр), которыйразделяет территорию и игроки (страны или фирмы), эксплуатирующие возобновляемыйресурс на своей выделенной территории.Динамика развития ресурса с учетом эксплуатации описывается уравнениемxt+1 = (εxt )α , x0 = x ,где xt ≥ 0 – размер эксплуатируемой популяции в момент t, 0 < ε < 1 – коэффициентестественной выживаемости и 0 < α < 1 – коэффициент естественного роста популяции.Предполагается, что функции выигрышей игроков имеют логарифмический видI1 = ln((1 − s)xt ut1 ) , I2 = ln(sxt ut2 ) ,138где uti ≥ 0 – промысловые усилия игрока i в момент времени t, выраженные, например, вколичестве кораблей, участвующих в лове, i = 1, 2.
Применение логарифмических функций полезности в экономическом смысле равносильно задаче максимизации темпов ростафункции производства (в данном случае – интенсивности эксплуатации).Тогда динамика развития популяции с учетом эксплуатации примет видxt+1 = (εxt − (1 − s)xt ut1 − sxt ut2 )α , x0 = x .(3.1)Рассматривается задача максимизации сумм дисконтированных выигрышей двух игроков:J1 =nXδ1t ln((1 − s)xt ut1 ) → max, J2 =tnXu1 ≥0t=0δ2t ln(sxt ut2 ) → max,tu2 ≥0t=0(3.2)где 0 < δi < 1 – коэффициент дисконтирования игрока i, i = 1, 2.Также мы исследуем данную задачу на бесконечном периоде планирования.
В этомслучае выигрыши игроков имеют видJ1 =∞Xδ1tln((1 −s)xt ut1 ), J2 =→ maxtt=0∞Xu1 ≥0.δ2t ln(sxt ut2 ) → maxtu2 ≥0t=0(3.3)В следующей теореме приведены равновесия по Нэшу для конечной игры (3.1), (3.2)и бесконечной игры (3.1), (3.3). При этом решение для модели с бесконечным горизонтомполучено из решения n-шаговой игры путем устремления числа шагов к бесконечности.Теорема 3.1. Равновесие по Нэшу в задаче (3.1), (3.2) имеет видt−1Pεa2(a2 )jεa1j=0ut1 =(tP(a1j=0)jtP(a2)j− 1)(1 − s)(a1 )jj=0, ut2 =(j=0t−1PtP(a1)jj=0tP(a2, t = 1, . .
. , n ,)j− 1)sj=0а в задаче (3.1), (3.3) –ū1 =εa1 (1 − a2 )εa2 (1 − a1 ), ū2 =,(a1 + a2 − a1 a2 )(1 − s)(a1 + a2 − a1 a2 )sгдеa1 = αδ1 , a2 = αδ2 .При этом динамика развития популяции принимает вид³tP´ αj tεa1 a2j=1xt =xα0 , t = 1, 2, . . . ,a1 + a2 − a1 a2и стационарный размер популяции при использовании оптимальных по Нэшу стратегийα³´ 1−αεa1 a2x̄ =.a1 + a2 − a1 a2139Доказательство. Используем подход [118], который заключается в последовательном поиске оптимальных стратегий n-шаговой игры начиная с n = 1. Сначала рассмотрим задачус конечным горизонтом (3.1), (3.2). Предполагаем, что если игра заканчивается и нет будущего периода планирования, то игроки делят оставшейся ресурс в соотношении (1 − s) : s.Это означает, что игроки получают некоторую компенсацию (выраженную в денежныхединицах, если домножить на соответствующую константу) от доли неиспользованного ресурса.Начальный размер популяции x.
Рассмотрим одношаговую игру и пусть рыболовецкиеусилия игроков u1 и u2 . Эти стратегии должны удовлетворять неравенствуu1 (1 − s) + u2 s < ε .(3.4)Выигрыш первого игрока в одношаговой игре имеет видH11 (u1 , u2 ) = ln((1 − s)xu1 ) + δ1 ln((1 − s)(εx − (1 − s)xu1 − sxu2 )α ) == ln((1 − s)xu1 ) + a1 ln(εx − (1 − s)xu1 − sxu2 ) + δ1 ln(1 − s) ,и, аналогично, выигрыш второго игрока –H21 (u1 , u2 ) = ln(sxu2 ) + a2 ln(εx − (1 − s)xu1 − sxu2 ) + δ2 ln s ,гдеa1 = αδ1 , a2 = αδ2 .Функции H11 (u1 , u2 ) и H21 (u1 , u2 ) выпуклы, поэтому равновесие по Нэшу существует иможет быть найдено из системы уравнений ∂H11 /∂u1 = 0, ∂H21 /∂u2 = 0. Откуда получимравновесие по Нэшу в одношаговой игреu11 =εa2εa2=,(a1 + a2 + a1 a2 )(1 − s)((1 + a1 )(1 + a2 ) − 1)(1 − s)u12 =εa1εa1=.(a1 + a2 + a1 a2 )s((1 + a1 )(1 + a2 ) − 1)sСправедливость условия (3.4) следует из соотношенияu11 (1 − s) + u12 s =ε(a1 + a2 )< ε.a1 + a2 + a1 a2При этом оставшийся ресурс определяется равенствомεx − (1 − s)xu11 − sxu12 =εa1 a2x.(1 + a1 )(1 + a2 ) − 1140Найдем выигрыш первого игрока в этой одношаговой игреH11 (u11 , u12 ) = ln((1 − s)xu11 ) + a1 ln(εx − (1 − s)xu11 − sxu12 ) + δ1 ln(1 − s) == (1 + a1 ) ln x + A11 ,где A11 не зависит от x и имеет видA11³´εa2 (εa1 a2 )a1= ln+ δ1 ln(1 − s) .(a1 + a2 + a1 a2 )1+a1Выигрыш второго игрока имеет видH21 (u11 , u12 ) = ln(sxu12 ) + a2 ln(εx − (1 − s)xu11 − sxu12 ) + δ2 ln s = (1 + a2 ) ln x + A12 ,гдеA12 = ln³´εa1 (εa1 a2 )a2+ δ2 ln s .(a1 + a2 + a1 a2 )1+a2Теперь рассмотрим двухшаговую игру в предположении, что в последующей одношаговой игре используются уже определенные оптимальные по Нэшу стратегии, но с другимначальным размером популяции.
Тогда функция выигрыша первого игрока примет видH12 (u1 , u2 ) = ln((1 − s)xu1 ) + a1 (1 + a1 ) ln(εx − (1 − s)xu1 − sxu2 ) + δ1 A11 ,а второго игрока –H22 (u1 , u2 ) = ln(sxu2 ) + a2 (1 + a2 ) ln(εx − (1 − s)xu1 − sxu2 ) + δ2 A12 .Аналогично предыдущему случаю эти функции выпуклы, поэтому равновесие по Нэшув двухшаговой игре найдем из условий первого порядка:u21 =((1 + a1 + (a1u22 =εa2 (1 + a2 ),+ a2 + (a2 )2 ) − 1)(1 − s))2 )(1εa1 (1 + a1 ).((1 + a1 + (a1 )2 )(1 + a2 + (a2 )2 ) − 1)sУсловие (3.4) также выполняется, т.к.u21 (1 − s) + u22 s =ε(a1 + a2 + (a1 )2 + (a2 )2 )< ε.(1 + a1 + (a1 )2 )(1 + a2 + (a2 )2 ) − 1Аналогично получим выигрыш первого игрока в двухшаговой игре:H12 (u21 , u22 ) = ln((1 − s)xu21 ) + a1 (1 + a1 ) ln(εx − (1 − s)xu21 − sxu22 ) ++a1 (A11 + δ1 ln(1 − s)) = (1 + a1 + (a1 )2 ) ln x + A21 + a1 (A11 + δ1 ln(1 − s)) ,141гдеA21 = lnhiε(a2 + (a2 )2 )1+a1 +(a1 ) (a1 + (a1 )2 )a1 +(a1 ).((1 + a1 + (a1 )2 )(1 + a2 + (a2 )2 ) − 1)1+a1 +(a1 )222А выигрыш второго игрока равенH21 (u11 , u12 ) = ln(sxu22 ) + a2 (1 + a2 ) ln(εx − (1 − s)xu21 − sxu22 ) ++a2 (A12 + δ2 ln s) = (1 + a2 + (a2 )2 ) ln x + A22 + a2 (A12 + δ2 ln s) ,гдеhiε(a1 + (a1 )2 )1+a2 +(a2 ) (a2 + (a2 )2 )a2 +(a2 )= ln.2((1 + a1 + (a1 )2 )(1 + a2 + (a2 )2 ) − 1)1+a2 +(a2 )A2222Повторяя данный процесс для n-шаговой игры, получим равновесие по Нэшу в виде,указанном в формулировке теоремы.