Диссертация (1145439), страница 39
Текст из файла (страница 39)
Заметим, что для этого выражения вквадратных скобках должны быть положительны. Следовательно условия принимают видεx − u1 (1 + a1 ) − u2 ≥ 0 , εx − u1 − u2 (1 + a2 ) ≥ 0 .Из условий первого порядка получим решение в виде (2.48), поэтому в точке максимумавыполняетсяεx − u1 (1 + a1 ) − u2 (1 + a2 ) = 0 .Следовательно полученное решение удовлетворяет условиям. Более того, условия выполняются и в некоторой окрестности точки решения, т.к.a2 u2 > 0 , a1 u1 > 0 .Таким образом, показано, что условия Куна–Таккера являются достаточными условиями существования минимума.231Покажем, что полученное решение единственно. Предположим, что существуют дварешения: u1 , u2 и û1 , û2 . Из условий Куна–Таккера получим следующее соотношение:11(ln(u2 ) + a2 ln(εx − u1 − u2 )) − (ln(û2 ) + a2 ln(εx − û1 − û2 )) =u1û111= (ln(u1 ) + a1 ln(εx − u1 − u2 )) − (ln(û1 ) + a1 ln(εx − û1 − û2 )) .u2û2Подставляя выражения (2.48) для u2 и û2 , запишем³ εxa − u (a − a ) ´´1 ³ ³ εx − u1 (1 + a1 ) ´21 21ln+ a2 ln−u11 + a21 + a2³ εxa − û (a − a ) ´´1 ³ ³ εx − û1 (1 + a1 ) ´21 21−ln+ a2 ln−û11 + a21 + a2³³ εxa − u (a − a ) ´1 + a221 21−ln(u1 ) + a1 ln) +εx − u1 (1 + a1 )1 + a2³³ εxa − û (a − a ) ´´1 + a221 21+ln(û1 ) + a1 ln= 0.εx − û1 (1 + a1 )1 + a2f=Исследуем функцию f и покажем, что она равна нулю только при u1 = û1 .Легко видеть, что f возрастает по u1 и убывает по û1 .
Рассмотрим пределы при u1 → 0и u1 →εx.1+a1Выражение для второго предела получено из условий неотрицательностиεx − u1 (1 + a1 ) и εxa2 − u1 (a2 − a1 ).Сначала рассмотримf1 = u1 û1 f .Так каки³ εxa ´´³ ³ εx ´2+ a2 lnlim f1 = û1 lnu1 →01 + a21 + a2³ ³ εx ´³ εxa ´´2+ a2 ln,lim f1 = −u1 lnû1 →01 + a21 + a2тоf1= −∞u1 →0 u1 û1lim f = limu1 →0иf1= ∞.û1 →0 u1 û1lim f = limû1 →0Теперь рассмотримf2 = (εx − u1 (1 + a1 ))(εx − û1 (1 + a1 ))f .Так как³ ³ εx ´³ εxa ´´2limεx f2 = − ln+ a1 lnu1 → 1+a1 + a11 + a21232иlimεx f2 = lnû1 → 1+a1³ εx ´³ εxa ´2+ a1 ln,1 + a11 + a2тоlimεx f =u1 → 1+a1limεxu1 → 1+a1f2=∞(εx − u1 (1 + a1 ))(εx − û1 (1 + a1 ))иlimεx f =û1 → 1+a1limεxû1 → 1+a1f2= −∞ .(εx − u1 (1 + a1 ))(εx − û1 (1 + a1 ))Следовательно, f равно нулю только при u1 = û1 , а так как такая точка единственна,то и полученное решение единственно.Аналогичным образом показывается, что решения всех рассмотренных в данном и предыдущем разделах задач оптимизации достигаются во внутренних точках, единственны имогут быть получены из условий первого порядка.Продолжим доказательство теоремы.
Условия первого порядка для задачи (2.37) имеютвид³1´a1a2cNN−(H21−H21)−(H c −H11) = 0,u1 εx−u1 −u2εx−u1 −u2 11³1´a1a2cNcN−(H −H21 )+−(H11−H11) = 0.εx−u1 −u2 21u2 εx−u1 −u2(2.46)(2.47)Вычитая (2.47) из (2.46), получим следующее соотношение:u2 =εx − u1 (1 + a1 ).1 + a2(2.48)Предположим, что кооперативные стратегии имеют линейный вид u1 = γ11c x , u2 = γ21c x .Тогда, используя (2.46), (2.47), они могут быть найдены из решения следующего уравнения:³´³´γ21c ln(γ21c )+a2 ln(ε−γ11c −γ21c )−A12 = γ11c ln(γ11c )+a1 ln(ε−γ11c −γ21c )−A11(2.49)со связьюγ21c =ε − γ11c (1 + a1 ).1 + a2К сожалению, аналитическое решение не может быть найдено. Ниже будут представлены результаты численного моделирования.Тогда кооперативные выигрыши в одношаговой игре имеют видc= (1 + a1 ) ln x + ln(γ11c ) + a1 ln(ε − γ11c − γ21c ) − δ1 ln 2 ,H11(2.50)c= (1 + a2 ) ln x + ln(γ21c ) + a2 ln(ε − γ11c − γ21c ) − δ2 ln 2 .H21(2.51)233Теперь перейдем к двухшаговой игре.
Сначала предположим, что участники действуютнекооперативно до конца игры, тогда игроки максимизируют свои выигрыши видаNNH12= ln(u21 ) + δ1 H11== ln(u21 ) + a1 (1 + a1 ) ln(εx − u21 − u22 ) + δ1 A11 − (δ1 )2 ln 2иNH22= ln(u22 ) + a2 (1 + a2 ) ln(εx − u21 − u22 ) + δ2 A12 − (δ2 )2 ln 2 .Максимизируя, получим некооперативные стратегииu2N=iε(aj + a2j )x , i, j = 1, 2 , i 6= j(1 + a1 + a21 )(1 + a2 + a22 ) − 1и выигрыши в равновесии по НэшуNH12= (1 + a1 + a21 ) ln x + A21 + δ1 A11 − δ12 ln 2 ,(2.52)NH22= (1 + a2 + a22 ) ln x + A22 + δ2 A12 − δ22 ln 2 ,(2.53)где2A2i= ln2(ε(aj + a2j ))1+ai +ai (ai + a2i )ai +ai2((1 + a1 )(1 + a2 ) − 1)1+ai +ai, i, j = 1, 2 , i 6= j .Кооперативные стратегии определяются из решения следующей задачи:cNcNH2c = (ln(u1 ) + δ1 H11− H12)(ln(u2 ) + δ2 H21− H22)=³= ln(u1 ) + (a1 + a21 ) ln(εx − u1 − u2 ) +´N+δ1 (ln(γ11c ) + a1 ln(ε − γ11c − γ21c )) − δ12 ln(2) − H12·³· ln(u2 ) + (a2 + a22 ) ln(εx − u1 − u2 ) +N+δ2 (ln(γ21c ) + a2 ln(ε − γ11c − γ21c )) − δ22 ln(2) − H22)=´NcNc→ max ,− H22)(H22− H12= (H12где Hi1c заданы в (2.50), (2.51) и Hi2N определены в (2.52), (2.53).Аналогично, из уравнений условий первого порядка получим следующее уравнение длянахождения γ12c и γ22c :γ22c³ln(γ22c ) + (a2 + a22 ) ln(ε − γ12c − γ22c ) +´1c1c1c21+δ2 (ln(γ2 ) + a2 ln(ε − γ1 − γ2 )) − A2 − δ2 A2 =³= γ12c ln(γ12c ) + (a1 + a21 ) ln(ε − γ12c − γ22c ) +´+δ1 (ln(γ11c ) + a1 ln(ε − γ11c − γ21c )) − A21 − δ1 A11(2.54)234со связьюγ22c =ε − γ12c (1 + a1 + a21 ).1 + a2 + a22Тогда кооперативные выигрыши в двухшаговой игре имеют следующий вид:cH12= (1 + a1 + a21 ) ln x + ln(γ12c ) + (a1 + a21 ) ln(ε − γ12c − γ22c ) ++δ1 (ln(γ11c ) + a1 ln(ε − γ11c − γ21c )) − δ1 ln 2 ,cH22= (1 + a2 + a22 ) ln x + ln(γ22c ) + (a2 + a22 ) ln(ε − γ12c − γ22c ) ++δ2 (ln(γ21c ) + a2 ln(ε − γ11c − γ21c )) − δ2 ln 2 .Повторяя процесс для n-шаговой игры получим кооперативные выигрыши в виде (2.32),(2.33), а кооперативные стратегии могут быть найдены рекурсивно из уравнений (2.34).Результаты моделированияЧисленное моделирование для 20-шаговой игры проведено для тех же параметров, чтои в предыдущем разделе.
На рис. 4.13 представлен размер популяции, а на рис. 4.14, 4.15– выловы игроков.0.80.70.6xN0.50.424681012Time t14161820Рис. 4.13. Размер популяции: темная линия – кооперативное поведение, светлая –равновесие по НэшуСравним кооперативные и некооперативные выигрышиc(x, δ1 ) = −14.1039 > V1N (x, δ1 ) = −14.6439 ,V1ncV2n(x, δ2 ) = −20.5108 > V2N (x, δ2 ) = −23.2596 ,и заметим, что кооперация выгодна обоим игрокам.2350.20.180.180.160.16vil2N 0.14vil1N0.140.120.120.10.12468Time t1012142468Time t101214Рис. 4.14. Вылов первого игрока:Рис. 4.15.
Вылов второго игрока:темная линия – кооперативноетемная линия – кооперативноеповедение, светлая – равновесие поповедение, светлая – равновесие поНэшуНэшуТеперь сравним выигрыши игроков в данной рекурсивной процедуре с выигрышамииз предыдущего раздела и заметим, что выигрыш второго игрока практически не меняется, а первого становится меньше. Можно сделать вывод, что использование рекурсивнойарбитражной схемы Нэша невыгодно игроку с меньшим коэффициентом дисконтирования.Сравним выигрыши игроков при изменении коэффициентов дисконтирования. На рис.4.16 представлены выигрыши V1nc (x, δ1 ) и V2nc (x, δ2 ) для δ1 = 0.1, .
. . , 0.9 и δ2 = 0.1, . . . , 0.9.Заметим, что игрок с более высоким коэффициентом дисконтирования получает большевыгоды от кооперации. И игроки получают одинаковые выигрыши при совпадении коэффициентов дисконтирования.Заметим, что при использовании предложенного в диссертационной работе подхода кооперативный выигрыш игрока всегда больше или равен (при некоторых параметрах) выигрышу в равновесии по Нэшу. На рис. 4.17 представлены выигрыши второго игрока при кооперативном и некооперативном поведении. Следовательно, предложенный подход стимулирует кооперацию. Таким образом, при использовании арбитражной схемы для определения кооперативного поведения выигрыши агентов эколого-экономической системы большеили равны выигрышам в равновесии по Нэшу, что не всегда выполняется при применениидругих подходов определения кооперативного поведения [94].236Рис.
4.16. Кооперативные выигрыши игроковРис. 4.17. Выигрыши второго игрока2374.3. Модели с различными горизонтами планированияВ данном разделе исследованы теоретико-игровые модели, в которых агенты экологоэкономической системы различаются не только коэффициентами дисконтирования, но ивременами участия в процессе эксплуатации. Рассмотрены случаи фиксированных и случайных горизонтов планирования.Основной задачей является определение кооперативных стратегий и выигрышей в случае различных горизонтов планирования.
Когда время участия одного из агентов меньше,чем у другого, то игрок включается в процесс эксплуатации на фиксированное время иготов вступить в кооперацию зная, что это более прибыльно для него. Но так как у агентаменьший, чем у партнера горизонт планирования, то он должен получить выгоду от кооперации больше, чем игрок, который продолжает процесс эксплуатации ресурса дальше.Определение кооперативного поведения в данном случае не было исследовано ранее.В диссертационной работе для построения кооперативных стратегий и выигрышей вслучае различных горизонтов планирования разработаны новые методы с применениемарбитражной схемы Нэша.Рассмотрим задачу управления возобновляемыми ресурсами с асимметричными временами участия в процессе эксплуатации. Динамика развития возобновляемого ресурса имеетвидxt+1 = f (xt , u1t , u2t ) , x0 = x ,(3.1)где xt ≥ 0 – размер эксплуатируемого ресурса в момент времени t, f (xt , u1t , u2t ) – функция развития возобновляемого ресурса, uit ≥ 0 – стратегия (интенсивность эксплуатации)агента i в момент времени t, i = 1, 2.Функции выигрышей агентов для конечного горизонта планирования ([0, n]) имеют видJi =nXδit gi (u1t , u2t ) ,(3.2)t=0где gi (u1t , u2t ) – «мгновенная» прибыль игрока i в момент времени t, 0 < δi < 1 – коэффициент дисконтирования игрока i, i = 1, 2.NОбозначим uN = (uN1 , u2 ) – равновесие по Нэшу в задаче (3.1), (3.2), а соответствующиевыигрыши – Vi (x, δi )[0, n].В диссертационной работе предложен метод определения кооперативного поведенияв случае различных (фиксированных) времен участия агентов в процессе эксплуатации.Пусть игроки (страны или фирмы) различаются горизонтами планирования, а именно первый агент эксплуатирует возобновляемый ресурс на протяжении n1 моментов времени, а238второй – на протяжении n2 моментов времени.