Диссертация (Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами), страница 7
Описание файла
Файл "Диссертация" внутри архива находится в папке "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами". PDF-файл из архива "Кооперация и конкуренция в динамических моделях управления возобновляемыми ресурсами", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой докторскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени доктора физико-математических наук.
Просмотр PDF-файла онлайн
Текст 7 страницы из PDF
. . , n, таких, что выполнены следующие условия:u∗i (t) = argmax Hi (x∗ (t), u−i∗ (t), ψi (t)) ,ui ∈ Ui(x∗ )0 (t) = f (x∗ (t), u∗ (t)), x∗ (0) = x0 ,∂Hi (x∗ , u∗ , ψi )dGi (x∗ (T ))0ψi (t) = −, ψi (T ) =,∂xdxгдеHi (x, u, ψi ) = gi (x, u)+ < ψi , f (x, u) > .Для игр типа (1.12), (1.16) условия принципа максимума аналогичны с той лишь разницей, что вместо сопряженных переменных ψi (t) удобно использовать ψ̄i (t) = e−ρt ψi (t),i = 1, . . .
, n.Утверждение 1.2. В динамической игре (1.12), (1.14) стратегии u∗i (x, t) образуют равновесие по Нэшу тогда и только тогда, когда существуют функции Vi : Rm × [0, T ] → R,такие, что выполнены следующие условия:∂Vi (x∗ , t)∂Vi (x∗ , t)= max [f (x∗ , u−i∗ ) + gi (x∗ , u−i∗ )] =ui ∈ Ui∂t∂x∂Vi (x∗ , t)=f (x∗ , u∗ ) + gi (x∗ , u∗ ) , Vi (x∗ , T ) = Gi (x∗ (T )) ,∂x−гдеVi (x, t) =maxui (s), t ≤ s ≤ TZ[Tgi (x(s), u(s))ds + Gi (x(T ))] .tДля игр типа (1.12), (1.16) уравнение Гамильтона–Якоби–Беллмана аналогично, новместо gi (x, u) в уравнении будет gi (x, u)e−ρt , i = 1, .
. . , n.28Заметим, что применение принципа Беллмана в задаче с конечным горизонтом планирования сопряжено с решением дифференциальных уравнений в частных производных,в которых редко удается получить решение в аналитическом виде. Поэтому, в дальнейших разделах диссертационной работы для определения оптимальных стратегий в играх сконечным горизонтом планирования будем использовать принцип максимума Понтрягина(теорема 1.5).Применение же принципа максимума для решения задач с бесконечным горизонтом планирования связано с проблемой определения условия трансверсальности на бесконечности[4], поэтому для построения оптимальных стратегий в динамических играх с бесконечнымвременем будем применять метод динамического программирования.В динамических теоретико-игровых задачах экономического роста с выигрышами вида (1.17), как было показано в разделе 1.1.1, удобно использовать метод динамическогопрограммирования, т.к.
стратегии строятся в виде функций с обратной связью, и уравнение Гамильтона–Якоби–Беллмана является обыкновенным дифференциальным уравнением. Приведем соответствующий результат.Утверждение 1.3. В динамической игре (1.12), (1.17) стратегии u∗i (x) образуют равновесие по Нэшу тогда и только тогда, когда существуют функции Vi : Rm → R, такие,что выполнены следующие условия:−ρVi (x∗ ) = max [ui ∈ UidVi (x∗ )f (x∗ , u−i∗ ) + gi (x∗ , u−i∗ )] =dxdVi (x∗ )=f (x∗ , u∗ ) + gi (x∗ , u∗ ) ,dxгдеVi (x) =maxui (s), t ≤ s ≤ TZ[∞e−ρ(s−t) gi (x(s), u(s))ds] .tДискретные игрыТеперь рассмотрим динамическую игру n лиц в дискретном времени.
Динамика развития системы описывается уравнением (1.13).Функции выигрыша каждого игрока для конечного и бесконечного горизонта планирования имеют вид1nJi (u , . . . , u ) =N−1Xt=0иJi (u1 , . . . , un ) =gti (xt , u1t , . . . , unt ) + Gi (xN ) → maxiu ∈U∞Xt=0gti (xt , u1t , . . . , unt ) → max.iu ∈U(1.18)(1.19)29А в играх, связанных с задачами экономического роста –1nJi (u , . . . , u ) =N−1Xt=0или1nJi (u , . . .
, u ) =δ t gti (xt , u1t , . . . , unt ) + Gi (xN ) → maxiu ∈U∞Xt=0δ t gti (xt , u1t , . . . , unt ) → max.iu ∈U(1.20)(1.21)Применяя обозначениеn∗−i∗i − 1∗u∗t = (u1∗= (u1∗, uit , uit + 1∗ , . . . , un∗t , . . . , ut ), utt , . . . , utt ),приведем результаты о существовании и методах построения оптимальных по Нэшу стратегий.Утверждение 1.4. Пусть ft , gti – непрерывно дифференцируемы. Тогда, если u∗t – равновесие по Нэшу в игре (1.13), (1.18) и x∗t – соответствующая ему траектория процесса, тоiсуществует набор m-мерных векторов ψ1i , . .
. , ψN+ 1 , i = 1, . . . , n, такой, что выполненыследующие условия:∗−i∗iui∗t = argmax Hi (xt , ut , ψt + 1 ) ,ui ∈ U ix∗t + 1 = ft (x∗t , u∗t ) , x∗0 = x0 ,ψti = −∂Hi (x∗t , u∗t , ψti + 1 )dGi (x∗N )i, ψN=,∂xtdxNгдеHi (xt , ut , ψti + 1 ) = gti (xt , ut ) + ψti + 1 ft (xt , ut ) .Утверждение 1.5. В динамической игре (1.13), (1.18) стратегии ui∗t (xt ) образуют равновесие по Нэшу тогда и только тогда, когда существуют функции Vti (xt ), такие, чтовыполнены следующие условия:−i∗∗i[gti (x∗t , u−i∗Vti (x∗t ) = maxt ) + Vt+1 (ft (xt , ut ))] =iut ∈ Uii(ft (x∗t , u∗t )) , VNi (x∗N ) = Gi (x∗N ) ,= gti (x∗t , u∗t ) + Vt+1гдеVti (xt ) =maxiuit , ..., uN −1 ∈ UiN−1Xgji (xj , uj ) + Gi (xN ) .j =tА для игры (1.13), (1.21) уравнения примут видVi (x∗ ) = max[g i (x∗ , u−i∗ ) + δVi (f (x∗ , u−i∗ ))] = g i (x∗ , u∗ ) + δVi (f (x∗ , u∗ )) .iu ∈ Ui30В дальнейших исследованиях все приведенные методы решения динамических игр будут применены для определения оптимальных стратегий игроков не только в равновесиипо Нэшу, но и при кооперативном поведении (за исключением главы 4).
Так как в кооперации игроки максимизируют общий выигрыш, то определение оптимальных кооперативныхстратегий является задачей оптимального управления.1.1.3. Арбитражные схемыВ разделе 1.2 настоящей главы и в главе 4 в качестве решений используются арбитражные схемы Нэша и Калаи–Смородинского. Поясним данные концепции решения для игрыс двумя участниками.Конфликт двух игроков формулируется парой (S, H 0 ), где S ⊆ R2 – допустимое множество решений и H 0 = (H10 , H20 ) ∈ R2 – точка статус-кво. Если игроки не могут достичь соглашения, то они получают в качестве выигрыша компоненты вектора H 0 . Обычно предполагается, что S – замкнутое, выпуклое множество.
Так как ни один рациональный игрок непримет соглашения, которое хуже, чем выигрыш без соглашения, то ограничим допустимоемножество: S̄ = {H | H ∈ S, H ≥ H 0 }. Для k = 1, 2 обозначим Hk∗ = max{Hk | (H1 , H2 ) ∈ S̄},так называемую идеальную точку. Определим функцию g : [H10 , H1∗ ] → [H20 , H2∗ ] так, чтоS̄ = {H | H10 ≤ H1 ≤ H1∗ , H20 ≤ H2 ≤ g(H1 )} и предположим, что g – строго убывающая ивогнута. Заметим, что граница Парето задана графиком функции g на [H10 , H1∗ ].Определение 1.3. Задача о переговорах – это задача выбора точки (H̄1 , H̄2 ) из S в результате переговоров [14], [29], [159]. Таким образом, необходимо построить правило длярешения задачи о переговорах, а именно найти функциюφ(S, H10 , H20 ) = (H̄1 , H̄2 ) .Теорема 1.5. [159].
Пусть S – выпуклый компакт в R2 , (H10 , H20 ) – вектор макcиминныхвыигрышей (точка статус-кво). Выполнены следующие аксиомы Нэша:1) индивидуальная разумность. (H̄1 , H̄2 ) ≥ (H10 , H20 );2) допустимость. (H̄1 , H̄2 ) ∈ S;3) оптимальность по Парето. Если (H1 , H2 ) ∈ S и (H1 , H2 ) ≥ (H̄1 , H̄2 ), то (H1 , H2 ) =(H̄1 , H̄2 );4) независимость от посторонних альтернатив. Если (H̄1 , H̄2 ) ∈ T ⊂ S и (H̄1 , H̄2 ) =φ(S, H10 , H20 ), то (H̄1 , H̄2 ) = φ(T, H10 , H20 );315) независимость от линейного преобразования.
Пусть T получается из S с помощьюлинейного преобразованияH10 = α1 H1 + β1 , H20 = α2 H2 + β2 .Тогда, если (H̄1 , H̄2 ) = φ(S, H10 , H20 ), то (α1 H̄1 + β1 , α2 H̄2 + β2 ) = φ(T, α1 H10 + β1 , α2 H20 + β2 );6) симметрия. Если (H1 , H2 ) ∈ S, то (H2 , H1 ) ∈ S. Если H10 = H20 и (H̄1 , H̄2 ) = φ(S, H10 , H20 ),то H̄1 = H̄2 .Тогда существует единственная функция φ(S, H10 , H20 ) = (H̄1 , H̄2 ).Теорема 1.6.
[159].Если существуют точки (H1 , H2 ) ∈ S, такие, что H1 > H10 ,H2 > H20 , то арбитражное решение Нэша – это точка (H̄1 , H̄2 ), которая максимизируетфункциюq(H1 , H2 ) = (H1 − H10 )(H2 − H20 )(1.22)на подмножестве S, где H1 ≥ H10 .Теорема 1.7. [159]. Пусть (H̄1 , H̄2 ) удовлетворяет теореме 1.6. Тогда в этой точкедостигается максимум функцииh(H1 , H2 ) = (H̄1 − H10 )H2 + (H̄2 − H20 )H1 .Таким образом, арбитражное решение Нэша выбирает единственную точку на границеПарето, которая максимизирует произведение удалений от точки статус-кво.
Следовательно, решение Нэша – это единственное оптимальное решение следующей задачи оптимизации: (H1 − H10 )(H2 − H20 ) → max ,H1 ,H2H10≤ H1 ≤H1∗, H2 = g(H1 ) .Еще один метод построения арбитражного решения был введен в [116]. Арбитражноерешение Калаи–Смородинского не столь широко распространено как схема Нэша, но егопостроение гораздо проще и не требует решения задачи оптимизации. Данная схема будетприменена в следующем разделе диссертационной работы для разрешения возникающегоконфликта наряду с арбитражной процедурой Нэша.Решение Калаи–Смородинского может быть графически представлено так.
Рассмотримлинейный отрезок L, соединяющий точку статус-кво (H10 , H20 ) с идеальной точкой (H1∗ , H2∗ ):L : H − 2 − H20 −H2∗ − H20(H1 − H10 ) = 0 .H1∗ − H1032Тогда решение – это единственная точка пересечения этого отрезка и границы ПаретоH2 = g(H1 ).Следовательно, для построения решения Калаи–Смородинского необходимо найти решение уравненияH20 +H2∗ − H20(H1 − H10 ) − g(H1 ) = 00∗H1 − H1на интервале [H10 , H1∗ ].H2H2(H*1 , H*2 )H2*0(H*1 , H*2 )H2*0(H1- H1 ) (H2- H2 ) =const(H1 , g(H1 ))_S(H1 , g(H1 ))_S000H = (H1 , H2 )000H = (H1 , H2 )H1*(0,0)LH1(0,0)H1*Рис 1.1. Арбитражное решениеРис 1.2. РешениеНэшаКалаи–СмородинскогоH1331.2.Теоретико-игровыемоделиуправлениявозобновляемымиресурсамис участием центраВ данном разделе рассматриваются модели динамической игры управления возобновляемыми ресурсами.
Агентами эколого-экономической системы являются центр (контролирующий орган), который назначает долю закрытой для эксплуатации части территории,и участник (агент), эксплуатирующий возобновляемый ресурс. В традиционной постановке задачей центра является регулирование процесса эксплуатации ресурса путем введенияограничений (квот).
В диссертационной работе предлагается новый метод экологического регулирования, в котором задача центра – выбор оптимальной доли эксплуатируемойтерритории для поддержания стабильного развития ресурса в долгосрочной перспективе иопределение интенсивности эксплуатации, достаточной для удовлетворения спроса.Заметим, что практическая организация такой схемы экологического регулированиязначительно проще, чем использование квот. Рекомендуемый способ управления экологоэкономической системой, в свою очередь, приводит к существенному экологическому эффекту в виде поддержания стабильного развития экологической системы.Итак, предлагается новая схема регулирования процесса эксплуатации возобновляемогоресурса, в которой центр определяет долю закрытой для эксплуатации части территории,обозначенную s(t), 0 ≤ s(t) ≤ 1. На рис.