Диссертация (1145356), страница 39
Текст из файла (страница 39)
функции (* ( )) , ∈ , ∈ , =1, . . . , , которая удовлетворяет условиям, приведенным в следующем определении.Определение 9.3.1. Процедура распределения дележа { (* ( ))} ∈ , = 1, . . . , , ∈ , называется динамически устойчивой процедурой распределения дележа с начальным состоянием 0 (0 ), если для любого состояния (* ( )), ∈ , = 0, . . . , и для всех ∈ выполняются условия(︀ (︀ )︀)︀(︀ (︀ (︀ )︀)︀)︀ℎ * ≥ ˜ * , (9.3.9)−1 ∑︁∑︁( ) (* ( ))+=0 ∈ ∑︁(︀(︀ (︀ )︀)︀)︀( )ℎ * ( ) = ℎ 0 0 . (9.3.10) ∈ Первое условие гарантирует, что при движении вдоль кооперативной траектории выигрыш каждого игрока не может быть меньше того, что этот игрокполучил бы в некооперативном варианте игры. Второе условие аналогичноусловию (8.2.21).Очевидно, что первое условие всегда удовлетворяется, т.к. вектор Шеплиявляется дележом.
Остается проверить выполнение второго условия. Этот результат сформулирован в следующей теореме.Теорема 9.3.1. Пусть(︀ (︀ )︀)︀(︀ (︀ )︀)︀ * = ℎ * −∑︁(︀ * (︀ +1 )︀)︀(+1|)ℎ ,+1 ∈( ) = 0, . . . , − 1, (9.3.11)(︀ (︀ )︀)︀(︀ (︀ )︀)︀ * = ℎ * .Тогда вектор (1 (* ( )) , . . . , (* ( ))) удовлетворяет (9.3.10).(9.3.12)Глава 9.302Многошаговые игры на деревьях событийДоказательство.
Для проверки свойства (9.3.10) посчитаем взвешенную сумму выплат (* ( )) по множеству всех вершин ∈ , = 0, . . . , − 1:∑︁(︀ (︀ )︀)︀( ) * = ∈ ⎛⎞∑︁∑︁(︀ (︀ )︀)︀( ) ⎝( )ℎ * −∑︁ ∈ ∈ =∑︁ ∈ ∑︁(︀ (︀ )︀)︀( )ℎ * − ∈ ∈ ( )⎞∑︁∑︁(︀ (︀ )︀)︀⎝( )ℎ * − ∈ =+1⎛(︀ * (︀ +1 )︀)︀⎠=(+1|)ℎ (︀ * (︀ +1 )︀)︀⎠=(+1 )ℎ +1 ∈ ( )∑︁(︀ * (︀ +1 )︀)︀(+1)ℎ. +1+1 ∈ Суммируя по всем = 0, .
. . , − 1 получаем−1 ∑︁∑︁∑︁(︀)︀(︀)︀( )(* ( )) = (0 )ℎ 0 (0 ) −( )ℎ * (+1). ∈ =0 ∈ Принимая во внимание, что (0 ) = 1 окончательно получаем (9.3.10).Таким образом, вычисляя ПРД согласно формуле (9.3.11), получим динамически устойчивое распределение компонент вектора Шепли во времени, т.е.такую схему выплат, при которой у игроков не будет оснований отклонитьсяот кооперативной траектории.9.3.1ПримерВ качестве иллюстративного примера рассмотрим олигополию Курно, состоящую из трех игроков, производящих однородный продукт (см. [?]). Ввведем следующие обозначения: = {1, 2, 3} – множество игроков, ( ) –количество продукта, производимого -ым игроком в вершине дерева событий , ( ) =∑︀ ( ) – количество продукта, производимое всеми игроками.Спрос является случайной функцией, которая описывается деревом событий,изображенным на Рис.
9.1.Глава 9.303Многошаговые игры на деревьях событийРис. 9.1: Дерево событий, соответствующее случайному спросуПоложим, что обратная функция спроса описывается следующей аффинной функцией:(︀ (︀ )︀)︀(︀ )︀ = ( ) − , ∈ , = 0, 1, 2,(9.3.13)где ( ) и – положительные параметры.Обозначим через ( ) максимальную производительность, через ( ) –инвестиции в производство, осуществляемые -ым игроком в вершине , =0, 1. Полагая, что инвестиции оказывают влияние на производительность наследующем шаге, динамика производительности -го игрока может быть описана следующим уравнением состояния:(︀ )︀(︀ (︀ )︀)︀(︀ (︀ )︀)︀ = (1 − ) + , (0 ) = 0 ,(9.3.14)где 0 обозначает начальную производительность, а , 0 ≤ < 1 – коэффициент амортизации.
Произведенное количество товара должно удовлетворятьограничению(︀ )︀(︀ )︀ ≤ , ∈ , = 0, 1, 2.(9.3.15)Глава 9.304Многошаговые игры на деревьях событийЗатраты на производство и инвестиции описываются следующими выпуклымифункциями: 2 , > 0,2 2 ( ) = , > 0.2 (9.3.16) ( ) =(9.3.17)Ликвидационная стоимость продуктов, произведенных игроком к конечномумоменту времени ( = 2) обозначается ( ) :(︀)︀(︀)︀ ( ) = 2 ( ),2 > 0.Игроки стремятся максимизировать свои выигрыши, т.е. игрок решает следующую оптимизационную задачу:max =∑︁=0∑︁(︀ )︀ (︀ (︀ )︀ (︀ (︀ )︀)︀(︀ (︀ )︀)︀(︀ (︀ )︀)︀)︀ − − + ∈ +∑︁(︀ )︀ (︀ (︀ )︀)︀ , ∈ где (·) и (·) удовлетворяют (9.3.14) и (9.3.15) и выполняются условия неотрицательности ( ) ≥ 0, ( ) ≥ 0, ∈ , = 0, 1, 2.
Обратная функцияспроса описывается (9.3.13) при условии ≡ 0, ∀ ∈ .(︀)︀Для численного эксперимента использовались следующие значения параметров::1 = 2.75, 2 = 3, 3 = 3.25,1 = 20,2 = 22,3 = 19,10 = 15,20 = 18,30 = 16,1 = 2.5,2 = 3,3 = 3.5, = 0.151 = 2 = 3 = 0.8, = 2.5,Глава 9.305Многошаговые игры на деревьях событийВершина0123456( )1001109012010010585иВычисления проводились в среде Matlab.
Кооперативные решения, соответствующие совместной максимизации игроками совокупного выигрыша, * ={︀}︀{* ( )}, = 1, 2, 3 : ∈ , = 0, 1, 2 приведены в таблице 9.1. Значения - характеристической функции (; * ( )) для подыгры, начинающейся ввершине , = 0, 1, 2 с начальным условием * ( ) приведена в таблице 9.2.Таблица 9.2 должна быть интерпретирована следующим образом: столбцы соответствуют коалициям, а строки представляют собой значения характеристических функций подыгр.
Далее, для подыгр, начинающихся в вершине деревасобытий , значения вектора Шепли ℎ( * ( )) = {ℎ ( * ( ))}∈ , былирассчитаны с использованием (9.3.8) (см. Рис. 9.2 для иллюстрации). Динамически устойчивое распределение значений вектора Шепли ℎ( * (0 )), т.е.процедура распределения дележа ( * ( )) = { ( * ( ))}∈ , ∈ , =0, 1, 2, получено из выражения (9.3.11) Теоремы 9.3.1 и проиллюстрировано наРис. 9.2. Можно заметить, что терминальное условие (9.3.12) выполняется.=00=1=21234561* ( ) 15.000013.625013.625012.868112.868112.868112.86812* ( ) 18.000016.465316.465315.709315.709315.709315.70933* ( ) 16.000015.109515.109515.062815.062815.062815.0628Таблица 9.1: Кооперативная траекторияГлава 9.Многошаговые игры на деревьях событийРис.
9.2: Динамически устойчивый вектор Шепли на дереве событий306509.3831454.6935388.1486403.6505346.1800 (; * (2)) 436.3969 (; * (3)) 364.0190 (; * (4)) 293.2680 (; * (5)) 309.7497 (; * (6)) 248.6465357.2139411.4388396.8124459.5991498.1369617.0512770.8046{3}593.6033711.5337679.7235816.2745942.44051201.05981559.9283{{1, 2}, {3}}604.2215718.6877687.8120820.3517930.05941181.08171522.0376{{1, 3}, {2}}701.2751811.8562782.0284910.06971001.73551244.23801565.3457{{2, 3}, {1}}Таблица 9.2: Значения –характеристической функции для подыгр635.4151 (; * (1)) 570.3952{2}806.3739{1} (; * (0)) 760.38581009.12701211.95061157.24161392.08991599.76932044.55782656.3805{1, 2, 3}Глава 9.Многошаговые игры на деревьях событий307ЗаключениеОсновной целью диссертационной работы являлось построение конструктивной теории кооперативных дифференциальных игр со случайной продолжительностью.
Был разработан математический аппарат, позволяющий формально описать и исследовать широкий класс теоретико-игровых динамическихзадач со случайной продолжительностью в форме кооперативных дифференциальных игр со случайной продолжительностью. Способы построения динамически устойчивых принципов оптимальности для указанного класса кооперативных игр были предложены в форме алгоритмов и обоснованы в видеТеорем. Полученные результаты были адаптированы для дискретной постановки игры. В работе были изучены многочисленные прикладные примерытеоретико- игровых задач со случайной продолжительностью, для которыхбыли применены предложенные математические методы и алгоритмы.Таким образом, основные цели и задачи диссертационной работы были выполнены полностью.308Литература[1] Аваков Е. Р.
Необходимые условия первого порядка для анормальныхзадач вариационного исчисления / Е.Р. Аваков. // Дифференц. уравнения, 1991, Т. 27, № 5, С. 739–745.[2] Асеев С. М. Принцип максимума Понтрягина и задачи оптимального экономического роста / С. М. Асеев, А. В. Кряжимский. – М: Наука, 2007Тр. МИАН, 257, 3–271 , – 272 с.[3] Айзекс Р. Дифференциальные игры / Р. Айзекс.
– М.: Мир. 1967, – 479 с.[4] Ауман Р. Значение для неатомических игр / Р. Ауман, Л. Шепли. –Принстон: Изд-во Принстонского ун-та, 1974, – 283 с.[5] Белицкая А. В. Сетевая игра сокращения вредных выбросов в атмосферу/ А. В. Белицкая, Л. А. Петросян. // МТИП, 4:2, 2012, С. 3–13.[6] Беллман Р. Введение в теорию матриц / Р. Беллман. – М.: Наука, 2-еизд. – 352 с.[7] Беллман Р. Динамическое программирование / Р. Беллман. – М.: И.Л.,1960.[8] Берж К. Общая теория игр нескольких лиц / К.
Берж. – М.: Физматгиз,1961, – 114 с.309Литература310[9] Блекуэлл Д. Теория игр и статистических решений / Д. Блекуэлл, М.Гиршик. – М.: И.Л., 1958, – 330 с.[10] Бондарева О. Н. Некоторые применения методов линейного программирования к теории кооперативных игр / О. Н. Бонадрев. – М.: Государственное издательство физико-математической литературы, Проблемыкибернетики. Выпуск 10, 1963, С. 119–139.[11] Бондарева О. Н. О теоретико-игровых моделях в экономике / О.
Н. Бонадрева. – Л.: Изд-во ЛГУ, 1974, – 115 с.[12] Буре В. М. Теория вероятностей и математическая статистика / В. М.Буре, Е. М. Парилина. – СПб: Изд-во "Лань 2013, – 416 с.[13] Вайсборд Э. М. Введение в дифференциальные игры нескольких лиц иих приложения / Э. М. Вайсборд, В. И. Жуковский. – М.: Сов. радио,1980, – 303 с.[14] Воробьев Н. Н. Основы теории игр. Бескоалиционные игры / Н.
Н. Воробьев. – М.: Наука, 1984.[15] Воробьев Н. Н. Современное состояние теории игр / Н. Н. Воробьев. –Успехи мат. наук, 1970, Т. 25, № 2, C. 69–90.[16] Воробьев Н. Н. Теория игр для экономистов-кибернетиков / Н. Н. Воробьев. – M.:Наука, 1985. – 272 с.[17] Габасов Р. Ф. Особые оптимальные управления / Р. Ф. Габасов, Ф. М.Кириллова. – М.: Наука, 1973. – 256 с.[18] Гаврилов Л. А. Биология продолжительности жизни / Л. А. Гаврилов,Н.
С. Гаврилова. – М.: Наука, 1991.Литература311[19] Гермейер Ю. Б. Дискретный принцип максимума в задачах определениямаксимина / Ю. Б. Гермейер. // Журнал вычислительной математикии математической физики, 1970, Т. 10, № 2, С. 461–465.[20] Гермейер Ю. Б. Игры с непротивоположными интересами: с предисловием Н. Н. Моисеева / Ю. Б. Гермейер. – М.: Наука, 1976. – 328 с.[21] Гермейер Ю.