Диссертация (1145356), страница 2
Текст из файла (страница 2)
. . . . . . . . . . . . 2999.3.1Пример . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302Заключение308Литература309Введение1. Актуальность и степень разработанности темы исследованияОсновными задачами современной теории игр являются конструирование ианализ принципов оптимального поведения участников в различных задачахконфликтного управления. Реально происходящие конфликты развиваютсяво времени, поэтому особую актуальность приобретают динамические модели.
Дифференциальные игры являются удобными математическими моделями для описания конфликтно- управляемых процессов, происходящих в экономике, экологии, менеджменте и других сферах человеческой деятельности.Теория дифференциальных игр выделилась в отдельный раздел математики в пятидесятых годах XX в. Одной из первых работ в области дифференциальных игр принято считать работу Р. Айзекса [3], в которой в терминах состояний и управлений была сформулирована задача перехвата самолетауправляемой ракетой, а также выведено основополагающее уравнение для нахождения решения.
Вклад Р. Айзекса вместе с классическим исследованием Р.Беллмана [7] создали основу для использования результатов теории оптимального управления в задачах конфликтного управления с несколькими участниками. Первые интересные результаты в теории дифференциальных игр былиполучены Л.
Берковицем [174], Г. Лейтманом [260], В. Флемингом [208], А.Фридманом [209] и др.91. Актуальность и степень разработанности темы исследования10Значительный вклад в дальнейшее развитие дифференциальных игр внесли отечественные ученые Л.С. Понтрягин [118, 119], Л.А. Петросян [98, 97],Н.Н. Красовский [68, 69], Б.Н. Пшеничный [122], работы которых в основном были связаны с дифференциальными играми преследования.
Важнейшиерезультаты в области обоснования и методов нахождения решений антагонистических дифференциальных игр были получены в работах Красовского Н.Н. и А.И. Субботина [70, 130, 131]. Параллельно начала развиваться теориянеантагонистических дифференциальных игр, в которых в качестве принципа оптимальности использовалось равновесие по Нэшу [278].
Особо следуетотметить работы отечественных ученых, внесших большой вклад в развитиенеантагонистических дифференциальных игр: Э. М. Вайсборда, Р.В. Гамкрелидзе, Н. Л. Григоренко, В.И. Жуковского, А. Ф. Клейменова, А. Ф. Кононенко, А.В. Кряжимского, А. Б. Куржанского, В.Н.
Лагунова, Н. Ю. Лукоянова,С.С. Кумкова, О. А. Малафеева, Мищенко Е.Ф., В.С. Пацко, Н. Н. Петрова,Н. Никандр. Петрова, Субботиной Н.Н. , Тынянского Н.Т., Чикрия А.А., Чистякова С. В., Ченцова А. Г. [13, 24, 25, 40, 41, 43, 55, 56, 57, 58, 60, 64, 75, 81,82, 83, 84, 87, 93, 94, 142, 143, 144, 145, 147, 148, 149, 340, 360] и многих других.Позднее работы, использующие методы дифференциальных игр, появилисьи в области моделирования конфликтно– управляемых экономических процессов, в том числе в задачах природоохранной политики, оптимальной эксплуатации природных ресурсов и пр. (см., например, [196, 175, 211]). Даннаяобласть развивается достаточно быстро, подробный анализ указанных работможно найти в [194] (см.
также [109]). Особо отметим работы Л.А. Петросяна,В.В. Захарова, Н.А. Зенкевича, В.В. Мазалова, А.Н. Реттиевой, С. Йоргенсена, Е. Докнера, Н. Лонга, Г. Соргера, Дж. Заккура, Я. Кравчика, Дж. Филараи др. [46, 47, 22, 79, 123, 179, 185, 186, 191, 195, 196, 205, 212, 231, 232, 237, 236,238, 239, 241, 242, 243, 256, 338, 359], посвященные использованию теоретико-1. Актуальность и степень разработанности темы исследования11игрового подхода для решения проблемы охраны окружающей среды.Во многих указанных выше работах рассматриваются кооперативные дифференциальные и динамические игры. Использование кооперативного подходаобосновано «неагрессивным» характером поведения игроков во многих экономических приложениях теории игр.
Теория кооперативных «однократных»игр была введена в работе Дж. фон Неймана и О. Моргенштерна [141], которая получила развитие в отечественных научных школах, возглавляемыхН. Н. Воробьевым [16] и Ю.Б. Гермейером [20]. Особенно следует отметитьуспехи, полученные в работах по кооперативным играм представителями Ленинградской школы О. Н.
Бондаревой [10], Е. Б. Яновской [350] и др.В кооперативных играх под принципом оптимальности, как правило, понимается способ распределения заработанного совместными усилиями игроковсуммарного выигрыша. Наиболее часто в работах в прикладных задачах используются такие принципы оптимальности, как вектор Л.С. Шепли [324], –ядро, – ядро и др. (см. [114, 16, 109, 227]).Непосредственный перенос результатов теории кооперативных «однократных» игр на динамические модели привносит дополнительные проблемы дляисследования. Предварительно следует пояснить различие в специфике решаемых задач в кооперативных и некооперативных играх. При изучении оптимального поведения игроков в некооперативных играх последние, как правило, рассматриваются в нормальной форме, т. е.
задается система Γ =<, { }∈ , { }∈ >, где = {1, 2, . . . , } – множество игроков, – множество стратегий игрока , – функция выигрыша игрока , определеннаяна =∏︀ . Конфликт интересов игроков состоит в том, что перед каждым=1игроком , ∈ , стоит задача выбора одной из стратегий ∈ , максимизирующей выигрыш этого игрока, зависящий, в том числе, и от выбранныхстратегий других игроков. В этом смысле подход к решению круга задач в1.
Актуальность и степень разработанности темы исследования12некооперативной постановке игры может быть назван «стратегическим» [101].В кооперативной постановке все игроки перед началом игры договариваются действовать совместно оптимально (кооперируются), т.е. договариваются использовать стратегии * = (*1 , *2 , . . . , * ), максимизирующие суммарный выигрыш ( ) = max∑︀∈ =1 ().
При достаточно слабых ограничениях наусловия достижимости максимума и пр. в кооперативных играх «достаточнопросто» найти оптимальные стратегии * = (*1 , *2 , . . . , * ) (о поиске Парето–оптимальных решений см. [88]). В кооперативном варианте игры главной задачей, носящей конфликтный характер, становится проблема справедливогораздела ( ) между игроками.
В связи с этим подход к решению задач вкооперативных играх может быть назван «нестратегическим», подчеркиваято, что задача нахождения оптимальных стратегий не носит конфликтныйхарактер и не является основной.При изучении кооперативных игр выделяют так называемые кооперативные игры с трансферабельной и нетрансферабельной полезностью [354]. Свойство трансферабельности означает, что игроки имеют возможность складывать и делить выигрыши. В трансферабельных кооперативных играх под принципом оптимальности понимают способ раздела суммарного максимального выигрыша, совместно заработанного игроками [101].
Отметим, что в англоязычной литературе вместо словосочетания «принцип оптимальности» используется понятие «кооперативного решения», однако мы в основном будемпридерживаться терминологии, введенной Н.Н. Воробьевым в [16].Теория кооперативных дифференциальных игр получила бурное развитиепосле выхода монографии Л.А. Петросяна, Н. Н. Данилова [101], в которой,в том числе, обсуждалась проблема динамической неустойчивости классических принципов оптимальности, перенесенных из теории статических кооперативных игр на динамическую постановку. Это обстоятельство впервые было1.
Актуальность и степень разработанности темы исследования13замечено Л.А. Петросяном в 1977 году [110]. Позднее введенные им термины динамической и сильно динамической устойчивости в англоязычной литературе трансформировались в «состоятельность во времени» и «сильнуюсостоятельность во времени» соответственно. В работах по кооперативнымдифференциальным играм с предписанной продолжительностью Л.
А. Петросяном [105, 107, 110, 111, 113] был разработан математический аппарат, названный процедурой распределения дележа, позволяющий добиться динамической устойчивости (или реализуемости во времени) выбранного игрокамиперед началом игры принципа оптимальности. На основе предложенного Л.А.Петросяном подхода, была изучена проблема динамической и сильно динамической устойчивости в кооперативных дифференциальных и многошаговыхиграх (Д.В. Кузютин, Л.А.
Петросян), в том числе в стохастической постановке (см. А.В. Белицкая, Л.В. Грауэр, М. Дементьева, В.В. Захаров, Н.А.Зенкевич, А.В. Зятчин, Н.В. Козловская, Н.В. Колабутин, В. В. Мазалов,М.В. Марковкин, Е.М. Парилина, А. Н. Реттиева, Я. Б. Панкратова, О. Л.Петросян, А.Н. Реттиева, С.И. Тарашнина, А.В. Тур и др.), в сетевых играх(А.А.
Седаков, М.В. Булгакова), играх с нетрансферабельной полезностью (Д.Янг) [99, 23, 45, 48, 49, 50, 51, 62, 71, 90, 91, 95, 104, 106, 123, 135].Попытка применения классических для «однократных» кооперативных игрпринципов оптимальности в динамических моделях приводит к тому, что ониоказываются нереализуемыми во времени (динамически неустойчивыми). Данный факт был замечен в различных формулировках: Ф. Кидланд, Е. Прескотт[249] обнаружили динамическую неустойчивость решений в некоторых экономических задачах, А. Ори [230] заметил динамическую неустойчивость вектора Шепли в задаче о переговорах, также проблема динамической неустойчивости в повторяющихся играх была обозначена в работе И. Куриель [189],однако только в концепции, предложенной Л.А.