Автореферат (Кооперация в дискретных линейно-квадратичных играх), страница 3
Описание файла
Файл "Автореферат" внутри архива находится в папке "Кооперация в дискретных линейно-квадратичных играх". PDF-файл из архива "Кооперация в дискретных линейно-квадратичных играх", который расположен в категории "". Всё это находится в предмете "физико-математические науки" из Аспирантура и докторантура, которые можно найти в файловом архиве СПбГУ. Не смотря на прямую связь этого архива с СПбГУ, его также можно найти и в других разделах. , а ещё этот архив представляет собой кандидатскую диссертацию, поэтому ещё представлен в разделе всех диссертаций на соискание учёной степени кандидата физико-математических наук.
Просмотр PDF-файла онлайн
Текст 3 страницы из PDF
, n.(12)k=lТеорема 6. В линейно-квадратичных дискретных играх с нетрансферабельными выигрышами с бесконечной продолжительностью условие устойчивости14против иррационального поведения игроков выполнено для любого Паретоотимального решения, состоятельная во времени процедура распределениявыигрыша β(k) которого удовлетворяет неравенствам:βi(k) + (xα(k))T (A(k) + B(k)M α (k))T Θi (k + 1)(A(k) + B(k)M α (k))−!Θi (k) xα (k) ≥ 0,k ≥ k0 . (13)Утверждение 4.
Если для некоторого Парето-оптимального решения влинейно-квадратичных дискретных играх с нетрансферабельными выигрышами с бесконечной продолжительностью выполняется Jiα (k0 , x0, uα ) ≥Vi (k0, x0),i = 1, . . . , n, и процедура распределения выигрыша β(k) вычисля-ется по формуле (11), то условие устойчивости против иррационального поведения игроков выполнено для этого Парето-отимального решения.В качестве примера в данной главе рассмотрена игра стабилизации государственного долга.Четвёртая глава посвящена сетевым линейно-квадратичным дискретным играм c управляющей коалицией.
Рассмотрим игру на сети G = (N, U ), гдеN – конечное множество узлов сети, N = {1, 2 . . . , n}, U – множество пар (i, j),называемых дугами, i ∈ N , j ∈ N . Узлами сети считаем игроков. Предполагаем, что сеть G представляет структуру руководства или влияния некоторойорганизации.Перед началом игры определятся управляющая коалиция P . В качестветакой коалиции, например, можно взять базу, т.е. коалицию включающую наименьшее число лиц, влияющих на каждого члена организации. Если в графесуществует несколько баз, то в качестве управляющей коалиции можно взятьих объединение.Для игроков, не входящих в управляющую коалицию, задается динамика, характеризующая состояние системы в каждый момент времени:Xx(k + 1) = Ax(k) +Bi ui(k),(14)i∈N \Pгде k0 ≤ k ≤ K < ∞, k0 , K ∈ T+, x(k0) = x0, x ∈ Rm – вектор-столбец, ui ∈ R –управление игрока i, i ∈ N \P ; A, Bi – матрицы размерности (m × m) и (m × 1)15соответственно, x(k0) = x0 – начальное состояние.
Пусть N \P = {i1 , . . . , in−p},Si = {j ∈ N \P : (i, j) ∈ U } – множество игроков из N \P , для которыхсуществует ребро (i, j). Выигрыш игрока i ∈ N \P обозначим через Ji (k0, x0, u),где u = (ui1 , . . . , uin−p ). Будем предполагать, что выигрыш игрока i имеет вид:Ji(k0, x0, u, W ) =K−1XxT (k)Pix(k) + u2i (k)ri +k=k0Xu2j (k)wij −j∈Si−Xj:i∈Sju2j (k)wji +xT (K)Pix(K),∀i ∈ N \P, (15)где Pi – симметричные матрицы размерности (m × m), ri ∈ R, wij ∈ M ⊂ R– вес ребра (i, j), который задаётся управляющей коалицией на первом шагеигры, W – матрица весов, M – конечное множество значений весов, Pi , ri –фиксированные параметры заданные в начале игры.
Каждый игрок стремитсямаксимизировать свой выигрыш. Предполагается, что игроки выбирают толькостратегии вида ui(k, x) = Mi (k)x, k0 ≤ k ≤ K, i ∈ N \P .Влияние управляющей коалиции на ход игры заключается только в выборе весов {wij }i∈N \P,j∈N \P . Целью управляющей коалиции является максимизация суммарного выигрыша игроков, не вошедших в коалицию P .В работе находится некооперативное и кооперативное решение игры.Приведен пример линейно-квадратичной игры на сети с управляющей коалицией. Продемонстрирована неустойчивость решения.В Заключении приведены основные результаты, полученные в ходеисследования.Публикации автора по теме диссертации1. Марковкина А.В. Линейно-квадратичные неантагонистические дискретные игры // Процессы управления и устойчивость: Труды 38-й международной научной конференции аспирантов и студентов / Под ред. Н.В.Смирнова, Г.Ш. Тамасяна - СПб.: Издат.
Дом С.-Петерб. гос ун-та, 2007.С. 580-585.2. Тур А.В. Теоретико-игровая модель планирования производства в условиях конкуренции // Процессы управления и устойчивость: Труды 39-й16международной научной конференции аспирантов и студентов / Под ред.Н.В. Смирнова, Г.Ш. Тамасяна - СПб.: Издат.
Дом С.-Петерб. гос ун-та,2008. С. 517-522.3. Тур А.В. Условие Д.В.К. Янга в линейно-квадратичных дискретных играх // Процессы управления и устойчивость: Труды 40-й международнойнаучной конференции аспирантов и студентов / Под ред. Н.В. Смирнова,Г.Ш. Тамасяна - СПб.: Издат. Дом С.-Петерб. гос ун-та, 2009. С. 678–683.4. Тур А.В. Линейно-квадратичные неантагонистические дискретные игры // Управление большими системами. Выпуск 26.1. М.:ИПУ РАН, 2009.
С. 139–163.5. Тур А.В. Условие Д.В.К. Янга в линейно-квадратичных дискретных играхс неполной информацией // Процессы управления и устойчивость: Труды40-й международной научной конференции аспирантов и студентов / Подред. Н.В. Смирнова, Г.Ш. Тамасяна - СПб.: Издат. Дом С.-Петерб. гос унта, 2010. С. 718–723.6. Тур А.В. Линейно-квадратичные стохастические дискретные игры со случайной продолжительностью // Математическая теория игр и её приложения. Петрозаводск: КарНЦ РАН, 2014. Т.6, В. 3.
C. 76–92.7. Tur Anna V. Dynamic Game-theoretic Model of ProductionPlanning under Competition // Contributions to Game Theory andManagement. Vol II. Collected papers/ Editors Leon A. Petrosjan,Nikolay A. Zenkevich , SPb, Graduate School of Management,SPbU, 2009. P. 474–482.8. Tur Anna V. The Irrational Behavior Proof Condition for Linear-QuadraticDiscrete-time Dynamic Games with Nontransferable Payoffs // Contributionsto Game Theory and Management. Vol VII. Collected papers/ Editors LeonA. Petrosjan, Nikolay A. Zenkevich , SPb, Graduate School of Management,SPbU, 2014. P.
384–392..