Теория игр. Оуэн (1971) (1186151), страница 25
Текст из файла (страница 25)
а) Ловушкой называется такой игровой элемент илн нх совокупность, что если элемент ловушки встречается а партии, один из игроков может оставить партию в ловушке, так что выигрыши будут нанаплнваться и математическое ожидание выигрыша станет неограниченным. Показать, что для игры с тремя игровыми элементами 133 Задачи 3. Показать, что если время рассматривать как непрерывное, а не как дискретное, то рекурсивная игра может и не иметь значения, даже если функциональное уравнение (5.3.7) имеет единственное решение. Рассмотреть следующую игру с одним игровым элементом: О 1 — 1з, Г= 1 О 1). 1 — 1 Гг Здесь игра должна разыгрываться в течение некоторого (нефиксированного) интервала времени, а затем должна закончиться.
Другими словами, каждый игрок выбирает момент для того, чтобы предпринять действие; до этого момента он непрерывно применяет свою третью чистую стратегию 4. Изучение дифференциальных игр включает не только уравнения траекторий (5.5.12), но и так называемые сингулярные поверхности. Рассмотрим игру ма полуплоскости у ~ О с терминальной поверхностью у О н терминальным выигрышем 6 (х*) 1/(! + х э) Пусть кннемзтнческие уравнения таковы: х=ф(1+21/ [к))+ф где управляющие переменные ф и ф ограничены интервалом [О, Ц.
Показать, что ось у — сингулярная поверхность в том смысле, что оптимальные траектории образуют семейство кривых, которые начинаются на оси у. Что нужно делать в точке на оси у (где встречаются два оптимальных пути) у 5. Кажется весьма правдоподобным, что любая дифференциальная игра с интегральным нли непрерывным терминальным выигрышем должна иметь решение в чистых стратегиях, за исключением, быть может, множества меньшей размерности (сингулярной поверхности), Показать, что это не так. Рассмотрим игру на полуплоскости у ~ О с терминальной поверхностью у = О н интегральным выигрышем ~ к Л, кннематические уравнения которой таковы; х=(ф — ф)з, у= — 1, где, как н ранее, ф и ф ограничены интервалом [О, Ц.
Показать, что для любой начальной точки (хр,уз) значения в чистых стратегиях удовлетворяют неравенствам о1 Ы хоуо' оп а хоро+ Уо! 3. Следовательно, для у.э О игра не имеет решения в чистых стратегиях (а также не имеет оптимальных траекторий). 6. Дифференциальная игра называется игрой качества, если она имеет только два возможных исхода, например выиграть и проиграть (для игрока 1). Таким образом, можно представить себе, что терминальная поверхность $' разделена (л — 2].мерным многообразием эз' на два множества )У' и 2'. Игрок 1 пытается закончить игру в йг; игрок П вЂ” а Ы. Вообще говоря, пространство игры )7" будет так разбито на две части, называемые выигрывающей зоной (%Е) и проигрывающей зоной (!.Е), что из точки в %2 игрок 1 может форсировать окончание игры в лч; нз точки в (,Е игрок П может форсировать окончание игры в Ы.
Эти две зоны, вообще говоря, разделены поверхаостью Л; которая пересекает 27 влоль Л', Гл. К Многошаговые игры 134 а) В предположении, что Л' гладка, показать, (ть ..., т ) к Л' удовлетворяет уравнению шах пнп ~Р~ тл (к, м, ф = О 'г т ! что вектор нормали (где т ориевтнрован в сторону туЕ). Вывести для этих игр систему уравнений траекторий, аналогичную (б.б.!2).
б) Рассмотреть следующую игру: игроки 1 и 11 управляют движением точек Р и Е соответственно в верхней полуплоскостн Ф. Эти две точки могут двигаться в любом направлении со скоростямн соответственно ! и ю ( 1. Игра заканчнваетсп выигрышем игрока 1, как только расстояние РЕ становится меньше Н; она заканчивается проигрышем игрока 1, как только Е достигает прямой у О. в) Вывести кинематические уравнения атой игры, если (хну~) н (хауг)— координаты Р и Е соответственно, а о н ~р — управляющие переменные; описать множество мг. г) Решить зту игру. Глава Ч1 ТЕОРИЯ ПОЛЕЗНОСТИ 71Д.
ОРДННАЛЬНАН ПОЛКЗНОСТЬ В предыдущих четырех главах мы исходили из предположения о том, что два игрока имеют прямо противоположные интересы. Однако даже в том случае, когда игроки образуют замкнутую систему, так что один из них проигрывает то, что выигрывает другой, далеко не очевидно, что их интересы всегда будут прямо противоположны. Так, если один из игроков — богатый филантроп, а другой — бедный, но достойный человек, то может случиться, что первый предпочтет дать выиграть второму (в определенных пределах).
В таких случаях нужно принимать во вянмзние тот факт, что выигрышем являются не деньги, а полезность, выраженная деньгами. Точно так же, ставки в игре могут не иметь денежного выражения. Неденежные (например, моральные) мотивы могут сделать выигрыш весьма ценным для одного игрока, но практически ничего не стоящим для другого. Именно зто понятие индивидуальной ценности, или индивидуальной полезности, должно изучаться. Рассмотрим теперь такую ситуацию, когда некоторое лицо в одних случаях предпочитает одни события другим, а в других случаях безразлично по отношению к двум событиям.
Таким образом, мы имеем здесь два отношения, ф и 3. Областью задания этих отношений является множество событий. Для обозначения событий мы будем использовать буквы А, В, С и т. д, У1.1.1. Определение. Для любых двух событий А н В мы будем писать АРВ, если А предпочтительнее В. Мы будем писать АЗВ, если не имеет места ни А1)В, ни ВфА. Ч1.1.2. А к с и о м ы п о л е з н о с т и. Отношения р и 3 удовлетворяют следующим аксиомам: (6.1.2.1) Для любых двух событий А и В имеет место в точности одно из следующих отношений: (а) АРВ, ((1) В$А, (у) АЭВ.
!Зз Гл. П. Теория полезности АЗА для всех А. (6.1.2.2) Если АЗВ, то ВЗА. (6.1.2,3) Если АЗВ и ВЗС, то АЗС. (6.1.2.4) Если АфВ и В$С, то АфС. (6.1.2.5) Если А%В и ВЗС, то АфС. (6.1.2.6) Если АЗВ и ВчзС, то АСС. (6.1.2.7) Аксиома 1 называется также трихогожическим законом. Аксиомы 2, 3 и 4 означают, что 3 есть отношение эквивалентности.
Аксиома 5 (вместе с 1) означает, что ф есть отношение порядка. И, наконец, аксиомы 6 и 7 утверждают, что ф транзитивно относительно 3. В сущности говоря, аксиомы Ъ'1.1.2 задают слабое линейное упорядочение событий от наиболее желательного до наименее желательного. Обычно говорят, что если кто-то предпочитает событие А событию В, то событие А имеет большую полезность, чем событие В, или же что полезность события А больше, чем полезность события В.
К сожалению, хотя отсюда мы можем заключить„что полезность А больше полезности В, мы не знаем, сколь велика разность этих полезностей. В некоторых случаях этот вопрос не представляет трудностей (например, если задача состоит просто в определении события, которое выберет индивидуум). С другой стороны, если имеется какой-либо риск, то ясно, что мы должны иметь некоторую оценку разности полезностей для данной пары событий (а не просто знать, какое из этих событий предпочитается индивидуумом). Если, например, некоторое лицо должно выбрать между событием В и лотереей, исходами которой являются события А и С с равными вероятностями, и если, кроме того, АфВфС, то задача состоит в том, чтобы определить, достаточна ли возможность выигрыша (в случае, если осуществится событие А), для того чтобы возместить риск убытка (если осуществится событие С).
Если бы существовал некий товар, для которого полезность была бы линейна (т. е. такой товар, что полезность некоторого его количества прямо пропорциональна этому количеству), то никаких трудностей не возникало бы. Мы могли бы просто определить величину побочных платежей (в единицах этого товара), которые побудили бы нашего игрока отказаться от А в пользу В и от В в пользу С, а затем действовать в соответствии с этим правилом. К сожалению, мы видели, что никакой товар (в том числе и деньги) не обладает этим свойством, так что эта идея неосуществима. Однако мы покажем, что такой товар можно ввести в рассмотрение и иметь с ним дело до тех пор, пока мы не попытаемся обращаться с ним, как с другими товарами, которые можно покупать, продавать, передавать или уничтожать.
П. д Лотереи 137 т'1. 2. ЛОТЕРЕИ Выше мы упоминали, что одним из важных случаев, в которых мы хотели бы иметь описанный выше товар, является случай наличия некоторого риска. Но введение в рассмотрение риска связано в сущности с понятием лотереи. ч!.2.1. Определение. Пусть А и  — два любых события, а О ( г = 1. Тогда под гА +(! — «)В мы будем понимать лотерею, которая имеет два возможных исхода А и В соответственно с вероятностями г и 1 — г.
Аналогично можно определить лотереи с тремя или большим числом возможных исходов. Нужно заметить, что лотерея также есть событие. Таким образом, возможна лотерея, одним нз исходов которой является другая лотерея. Кроме того, комбинирование событий с помощью лотерей подчиняется всем обычным законам арифметики (и линейной алгебры). Таким образом, мы имеем следующие аксиомы; гА+(1 — г) В =(1 — г) В+ гА, (6.2.1) «А+(1 — г)(зВ+(1 — з)С)=гА+(1 — г)зВ+(! — г)(1 — з)С, (6.2.2) гА+(! — г) А = А. (6.2.3) Аксиома (6.2.1), коммутативный закон, имеет очевидный смысл. Аксиомы (6.2.2) и (6.2.3), похожие на дистрибутивный закон, утверждают, что порядок, в котором осуществляется лотерея или последовательность лотерей, не имеет значения; важны лишь окончательные вероятности возможных исходов.
Далее, ясно, что в лотерее «А+(1 — г)В событие А можно заменить на такое событие С, что А5С. Таким образом, мы имеем следующие аксиомы: Если АЗС, то для любых г, В («А + (1 — г) В) 3 (гС+ (1 — г) В). (6.2А) Если А 1)С, то для любых г > О, В («А+(1 — г) В) Я«С+(1 — г) В). (6.2.5) Когда мы рассматриваем лотерею гА +(1 — г)В, мы видим, что при «=1 лотерея совпадает с событием А, а при «=О-с событием В. Теперь кажется правдоподобным, что небольшие изменения г должны вызывать небольшие изменения в полезности лотереи (что бы этот термин ни означал).
Это соображение, вместе с теоремой о промежуточном значении для непрерывной вещественной функции, приводит нас к следующей аксиоме: 1Г1.2.2. Аксиома (непрерывности). Пусть А, В и С вЂ” такие события, что АфСфВ. Тогда существует такое «~ [О, 1), что («А+ (1 — г) В) 3С. !38 Гл, У!. Теория полезности Нужно заметить, что на самом деле в аксиоме !с'1.2.2 должно быть г ~(0, 1). Действительно, если г = 0 или 1, то лотерея совпадает соответственно с В или А, а по предположению А$С!зВ, так что ни в одном из этих двух случаев лотерея не может быть эквивалентна С (относительно 5).