Теория игр. Оуэн (1971) (1186151), страница 29
Текст из файла (страница 29)
Предположим теперь, что условия леммы ЧП.2.3 не выполнены, т. е. не сушествует точек (и, о)~5, для которых и ) и", о ) о*. Ввиду выпуклости Я мы знаем, что если существуют точки (и, о)сна, у которых и ) и*, о = о*, то не может существовать точки (и, о)~5, у которой о > о*. При этих условиях мы в качестве (й, й) просто возьмем точку в Я, которая максимизирует и при ограничении о = о*. Аналогично, если существует (и, о)ен 8„ для которой и = и*, о > о', то не существует (и, о) ~ Я, у которой и ) и*, и в качестве (й, й) мы возьмем точку в Я, которая максимизирует о при ограничении и = и*.
Легко проверить, что эти решения удовлетворяют аксиомам; также легко проверить, что иэ аксиом И1, Х2 и МЗ следует единственность. Теорема ЧП.2.2 показывает, таким образом, что аксиомам Нэша можно удовлетворить посредством единственной схемы; мы выяснили также, что представляет собой решение в смысле Нэша. 154 Гл. ЧИ. Игры двух лиц с произвольной суммой Согласно лемме хг1!.2.3, если граница множества Я гладка (т.
е. имеет касательную) в точке (й,о), то прямая, на которой функция Ь(и, и) постоянна, является касательной к 5 в этой точке. Но наклон границы множества 5 в произвольной точке представляет собой отношение, в котором полезность может передаваться от одного игрока к другому. Коротко говоря, схема Нэша утверждает, Р и с. Ч!!. 2.!. что дополнительная полезность должна делиться между игроками в таком же отношении, в каком она может передаваться.
Так как не предполагается, что полезность линейно траисферабельна, то естественно, что может оказаться лишь одна точка, в которой полезность передается в данном отношении. Это иллюстрирует В случае линейно трансферабельной полезности задача, конечно, становится гораздо проще. Действительно, мы можем п еполагать ( (изменяя, если это необходимо, шкалы полезност ), ем пред- отношен ие, в котором полезность может передаваться, равно 1:1 „(т. е.
игрок 1 может передать единицу полезности игроку П, УП.2. задача а сделкак лишаясь при этом сам только одной единицы). Таким образом„ 8 содержит все точки, лежащие на некоторой прямой и+ о = Й или ниже нее (где Й вЂ” максимально возможная полезность, которую эти два игрока могут получить совместно) и вместе с тем выше и правее точки (и", о*) (см. рис. Ч11.2.3). Соответствующим этому случаю решением Нэша будет точка (й, й), где й = (и* — о* + й) /2 и й = (о* — и" + й) /2.
Р н с. Ч11. 2.2. Р н с. ЧП. 2.3. Легко видеть, что й+ о = й, а й — й = и* — о*. Таким образом, в этом случае относительные положения игроков сохранились, а их полезности максимально возросли (т. е. избыток полезности делится поровну между игроками). Ч!1.2.5. Пример. Лвоим людям предлагают 100 долларов, если они смогут решить, как поделить эти деньги между собой. Предполагается, что первый из них очень богат, а второй имеет капитал всего в !00 долларов. Предполагается также, что полезность суммы денег пропорциональна ее логарифму.
Как должны быть разделены эти деньги? Так как первый игрок очень богат, мы можем предположить, что полезность х доларов, где х ~ !00, пропорциональна х. Так как второй игрок имеет только !0(Гдолларов, полезность, которую он получает от х долларов, равна !ой(100+ х) — !ой 100 = !ой (Мы, конечно, полагаем и" = о* = О.) Таким образом, множество 5 будет выпуклой оболочкой точки (0,0) и дуги кривой, задаваемой уравнением 200- и о=!ой Гл. УИ. Игры двух лич с произвольной суммой Так как эта функция выпукла, Я просто является областью, ограниченной этой кривой (см.
рис. ЧП.2.4); конечно, мы интересуемся только пересечением этой области с положительным квадрантом. Теперь мы ищем точку в Я, которая максимизирует ио, т. е. значение и, которое максимизирует функцию 200 — и й =и 1~%,00 После дифференцирования и приравннвания нулю производной мы получаем уравнение и 200- и 200- и ы 100 Решая его, получаем приближенно и = 54,4; иначе говоря, игрок 1 должен получить 54,40 доллара, Р и с.
Чгп 2.4. а игрок П должен получить 45,60 доллара. В некотором смысле этот результат кажется странным; из него следует, что богатый игрок должен получить больше, чем бедный, о котором можно утверждать, что он больше нуждается в деньгах. Однако такое утверждение предполагает сравнение полезностей разных лиц, что в принятой схеме, вообще говоря, не допускается. Решение учитывает, что фактически полезность денег у игрока П убывает быстро, а у игрока ! медленно.
В результате получается, что игрок П стремится получить хоть что-то и при сделке может уступить игроку 1. У11. 3. УГРОЗЫ Против решения Нэша задачи о сделках можно выдвинуть серьезное возражение, состоящее в том, что оно не принимает в расчет угрозы. Это возражение лучше всего иллюстрируется следующим примером. Ч11.3.0. Пример. Рабочий имеет на выбор две возможности: либо работать, и в этом случае ему будет выплачиваться зарплата, а его хозяин получит прибыль в 1О долларов, либо не рабо.тать, и в этом случае он будет голодать, а его хозяин не получит прибыли. Разумно этим событиям приписать соответственно полезности (0,10) и ( — 500,0).
Хозяин, однако, если оп этого захочет, может отдать часть прибыли рабочему, так что (в предположении, что полезность линейно трансферабельна) множество 5 будет со- ОВ. 3. Угроэи держать все точки на прямой и + о = 10 или ниже нее и не будет содержать других точек положительного квадранта. Так как ясно, что и" = о* = О, решением Нэша будет й = й = 5. Однако это решение игнорирует тот факт, что второй игрок находится в гораздо более выгодном положении, чем его оппонент.
Действительно, игрок 1 не может воспрепятствовать игроку П получить !О долларов иначе. как решившись на очень трудный шаг; угроза прекратить работу с его стороны была бы не очень правдоподобна, и в результате он, вероятно, продолжал бы работать за свою зарплату. Трудно отрицать, что примеры, подобные этому, указывают на недостатки предложенного Нашем решения задачи о сделках.
Если мы хотим избавиться от этих недостатков, необходимо проанализировать угрозы. Вообще говоря, угроза эффективна, если она правдоподобна и если она может улучшить положение угрожающего по отношению к тому лицу, которому угрожают. Так, например, угроза убить кого-нибудь обычно более эффективна, чем угроза рассердиться, потому что, несомненно, положение убийцы улучшается по отношению к его жертве (хотя фактически его абсолютное положение может ухудшиться), в то время как стать рассерженным не имеет такого действия.
С другой стороны, угроза уничтожить весь мир, хотя, возможно, и могла бы улучшить положение угрожающего по отношению к другим (уравнивая их всех в небытии), не очень правдоподобна и, следовательно, неэффективна. Нэш предлагает следующую трехшаговую схему сделки: !. Игрок !объявляет стратегию угрозы х. 2.
Игрок И, не зная х, объявляет стратегию угрозы у. 3. Игроки! и П торгуются. Если они приходят к соглашению, то это соглашение вступает в силу. Если они не приходят к сотлашению, то они должны применять свои стратегии угроз х и у; этими стратегиями определяются выигрыши двух игроков. Естественно возникает вопрос о действенности этих угроз; если один из игроков сделал необдуманную угрозу, то может оказаться, что в дальнейшем он не захочет ее осуществить. Для этой цели можно, однако, предложить некоторую процедуру. Во всяком случае мы предполагаем, что в выборе своих угроз игрок ограничен тем или иным образом.
Фактически это ограничение означает, что максиминные значения и* и о* заменяются соответственно на значения угроз хАу" и хВуг. После этого применяются аксиомы Х! — Х5, и в результате получается решение (й, о), где (й, й) — точка в 5, максимизирующая функцию д(и, о) =(и — хАуг) (о — хВуг) (конечно, при условии и ~.
хАут), Гл. ЧП. Игры дэук лия с вронэвольной суммой Эту схему лучше всего, вероятно, пояснить рисунком. На рис. ЧП.З.! показано типичное множество $ (замкнутое, ограниченное и выпуклое). Кривая Яо представляет собой часть границы 5, оптимальную по Парето (т, е. то подмножество 5, которое удовлетворяет аксиоме МЗ). Из каждои точки Яо, в которой существует касательная к яо, проводится прямая, угловой коэффициент которой равен взятому со знаком минус угловому коэффициенту касательной к Яо в этой точке.
Если касательная не Р н с. Ч!1. 3.1. существует ( как в точке С), то проводятся две прямые, соответствующие правой н левой касательным к Яо в точке С. Легко видеть, что в силу выпуклости 8 прямые этого семейства пересекаются вне Я (если онн пересекаются вообще). Предположим теперь„что стратегии угроз х и у дают значение угрозы, которому соответствует точка Р, лежа1цая на одной из этих прямых. Арбитражное значение игры (значение игры по Нэшу) есть та точка Я, в которой эта прямая пересекает Яв. Если же, с другой стороны, значение угрозы есть точка, подобная Я (которая лежит внутри угла, образованного двумя прямыми, исходящими из одной и той же точки Яв), то арбитражным значением будет точка С, в которой этн прямые пересекают Яо.
Таким образом, целью игрока ! при выборе своей стратегии угрозы является достижение точки, лежащей на возможно более низкой прямой этого семейства; цель игрока П вЂ” достижение точки, лежащей на возможно более высокой прямой этого семейства. И!. 3. Угрозы На вопрос, возникающий в связи с существованием ситуации равновесия в стратегиях угроз, можно ответить, что эти ситуации действительно существуют.