Контрольная (1)
Описание файла
PDF-файл из архива "Контрольная (1)", который расположен в категории "". Всё это находится в предмете "теория игр и исследование операций" из 9 семестр (1 семестр магистратуры), которые можно найти в файловом архиве МФТИ (ГУ). Не смотря на прямую связь этого архива с МФТИ (ГУ), его также можно найти и в других разделах. .
Просмотр PDF-файла онлайн
Текст из PDF
Теория игрКонтрольная работа 2014 года. Решения.Задача 1. Рассмотрим приведенную ниже игру в нормальной форме, в которой игрок 1выбирает строки, а игрок 2 – столбцы.LC RU 3,0 5,1 2,2M 2,5 3,3 1,4D 1,4 1,1 5,1а. Проведите процесс последовательного исключения строго доминируемых чистыхстратегий с использованием чистых и смешанных стратегий.Стратегия U игрока 1 строго доминирует стратегию M.
Удалив стратегию M, получаемигруLC RU 3,0 5,1 2,2D 1,4 1,1 5,1В этой игре кандидатом на исключение является стратегия C, поскольку она не являетсянаилучшим ответом ни на одну стратегию игрока 1. Составим смешанную стратегиюx L (1 x) R . Чтобы эта стратегия строго доминировала стратегию C, должнывыполняться два неравенства0 x 2 (1 x) 1 x 0.5 и 4 x 1 (1 x) 1 x 0 .Итак, при 0 x 0.5 смешанная стратегия x L (1 x) R строго доминирует стратегию Cигрока 2. Исключив стратегию C, получаемLRU 3,0 2,2D 1,4 5,1Дальше ничего исключить нельзя, поскольку каждая стратегия одного являетсянаилучшим ответом на какую-то стратегию другого игрока.б. Найдите все равновесия Нэша (РН) в чистых стратегиях.Подчеркиванием отмечены наилучшие ответы игрока 1 (максимум в столбце) и игрока 2(максимум в строке).
РН в чистых стратегиях нет, так как нет двух подчеркиваний в однойклетке таблиы.в. Найдите все РН в смешанных стратегиях.Воспользуемся результатами пункта а. Справедливо утверждение: строго доминируемаячистая стратегия не может входить в РН с положительной вероятностью.LRU 3,0 2,2p1D 1,4 5,11 p1p21 p2Из принципа выравнивания ожидаемых выигрышей игрока 2 находим0 p1 4 (1 p1 ) 2 p1 1 (1 p1 ) p1 3 / 5 .Аналогично находим3 p2 2 (1 p2 ) 1 p2 5 (1 p2 ) p2 3 / 5 .Так, получили единственное РН в смешанных стратегиях3232( U 0 M D, L 0 C R) .5555138Выигрыши игроков 1 и 2 в этом РН равны 2.6 и 1.6 , соответственно.55Для контроля (вместо ссылки на утверждение про нулевые вероятности для строгодоминируемых стратегий) можно проверить, что 2.6 u1 (M , L) 2, 2.6 u1 (M , R) 1 и1.6 u2 (U , C ) 1,1.6 u2 ( D, C ) 1 . Следовательно, стратегии M игрока 1 и C игрока 2действительно можно брать в РН в смешанных стратегиях с нулевыми вероятностями.Задача 2.
Рассмотрим дуополию Курно с обратной функцией спроса P(Q) 1 Q , гдеQ q1 q2 – суммарный выпуск продукции, поставляемой на рынок фирмами 1 и 2.Затраты на выпуск продукции qi фирмы i описывается функцией f qi 4, qi 0ci (qi ) ,qi 0 0,где f 0 – постоянные затраты, связанные с началом выпуска продукции.а. Постройте игру в нормальной форме для данной дуополии Курно, считая, что выигрышфирмы определяется ее прибылью.N {1, 2} , S1 S2 [0, ) , ui (qi , q j ) P(Q) qi ci (qi ) .б. Найдите все равновесия Нэша (РН) в данной игре при f 1/ 25 .в.
Найдите все РН в данной игре при f 1/ 8 .При условии, что обе фирмы выпускают положительный набор продукции, имеемui (qi , q j ) (1 q j qi ) qi f qi / 4 . Найдем наилучший ответ на стратегию другой фирмы:R i (q j ) 1 q j 1/ 4, если ui ( R(q j ), q j ) 0 и R i (q j ) 0 в противном случае.2В отличие от случая нулевых постоянных затрат f (который рассматривался на лекции)теперь могут быть три варианта РН: дуополия (оба выпуска положительные), монополия(только одна фирма дает положительный выпуск), нулевое РН (оба выпуска нулевые).
Этоосновано на том, что функции выигрыша игроков разрывны при нулевых выигрышах, апотому проверку на наилучший ответ qi 0 нужно делать отдельно.Найдем РН типа дуополия:1 q*j 1/ 4*qi , i 1, 2 .21111Отсюда qi* , i 1, 2 . Получаем Q* , P(Q* ) , ui (q1* , q2* ) f .42216Следовательно, при f 1/ 25 такое РН (дуополия) есть, а при f 1/ 8 такого РН нет,поскольку выигрыши в РН должны быть неотрицательными, иначе игрок может перейтина нулевой выпуск.В случае монополии фирмы 1 (когда q2* 0 ), получаем q1* равен3. Выигрыш монополиста89 f , что больше 0 при обоих значениях f . Наилучший ответ при64положительном выпуске фирмы 2 на действия монополиста достигается в точке3.162 3Однако, при этом прибыль фирмы 2 получается f , что меньше нуля как при 16 f 1/ 8 , так и при f 1/ 25 . Следовательно, наилучший ответ на монополию фирмы 1 –нулевой выпуск фирмы 2. Симметричный случай – монополия фирмы 2.1 1 33Итак, при f 1/ 25 получаются три РН: ( , ), ( , 0), (0, ) .4 4 8833При f 1/ 8 существуют только два РН: ( , 0), (0, ) .88г.
Приведите экономическую интерпретацию различия РН в пунктах б. и в.2 3При малых постоянных затратах f на выход на рынок, когда f 0 , есть только 16 1 1одно РН: дуополия ( , ) с положительными выпусками обеих фирм. При постоянных4 421 3затратах из диапазона f помимо дуополии, возникают еще два РН типа16 16 3монополии: какая-то одна фирма может захватить рынок с выпуском . Отметим, что для8потребителя дуополия лучше монополии: суммарный выпуск выше, а цена ниже. При1увеличении затрат до уровня f исчезает РН в виде дуополии, но остаются два РН169типа монополии.
При высоких постоянных затратах, когда f даже одной фирме в64отсутствии конкурента не выгодно выходить на рынок: появляется РН с нулевымивыпусками, а других РН нет.Задача 3. Рассмотрим игру G(, ) с бесконечным повторением статической игры G :LRU 3,3 0,7D 7,0 1,1а. Найдите все РН в чистых и смешанных стратегиях в статической игре G .В этой статической игре есть только одно РН (D,R). Оно же равновесие в строгодоминирующих стратегиях, поэтому использование смешанных стратегий РН недобавляет. Проверку отсутствия других РН в смешанных стратегий можно провести инепосредственно.б. При каких значениях коэффициента дисконтирования повторение выигрышей (3,3)будет соответствовать траектории СПРН в игре G(, ) ?Будем использовать релейные стратегии: игроку 1 играть U пока во всех прошлых повторениях наблюдается (U,L),иначе играть D; игроку 2 играть L пока во всех прошлых повторениях наблюдается (U,L),иначе играть R.Эта пара стратегий порождает траекторию повторений (U,L) с выигрышами (3,3).
Для тогочтобы эта пара стратегий была бы СПРН, надо проверить условие невыгодности31 2отклонения:7 . Здесь мы находимся в рамках конструкции1 1 3Народной теоремы.в. При каких значениях коэффициента дисконтирования в игре G(, ) существуетСПРН, в котором выигрыш обоих игроков больше, чем в СПРН из пункта б.При коэффициенте дисконтирования близком к 1 становится целесообразнымчередование исходов (D,L) и (U,R), поскольку в среднем за два периода от такогоповторения каждый игрок получает 3.5. Видоизменим релейные стратегии: пока наблюдается чередование (D,L) в нечетных периодах и (U,R) в четныхпериодах игрок 1 играет D в нечетных и U в четных периодах, иначе играет D; пока наблюдается чередование (D,L) в нечетных периодах и (U,R) в четныхпериодах игрок 2 играет L в нечетных и R в четных периодах, иначе играет R.При отклонении можно получить вместо 0 выигрыш 1, потом повторение с выигрышами(0,7) и (7,0) сменится на повторение выигрышей (1,1).
Чтобы такое отклонение было невыгодно должно быть выполнено условие17110 7 0 2 7 3 ... .21 1 1 61Итак, при определенных выше стратегиях и получаем СПРН.6Для того чтобы это СПРН было выгоднее обоим игрокам того СПРН, которое определенов пункте б., должно быть выполнено неравенство:733 .21 1 4Задача 4. Игрок 1 может согласиться принять участие в статической игре «семейныйспор» или отказаться от участия в ней. В случае отказа игра кончается, причем оба игрокаполучают выигрыш по 1.5. В случае согласия игрока 1 разыгрывается игра «семейныйспор»:БОБ 2,1 0,0О 0,0 1,2а.
Постройте расширенную форму данной динамической игры.(1.5,1.5)N21Б(2,1)О(0,0)Б(0,0)О(1,2)БY1О2Пунктирными линиями помечены информационные множества.б. Найдите все совершенные по подыграм равновесия Нэша (СПРН) в динамической игре.В этой игре в расширенной форме есть только одна собственная подыгра, нормальнаяформа которой приведена в условии задачи. В ней есть два равновесия с выигрышами(2,1) и (1,2). Отсюда получаем два СПРН: (YБ,Б) с выигрышами (2,1) и (NО,О) свыигрышами (1.5,1.5).Переход в смешанные стратегии поведения добавляет СПРН2112( N{ Б О},{ Б О}) с выигрышами (1.5,1.5).3333Замечание: следует учитывать все стратегии (в данном случае их 4 у игрока 1: YБ, YО,NБ, NО, – и две у игрока 2: Б, О), иначе легко допустить ошибку.Задача 5.
Рассмотрим следующую игру в развернутой форме.а. Сколько стратегий у игрока 1 и сколько стратегий у игрока 2 в этой игре?У игрока 1 есть 3 2 6 стратегий (Lx, Ly, Mx, My, Rx, Ry), у игрока 2 – 2 2 4стратегии (la, lb, ra, rb).б. Найдите все совершенные по подыграм равновесия Нэша (СПРН) в чистых стратегиях вданной игре.В этой игре в развернутой форме есть только одна собственная подыгра с одноточечныминформационным множеством в начальной позиции, помеченной на рисунке жирнымовалом. У этой подыгры нормальная форма имеет видlrx 2,-1 1,1y 1,10 0,0В этой игре есть только одно РН (x,r), причем, поскольку стратегия x игрока 1 строгодоминирует стратегию y , то легко проверить, что в смешанных стратегиях РН недобавляется.Заменив подыгру выигрышами (1,1) в РН, получим сокращенную игруПостроим нормальную форму этой игрыaL 1,1M 0,2R 2,0b1,10,10,-1Получили два РН: (L,b) и (R,a).
В итоге имеем два СПРН: (Lx, rb) и (Rx, ra) с выигрышами(1,1) и (2,0), соответственно.в. Найти все СПРН в смешанных стратегиях с использованием стратегий поведения.Стратегия L игрока 1 в сокращенной игре строго доминирует стратегию M. Исключим M:aL 1,1R 2,0qb1,10,-11 qp1 pТеперь стратегия a игрока 2 доминирует (но не строго) стратегию b. При p 1наилучшим ответом игрока 2 будет стратегия a, но при p 1 , любая чистая и смешаннаяигрока 2 будет наилучшим ответом. Наилучший ответ для игрока 1 в зависимости от qимеет переключение с L на R при q 0.5 , поскольку надо сравнивать выигрыши 1 и 2 q .Для наглядности изобразим графики наилучших ответов графически:q(1,1)(1,0.5)(0,0)pПолучили изолированное РН в чистых стратегиях ( p 0, q 1) с выигрышами (2,0) имножество РН в смешанных стратегиях ( p 1, 0 q 0.5) с выигрышами (1,1). Новые РНв смешанных стратегиях, как и ранее, достраиваются до СПРН с выигрышами (1,1)действиями x и r в подыгре: (Lx, r{q a (1 q) b}) , 0 q 0.5 ..