Секей Г. Парадоксы в теории вероятностей и математической статистике (1990) (1151962), страница 12
Текст из файла (страница 12)
(И) Интегральная геометрия, возникшая в связи с геометрнческнмн вероятностями, приобретает все возрастающее значение во многих областях науки, например, для восстановления трехмерных фигур по нх двумерным сечениям нлн проекциям, а также в минералогии, металлургии н биологии (особенно в томографнн для трехмерной реконструкции опухолей). д) Литература А!п1еу Е. $. "А ргоЬаые рагааох", Мо!А Соа., 66, 300 — 301, (1982). Кепйа!! М. О., Могап Р. А. Р. Оеотегис Ргойпйщу, Ог!!!!и, 1.опеоп, 1963. [Имеется перевод: Кендалл М., Морен Н.
Геометрические вероятностн. — Мс Наука, 1972.] Ма!Ьегоп О. 7(олг(от Зеы олг( !лгеуго1 Оеоте!гу, ГУ!!еу, Неге Уогй, 1975. [Имеется перевод: Матерон Ж. Случайные множества я интегральная геометрия. — Мс Мнр, 1978.) нап1а16 (,. А. !лгеуго! Оеотеиу олг( Оеотегг!с Ргоаоь!Шу, А44(воп-тнев1еу, Ееайпк, 1976, [Имеется перевод: Сантало Л. Интегральная геометрия н геометрические вероятности. — Мс Наука, 1983.] ае Тетр!е Гх %., КоЬег1воп 3. М. "Сопя!гас((па никол сигчев !тот Ше!г 6!в1г!Ьи(!опя", Тйе Атеггсол Мопс Мол!А(у, 87, 779 — 784, (1980), Еа!стан 1.. пОНЬеа! !п(еага! Неоте1гу", Тйе Ателсол Мпгй. Молы!у, 87, 161 †1, (1980). зсьив!ег е. Р.
"Виноп'в пееше ехрег!теп('ц тье Атепсел млгл. молей!у, 81, 26 — 29, (1974). 12. Парадокс из теории игр. Парадокс гладиатора а) История парадокса Хотя азартные игры в различных формах существуют со времен палеолита н математические исследования разных нгр восходят к эпохе Возрождения, общая теория нгр возникла лишь в ХХ веке (н лишь тогда была установлена ее связь с другими науками, например, такими, как экономика). В 1921 г. Эмиль Борель попытался создать математическую теорию игровых стратегий, однако принцип минимакса, фундаментальную теорему в теории нгр, в 1928 г, доказал основоположник теории нгр Джон фон Нейман.
(Ранее даже Ворель сомневался в ее справедлнвостн.) Следующий парадокс поможет понять суть теоремы о мини- максе. б) Парадокс Двое детей й н Я играют в известную игру, которая состоит в следующем. Оба одновременно поднимают один нлн два пальца, если общее число поднятых пальцев четно, то !2 платит Н, и если оно нечетно, то Я платит О сумму, равную общему числу поднятых пальцев. Ниже в таблице (матрице выплат) указаны денежные суммы, которые О должен заплатить Л. Хотя многие считают эту игру справедливой (видимо потому, что числа в Рис. 6.
таблице при сложении дают О, действительно, 2+ ( — 3) + + ( — 3) +4=0), она такой вовсе не является: зта игра выгодна для 9. в) Объяснение парадокса Очевидно, если один из игроков все время поднимает один палец или всегда поднимает два, то второй игрок, заметив зто, будет вести себя так, чтобы все время выигрывать. Следователько, выгодными могут быть только «смешанные стратегии», т. е.
при каждом испытании игрок случайно, но с фиксированными вероятностями, выбирает одну из двух возможностей (поднять один или два пальца). Предположим, что для обоих игроков мы уже нашли оптимальные стратегии, т. е, мы знаем, что лучшей стратегией для игрока )г является то, что нужно поднять один палец с вероятностью р1 и поднять два пальца с вероятностью ре (очевидно, р~ + рз — — 1), и аналогично для Я наиболее выгодно поднять один палец с вероятностью д~ и два пальца с вероятностью аз(д~ + дз = 1). Поскольку оба игрока принимают решения независимо друг от друга, сумма денег, которую О в среднем выплатит д (если оба игрока применяют оптимальные стратегии), равна 'г' = 2рв)1 — Зр~дз — Зрггп + 4рзяа Игра была бы справедливой, если бы Р= О.
Однако мы покажем, что р, = 41 =7/12, рз=д«=б/12, и тогда Р= — 1/12, что означает, что О выигрывает в среднем 1/!2 доллара после каждой игры даже в том случае, когда Я применяет свою оптимальную стратегию. Подставим д~ =1, дую=О в (ч). Тогда У= 1е1 =2р1 — Зрь Аналогично, если да=! и в=О, то У=Яэ= — Зр1+4рь В этих обозначениях имеем У=дД, +дДь Так как У вЂ” это средний проигрыш игрока Я, если он использует свою оптимальную стратегию, Я1) У и 4 ) У, то У=дД1+ЧэЯз ) Ф~'+ + ч21 (ч~ + чэ) 1 Поскольку ни дь ни ~уз не могут быть равны нулю, из предыдущего соотношения вытекает, что у=Я,=Яь т.
е. 2р~— — Зрэ = — Зр1 + 4рь поэтому (вспоминая, что р1 + рэ = 1) имеем р~ =7/12, р,=5/12 и У= — 1/12. Аналогично, 24~— — Здэ = — Зд~ + 44э(41 + аз = 1) и, следовательно, д1 =7/12, 4э= 5/12. Таким образом, доказано, что игра справедливой не является, и найдены оптимальные стратегии. Для обоих игроков выгодно поднимать один палец с вероятностью 7/12. Подставляя в формуле (») 1 — р| вместо рэ и 1 — д1 вместо дь получаем )г=12р,д,— 7р~ — 74~+4.
Независимо от значения д1 при р~ = 7/12 имеем г'= — 1/12. Аналогично, независимо от значения р~ при д1 = 7/12 имеем У= — 1/12, Таким образом, игроку все равно, как играть, если он знает, что его противник использует оптимальную стратегию. г) Замечания (!) Главной целью исследований Неймала в теории игр был поиск оптимальной стратегии в игре с т игроками. Для простоты мы предполагаем, что ш = 2 (т. е. друг против друга выступают только два игрока), и игра является игрой с нулевой суммой (т. е.
проигрыш первого игрока равен выигрышу второго). Пусть Я1 и Яэ обозначают множества чистых стратегий для первого и второго игроков соответственно (чистая стратегия — это правило, которое задает первый шаг первого игрока, а также ответы на всевозможные ходы второго игрока). Пусть Ь(зь зэ) — функция двух переменных, которая определяет проигрыш второго игрока, когда он использует чистую стратегию ээ чн Яь и первый игрок применяет стратегию з~ ен Зх (таблица на стр.
55 дает пример такой функции). Для осторожного игрока лучшей является стратегия, которая минимизирует его максимальный проигрыш (что происходит при оптимальной защите). Первый игрок всегда может добиться выигрыша У, = шах(ш(п Л(з„з,)), з з. а второй игрок проигрыша У, = ппп (шах Ь (з„з,)). (Естественно, величины 1~~ и 1~~ могут быть отрицательными.) В том случае, когда г'1 = Р~ и множество возможных стратегий конечно, обоим игрокам выгодно применять такие стратегии з'„з'„для которых У,=У,=~(зп з',). Такая пара стратегий (з'„з,') является седловой точкой игры, но она не всегда существует.
Однако у Неймана была замечательная идея расширить множество возможных стратегий, он ввел «смешанные стратегии», которые соответствуют случайному выбору из множества чистых стратегий. Таким образом, смешанная стратегия есть вероятностное распределение на множестве чистых стратегий. (В примере с игрой детей смешанными стратегиями были пары рь рз и дь оз соответственно.) При смешанных стратегиях игрок не может «видеть противника насквозь», но зато появляется случайность, даже в тех играх, которые сами от случая не зависят.
Если мы хотим найти оптимальную смешанную стратегию, то мы, естественно, должны определить функцию потерь на множестве пар (пь пз) смешанных стратегий. Пусть Е(пь пз) — потери в среднем, которые второй игрок выплачивает первому, когда игроки применяют смешанныестратегиип~ ен Р1 ипзен Рь Теорема Неймана о мннимаксе (фундаментальная теорема теории игр) утверждает, что если множества 51 и 5з конечны, то шах пцп Ь(пь и,)= ш!и шах ь'(по и«), м«Р «,еР, «'«Р жыР, т. е. в классе смешанных стратегий всегда существует седловая точка. Иными словами, для обоих игроков существуют оптимальные смешанные стратегии.
Общую модель теории игр можно также использовать для исследования конфликтов, возникающих в других сферах жизни. Например, с математической точки зрения коммерческую конкуренцию можно рассматривать как «игру», в которой оба игрока хотят найти свои оптимальные стратегии. Поскольку все менее и менее вероятно, что конкуренты могут постоянно надувать друг друга, компромиссы (соответствующие седловым точкам) становятся все более и более необходимыми во многих областях.
Теория игр внесла новые аспекты и в математическую статистику, благодаря в основном трудам Абрплама Вальда. Ниже иллюстрируются некоторые применения теории игр в статистике. (В) Типичной задачей статистики является оценка неизвестного параметра 0 ен 6 вероятностного распределения Ра, исходя из наблюдений Хь Хм ..., Х„, имеющих распределение Рз (и обычно независимых), т. е. исходя из выборки. (Обычно, 6— произвольное множество чисел или векторов.) Рассмотрим функцию двух переменных Ь(6, с), значениями которой являются наши потери, когда в качестве оценки для неизвестного па- раметра 0 берется с. Естественно предполагать, что потери тем больше, чем больше отклонение (8 — с~(.
Таким образом, ь(0, с), как правило, является монотонно возрастающей функцией от величины )Π— с(, например, Ь(0, с) = )8 — с)", где й ~ О. Оценка 0 =~(Х» Хм ..., Х„) хороша, если средние потери малы, т. е. если функция риска Я(О, 8) =Е((.(8,0)) мала. Однако при сравнении двух оценок может оказаться, что значение функции риска для первой оценки при некоторых значениях параметра 0 меньше, чем для второй оценки, а при других значениях 0 ситуация противоположная.