Секей Г. Парадоксы в теории вероятностей и математической статистике (1990) (1151962), страница 13
Текст из файла (страница 13)
Для достаточно большого класса оценок существуют функции риска, которые убывают при одних значениях О только тогда, когда при других значениях 0 они возрастают. Оценки такого типа называются допустимыми оценками, т. е. оценка Оз является допустимой, если неравенство Я(0, 8) ( г((0, 0«) справедливо для всех 0 ен 9 тогда и только тогда, когда )с(8, 8) = )г(8, 0,) для всех 0 ~ 9. Имеет смысл использовать только допустимые оценки, так как для оценки,которая не является допустимой, мы всегда можем найти другую оценку, функция риска которой нигде не больше, а в некоторых точках строго меньше функции риска недопустимой оценки.
Если мы хотим найти допустимую оценку, которая минимизирует средние потери при «наихудшем» действительном значении параметра (т е. когда функция риска достигает максимума), то мы получим минимаксную оценку. Эта «осторожная» оценка определяется следующим образом: оценка 8' называется минимаксной, если зпр Я(0, 8') = 1п(ацр Я(0, О), е е ' за~в где 0 пробегает множество всех возможных оценок. «Минимаксный аспект» математической статистики рассматривает поиск оценки как игру, в которой Природа «выбирает» параметр 0; а мы выбираем оценку 8.
Цель игры — добиться наименьших возможных средних потерь. Средние потери можно уменьшить, допустив смешанные стратегии, когда Природа выбирает параметр 0 случайно из множества 9 с распределением т, и мы выбираем оценку случайно с распределением а из множества всевозможных оценок. В этом случае функцией риска является функция г(т, а) = ЕЯ(Т, А)), где Т вЂ” случайная величина с распределением т на множестве параметров 6, и А имеет распределение я на множестве всевозможных стратегий. Теорема о минимаксе остается справедливой для функций риска такого вида при достаточно общих условиях: анр1п(г(т, а) =(п(зпрг(«, а). Поскольку распределение т неизвестно, полезно выбирать минимаксную стратегию а' как оценку, удовлетворяющую уравнению зпрг(т, а') = 1п1апрг(т, а). в о в (й1) Следующий парадокс гладиатора исходит от К.
Каминского, Е. Лакеи и Н. Нелсона. Предположим, что в некотором соревновании, называемом игрой гладиаторов, участвуют две команды гладиаторов, которые на арене устраивают бой. В последовательных турах из команды А =(А!, Ав, ..., А,) выбирается гладиатор для встречи с гладиатором из команды В = = (Вь Вм ..., В.). Победитель возвращается в свою команду с неослабевшим желанием сразиться вновь, если потребуется. Предполагается, что проигравший теряет возможность сражаться и выбывает из турнира. Предполагается также, что индивидуальные встречи носят стохастический характер и представляют собой независимые испытания, в которых 0( Р(Аг, В!) ( 1 обозначает вероятность того, что гладиатор А; нанесет поражение гладиатору Вь Турнир продолжается до тех пор, пока не уничтожается одна из команд.
Рассмотрим вопрос о существовании стратегии Я, которая оптимальна в том смысле, что она максимизирует Р,(А, В), вероятность выигрыша команды А у команды В, когда используется стратегии 5. Под стратегией здесь понимается правило, определяющее порядок выхода на арену гладиаторов обеих команд. (При указании стратегии можно исходить только из текущего состояния команд на каждом этапе игры.) В одном из вариантов игры гладиаторов предполагается, что игрокам А!, Ам..., А„, В!, Вв,..., В„ставятся в соответствие положительные числа аг, а„..., а„, Ь„Ь„..., Ь таким образом, что во всех встречах А; против В! имеем Р(Ап В!) =аг/(а!+ Ь!).
Тогда вероятность Рв(А, В) одинакова для всех 31 В этом суть парадокса гладиаторов. Другой парадокс этой же игры состоит в следующем. Будем говорить, что команда А превосходит команду В, если Р(А, В) ) 1/2. Далее, если А превосходит В и В превосходит С, то А не обязательно превосходит С. Существуют примеры, показывающие, что ав= = ппп (Р(А, В), Р(В, С), Р(С,А)) ) 1/2. Хотя открытым остается интригующий вопрос о точном верхнем пределе для нг. (Аналогичную ситуацию см. в парадоксе 1/13е). (рр) Еще одним парадоксом из теории игры является знаменитая «Дилемма заключенного».
Здесь мы лишь сошлемся на работу Бремса, Штрафина и Хофштадтера. д) Литература Вгагпв 8. 3., ягангп Зг. 8 Л 7Рг!вопегв анепппа апа рго1евв!опа! врог! йга1!в", Тае Аегег. Мана Мое!а!го 88, 80 — 88, (1979) Ноьцвшег О. и. "Сошрщег 1оигпвшепы о( Ше Рг!копет'и Ш)ешшв викНев! Ьочг соорегвиоп ечо)чев", Вс!. Атег., !6 — 26, (Мву 1983).
зоб 1. "А випр1е ргоо( !ог Хешпвпп'и пнп!швх !Ьеогеш", Ас!а Ясь Ма!д (зхенеб), 42, 9! — 94, (1980) и Ас!а Мами Ниву., 44, 363 — 365, (!984). Хеишвпп 3., Могнепыегп О. Тлеогу о[ Батек ала Есопот!с Вейаи!ог, Рг)псе1оп Ошч. Ргеш, Рппсе1оп, 1944, [Имеетсн перевод. Нейман Дж., Моргенштерн О. Теория игр н экономическое поведение.— Мл Наука, 1970.) Бичеке Ц ).
Тйе Еоиаг(апоа о[ 3!аавпсв, УУ1)еу, Хеж Уогк !954. цгв!б А. Втаависа! Вес!Моп Риис!!оиг, 97!)еу, Хеж уогй, 1954. 971)пешв 3. О. Тье Соту!е!е В!го!еуув! Вешу а Рптег оа Ме Тйеогу о[ Оаягев о[ 3!гагеуу, МсСгвж-НЩ, Воо)г Сошрепу, Хеи Уогм [Имеется пере. вод: Вильямс Дж.
Д. Совершенный стратег, или Букварь по теории .стрвгегическнх нгр. — М.: Советское радио, !960.) 13. Еще несколько парадоксов а) Парадокс событий, проискодяи(их почти наверно Рассмотрим события, происходящие с вероятностями 0.99 и 0.9999 соответственно. Можно сказать, что обе вероятности практически одинаковы, оба события происходят почти наверно. Тем не менее в некоторых случаях разница становится заметной.
Рассмотрим, например, независимые события, которые могут происходить в любой день года с вероятностью р = 0.99; тогда вероятность того, что они будут происходить каждый день в течение года, меньше, чем Р=О.ОЗ, в то же время, если р= = 0.9999, то Р = 0.97. б) Парадокс вероятности и относительной частоты Следующая история, принадлежащая Джорджу Пойа, показывает, как не следует интерпретировать частотную концепцию вероятности. Д-р Тел (доктор телепатии), закончив осмотр пациента, покачал головой. «Вы очень серьезно больны», — сказал он, — «из десяти человек с такой болезнью выживает только один». Пациента эта информация изрядно испугала„и д-р Тел начал его успокаивать: «Но Вам очень повезло, что Вы пришли ко мне, сэр. У меня уже умерли от этой болезни девять пациентов, так что Вы выживете».
(Лига Ро1уе О. Рвнегпв о1 Р)вив!Ые 1п1егепсе, чо1. Н, Рг!псе!оп ()и!ч. Ргеш, 1954, р. 101. [Имеется перевод: Пойв Д. Математика и правдоподобные рассуждения. — Мл Наука, 1975.)) в) Парадоксы, связанные с бросанием монеты (1) Предположим, что мы бросаем правильную монету до тех пор, пока ие выпадут последовательно два герба (ГГ) илн герб и решка (ГР). Очевидно, вероятность того, что (ГГ) по- явится быстрее, чем (ГР), равна вероятности того, что (ГР) появится быстрее, так как после выпадения Г монета выпадет на Г или Р с равной вероятностью. Несмотря на это, для появления (ГГ) потребуется в среднем больше бросаний, чем для появления (ГР). Серия (ГГ) появится в среднем через 6 бросаний, а серия (ГР) через 4 [Пусть М обозначает математическое ожидание числа бросаний до появления (ГГ) в предположении, что при первом бросании выпал Г, и Мр обозначает математическое ожидание числа бросаний до появления (ГГ) при условии, что при первом бросании выпала Р.
Тогда Мг =1+ + (1+Мг)/2 и М»=1+(Мг+Мг)/2. Отсюда следует, что (Мг + Мг)/2=6, т. е. среднее число бросаний до появления (ГГ) действительно равно 6.] Если сравнить серии (ГРГР) и (РГРР), то различие будет больше. Вероятность того, что (ГРГР) появится быстрее, чем (РГРР), равна 9/14) !/2, но среднее число бросаний, которое потребуется для получения серии (ГРГР) все же больше, чем среднее число бросаний до появления серии (РГРР). (Первое равно 20, а последнее лишь 18.) Следовательно, даже если вероятность того, что событие А появится быстрее, чем событие В, больше вероятности того, что В появится быстрее; может так случиться, что до появления А придется ждать дольше, чем до появления В.
Можно доказать, что среди всех серий à — Р наибольшее среднее время ожидания имеют чистые серии, т. е. те, которые состоят только из Г или только из Р. В этом случае среднее число бросаний равно 2"+' — 2. Наименьшее возможное (среднее) число бросаний равно 2", что соответствует серии, состоящей из и — 1 герба и заканчивающейся одной решкой или из и — 1 решки с одним гербом в конце. (Таким образом, до появления серии, состоящей из одних гербов, нужно ждать почти вдвое больше времени, чем до появления серии из и — 1 Г и одной Р, хотя вероятность того, что первая появится быстрее, равна вероятности того, что раньше появится последняя.) Нахождение времени, которое нужно ждать до появления заданной серии à — Р длины л, при больших и обычно требует утомительных вычислений (решения многомерной системы ли.
нейных уравнений). Вычисления можно в значительной степени упростить, пользуясь «магическим» алгоритмом Конвея, который обсуждается в статье Ли, см ссылку ниже. Приведем этот алгоритм для случая более общего, чем серии à — Р при бросании правильной монеты. Пусть Х, Хь Хь .., — независимые одинаково распределенные случайные величины, принимающие конечное или счетное число значений с положительными вероятностями.