Секей Г. Парадоксы в теории вероятностей и математической статистике (1990) (1151962), страница 24
Текст из файла (страница 24)
А. "Оо шв(Ьешвнсв) 1онпйвиопв о1 йеогенсв) в!в!!в((св", РЫ!. Тгалз. Воу, Зос. (Еолпол) Зег. А, 222, 309 — 368, (1922). Кв)е В. К. "1пвйпнвыы!пу о! 1ие швх)шнгп )йе!йооБ еьцшвцоп )п Пге ргеьепсе о1 рпог !п1оппв!!оп", Салаг(. Май. Ваи., 13, 391 — 393, (1970), К!е(ег Д, %о!(ом)!х Д "Сопя!в1епсу о( йе швхнпнш !йе!йооБ еынпвпоп )п йе ргевепсе о1 !липпе)у швпу шссаеп!в) рвгвше!егв", Алла!з о[ Ма(Л. Згаиз!., 27, 887 — 906, (1956). Койб!п Н.
3. "Но1е оп йе попех!ивисе о1 в швхнпшп !йе!йооБ еь1ппв!(оп", Анзз. А Ззаиз(., 5, 143 — ! 46, (1963). Кгв(1 С., !.е Свш 1.. "А теша!и оп йе гоо(в о1 йе 1(иенпооБ еянв!юп*', Алл. МаГЛ. 5(аиз!., 27, !174 — 1177, (1956). 1.е Свш 1.. "Оп ваше ввушр1онс ргорегиев о1 швхнпшп 1йе!!ЬооБ ев(1- шв(ев ьпБ ге(в!еБ Ввуев' ев!(шв1ев", (Гл!е. Са!!)огл!а Ран.
5(а!., 1, 277 — 330, (1953). Неушвп Л, Зсои Е. 1.. "Сопке!еп! еь!нпв1ев Ьвьед оп регия)!у сопя!в!еп! оьвегчв!!опв", Есологле!Мса, !6, 1 — 32, (1948) НогБеп Н. Н. "А внгчеу о1 швх!шнш 1!хе!!ЬооБ ев(!шв!)оп", )л(егл. Згаиз!. )!ее., 40, 329 — 354, (!972). Р!ипвп Е. 3. О. Зогле Ваз!с ТЛеогу )ог Згаг!зиса! !л[егелсе, ЧУ!1еу, Нетч Уогц 1979. [Имеется перевод: Питмен Э. Основы теории стьтистичесхнх выводов.
— Мс Мнр, 1986.] йво С. )(. "Аррвгеп! впошв!1ев впБ )ггеян1апиеь (п птвхппшп !йе)йоо4 ев(опв(юп", Залаяуа, 24, 73 — 102, (1952). йееБв 3. А. "Авугпр1о1!с пшйЬег о1 гооы о1 СвнсЬу )освиоп еяпа((опв", Ашииз о[ 5!а!м!4 !3, 775 †7, (1985). 9. Парадокс интервальных оценок а) История парадокса Теория интервального оценнвания была разработана в основном Г. Фишером и Е. Неймаяом между 1925 и 1935 гг.
Доверительный интервал Неймана содержит неизвестный параметр 0 с заданной вероятностью а. Пусть Хг, Хв, ..., Х„обозначают последовательность элементов выборки, и предположим, что А = =А(ХЬ Хь ..., Хго а) и В =В(ХЬ Хь ° .,Х, а) таковы, что Р(А < 8 < В) =а. Тогда (А, В) называется а-доверительным интервалом для О.
Если 8 обозначает неизвестное математическое ожидание нормального распределения со стандартным отклонением в, то Р (Х вЂ” 2в/ Л/л < 8 < Х + 2в/л/и ) ев 0.95, т. е. (Х вЂ” 2о/!/л, Х+ 2п/Л/л) является 95 !)о доверительным интервалом для О.
При другом подходе к интервальному оцениванию случайным параметром считается не выборка, а неизвестный параметр О. В этом случае интервал (А, В) не зависит от случая, и равенство Р(А < О < В) = а просто означает, что 8 попадает в интервал (А, В) с вероятностью сь. Например, если 0 обозначает неизвестное математическое ожидание нормального распределения, то из-за случайных ошибок измерений О не определяется полностью выборочным средним Х. Такой параметр О можно рассматривать как нормально распределенную случайную вели- чину с математическим ожиданием Х и стандартным отклонением о/~/н. Следовательно, Р(Х вЂ” 2о/1/н (О <Х+ 2о/1/и) = 095. Такой вид интервальных оценок, называемых фидуциал»ньгми интервалами, ввел Фишер.
В случае нормального распределения, как мы видим, доверительные н фидуциальные интервалы формально совпадают; различается лишь их «философия», В течение некоторого времени считали, что эти два вида интервалов практически совпадают, и споры о различии между доверительными и фидуциальными интервалами являются чисто теоретическими. (Вначале Нейман поддерживал фидуциальную теорию Фишера главным образом потому, что Фишеру также не удалось использовать теорему Байеса.) Однако вскоре обнаружились парадоксы, имеющие практическое значение.
Разные подходы Фишера и Неймана привели и к различным результатам в практических применениях. В 1959 г. К. Сгейн указал на чрезвычайно парадоксальный случай. Для простоты он рассмотрел доверительные и фидуциальные интервалы, в которых В = со или А = — со потому, что такие интервалы определяются одним значением (вторым концом интервала). б) Парадокс Пусть Хь Хм ..., Х» суть независимые нормально распределенные случайные величины с единичной дисперсией (й) 2).
Обозначим через 8ь 8», ..., 8» их неизвестные математические ожидания. Пусть вектор 8= (8ь Оь ..., О») находится на расстоянии )9~=~/0~1+8»+ ... +8»» от начала координат. Стейн доказал, что доверительный и фидуциальный интервалы для ~8( могут сильно различаться, что и показано в следующем парадоксе. Будем оценивать каждое 8; средним значением Х; выборки объема п. Пусть расстояние между началом координат и вектором выборочных средних (Хь Хь, Х») равно ~Х~ = Х',+Х»-»- ...
+Х»„. Тогда Р((Х! ) (О!) ) 05, когда Х— случайная величина (строится доверительный интервал) и каково бы ни было значение неизвестного параметра О. С другой стороны, если 0 — случайная величина (строится фидуциальный интервал), то Р()8) )1Х1)) 0.5 для любого значения выборочного среднего Х. Иными словами, вероятность того, что доверительный интервал ( — со, )Х() содержит неизвестное значение )8~, больше 50%; в то же время с вероятностью, большей 50»В, случайная величина 10! попадает на (фидуциальный) интервал ((Х(, +со). Таким образом, с точки зрения теории до- верительных интервалов выгоднее ставить на неравенство )Х( ) )О), а при фидуциальном подходе ситуация прямо противоположная. в) Объяснение парадокса Невозможно показать все противоречия между фидуциальным подходом я теорией доверительных интервалов, возникающие в связи с задачей Стейна.
Здесь мы ограничимся изложением решения, которое предложил сам Стейн. Если фидуциальный подход применяется не к элементам выборки, заданным своими координатами, а (в силу сферической симметрии нормального распределения) к суммам квадратов координат, то фидуциальные интервалы совпадают с доверительными интервалами (см. статью Стейна). Следовательно, выгоднее ставить на то, что «(Х! больше, чем (6(». г) Замечания (1) Построим интервальную оценку для неизвестного математического ожидания 0 нормального распределения с известным стандартным оклонением а, используя априорную информацию о том, что величина 0 нормально распределена с математическим ожиданием 1» н стандартным отклонением з (величины и и з известны).
Если Х вЂ” среднее значение выборки объема л, то по теореме Байеса алосгериорное распределение величины 6 также нормально с математическим ожиданием 0'= = в+ С(Х вЂ” и) и стандартным отклонением Р, где л/в« » ! С=-07+й(в н Р'= 1/У+я/в». Следовательно, (6' — 2Р, 0' + 2Р) есть 95 % интервальная оценка для 0, так как Р(0' — 2Р < 0 < 0*+ 2Р) ж 0.95. Отсутствие априорной информации означает, что в= со, т. е. С=1.
Таким образом, 0'=Х и Р»=а'/л, а это и есть фидуциальный интервал. Следовательно, в случае многомерного нормального распределения байесовский подход приводит к тому же самому парадоксу, что и фидуциальный подход. Другой парадокс подобного типа (он исходит от московской статистической школы) заключается в следующем.
Машина состоит из лг деталей, соединенных последовательно. Поэтому, если 1-я деталь исправна с вероятностью р; (1=1, 2, ..., лг), то машина исправна с вероятностью р=р, р»... р . Возьмем теперь выборку из ль лм, л элементов, и предположим, что все элементы исправно работают. Используя эту информацию, надо найти интервальную оценку в виде Р(р) р') =а.
Как это ни странно, но доверительный интервал (т. е. величина р') не зависит от гл, а зависит лишь от ш(п и, = л«и соответствующей вероятно- 1~!(гн сти рь В то же самое время в рамках байесовского подхода интервальная оценка для р зависит от т. (й) Фишер (1890 — 1962 гг.) начал заниматься интервальными оценками немного раньше, чем Нейман (1894 — 1981 гг.). Фишер даже обвинил Неймана, который тогда работал в Польше, в присваивании и обобщении своих идей. В это время у Фишера уже были личные и профессиональные конфликты с другими выдающимися статистиками.
Он ненавидел К Пирсона (1857 — 1936 гг.) и поэтому не публиковался после 1920 г. в журнале «Биометрика» (ведущем периодическом журнале по статистике, среди основателей и редакторов которого был Пирсон). Фишер перенес свою антипатию, хотя и в ослабленном виде, на Э. Пирсона (1895 — 1980 гг.), сына К. Пирсона, и его друга Е.
Неймана. Позднее Нейман стал одним из ведущих статистиков в США, и их личный спор перерос в спор англо-американский. Фишеру никогда не нравилась идея сведения статистических выводов к принятию решений с помощью функций потерь. (Это «американское» направление в статистике было разработано венгром Абрахамом Вальдом на основе теории игр Джона фон Неймана.) Главное противоречие выражалось в следующем: в Америке (в соответствии с прагматизмом Пирса) не важно, о чем вы думаете, а важно, что вы делаете. В Англии же — наоборот.
Хотя рассуждения Фишера и не были всегда убедительными, он является одним из крупнейших (если не крупнейшим) статистиков, когда-либо живших. Поэтому странно, что он не стал профессором статистики. В действительности, в 1943 г. он-таки стал профессором Кембриджского университета, но по генетике. Между 1952 и 1954 г. он также был президентом Королевского общества. (111) Нам нужно оценить параметр сдвига О по выборке Хь Хь ..., Х„, элементы которой имеют показательную плотность вероятности ез — * (если к ~ О и 0 в противном случае). Оценка является несмещенной, и ее плотность вероятности пропорциональна (х — О+ 1)"-' е — м"-а+и для л ) Π— 1.
С помощью этой плотности можно легко найти 90 «(, доверительный интервал наименьшей длины. В случае, когда Х~ =12, Хз=14, Хз =16 этот доверительный интервал запишется в виде 12.1471 < 8( !3.8264. С другой стороны, О, очевидно, меньше, чем Х;= =ш(ИХ(=12.Такимобразом, 90 зй доверительный интервал наи- меньшей длины лежит в области, в которой О находиться не мо- жет! Джейнес подчеркнул (см. ссылку ниже), что для построе- ния интервальной оценки следует воспользоваться байесовским подходом. Если априорная плотность равна постоянной величил (е-х ) не, то апостериорная плотность величины О будет ле ( если 0 <Х; и 0 в противном случае.