Секей Г. Парадоксы в теории вероятностей и математической статистике (1990) (1151962), страница 19
Текст из файла (страница 19)
Пусть а(х) — действительная функция на [О, !) и ам=а((/и)/и. Если функция Г трижды дифференцируема, то оптимальный выбор а(х) определяется соотношением а(Р(х)) = — [(А+ Вх)(!оя/(х)) ]', где ие А= иеи2 и! )ге= 1 В= 2 иене И1 Г (1'(х))' )х4 3 1(х) х дх р =1 ххдх — ! г (!'(х))е 1 (х) Х' = [ 1 — )Х, где й > 2. (а — 2) вх х— !!х!» / (штрихи обозначают производные, Р'=( есть плотность).
Эта формула для а(х) применима даже тогда, когда у г" не существует математического ожидания и 0 обозначает центр симметрии функции 1е(х). Например, пусть !е(х) = !/(л(1+ (х — 0)ь)) (плотность распределения Коши; см. историю парадокса П/4). Тогда как это не удивительно, а(х) = — Асоьулхып'лх является оптимальным выбором, но а(х) отрицательна (1) для х близких к О или !. В этом случае «обычная» оценка Х даже не будет состоятельной. (Более подробный анализ можно найти в статье Мбг! Т. Р., Зхейе!у 6..). «Нож 1о еь1ппа1е !оса1юп апд ьса!е рагаше(егь», ТесЬп!са! герог1, Ео1чбь 1.. Пп!ч. (!986); см. также СЬегпоН Н., Паь1чпг(Ь Л.
1, )оЬпь М. У..)г. «Аьушр1оБс б!ь1г!Ьи(!оп о! Ипеаг согпЬ!па1!опь о( огбег ь1а11ьИсз тч!(Ь арр!!са(!опь (о еь1ппаВоп», Аппо!ь ог Май. $(абьВсь, 38, 52 — 72, (!967).) (Б) После статьи Стейна, опубликованной в 1956 г., Джеймс и Стейн в 1961 г. предложили следующую простую оценку для математического ожидания многомерного нормального распре- деления Тогда Е((Х' — 8Р ( й, но Е((Х вЂ” 8((з и. Следовательно, оценка Х действительно не является допустимой.
Оценка Х' переводит вектор Х ближе к началу координат, а так как начало координат можно выбрать произвольно, то оценка также лучше, чем Х, при любом !г. Таким образом, оценка Джеймса — Стейна зависит от выбора начала координат (г, в то же время Х от !1 не зависит. (Можно показать, что оценка даже несколько лучше, чем Х'.) Теперь попытаемся эвристически объяснить, почему оценка Х' лучше, чем Х. Рассмотрим в совокупности выборки в и независимых задачах оценки параметров. Разброс скалярных элементов выборки определяется частично (общим) стандартным отклонением а каждого из и распределений, частично (вообще говоря) неравными математическими ожиданиями О» Хотя эти неизвестные математические ожидания могут быть очень разными, разброс обшей выборки может указывать на то, что значения 0; различаются не сильно.
Например, в случае, когда о = 1 и приблизительно 16 /г наблюдений превосходит 1, а 16 $(р наблюдений меньше — 1, естественно считать, что все математические ожидания 0; близки к нулю. В этом случае, если Х; = 0.8, то обычная оценка Ого параметра даст 0.8, в то же время согласно более «рациональной» концепции Джеймса — Стейна математическое ожидание 0; близко к нулю. Хотя такое объяснение может убедить нас в «рациональности» оценок, предложенных Джеймсом и Стейном, однако их метод все же представляется странным, когда мы имеем дело с задачами, между которыми вряд ли существует какая-либо связь, например, когда нужно оценить математические ожидания (нормально распределенных) высоты тела, скорости света и цены продукта.
г) Замечания (!) Следующее неравенство, принадлежащее Крамеру и Рао, дает полезную информацию, касающуюся обоих парадоксов. Пусть )(х, О) — совместная плотность (зависящая от параметра 8) элементов выборки Х» 1= 1, 2, ..., и, и пусть В(0) обозначает смещение Е(0„— 8) оценки О„от параметра О. Тогда неравенство Крамера — Рао утверждает, что при выпол- ненни некоторых условий регулярности справедливо соотношение Е(6„— 6)а~в(6)в+ "+;„',""*, где В'(О) — производная функции В(6) и /(81-в— -и ьз)(хь в) есть информация Фишера.
Следовательно, скорость сходимости Е(6„— 6)' к нулю не может быть быстрее, чем 1/о. Однако в примере, рассмотренном в первом парадоксе (равномерное распределение, В(0) = 0 и поэтому Е(6 — 0)' = Вт(6„)), скорость сходимости составляет 1/па. Противоречия здесь нет, так как пример представляет собой типичный случай, когда условия регулярности, которые упоминались выше, не выполнены. (Например, достаточным было бы следующее условие регулярности: множество чисел х, для которых функция 1(х, 6) положительна, не зависит от 6.) Теперь относительно второго парадокса. Из неравенства Крамера — Рао вытекает, что если разрешено использовать смещенные оценки, т.
е. мы отказываемся от условия В(6) — О, и если производная В'(0) отрицательна, то Е(6„ — 6)' может убывать значительно быстрее, чем дисперсия несмещенной оценки с минимальной дисперсией. (В) Пусть Х", < Х; « ... Х„' обозначают упорядоченную выбоРкУ и Х' обозначает выбоРочнУю медианУ, т, е. Х' =Х;„ и для нечетных и и Х' = (Х„'„+ Х'„„„У9 для четных а. Если выборка взята из нормального распределения, то Ва (Х) = — „1)а (Х') 0.63йв (Х'), т. е. эффективность оценки Х' составляет (асимптотически) всего лишь 63 7р от эффективности Х '). Однако ситуация изменится, если мы немного красстроим» нормальное распределение: рассмотрим случайную величину, которая является смесью двух нормальных распределений, а именно, 91 о)а составляет нормальное распределение со средним 0 и дисперсией 1 и 9 а/а — нормальное распределение с тем же средним О и дисперсией 9.
') Эффективность оценки 8 пропорциональна 0-т(В). — Прим. персе. В этом случае медиана Х' является для В оценкой лучшей, чем Х. (ш) Следующий парадокс допустимой оценки принадлежит С. Масани. Пусть Хс, Хз — две независимые случайные величины с математическими ожиданиями лсс, лгз. Масани строит два примера (один с биномиальным распределением, другой с нормальным), в которых оценка, зависящая только от Хь является допустимой при оценивании лс!.
Здесь мы рассмотрим только биномиальный случай. Пусть Хь Хп ..., Մ— независимые случайныс всличины, имеющие биномиальные распределения с параметрами ль ро Можно доказать, что линейная оценка Р,(Хь Х,, ..., Х ) = ~, асХс/лс+с с ! является допустимой оценкой параметра р, при квадратичной функции потерь 7.(рс, р) = (р! — р)' тогда и только тогда, когда или 0<а, < 1, 0<с<1 и 0<~ а!+с~(1, 0(~~,а,+с(1, с-! или а! = 1 и аз=аз — — ...— — а„=с = О.
Полагая а! = О, получаем большой класс допустимых оценок параметра рс, не зависящих от Х!. д) Литература Е(гоп В. "В!азеа чегвив ипЬ!авва ев!!та!!оп", Ас(оалсез !л Мага., 16, 259 †2, (1975). затее 'йс., 5!е!и С. "Еыппацоп чс!1Ь Чиаага!!с !овв", Ргос. 4!Л Вегас!еу Вутр. ол МаСЛ. Всагыг. алсг Ргоь., 1, 361 — 380. Бп!ч, Са)!(огп!а Ргевв, Вегйе!еу, (!96!). Какао А. М., Ь!пп!М Уи. Ч„йао С. П. "Оп а сьагас1ег!ха1соп оп псе погта! 1очг Ьазеа оп а ргорег1у о! Ьхе затр1е ачегаае'Х Валаауа, Вег.
с(, 27, 3 — 4, 405 — 406, (!965). Мазал! 5. М. "А рагааох !и ает!вв!Ь!1!!у", с(лла!з о) Вгагсз!., 5, 544 — 546, (!977). 5!е!п С. "1паат!вз!Ь!!Иу о( Ще изиа! ев1ппа1ог !ог Рхе теап о( а ти!ичапа1е попив! 6!в!г!Ьи!!оп", Ргос. Зп! Вегас!еу Вутр. ол МаСЬ. Вга!сз!.
алс( Ргов., 1, 197 — 206, 1)про СаИогпса Ргевв, Вег1се!еу, (!956). Тихеу Д ВС. "А зигчеу о1 вату!!йк 1гот соп1ат(йа(еа а!в(г!Ьи!(опз", Солгг(Ь. Со РгоЬ. алс( В!а!ге!., (Еа. 1. О!Ып) 448 — 485, $(апа!ога \1п(ч. Ргевв, (1960). Хаскз 8. Тае Таеогу о) Бса!Нссса! (л)егелсе, йг!!еу, Ыетч МагМ, (197!). (Имеется перевод: Закс Ш. Теория статистических выводов. — Мп Мир, 1975.1 3. Парадокс оценок дисперсии а) История парадокса Важнейшей характеристикой случайных величин и их распределений наряду с математическим ожиданием является дисперсия.
Оценим неизвестную дисперсию 0' случайной величины Х по выборке Хь Хм ..., Х„(где Хь Хь ., Х„являются независимыми наблюдениями, имеющими то же распределение, что и Х). При известном математическом ожидании Е оценка Ро — „~ (Х! — Е)' ! ! — несмещенная. Ситуация меняется, когда Е неизвестно и (в предыдущую формулу) вместо Е ставится его несмещенная оценка Х.
Тогда оценка л Р'= — ~ (Х! — Х)' ! уже не является несмещенной. Поскольку несмещенность (со времен Гаусса) была одним из необходимых свойств, которыми должна обладать хорошая оценка, Рт изменяют так, чтобы получить несмещенную оценку. (Некоторые параметры вообще ие имеют несмещенных оценок. В этих случаях ограничиваются требованием асимптотической несмещенности, т. е, !(т Е(0„)= !!-+ ~ = 0 для всех й ~ 6.
Это требование для 0! выполнено.) Наряду со свойством несмещенности постепенно возникли и другие требования, которым должна удовлетворять хорошая оценка. Парадокс возникает тогда, когда различные требования к качеству оценок не приводят к одной и той же оценке. б) Парадокс Умножая Рт на множитель Бесселя и/(и — 1), получаем величину и Р' = — „', ~(Х,— Х)', ! ! являющуюся несмещенной оценкой дисперсии. Предположим, что случайная величина Х нормально распределена (с неизвестными математическим ожиданием и дисперсией), и нам нужны мииимаксные оценки (см. замечания в1/12) с функцией потерь Е(0з, 0') = (О' — Р')(Р'. Тогда 0' надо изменить следующим образом: умножим ггв на и/(и+1) и получим минимаксную оценку „', Х(Х,— Х)х.